摸鱼 发现创造 Rules & Tips
1. 遵守中国大陆相关法律法规
2. 推崇「哥伦布式」的发现
3. 创造不是复制粘贴,是自我表达

谁尝试过面向图书搜索?

查看: 5073|回复: 4
MindBread 发表于 2021-1-29 00:09:37
曾经学习C语言的时候遇到一个统计单词数的问题,尝试去上网搜索相关信息,但是大多记录的答案质量都层次不齐,很难延展思路,正当发愁的时候突然想到《C Primer Plus》上有描述过同样的问题,赶紧打开PDF搜索,书中的讲解马上就使我醍醐灌顶了。
这次经历让我有了一个想法:能不能通过对一个专门问题的搜索从而引出一本较为系统的书,在解决某个问题为方向的同时顺便通过一本书,甚至多本书之间跳转,达到解决问题的同时还能较为系统地掌握一门技术的目的?毕竟很多时候一个专业问题凭网上几篇文章很难得到完整的见解,而书籍相对能集中讨论一类问题,通过章节系统构建相关的知识体系。

如果在google上,能提供类似功能的就是google books了,能由某个搜索结果部分显示一本书的内容,但是搜到的书质量上不太好说。

但我想这种方法目前应用不太多,一是要求使用者比较"吃书",在解决某类问题的时候能想起自己看的哪几本书有比较好的见解,二是版权上会有各种限制。

我还是觉得这是个挺有意思的想法。
坏脾气先森i 发表于 2021-1-29 00:47:41
自己之前有个思路:
将自己读过的书的电子版(非扫描版)都弄下来,再用那个可以搜文件内容的搜索软件搜。
冰与光的孤独 发表于 2021-1-29 12:56:28
感觉你的思路有一些局限性,找到解决问题的方法并不一定特定指向某本或者某一系列的书籍。图书出版具有滞后性,我感觉属于旧知识,一些已经解决但是你不知道的旧问题还好(比如说一些数学问题的优化解法,单词的意思之类的),但是一些原创性工作遇到的问题(比如自然科学研究等)就不能完全通过查阅书籍来获得解决方法或者指导思想了,相关性指向性都不怎么高。

相反,解决这类新问题的方法恰恰是这种在网上查阅文章或文献的方式来获取零碎的相关信息,总结,然后产生启发与共鸣

然后至于学习新技术这件事情,窃以为并不非得要通过这种相关性关联出来的东西来系统学习一个新东西,我觉得这并不系统,或许相关度还成问题。我的想法是可以通过这种搜索找到你想学的东西,然后再去搜索如何系统的学习这个东西,这样或许会更好一些

其实并不是所有搜索都非得弄成集成度高的一站式服务,信息量太大了,而目前搜索引擎又不那么智能,所以我觉得现阶段逐级搜索更能准确的定位某个你所需要的信息,期待未来科学技术的发展会让搜索更加便利!
虫子 发表于 2021-1-29 04:01:18
你这个想法也挺有创见性。

Google 的一个测试项目 Talk to Books 与你的想法基本一致。



Talk to Books 是一个运用「词向量」人工智能技术的搜索引擎。词向量是一种自然语言处理形式,两个词向量的差值对应词的关系,词向量的距离则对应词的相关或相似性。对于选定的一组词,将其向量投影到空间中,词义相近的词向量在向量空间中表现出聚类现象。陈述一件事或提出一个问题,Talk to Books 就会在书中找出能回答你的句子,这种方法不依赖关键词匹配。

Talk to Books 可以按照艺术、小说、科学、历史和宗教等十个门类对搜索的图书进行过滤,目前仅支持英文。看个例子:是什么引发了第一次世界大战?(搜索结果是机器翻译的)



Talk to Books 理解这段自然语言并且给出了十分吻合的答案。当然这也是一个比较理想的实例。

假设一下,如果你在某段时间对人生充满了迷茫,困顿于活着的意义等事关人类终极关怀的问题,那么通常情况下搜索引擎能帮到你的不过是检索到「活着的意义」的网络讨论,比如在知乎上;但若 Talk to Books 足够聪明,就会为你搜索推荐一系列探讨「人活着是为什么」这个命题的图书,你还担心图书质量层次不齐?那把类似豆瓣图书这样的评分抓过来作为一个参考条目岂不完美?

这件事,特别考验技术,更考验资历,也就是你说的版权问题。只有 Google 这样级别的公司,才能有资历去统筹开发出 Google books 这样伟大的产品(Google books 的前身 Google print 就是因为版权问题让两位创始人吃过官司)。何况 Google books 至今还存在许多潜在的版权问题以及没有编辑来纠正 OCR 过程中引入扫描文本的许多错误这样影响阅读体验的系统级问题。

无论是 Google books  还是 Talk to Books ,以我和百度一样短浅的目光来看都是吃力不给力(于 KPI 而言)的。但至少这种永不停止探索的精神真是让人敬佩和鼓舞。
Yuki_fx 发表于 2021-1-29 10:07:56
你这个想法我之前也想过,但目前没有比较好的解决方案,就暂时搁置了。
目前,我有几个想法:

1、搜索几本权威或者自己熟读过的书籍,以后遇到问题时,可以凭借印象,在这几本书内找到相应章节,然后再仔细阅读,尝试找到自己问题的答案

2、使用类似Everything,Listary等本地搜索软件。我目前了解到的软件有FileLocator Pro,anytext  这两个。我粗略体验了一下,没有深入。这两个软件能够搜索文件内的信息。但是不完善,能够搜索到电子书籍,txt,word等内容,但是对于扫描版的电子书,就不太能行。

3、可以去知网等文献检索平台搜索,找到相关问题研究,可能可以找到答案。这要看你的问题是什么类型。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-7-6 11:53

快速回复 返回顶部 返回列表