搜索 搜索杂谈 Rules & Tips
1. 遵守中国大陆相关法律法规
2. 搜索相关行业技术资讯

更好的搜索引擎,是不是已经不会再有了?

查看: 1086|回复: 2
J0KER 发表于 前天 12:44
写这篇帖子主要是为了分享我的一些经历和感受,这个疑问不是给单一某个人回答的,而是给这个时代里的每个人的,或者说,是给我自己的,为了更进一步提高自己的搜索能力而提问的。

我的第一款搜索引擎是百度,刚刚学会用电脑什么也不懂,一开始连打字都不会,只能死记硬背几个网址,比如说qq.com,hao123这些门户和导航网站,从这些地方出发去上网,后来才发现有搜索引擎这么好用工具,搜索一下就能找到相关的内容和资料,实在很方便。那个时候,谷歌还没有退出中国,除了预装全拼和智能ABC,我用的的第一款输入法就是谷歌拼音输入法,谷歌搜索一用就知道,比百度好用太多。其实当年的百度也并没有那么差,只是能搜到的结果少一些,稍微没有谷歌的那么精准准确,当年谷歌还有一个“感觉不错”的搜索按钮,会直接进入搜索结果的第一个,算是一个很有意思的功能,我曾经比较过百度和谷歌的搜索结果,一般来说谷歌前面五页都能找到真实相关的资料,翻到十页之后也还有能看的内容,而百度大概只有前面两三页真实相关,翻到后面就是各种乱七八糟的东西。

当然,这些都是百度在搜索里插各种流氓广告之前的事,自从发现搜索结果前几项里有点击过广告之后,我再也没用过百度。

后来很长一段时间,我都以谷歌作为主力搜索引擎使用,没有十年也有七八年吧,谷歌的确带给我很多发现互联网的乐趣,而不止局限在单个网站之内,虽然门户网站的内容也很丰富,比如当年的社交网络,人人网,开心网,每天上去就是玩和刷,实在是非常让人沉迷,可惜现在也有了后来的替代者,这些建立在网页里的社区,也不复存在了。直到现在,通过谷歌,也依然能够有效的找到需要的信息,发现一些人发布在网络上的原创内容,各种博客,所谓的“small web”内容,在测试网络连通性的时候,总是习惯输入google.com,这个搜索框往往就代表着互联网最多人使用的入口。可是,我现在谷歌搜索用得越来越少,为什么呢?

单纯是因为,我感到谷歌没有那么好用,也没有那么纯粹了。谷歌作为一家互联网公司,进行过很多尝试,很大一部分都失败了,就比如说,谷歌拼音输入法,我用的第一款带云联想功能的输入法,早在2018年就死了,它活了11年,还有死了已经很久的google+,一个曾经有很多中文用户使用的社区,Google Cache,看网页历史的工具,Google Podcasts,Google Domains等等,这些都是我使用过的,感觉都很好用但不知道为什么就死了项目。另外一方面,谷歌大概已经忘记了它的“Don't be evil”。通过社会工程学,谷歌完全可以通过你不断提供的搜索词为你进行大数据建模,谷歌很可能会比任何人都更了解你,比如说谷歌手机新闻的推送,很大一部分就是基于你的搜索记录生成,要是你完全通过谷歌收发邮件,谷歌实际上能够阅读你的所有邮件,账单、订阅、和别人的书信内容,谷歌自然能够获取这些信息利用这些信息对你进行建模,更不用说,Google Photos,掌握了你拍的所有照片。虽然我觉得这就是所有太大的互联网公司的通病,马化腾也曾经宣称腾讯通过大数据对全国人脸几乎都有识别,甚至具备预测人未来样貌的能力,美国警方通过搜查谷歌搜索词来破杀人纵火案。隐私在互联网发展刀今天这个地步,本来就不存在,而谷歌自然也不能免俗。出于这种顾虑,除了不再使用它们之外,也没有其他方法,谷歌已经不再只是一个搜索引擎,也可以说,匿名搜索,已经是这个时代里的一种特权。虽然,搜索本来是这样的。

过去几年里,在我不再使用谷歌之后,我接触了很多很多其他的替代品和搜索引擎,就最简单的中文搜索来说,互联网上的确是有不少很好的替代品,比如说需要付费的kagi,能搜出更多有用的结果,还能通过标签自定义在一系列网站里更加高效的搜索,还能对搜索结果进行个性化的排序,让自己选择更加有用的信息来源。另外,通过自己搭建的元搜索引擎,也能规避谷歌搜索的坏处的替代也有,比如说SearXNG,通过聚合其他一系列搜索引擎的结果,提供一个综合的搜索排序,还能自己选择搜索结果的来源,选择你想用不想用的搜索引擎,我现在的主力使用是这个。

而中文互联网内,大概已经没有真的互联网这种概念,在我看来,微信和小红书是国内最好用的搜索引擎,因为你在其他地方不可能搜到平台内的内容,而这些内容大部分都是用户所提供的,平台已经根据它自己的算法对内容进行了排序,而不再列入一般的网页搜索里。稍差一点的,可能是贴吧和微博中的内容,因为被删除的太多,信息中的噪音也太多,所以更难搜索到有用的内容,不过还是有一部分的。

而展望未来,我真的还需要搜索引擎吗?假如AI能准确回答我的问题,我又何必用搜索引擎再去寻找信息和求证呢?例如说,PPLX或者copilot都可以根据网页内容总结信息,回答问题,直接通过AI获取信息,还不用自己再筛选处理,岂不是更加高效便捷?这不也是我通过搜索引擎想做到的事情?假如一直用AI,更好的搜索引擎,是不是已经不会再有了?
虫子 发表于 前天 15:04
单纯是因为,我感到谷歌没有那么好用,也没有那么纯粹了。谷歌作为一家互联网公司,进行过很多尝试,很大一部分都失败了...


在英文互联网也时常会看到对于 Google 搜索体验变得糟糕的吐槽,尤其是广告。造成这种情况的一部分原因,我想也可以用你提到的「纯粹」来解释。

期望 Google 这样体量的产品保持所谓「纯粹」,既不现实,也不不公平——商业巨头的每一次决策,早已不只是单纯靠技术理想驱动。它是从车库里诞生,但它早已不属于「两个程序员的梦想」这个叙事。

“Don't be evil” 也更多用于嘲讽 Google 丑闻(比如跟踪用户行为)的批评中。

我想再提供一个视角:搜索质量的变差是否也与用户的「不再纯粹」行为有关呢?

因为搜索引擎是一种强交互的产品类型,它索引的数据就来自用户的生产。那么用户在互联网生产的内容有变化吗?单说中文互联网。宏观上,自 2018 开始的提速降费,移动互联网渗透率接近饱和,信息的生产门槛降低到村头二大爷都能信手拈来;微观举例,我曾在某社区首页信息流刷到一篇「关于 Google 中文搜索结果中内容农场的吐槽」——这并不稀奇,有意思的是,第二天就出现了另一篇热帖,作者在分享自己利用爬虫搭建内容农场站点收益的情况——收益还挺可观,于是评论区一水的「兄弟求带」。你看吧,在利益面前,人是可以 180 度大转弯去拥抱自己昨天还所不齿的事物。就像训练数据的质量对于基座大模型的重要,互联网内高质量内容比例的急速下滑,也就促成了搜索引擎屎里淘金的局面,反映到输出质量,自然也会受影响。

再说 Google 那么多尝试后的失败产品,有一个网站叫 Killed by Google,记录了 297 个被 Google 扫进坟墓的产品。我想这依旧摆脱不了体量和利益的叙事逻辑。批评者可以说这是不够专注,东一榔头西一锤子。不过我个人还是挺欣赏这种「玩儿」一样的创新姿态。况且,有些产品的失败是局限于当时的软硬件技术和市场,但失败的探索或许正是未来某项技术的能够落地的「巨人的肩膀」,这方面的例子很多,比如李飞飞搞的那个 ImageNet,当年只是一个给图片打标签的项目,很多人不理解它的意义,甚至觉得只是低成本的众包苦力活。但正是这个庞大、结构化的数据集,为后来深度学习的发展提供了燃料。Google 之于 AI 也有类似的叙事——那篇著名的论文《attention is all you need》。

你提到的 kagi,不可否认它有一些实用且高效的特性,但这其实也是两种不同的商业模式促成的。kagi 是付费使用,自然不用再考虑广告问题。而 Google 的广告分成模式,加之其体量巨大,大家都想从它身上获利,也就会有针对性 SEO,包括垃圾 SEO。打个比方,kagi 可能就像山姆,针对一类客群提供会员提供较高品质、较低干扰、精挑细选的「会员制」搜索体验,付费用户享受的是一种被过滤后的「信息超市」,干净、高效、无推销。而 Google 更像是沃尔玛或者淘宝,流量巨大、琳琅满目、覆盖的国家、地区和语言众多,同时也充满了营销博弈、真假难辨的信息混战。

曾经有一位虫友和我交流搜索的本质,他想要一种逻辑而非路径的解释。我分享了我的看法:搜索的本质就是对用户认知模式的匹配。我想用到这里来回答你对「真的还需要搜索引擎吗」的疑问,还挺合适的。

广义的搜索引擎,或称之为搜索行为,是脱离那一个个框的。比如你提到的微信、小红书、贴吧、微博...还包括抖音、B 站等内容平台,它们的内容呈现方式各异,不同内容载体的信息密度各异...一个常见的说法:长时间刷抖音或以视频来获取信息的人,其文字阅读能力是下降的,特别是对长文。且不论两种载体信息质量的高低,单说喜好,单纯刷视频的人可能更倾向于通过视频平台的搜索来获取信息,这就是用户认知模式的匹配。

最后说 AI 搜索,它仍旧依赖搜索引擎的技术,只是只是把「找到信息」这一步,从用户自己点选变成了模型帮你整合总结。它并没有改变信息的来源,而是改变了信息的呈现方式和交互流程。传统搜索给你的是入口,AI 搜索给你的是答案。但问题也随之而来:模型生成的答案依赖于背后的搜索质量。如果源信息就有偏差、过时或被 SEO 污染,再智能的模型也会胡说八道。

并且那些包含幻觉的回答还有一个更「致命的诱惑」——信息垄断,这个我在教程里专门还聊过。即如果它只给你了一个答案,但是没有更多的信息入口,那么你直觉上会更愿意相信它,因为你没有其它选择。从这个意义上讲,我个人更喜欢目前 Google 搜索的 AI Mode,overview + link 的信息组织形式。

最后再叠个甲:鉴于曾经有一位虫友给我贴了张「奉 Google 为黄金律」的标签,加之我回看这篇跟帖,可能还真会被有的人端详出「给 Google 洗地」的奇葩脑回路结论。我在此说明:如果进行一场 Google 吐槽大会,我自觉至少能拿个亚军;我不炒股,更谈不上持有 Google 的股票;在虫部落,获取信息的优先级永远高于争论观点。
 楼主| J0KER 发表于 昨天 11:34
虫子 发表于 2025-7-31 15:04
在英文互联网也时常会看到对于 Google 搜索体验变得糟糕的吐槽,尤其是广告。造成这种情况的一部分原因, ...


你说得很好,我很赞同也很有共鸣,实际上我感觉到的是旧日的互联网正在离我们远去,通过搜索词能够发现的新内容越来越少,也越来越难找了,有时候必须要用搜索语法反复尝试,或者再限定一个网站内定向搜索,而更多人对算法推荐的互联网趋之若鹜,更多有用得信息生成在了搜索引擎很难找到的地方,就比如说短视频媒体,完全封闭的微信公众号和小红书里,在其他平台的评论区里,例如说抖音评论区,微信群传播的聊天记录,B站评论区。这些地方,谷歌搜索都是很难触及的,谷歌引擎也许比以前的每一天都更加强大了,可是互联网本身已经改变了,获取有效信息的渠道也改变了。

特别是关于用户行为是不是已经转变了,所以搜索引擎也转变的观点,是值得深入探讨的。首先,在用户的认知中,搜索这件事本身就是没有成本的,而实际上并不是,谷歌构建的庞大系统里,怎么可能不需要成本?就比如说自建SearXNG,也需要用户自己付费买服务器,学习怎么搭建和使用,有金钱的成本也有时间的成本,那么谷歌需要用什么来弥补这些成本?谷歌为所有人提供的每一次搜索,用户所要付出的代价可能就是隐私,匹配到微信和小红书,也是同样的,算法正在通过每一次搜索凝视着用户。作为一个互联网使用者,每天都在互联网中汲取所需的信息,来丰富自己的生活,提高生活的质量,很少有人能从海量信息中修正自己的认知模式。

说到这里,我不禁想起以前从来不用小红书的我,看到有人如何利用小红书算法不断搜索租房信息,利用算法给自己推荐租房,所谓“养号”来找到最合适的租房,正是因为学习到其他人这种“搜素技巧”,我才开始使用小红书,在其中发掘冷门小众信息的乐趣。我不禁会想,到底是不是有人从开始上网开始,就从来没用过原味的搜素引擎,只在一个平台里不断深挖搜寻,就比如说小红书,其中的技巧难道就比普通搜素引擎简单,找到的信息质量就比搜索引擎低吗?我想现在已经完全不是了,有时候在谷歌搜索半天,还不如小红书微信里一搜就找到,我明白谷歌也已经被排除在大而全的互联网图景外了。

而从这些数据的不互通,平台之间的互相封闭来说,就像形成了一个个用户和数据的孤岛,有用的信息会在这些众多平台上形成长尾排列,有用的信息本身在争取更多用户关注,而用户会聚拢在垄断的信息周围,互联网搜素哦可能永远不会死,可是也已经没有谷歌搜遍天下这样的神话了。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则蛙先知RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-8-2 08:19

快速回复 返回顶部 返回列表