浅谈 Gemini 1.5 与高效的搜索的技术性实现

虫子 · 发表于 2024-2-21 22:47:08

Google 于前几日发布了 Gemini 1.5，看到有关其高效架构的描述，让我联想起早前对于未来搜索形态的一点构想。即抛开人的搜索行为的差异，如何技术性实现更高效的搜索？

理想的模式...就是传统的通用搜索和垂直搜索可以实现无缝对接，用户输入的信息会被智能分发给对应的垂直搜索引擎处理。比如我提出了一个有关拆迁的法律相关的问题，我的搜索意图可以被精确分析、归类、匹配，一定是分配给一个「法律专家」（而非情感专家、心理专家、甚至建筑专家...）去解决，只依赖垂直类的法律搜索引擎处理这个请求，而非爬取到的整个互联网的法律信息，这样索引的数量大大减少，如此便达成高效目标。

你看吧，想的是美，实现起来如何？没谱，只当给对方听个乐呵。

而 Gemini 1.5 ，包括之前 GPTs 推出的背后逻辑都是如此，可能因为很朴素，朴素到上过网都会这么遐想吧。

拿 Gemini 1.5 来说，它建立在 Transformer 和 MoE 架构之上。传统 Transformer 充当一个大型神经网络（就如同传统的通用搜索引擎 Google、Bing、百度），而 MoE 模型则分为更小的「专家」神经网络（好比专利搜索引擎、裁判文书网、GitHub、工商信息系统...）。区别在于前者是以 AI 的方式运行。

根据用户输入的类型，MoE 模型学会选择性地仅激活其神经网络中最相关的专家路径，正是这种专业化极大地提高了模型的效率，同时也极大提升了回答的质量。

如同虫部落 Wiki 中的五花八门一般，专家的数量也会很多，为了一个问题把所有专家都请来也是资源浪费，所以合理的做法，即便是一个复杂问题，也只需拆解为几个子问题，然后请来这部分对应的专家回答即可。

不过好像 Gemini 1.5 仅有内部训练、培养的专家，靠的是通过支持超长上下文的力大砖飞，而缺少了 OpenAI 那些外聘的专家 GPTs（Wolfram、Consensus、星座占卜...），后者无论是从观众还是商业的视角看，似乎都显更优。

看到 Gemini 1.5 架构与理想的搜索模式的神似之处，也正值搜索被重构之时，比如当下谈及最多的 RAG（Retrieval-Augmented Generation）就叫它检索增强式生成吧。因为大模型的上下文限制、缺乏实时性、不掌握专业垂直领域数据这些在信息检索中容易导致知识过期和不懂装懂的幻觉，RAG 应运而生，它将大模型的生成能力和传统搜索引擎的检索能力（也包含外挂的专家数据库）合二为一。不过现在看 RAG 在调遣外部数据方面并非完胜人类，有些网络数据对它是禁地，而人则具有权限（包括白嫖的权限）。比如版权内容、内部系统。

moreye · 发表于 2024-7-13 09:22:32

用kimi提炼了你的文字，并且让她解释了下Gemini 1.5高效的原理和Rag技术。

原理虽然很简单，但确实是一种颠覆式的变革，看了你的文字不知道该说什么，我只想过她的局限，那就扯一点这方面。

她作为人类的产物，自其诞生开始就会被打上社会的烙印，高效只能相对来说，规则决定了她的局限：
1、所有结果都是依据现有已存在的既定数据和内容。就算是量够多，突破也是有限。
2、每次只能给你一个她认为的最优解。这种最优解是依据她的算法，但不一定是我认为的最优解。
3、池子的边界很明显，无法突破现有边界的约束，包括了限制其连接网络的能力，不能违法，不能进入独立的圈子，还有你说的版权以及局域网。
4、如3条因为限制其互联网能力，她现有的池子内并未存在当下最新数据信息，所以有时效的弊端。
5、结果不一定客观，可以被某种意志修改。
6、她的原理也是她的弱点，利用其原理大量投入虚假捏造的数据，污染她的池子。

sap502 · 发表于 2024-7-13 10:03:29

我也试了下，用的是通义，精简并罗列了下：

1、理想搜索模式：
用户查询被智能分类，并导向最相关的垂直搜索引擎。
例如，法律问题直接由法律垂直搜索引擎处理，而不是全网搜索。
2、Google Gemini 1.5：
基于Transformer和MoE（Mixture of Experts）架构。
MoE机制让模型能够选择性地激活与查询最相关的“专家”子网络，提升效率和质量。
3、MoE与垂直搜索相似性：
MoE中的“专家”类似于垂直搜索引擎，专门针对特定领域的查询。
4、Gemini 1.5 vs GPTs：
Gemini 1.5的“专家”是内部训练的，而GPTs可以接入更多元化的外部专业知识源。
外部专业知识源可能使GPTs在多样性方面表现更优。
5、RAG（Retrieval-Augmented Generation）：
结合大语言模型生成能力和传统搜索引擎的检索能力。
目的是克服大模型的上下文限制、缺乏实时性和专业领域知识不足。
RAG在访问某些受限数据（如版权内容、内部系统）时仍有局限性。

貌似通俗并且和内容更加相关一点

sap502 · 发表于 2024-7-13 10:04:07

sap502 发表于 2024-7-13 10:03
我也试了下，用的是通义，精简并罗列了下：

1、理想搜索模式：

相对于上面那个KIMI的回答来说

浅谈 Gemini 1.5 与高效的搜索的技术性实现

浏览过的版块