摸鱼 发现创造 Rules & Tips
1. 遵守中国大陆相关法律法规
2. 推崇「哥伦布式」的发现
3. 创造不是复制粘贴,是自我表达

趣谈 Google 革命性的 PageRank 算法

查看: 6685|回复: 6
4
虫子 发表于 2018-5-1 17:57:16
写此文的灵感来自于某个阳光明媚的午后透过巨大的落地窗看到的远处玻璃幕墙上的幻想剧。

PageRank 对于 Google 而言绝对是一项革命性的发明,不夸张地说:是它奠定了 Google 在搜索领域独领风骚的基石。

曾几何时,因为国内厂商对于革命性和黑科技打擦边球式的滥用,致使它们的概念更加模糊。而用 PageRank 来解释则会让我们对革命性一词的理解变得心中有数。

在 PageRank 算法出现之前,人们通过搜索引擎每次获得的十条结果中,一般仅有两三条相关;而当时还在斯坦福大学实验室中的应用了 PageRank 的 Google 搜索,则将这种相关结果提升到七八条的水平。这是量的飞跃!然而,就是这样一个革命性的天才算法,其核心思想却是十分的通俗易懂:

在互联网中,如果一个网页被很多其它网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高。

这是最原始的 PageRank 形态,类比到人作为高级动物的进化初期,在一个部落或族群中,如果一个人和很多其他人有社交关系,说明他受到普遍的承认和信赖,那么他的人缘、人品、威望就高,最高者为首领。

随着人类社会的发展,物质、精神需求也在不断发生变化,呈现出人的复杂性。如果网页一样,为了利益,网页也开始欺骗,骗点击、刷更新。以期获得更高的排名,如何识别并处置此类垃圾网页自然需要一个更健壮的 PageRank 来实现。

权重!一个网页的排名越高,则权重越大。

由此看出权重的度量是来自网页的排名,所以导致搜索引擎在计算结果中网页的排名时要用到网页自身的排名。如何破解这个先有鸡还是先有蛋的哲学问题,Google 的创始人之一的谢尔盖·布林采用了线代中的二维矩阵相乘。

The Anatomy of a Large-Scale Hypertextual Web Search Engine

可以看出 Google 的两位创始人对于 PageRank 各有贡献,而拉里·佩奇则因为 PageRank 算法在30岁时就当选美国工程院院士,是继比尔·盖茨和史蒂夫·乔布斯之后又一位当选院士的辍学生(可别说虫子又想骗你去辍学==!)

Google 创始人

Google 创始人
杂食类蛛 发表于 2018-5-2 10:25:06
脑回路应该有些清奇
你们关注的多是有效信息呈现 有用的先放上去
我思考的是对垃圾信息的问题
僵尸电脑的存在 大数据收集的信息垃圾 即将无处不在的电子眼 物联网收集的庞大数据
这些都是数据 一样是01电信号 那么 这些信息被用来冲击正常生态的时候会发生什么?
单纯的屏蔽需要耗费多少资源进行鉴别?
数据垃圾或许有一天也是数据武器(希望不要一语成谶)
gpgp001 发表于 2018-5-1 20:14:19
吴军博士的《数学之美》里也有讲到呢,关于具体实现,涉及到线代里的矩阵。

大家可以去翻翻,吴军老师的书还是不错的。
客尘 发表于 2018-5-2 08:37:39
补了下课,看了下PageRank 算法的缺点,貌是是对去中心化的讽刺。用于社交网络人际关系处理,会造成大量明星帐号的泛滥吗。
琦六七 发表于 2018-5-2 11:22:26
很多经典算法很简单很易懂,但是解决某类问题得时候特别有用!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-5-5 03:10

快速回复 返回顶部 返回列表