搜索 Wiki Rules & Tips
1. 遵守中国大陆相关法律法规
2. Wiki 规范及版本说明 v1.0

提高搜索能力的关键技巧(如何查找可靠出处)

查看: 47648|回复: 61
33 3
徜云 发表于 2017-9-19 17:04:24
本帖最后由 徜云 于 2017-9-20 11:08 编辑

提高搜索能力的关键技巧(如何查找可靠出处)

当进行网络搜索时,有一些很有用的搜索技巧可用来找到最可靠的信息。大多数人比较信任那些出自主要媒体、大学或官方机构网站的信息。下面是一些关键的搜索技巧,让我们更有效地使用搜索引擎,并找到最可靠的出处。

  • 如何核查并找到最有力的信息源
  • 把搜索结果设成100条
  • 利用“网页快照”
  • 知道链接时,可以找到消失的文章或网页的旧版本
  • 只有文本或视频时,如何找到可靠出处
  • 用搜索引擎在单个网站中搜索
  • 利用时间限定功能找原始出处

* 如何核查并找到最有力的信息源

当看到重要的信息,但又不确定它的可信度时,你可以尝试几种方法来核查你所看到的信息。特别是在给朋友写邮件,或者在网上发布一些可能难以让人相信的信息时,如果你能提供可靠的信息出处,则你的朋友或读者一般会更信任你所写或转发的内容。下面是一些技巧来核查信息,并找到最佳的出处。

·选取几个关键词,要能够识别跟主题相关的网页。
·把它们输入搜索框。
·在结果列表中,浏览每一结果条目下的链接。
·找到最可靠的出处。
·用多个搜索引擎(如Google、Bing、雅虎)搜一下,因为它们的结果不一样。
·在结果页的最后,如果你看到“重新搜索以显示省略的结果”,则值得点击它来查看更多结果。

若没有直接找到好的出处,则请同时尝试搜索引擎的常规搜索和新闻搜索功能。默认的常规搜索的结果更完整,但经常有许多来源不可靠的结果。新闻搜索则把你的搜索限定到更可靠的新闻站点,但经常遗漏重要的信息来源。如果你所搜的信息是最近的新闻,则可以从新闻搜索页面开始搜索。
请注意,大多数搜索引擎的“新闻搜索”只能搜到近一段时间的结果,所以你没法在“新闻搜索”中搜到比较老的新闻文章。

* 把搜索结果设定成100条

为了让搜索更易于进行,可以将搜索引擎设定为显示100条结果。下面是谷歌的设置方法,其他搜索引擎也类似。

·找到“搜索设置”的选项,位于谷歌搜索页右下角的设置菜单。
·把每页搜索结果数设置为100,这样让人更易于查看更多结果。
·在同个页面,选择“在新的浏览器窗口中打开所选的每条搜索结果”。
·点击“保存”。

* 利用“网页快照”

若你点击一条搜索结果时出现空白页或错误提醒,这个网页一般仍可由网页快照来查看。找到“网页快照”的按钮,在谷歌上是位于每条结果第二行链接末尾的绿色小三角。百度也类似。如果没有网页快照(搜索引擎不时会改变查看网页快照的方法),那就搜索一下怎么查看网页快照。由于网页快照很可能会在原始网页移除很久后被清除,对于重要的信息,你最好下载和保存整个网页快照的页面(浏览器一般都有保存页面的功能)。

* 知道链接时,可以找到消失的文章或网页的旧版本

互联网档案馆(Internet Archive)是一个非常有用的资源。用这个网站可以找到被删除的重要页面的副本。如果一个网页被改变过,并且你想查看这个网页早期的版本,那么你也可以用这个网站来实现目的。使用方法:

·复制已经消失或变更过的网页地址。
·打开http://www.archive.org (被墙了)。
·把复制的链接粘贴到搜索框中,点击“BROWSE HISTORY”(浏览历史)。
·点击结果中呈现的任何日期,查看那些日期的原始网页。

请注意,任何网站都可以要求不被列入互联网档案。尽管很少网站这么做,但不幸的是,许多主要媒体网站都这么做了。若是这样,你仍能够利用原文内容从其他网站找到原文。下面将介绍这种方法。

* 只有文本或视频时,如何找到可靠出处

当一篇文章声称自己是出自主要媒体、官方或其他可靠来源,但未提供出处链接,或者只提供了不知名网站的链接时,通过字符串搜索,你仍可以容易地在出处网站找到原文。

·从文章内容中复制一串文字,7到10个英文单词(一二十个汉字)。一般来说,最好复制那些较不常见的话语。
·把这一串字符粘贴到搜索框中,并在字符串两端加上双引号(“”)。这样就能把搜索目标锁定在那些出现了完全一样的字符串的网页上。
·点击搜索。
·浏览结果中每个条目下的链接,找到可靠的新闻站点。
·如果条目太多,并且新闻是最近发生的,则可以尝试新闻搜索。
·对于视频,可用同样的方法,在搜索框输入从视频中听到的一串文字。

对于来自像美联社(Associated Press)这类新闻机构的文章,许多人可能更相信同时被MSNBC、ABC、纽约时报等网站所摘用的文章。通过之前介绍的字符串搜索,一般就能找到由主要媒体网站发布的文章。然后你就能援引可靠出处。记得总是附上链接,以供核实。

请注意,如果一条合法但又重要的美联社文章没有被其他媒体网站摘用,那么你可以推断,这篇文章很可能被相关机构审查掉了。就本文作者(wanttoknow.info站主)过往广泛积累的经验来看,这种情况经常发生在那些让世界权力精英最感到敏感的主题上。若想了解一下许多来自获奖记者的实例,请点击这里(英文)。

* 用搜索引擎在单个网站中搜索

当你想在某个特定的网站上进行搜索,你可以在搜索框中输入“site:”,随后直接输入这个网站的网址链接,不需要引号。接着在链接后打上一个空格,然后输入任何你想要搜索的关键词或字符串。当输入网址时,不需要输入网址前缀“http://www.”,但要确保site后面的冒号(:)与网址之间没有空格。

·例子:site:chongbuluo.com “提高搜索能力”

(字数超标,接下一楼)

(徜云编译,虫部落首发;出处:Search Techniques Key Techniques Improve Your Internet Search Skills



加入社区已有两月,这是首次发帖。很感谢虫子,感谢所有贡献力量的朋友,为大家创建了如此可爱的虫部落。很高兴能与大家一起学习和交流!




 楼主| 徜云 发表于 2017-9-19 17:04:25
本帖最后由 徜云 于 2018-9-19 22:52 编辑

* 结合时间限定功能找原始出处

当看到别人转发了一篇高品质文章,但文中没有创作者信息或原始出处,而你又想知道文章作者或原始出处时,除了用字符串搜索之外,你还可以结合搜索引擎(如谷歌和百度)的时间限定功能来协助自己。具体方法:

• 首先利用上述的字符串搜索来找到相关网页。
• 点击结果页顶部搜索框下方右侧的“工具”,找到时间范围设定。
• 把设定的时间下限逐步往前推移,直到出现的结果越来越少。
• 找到时间最早的那一条结果,往往就是最原始的出处。

注:上述的“字符串搜索”、“限定域名搜索”、“限定时段搜索”除了可以用特殊指令(如引号、“site:”等)来实现外,都可以在谷歌或百度的高级搜索页面实现。百度、搜狗的高级搜索可以直接在快搜中找到。

__________________

练习题

练习题1:很久以前,有位神秘人物“KXINet”写了一本“小众读物”《心网世界》分享在网络上,还专门建立了一个网站,分享了很多宝贵的思想。这本书现在已经很难找到,这个网站也早已消失不见。请问,这个网站在_______年出现,在______年关闭?此外,这位作者写了一首诗,请补全:“细腻敏感,只属于________;________,只缘于敞开心脑之门。”


练习题2:“觉醒字幕组”由于翻译了许多边缘话题的视频和资讯,真假混杂,真相扑朔迷离,因此充满了争议。不管怎样,该字幕组曾翻译并于2012年在国内出版过一本名叫《源场调查》(The Source Field Investigations by David Wilcock)的畅销书。由于出版审查要求,该书在出版过程中被“偷偷”节略了一部分。“觉醒字幕组”曾在其官网公布了一个包括所有被删部分的PDF,但现在下载链接已失效。请问,该失效的PDF下载链接是____________?通过_________或许能够下载到这份PDF?此书有____处被审查剔掉?


练习题3:2016年底,微信上出现一篇名为“中国阶层报告:顶层及最上层仅占0.001%,底层占45%”的文章,其划分中国当代社会阶层的方式很有道理,并且数据似乎挺专业。可惜的是,文中没有提到作者和原始出处。如果有位研究者,很想用此文的阶层划分方法来做社会调查研究,但写论文需要引用出处,为此他很苦恼。你是否能帮他找到这篇文章的最原始出处或作者________及其发布时间________?

答题格式:
①_______;_______;_______;________。
②____________________________;_______;_______。
③_______;_______;
总共耗时______。

(P.S. 欢迎虫友们作答;虽然没啥奖励,但可以测试下自己的“溯源”搜索能力,而且或许会有新奇的发现。答案适时再公布。)
(2018年9月19日更新:答案已经公布在本帖第46楼。)

信息检索宝典.pdf (455.57 KB, 下载次数: 434)
 楼主| 徜云 发表于 2018-9-19 22:48:16
epsilo 发表于 2018-7-28 18:48
快一年了,楼主如果你有时间把搜索答案历程整理出来,我顶你上去

已经整整一年,参加答题的朋友不多。应论坛朋友的建议,现公布答案如下:


①2004;心的品质;爱与力量;2007。
http://bbs.awaker.cn/TheSourceFiledInvestigation.pdf;Wayback Machine;7。
③豆瓣;2009年10月10日
————————————
过程:
①首先提取关键词:KXINet、心网世界,直接百度;然后,浏览第一页的结果,可以发现可能的网站地址,www.kxinet.net;接着,使用网站时光机(Wayback Machine; https://web.archive.org/;得翻过GFW);最后,在该档案中找到该网站出现和停用的年份,并浏览首页,即可发现空缺诗句。(注:此题考察关键词提取能力,以及网站时光机的运用。)

②首先搜索信息源头/发布者:觉醒字幕组,直接百度,发现该发布者的官方网站www.awaker.cn/;然后,限定域名百度搜索:"源场调查" site:awaker.cn;接着,从首页可以找到几条新闻,其中有一条是出版信息,http://www.awaker.cn/3293.html,其中提供了删减内容的链接,http://bbs.awaker.cn/TheSourceFiledInvestigation.pdf;由于链接失效,故使用网站时光机来碰碰运气看;结果看到有一条记录,但不巧已经是失效的链接。(注:虽然记不大清楚,本人于去年出题之前就通过此种方法或是网页快照碰巧成功下载到了该文档,见附件;但到去年出题之时,该链接就失效了。可见搜索中也有运气成分。此题考察的是域名限定搜索,以及网站时光机或网页快照。)


③首先百度:中国阶层报告:顶层及最上层仅占0.001%,底层占45%,找到相关文章;然后,选择文中一句比较独特的话语,如开头的“本工作室仅以官方和知名国内外机构统计数字为基准”,进行引号限定搜索;然后,在结果页面,使用搜索引擎提供的时间限定功能(谷歌或百度皆可),把下限的时间段逐渐往前推移,比如有一条结果是2009年10月13日的,那么,就可以把下限设置成2009年10月13日,看看网络上有没有更早的网站。百度上现在只能追溯到两条2009年10月12日的,但那是二手转载的网页;而谷歌上能搜到2009年10月10日的一条源自豆瓣的网页,不过打开链接发现,实际上也是转载的。此时已经穷尽网络,所以只能溯源到此。(注:实际上,去年在出题目之时,本人还是能够找到10月10日的豆瓣最初的那个首发网页的,故推测过去一年可能被删掉了。此题考察引号限定搜索能力,以及溯源能力。)
________________________

若有进一步问题,欢迎大家留言交流~


《源场调查》删节内容.pdf

461.2 KB, 下载次数: 34, 下载积分: Bit -1

删减部分

派的奇迹 发表于 2017-9-21 21:20:43
①2004_;_2007;_心的品质__;_爱与力量__。
②_http://bbs.awaker.cn/TheSourceFiledInvestigation.pdf;电驴__;_______。
③__cnblab_(360图书馆)http://www.360doc.com/content/09/1012/22/80642_7190428.shtml;2009年10月12日_;_
初步答了一下,第二题下载链接确实不好找
奔跑吧小葵 发表于 2018-7-11 15:45:59
感谢楼主分享,受益匪浅!
 楼主| 徜云 发表于 2017-9-19 17:24:13
本帖最后由 徜云 于 2017-9-19 17:26 编辑

两个例子——关于分享观点时援引可靠出处的重要性:


得到较多赞的答主往往会在回答中附上可靠的出处。
HaileyHabitsW 发表于 2017-9-19 19:53:54
感谢分享
某某 发表于 2017-9-19 22:47:26
感谢分享
hlng 发表于 2017-9-20 06:54:29
很实用,感谢分享
拖油瓶 发表于 2017-9-20 07:54:16
技巧很基础,一直在用=,=
逆光奔跑 发表于 2017-9-20 08:58:55
楼主很棒,学习了:)
小晋 发表于 2017-9-20 10:15:53
写的很棒呐~赞赞赞
苏葛月 发表于 2017-9-20 11:49:38
感谢分享:loveliness:
KouIuray 发表于 2017-9-20 22:39:12
{:5_150:}感谢感谢
777777c 发表于 2017-9-21 13:05:24
感谢分享!
Quark 发表于 2017-9-22 08:13:15
感谢感谢!
可乐smile 发表于 2017-9-22 14:31:58
哇,超酷,感觉你可以和虫子一起做那个搜索达人的课程呀,他太辛苦啦
可乐smile 发表于 2017-9-22 14:58:19
①_2004______;_2017______;____心的品质___;___爱与力量_____。
好难,后面的都不太会,心塞
开往春天的地铁 发表于 2017-9-22 17:11:06
解题思路,过程最重要!感谢分享!
海痞亮 发表于 2017-9-23 10:39:40
好多方法和技巧,自己也探索过,很实用的
lake 发表于 2017-9-23 14:57:41
棒棒哒,感谢分享
青衫依旧 发表于 2017-9-23 19:27:53
感谢分享,学习一下!期待有更多这样的干货课程!
开往春天的地铁 发表于 2017-9-27 22:19:43
感谢分享!
问题儿童团团长 发表于 2017-9-28 12:51:35
感谢分享
馋师小哥 发表于 2017-9-29 09:51:20 来自手机
感谢分享:D
Stacey 发表于 2017-12-7 17:58:00
谢谢分享~!
Stacey 发表于 2017-12-7 17:59:03

请问怎样才有权限下载?
alineline 发表于 2017-12-10 18:28:45
楼主很棒,学习学习
帼辣里不长番茄 发表于 2017-12-10 21:42:11
练习题2:“觉醒字幕组”由于翻译了许多边缘话题的视频和资讯,真假混杂,真相扑朔迷离,因此充满了争议。不管怎样,该字幕组曾翻译并于2012年在国内出版过一本名叫《源场调查》(The Source Field Investigations by David Wilcock)的畅销书。由于出版审查要求,该书在出版过程中被“偷偷”节略了一部分。“觉醒字幕组”曾在其官网公布了一个包括所有被删部分的PDF,但现在下载链接已失效。请问,该失效的PDF下载链接是___http://bbs.awaker.cn/TheSourceFiledInvestigation.pdf_________?通过_________或许能够下载到这份PDF?此书有____处被审查剔掉?


Wopcat 发表于 2017-12-13 15:27:08
温故而知新,谢谢楼主的努力
脑壳开过瓢 发表于 2017-12-14 14:23:52
感谢分享:Q
星月清朗 发表于 2018-1-17 12:02:07
感谢楼主的分享    不过这样大量文字的内容看得人头晕
希望后期能增加操作的截图或者录屏gif
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则蛙先知 - AI 玩家社区 🚧

Build with for "make search easier" Copyright © 2013-2024. Powered by Discuz! GMT+8, 2024-3-28 19:32

快速回复 返回顶部 返回列表