`
Ryee
  • 浏览: 284801 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Google是如何搜集互联网信息

阅读更多

如果你问别人什么是力量。培根会说“知识就是力量”,Google会说“信息就是力量”,某人会说“隐私就是力量”。毋庸置疑,Google早已认识到信 息(数据)的力量。相信其他公司,不管是互联网公司,还是其他类型公司,多多少少都应该意识到这一点了。否则,哪里会出现贩卖用户资料的案件?

 

Google信息收集渠道

  Google的使命是:“整合全球信息,让人人可用,人人受益”。它也正在很好地兑现这个诺言。然而,Google正在收集的信息似乎比我们意识到的还要多。

  • 1. 搜索 (网页、图片、新闻和博客等)- 众所周知,Google是全球最受欢迎的搜索引擎,其全球市场占有率几近70%(比如,美国本土占66%)。Google追踪所有的搜索,其现在的搜索方式也越加个性化,个性化势必将越来越细化。
  • 2. 搜索结果中的点击 - Google不仅能知道我们要找什么,它也知道我们点击了哪些搜索结果。(编者注:这个做SEO的朋友应该很清楚,可以从Google Analytics中知道。)
  • 3. 网页检索 - Google的网页爬虫Googlebot就是一只不知疲倦的小蜜蜂,一直不停地“品读”和收录数十亿的网页。
  • 4. 网站分析 - Google Analytics是目前最受欢迎的网站分析工具。因其免费并支持多种高级特性,全球大量网站正使用它。
  • 5. 广告服务 - Adwords和Adsense是Google财务成功的基石,但它们也给Google提供了大量的有价值的数据。网民点击了那些广告,广告主在竞争哪些关键字,哪些关键字最值钱等等。这些信息都是非常有用的。
  • 6. 电子邮件 - Gmail是全球三大电子邮件服务之一,面临着来自微软的Hotmail还有雅虎的Email的竞争。邮件内容,包括发送内容和接收内容,都是可以解析和 分析的。即使是从安全角度来看,这也是Google的一项优秀服务。Google的邮件安全服务——Postini,要从海量Gmail用户中,接收超大 量的数据,包括垃圾信息、恶意软件和邮件安全趋势数据。(编者注:2007年,Google以六亿二千五百万美元的价格收购网络安全服务商 Postini,以此为Google的小型商务客户提供更好的电子邮件安全服务。)
  • 7. Twitter - “你说有的Twitter消息都是我们的”,这句话用来解释早期的网络快速传播现象(又称“网络爆红现象”)。在09年和Twitter达成交易后,Google可以直接访问Twitter上所有的消息。
  • 8. Google应用服务 (文档、电子表单和日历等) - Google的办公套件有很多用户,它当然也是Google的一个数据收集来源。
  • 9. Google公开的个人资料 - Google鼓励你把你的个人资料在网络上公开,这些资料包括你活跃在哪些社交网站(Facebook或Linkedin),你的个人主页和在线图片等等。
  • 10. Orkut - 虽然Google的社交网络还并不是很成功,但Orkut在巴西和印度还是有很多成功。(编者注:为什么还没有成功?可参见伯乐在线此文:《Google的社交网络为什么还没有成功 》。)
  • 11. Google Public DNS - Google2009年年末推出的DNS服务并不只是帮助网民获得更快的DNA解析,也同时帮助Google自己。因为从这项服务中,Google可以获得大量的统计数据,比如网民访问了哪些网站。
  • 12. Chrome浏览器 - Chrome可以收集你的浏览器行为,还有访问哪些网站。
  • 13. Google财经 - 除了财经数据之外,用户在Google财经上搜索的信息和使用的信息都是Google的重要数据。
  • 14. YouTube - 这个目前是全球最大最受欢迎的视频网站,为Google所有。它也向Google提供了大量的用户观看习惯方面的数据。
  • 15. Google翻译 - 帮助Google完善其自然语言解析和翻译。
  • 16. Google Books - 虽然现在不是很庞大,但有潜力帮助Google知道网民阅读习惯和他们想阅读什么东西。
  • 17. Google阅读器 - 目前为止是全球最受欢迎的Feed阅读器。你订阅了哪些RSS种子?你在看哪些博文?Google会知道的。
  • 18. Feedburner - 很多博客都使用Feedburner来公开其RSS种子。Google追踪Feedburner的每一条链接。
  • 19. Google地图和 Google Earth - 你对哪些地方感兴趣?(Google也会知道的)
  • 20. 你的联系人网络 - 你在Gtalk和Gmail等上的联系,组成了一张错综复杂的用户网。如果他们都使用Google,网络映射更为深刻。虽然我们不知道Google是否做了这个,但这上面的数据是可以收集的。
  • 即将推出的 - Chrome OS等Google更多可能成功的产品。
  • 刚推出不久的 - 即时搜索和Goo.gl等服务
  • 已经消亡的 - Google Wave等(虽然消亡了,应该死前收集了一些数据吧。)

造访Google数据库

  值得称道的是,Google正通过各种服务来利用其收集的数据,进一步为你提供服务。

  • Google趋势
  • Google网站趋势
  • Google搜索解析
  • Google广告计划
  • 其他诸如Wonder Wheel这样的搜索工具


  如果Google能公布如此之多的数据,可以想象一下数据量有多大,还有Google所知道的细节程度有多深。而且这些服务也能向Google提供更多的数据,比如我们对哪些趋势感兴趣,我们在找哪些网站等。

  在使用Google趋势等这些工具的时候,发现一个有趣的现象:我们几乎可以知道一切,但就是无法知道Google自身的产品。比如,“Goolge广告计划”和“Google网站趋势”并不显示Google自身站点的信息,但你可以找到其他站点的信息。

 

 

分享到:
评论

相关推荐

    Google是如何搜集互联网信息的.docx

    以下是 Google搜集信息的渠道: 1. 搜索: Google 是全球最受欢迎的搜索引擎,其全球市场占有率几近 70%。 Google 追踪所有的搜索,其现在的搜索方式也越加个性化,个性化势必将越来越细化。 2. 搜索结果中的点击...

    GOOGLE邮箱搜集器

    总结来说,谷歌邮箱搜集器是一个利用网络爬虫技术从互联网上搜集与特定关键词相关的邮箱地址的工具。在使用时,需注意数据隐私法规、电子邮件营销的最佳实践以及工具的正确使用方式,以确保业务操作的合法性与有效性...

    入侵,用Google来收集信息

    首先,我们要明白,Google是互联网上最大的搜索引擎,拥有海量的索引数据,这使得它成为搜集信息的理想工具。攻击者可以利用特定的搜索技巧和语法,如双引号(精确匹配)、减号(排除关键词)、site(指定网站搜索)...

    从百度谷歌相继押宝信息流,看未来移动互联网发展趋势.pdf

    根据所给标题和描述,“从百度谷歌相继押宝信息流,看未来移动互联网发展趋势”是一篇探讨信息流对移动互联网未来发展趋势影响的分析文章。内容主要围绕百度和谷歌两大互联网巨头在信息流领域的战略部署和布局展开,...

    从百度谷歌相继押宝信息流,看未来移动互联网发展趋势.zip

    标题中的“从百度谷歌相继押宝信息流,看未来移动互联网发展趋势”揭示了本文的核心议题:两家全球知名的科技巨头——百度和谷歌,都在信息流领域投入重注,这暗示着移动互联网的未来走向。信息流是指用户在社交媒体...

    谷歌邮箱搜集GoogleSearcher2.3

    谷歌搜索引擎作为全球最大的网络搜索平台,其索引了海量的网页信息,其中包括许多公开的电子邮件地址。GoogleSearcher2.3利用这一特性,通过特定的关键词搜索策略,能够在遵守谷歌使用条款的前提下,有效地抓取与...

    google谷歌拼音输入法

    在此背景下,Google谷歌拼音输入法应运而生,为中文输入带来了革新。 谷歌拼音输入法是Google公司开发的中文输入工具,旨在为用户提供一种高效和智能的汉字输入体验。其核心优势在于智能化的拼音识别和联想技术。当...

    谷歌副总裁:Google+已死是一种误解.docx

    布拉德利·霍洛维茨代表谷歌所传递的信息非常明确:Google+是一个深思熟虑、与谷歌整体战略紧密相连的社交网络平台。尽管面临挑战,但谷歌对Google+的未来充满信心,并将继续推进其发展,致力于发挥其在谷歌产品生态...

    Google分布式计算论文收集

    本资源"Google分布式计算论文收集"涵盖了Google在该领域的一些重要研究成果,包括Google File System(GFS)、MapReduce、BigTable,以及Percolator、Pregel和Dremel等系统。 1. Google File System (GFS):GFS是由...

    第三节 收集敏感信息-01

    总结:收集敏感信息是渗透测试的重要一步,在进行技术层面情况下的测试之前,应该先进行更多的信息收集。通过 Google Hacking 语法、HTTP 响应收集 Server 信息和 Github 信息泄露,可以快速找到目标站点的漏洞和...

    google hack全套软件

    6. **Google 蜘蛛**:这可能是一个网络爬虫工具,模拟Google搜索引擎的行为,遍历互联网上的页面,寻找特定的模式或信息,如公开的目录、可下载的文件等。 7. **Alt-Google**:与第一个"Alt-Google"类似,这可能是...

    2-2019051114-李芷靖-网络信息收集1

    《网络信息收集:从基础到实践》 网络信息收集是网络安全领域中的基础步骤,它涉及对网络资源的全面...在这个数字化时代,掌握网络信息收集技能不仅对网络安全专业人士至关重要,也是每个互联网用户自我保护的基础。

    google商业模式分析.ppt

    通过网络,谷歌能够收集和分析海量用户行为数据,进而将这些信息转化为广告价值。广告不仅仅是一种营销手段,更是谷歌盈利的关键。因此,无论是YouTube、移动互联网还是其他服务,谷歌都致力于寻找新的货币化途径。 ...

    Google HacksGoogle Hacks

    3. **Google黑客工具**:如Google Hacking Database (GHDB)是一个收集公开可用的Google搜索技巧的数据库,用于寻找特定类型的公开信息。 4. **Inurl和Intext**:这些是Google的搜索语法,分别用于查找URL中和页面...

    模型6讲稿pptppt信息化教学资源的收集与整合.zip

    信息化教学资源的收集与整合不仅涉及资源本身的搜集,更涉及对其有效性的评估、分类、存储和使用。这一过程对于构建适应性强、可扩展性高的教学模式至关重要。通过高质量的信息化教学资源,教师可以更好地适应学生...

    谷歌嗅探扩展 - 猫抓

    在互联网世界中,嗅探指的是通过特定工具或技术监测网络流量,以获取数据包中的信息。在猫抓插件的语境下,嗅探是指自动检测并提取网页中的链接,这使得用户无需手动复制粘贴,从而提升了工作效率。 猫抓Chrome插件...

    Google Earth 特殊地理坐标收集贴

    在互联网技术高度发达的今天,地理信息系统(Geographic Information System, GIS)已经成为人们获取地理信息的重要工具之一。其中,Google Earth作为一款知名的地球可视化软件,能够让用户通过互联网浏览全球各地的...

    Google.Hacks.探索和利用全球信息资源的技巧和工具

    2.及时从Google收集网络快照 3.搜索结果视觉化 4.拼写检查 5.Google电话簿:让Google的手指为你指路 6.查找定义 7.查找信息所在的目录 8.搜索所有基本的关键词 9.搜索表单妙用 10.比较Google和Yahoo!的...

    谷歌最常见插件

    1. **内容聚合**:掘金插件能够自动从互联网上收集并整合各种技术博客、设计文章和产品新闻,提供一站式阅读体验,减少了用户在不同平台间切换的时间。 2. **个性化推荐**:根据用户的兴趣和浏览历史,插件会智能地...

Global site tag (gtag.js) - Google Analytics