Google 搜索背后的数据

2020年9月2日 03:22:04Linux大全评论551 views阅读模式

对于互联网用户来说，搜索是一件非常简单的事情。在搜索框输入关键词，回车（或点击搜索框），等待。而对于搜索公司来说，这是一个复杂的技术问题。从你开始搜索到获得结果的短暂时间里，究竟发生了什么？从 Google 发给 Mashable 网站的这副信息图里，我们可以了解到一些相关的数据。

搜索之前

在你进行搜索之前，Google 的搜索爬虫已经走遍了整个网络，它们从一个链接跳到另一个链接，将数据带回 Google 的服务器。网络就像是一本书，Google 的工作就是为图书建立目录。

Google 建立的目录，其容量已经超过 1 亿 GB。目前为止，Google 已经花费了 100 万个小时来构建目录。

搜索之时

从查询开始到获得结果，搜索查询的平均旅行路程是 1500 公里。在此过程中，它可能经过全球不同的数据中心。根据 Google 的说法，1500 是一个平均数字，具体到每次搜索产生的路程不会这么长，因为 Google 总是会寻找最近的数据中心。在用户键入搜索查询的时候，Google 就开始提供对查询的预测，以减少键入时间，这就是 Google Instant。

排名

Google 的排序算法会根据 200 多个信号来决定相关结果。每年，Google 对排序算法有 500 多项改进。这些信号包括：

网页内容的新鲜程度；网站内容的质量；网页的地址和标题；其它网站对某特定站点的链接，以及这些链接的权威性；最好的搜索结果是什么，网页、图片、视频、新闻、个人结果等；网页上的单词；拼写检查；个性化（与你关联的人推荐的结果）。

搜索结果

搜索结果根据相关性排序，同时，Google 还提供了网页预览功能。

Solaris 10下开启root远程访问的步骤

Solaris 10下开启root远程访问的步骤

卸载Linux系统分区经验

卸载Linux系统分区经验

Git 分支的创建、合并、管理和删除

Git 分支的创建、合并、管理和删除

JPPF 4.2.4 发布下载，Java 并行处理框架

JPPF 4.2.4 发布下载，Java 并行处理框架

Hibernate ORM 5.0.0.Beta2 发布下载

Hibernate ORM 5.0.0.Beta2 发布下载

Android短信应用——短信信息实时获取

Android短信应用——短信信息实时获取

inotify与rsync对服务器进行实时同步之sersync

inotify与rsync对服务器进行实时同步之sersync

FFmpeg多个未知细节安全漏洞

FFmpeg多个未知细节安全漏洞

Java后台JOSN转换为Stirng

Java后台JOSN转换为Stirng

Linux下Samba服务器搭建实例

Linux下Samba服务器搭建实例

本文由企鹅博客发表于 2020年9月2日 03:22:04
转载请务必保留本文链接：https://www.qieseo.com/272376.html

发表评论