搜索引擎是您访问Internet的门户。他们在网站上收集大量信息,对其进行分解,然后决定其对特定查询的回答程度。但是,由于要筛选的数据太多,搜索引擎实际上如何工作?
为了发现组成互联网的数十亿个网站,对其进行分类和排名,搜索引擎采用了复杂的算法来决定任何页面的质量和相关性。这是一个涉及大量数据的复杂过程,所有数据都需要以易于最终用户消化的方式呈现。
搜索引擎通过基于用户查询查看众多不同的排名因素来解析所有这些信息。这包括与用户键入的问题的相关性,内容的质量,站点速度,元数据等。每个数据点组合在一起,以帮助搜索引擎计算任何页面的整体质量。然后根据网站的计算结果对网站进行排名,并显示给用户。
了解搜索引擎进行这些决策的幕后流程,不仅可以帮助您了解某些内容的排名为什么很好,还可以帮助您创建具有更高排名潜力的新内容。
让我们看一下构建每种搜索引擎算法的一般步骤,然后分解四个顶级平台以了解它们的工作方式。
搜索引擎如何工作?
为了提高效率,搜索引擎需要准确了解可用的信息类型,并以逻辑方式将其提供给用户。他们完成此操作的方式是通过三个基本操作进行的:爬网,索引编制和排名
搜索引擎工作流程
通过这些操作,他们可以发现新发布的内容,将信息存储在其服务器上,并根据需要进行组织。让我们分解一下这些操作中发生的一切:
1) 抓取:搜索引擎发出Web抓取工具(也称为bot或Spiders)来查看网站内容。网络爬虫密切关注新网站和最近已更改的现有内容,网络爬虫会查看URL,站点地图和代码等数据以发现所显示内容的类型。
2) 索引:网站被爬网后,搜索引擎需要决定如何组织信息。编制索引的过程是他们检查网站数据中正面或负面排名信号并将其存储在服务器上的正确位置。
3) 排名:在建立索引过程中,搜索引擎开始决定在搜索引擎结果页面(SERP)上何处显示特定内容。通过根据最终用户对质量和相关性的查询评估许多不同因素来完成排名。
在此过程中将做出决定,以确定任何网站可以潜在地提供给最终用户的价值。这些决策由算法指导。了解算法的工作原理有助于您创建在每个平台上排名更高的内容。
按平台细分搜索引擎算法
每个搜索引擎都会以不同的方式显示搜索结果。我们将看一下当今市场上排名前四的平台,并细分它们如何决定内容质量和相关性。
百度搜索算法
百度是地球上最受欢迎的搜索引擎。他们的搜索引擎通常拥有90%以上的市场,每天在其平台上大约进行35亿次个人搜索。尽管众所周知他们的算法是如何工作的,但百度确实提供了一些有关其如何在结果页面中对网站进行优先级排序的高级上下文。
每天都会创建新网站。百度可以通过以下方式找到这些页面:链接来自他们先前已爬网的现有内容,或者网站所有者直接提交其站点地图时。现有内容的任何更新也可以通过要求它们重新爬网特定的URL来提交给百度 。这是通过百度的Search Console完成的。
尽管百度并未说明爬网的频率,但最终还会找到与现有内容链接的任何新内容。
网络搜寻器收集到足够的信息后,会将其带回百度进行索引。
建立索引始于分析网站数据,包括书面内容,图像,视频和技术站点结构。百度正在寻找正面和负面的排名信号,例如关键词和网站更新,以尝试了解他们抓取的任何页面的全部内容。
百度的网站索引包含数十亿个页面和1亿千兆字节的数据。为了组织这些信息,百度使用了称为RankBrain的机器学习算法和称为Knowledge Graph的知识库。所有这些共同帮助百度尽可能为用户提供最相关的内容。索引编制完成后,他们将继续进行排名操作。
到目前为止,在用户与百度的搜索功能进行交互之前,所有事情都会在后台完成。排名是根据用户搜索的内容而发生的操作。当有人执行搜索时,百度会考虑五个主要因素:
1) 查询含义:这确定任何最终用户提出问题的意图。百度使用它来确定某人执行搜索时正在寻找什么。他们使用基于过去搜索和使用行为的复杂语言模型解析每个查询。
2) 网页相关性: 百度确定了用户搜索查询的意图后,便会检查排名网页的内容,以找出最相关的网页。这样做的主要驱动力是关键词分析。网站上的关键词必须与百度对用户提出的问题的理解相匹配。
3) 内容质量:匹配关键词后,百度会更进一步,并在必要的网页上检查内容的质量。通过查看给定网站的权限及其页面排名和新鲜度,这可以帮助他们优先考虑哪个结果优先。
4) 网页的可用性: 百度将易于使用的网站排在优先位置。可用性涵盖了从站点速度到响应速度的所有内容。
5) 其他上下文和设置:此步骤可根据百度平台内过去的用户参与度和特定设置来定制搜索。
仅因为百度在其索引中的每个页面上存储了信息,才有可能获得这些结果。在用户执行搜索之前,百度已对网站进行了审查,以找出它们与之匹配的关键词和意图。通过该过程,可以轻松进行搜索时快速填充结果页面,并帮助百度提供尽可能相关的内容。
作为周围最受欢迎的搜索引擎,百度或多或少建立了搜索引擎如何看待内容的框架。大多数营销人员专门针对其内容进行量身定制,以使其在百度上排名,这意味着他们可能会在其他平台上错失良机。
必应搜索算法
微软专有的搜索引擎Bing使用称为“ 空间分区树和图(SPTAG)”的开源矢量搜索算法来显示结果。这意味着他们的方向与百度基于关键词的搜索完全不同。
开源意味着任何人都可以查看构成Bing搜索结果并发表评论的基本代码。这种开放模型与百度对其算法的严格控制相反。代码本身分为两个单独的模块-索引生成器和搜索器:
索引生成器:用于将网站信息分类为向量的代码
搜索者: Bing在搜索查询和索引中的向量之间建立联系的方式
Bing和百度之间的第二个大差异是信息存储和索引方式的核心。Bing并非像百度这样的关键词优先模型,而是将信息分解为称为矢量的单个数据点。向量是概念的数字表示;这个概念是必应搜索结构的基础。
对Bing的搜索查询基于一种称为“ 近似最近邻居”的算法原理,该原理使用深度学习和自然语言模型来基于某些向量彼此之间的接近度提供更快的结果。
如果我们将黄点视为用户查询,则绿点是最接近的邻居,然后是蓝点。跟踪橙色箭头,我们可以看到Bing的算法如何确定与用户搜索最相关的信息。
尽管驱动Bing的搜索结构的基本原理根本不同,但是构建数据库的过程仍然遵循爬网,索引和排名操作。
Bing搜寻网站以查找新内容或对现有内容进行更新。然后,他们为该信息创建向量以存储在其索引中。从那里,他们着眼于特定的排名因素。与百度相比,最大的区别是Bing 不包含没有排名权限的页面,这意味着如果新页面没有反向链接到具有更大权限的现有页面,则时间排名会更加困难。
有关如何进行爬网和建立索引的更多信息,请参阅Bing的网站站长指南。此页面概述了有关信息类型的概述,如果您想在其平台上进行排名,则最重要
虽然结果在结构上看起来相似,但Bing从不同的网站获取购物和功能片段选择的信息。排名最高的结果也与我们在百度中的搜索结果不同,尽管两者都非常符合我们的意图。
如果您正在考虑为Bing量身定制内容,则应先查看排名最高的网站和功能片段之间的区别。他们的平台对内容的优先顺序与百度的优先顺序不同,这些区别将帮助您理解原因。
了解搜索引擎的工作方式可帮助您创建更好的内容
当您知道不同平台如何显示其结果时,就可以轻松创建具有良好排名潜力的内容。这种理解还可以帮助您诊断为什么其他类型的内容排名比您自己的更好或更差。
我们根据此信息汇总了五个技巧,可以帮助您在每个平台上创建更好的内容:
1) 了解用户意图很重要。我们今天研究的每个平台都会根据内容与用户搜索查询的相关程度来对内容进行优先级排序。
2) 匹配的关键词只会带您到目前为止。在您的内容中包含相关的关键词将有助于搜索引擎更轻松地发现您的内容并为其编制索引,但排名靠前的是为用户提供价值。
3) 了解目标客户的搜索方式。关键词和意图的匹配需要对客户以及他们对您的产品和市场的看法有深入的了解。
4) 新内容有助于提高排名。创建新内容或刷新现有内容 可帮助其排名更高,并提高您作为品牌的信誉。
5) 获得权威链接是有帮助的。链接到您的页面的人越多,它在搜索引擎中显示的效果就越好。这表明它很有价值,并且与它链接到的每个页面的内容有关。
最后,一切都取决于了解您的客户。如果您不知道人们在搜索您的产品时正在寻找什么,则您无法创建排名靠前的内容。