什么叫做重复内容:重复内容通常分为三类之一:精确重复,近似重复和跨域重复。
完全相同: 两个网址具有相同的内容。
近似重复:两段内容的差异很小。
跨域重复:多个域中存在完全相同或几乎相同的内容。
重复的内容可能来自多种不同的因素。在某些情况下,网站许可在其他地方使用的内容;糟糕的站点体系结构缺陷也可能起作用。gi窃会导致内容重复,我认为最常见的原因是CMS问题。
尽管所有这些都会产生问题,但我们必须以特定的方式来处理它们。在开始技巧之前,让我们解决重复内容的后果。
重复页面会给SEO优化带来什么弊端:
浪费的抓取:搜索机器人以抓取预算进入您的网站。如果您有很多重复的内容,那么它将浪费机器人的爬虫预算,并且更少的唯一,良好的页面将被爬取并建立索引。
浪费的链接资产:重复的页面可以获取PageRank和链接权限,但这无济于事,因为Google不会对重复的内容进行排名。这意味着您浪费了这些页面的链接权限。
在SERP中列出的内容有误:没有人确切知道搜索算法的工作原理。因此,如果您有多个页面包含完全或几乎重复的信息,则不必决定要过滤哪些页面以及对哪些页面进行排名。这意味着您想要排名的版本可能会被隐藏。
如何正确的处理网页中的重复内容:
使用301重定向:如果您打算从网站中删除任何重复的内容,这是一种有用的方法。由于其中某些页面可能已收到链接,因此最好将这些页面永久重定向到正确的URL。这将告诉用户,在这种情况下更重要的是,告诉搜索机器人在哪里可以找到合适的内容。
使用robot.txt阻止:通常建议的另一种选择是使用robots.txt文件来阻止重复的页面被抓取。但是,Google不建议使用这种方法,并指出:“如果搜索引擎无法抓取具有重复内容的页面,它们将无法自动检测到这些URL指向相同的内容,因此必须将它们有效地分开对待,独特的页面。”
使用rel =“ canonical”:如果您打算保留重复的内容,那么使用rel =“ canonical”链接元素是一个不错的选择。此步骤告诉搜索引擎内容的哪个版本是“真实”版本。将此标签添加到重复的内容的标题中,这样链接:
这段代码告诉搜索机器人在哪里可以找到真正的内容。