SEO技术:如何消除重复内容

2020.04.02 -

   

在网站SEO领域中,消除重复的内容可能是非常麻烦的一件事情。

重复内容有两种,两种都可能是一个问题:

  • 自身重复是将同一内容在网站上复制了几份产生了不同的URL。通常,这可以由站点管理员和Web开发团队控制。
  • 异地复制是指两个或多个网站发布完全相同的内容。这通常是无法直接控制的,而是依赖与第三方和违规网站的所有者合作。

为什么重复内容有问题?

解释重复内容为什么不好的最好方法是首先告诉您唯一 内容为什么很好。

独特的内容是使自己与其他网站区分开的最好方法之一。当您网站上的内容仅由您自己决定时,您会脱颖而出。你有别人没有的东西。

另一方面,当您使用相同的内容来描述您的产品或服务或在其他站点上重新发布内容时,您将失去独特的优势。

或者,在自身重复内容的情况下,单个页面失去了唯一性的优势。

请看下面的插图。如果A表示在两个页面上重复的内容,并且B到Q表示链接到该内容的页面,则复制会导致拆分链接值。

现在想象一下,如果BQ页都只链接到A页上。所有值都将分配给单个URL,而不是拆分每个链接提供的值,这增加了该内容在搜索中排名的机会。

重复内容图

无论是场内还是场外,所有重复内容都在与自己竞争。每个版本都可能吸引眼球和链接,但如果是唯一的版本,权重将十分集中。

当在Web上的任何地方都只能在单个URL上找到有价值且独特的内容时,该URL最有可能被收录和排名,因为它是该内容的唯一提供者。

现在,有了这种了解,让我们看一下重复内容的问题和解决方案。

异地重复内容

异地复制有三个主要来源:

  • 您在自己的网站上重新发布的第三方内容。通常,这采用制造商提供的通用产品说明的形式。
  • 经您批准,您的内容已重新发布在第三方网站上。这通常是文章分发或反向文章分发的形式。
  • 有人从您的网站上窃取的内容,未经您的许可而重新发布。这就是常说的内容采集,可笑的是目前原创并没有受到搜索引擎的保护。

内容采集

内容抓取工具是重复创建内容中最大的违规行为之一。它可以从其他网站获取内容,然后自行发布。

在大多数情况下,这些网站都在尝试使用您的内容来吸引访问他们自己网站的流量,以吸引人们点击他们的广告。

不幸的是,您没有任何办法让它停止采集。(版权是什么东西?没听说过)

处理此内容的一种方法是忽略它,希望搜索引擎能够分辨出一个高质量网站(您的网站)与该抓取内容所在的网站之间的区别。由于我发现抓取的内容排名高于原始来源,因此一度陷入绝望。

您可以采取以下措施来消除抓取的内容的影响:将内容中的绝对链接(完整URL)用于指向您网站的任何链接。那些窃取内容的人通常不会进行清理工作,因此,至少,访问者有机会访问到您的网站,并增加了外部链接。

您也可以尝试将规范标签添加回源页面(无论如何都是一种好习惯)。如果抓取工具抓取了这些代码中的任何一个,则规范标签至少会为搜索引擎提供一个信号,使其将您识别为发起者。

文章分配

几年前,似乎每个SEO都将其内容重新发布在“电子杂志”上,以此作为建立链接的策略。当搜索引擎严厉打击内容质量和链接方案时,重新发布就被淘汰了。

但是只要有正确的重点,它就可以成为可靠的营销策略。注意,我说的是“营销”而不是“ SEO”策略。

在大多数情况下,任何时候您在其他网站上发布内容时,他们都希望获得该内容的唯一权利。为什么?因为他们不希望Web上出现该内容的多个版本。

这会造成重复的内容问题吗?因为仍然有两个版本的内容,每个版本都有可能生成链接。内容的第一个发布版本通常记为规范版本。在少数情况下,这些发布者将从重新发布该内容的作者网站上的内容中获得更多价值。

通用产品说明

重复内容的某些最常见形式来自每个(几乎每个)卖方都重复使用的产品描述。

许多在线零售商出售与数千家其他商店完全相同的产品。在大多数情况下,产品描述由制造商提供,然后将其上载到每个站点的数据库中,并显示在其产品页面上。

尽管页面的布​​局会有所不同,但大部分产品页面内容(产品说明)都是相同的。

现在,将其乘以成千上万种不同的产品以及成千上万个销售这些产品的网站。

搜索引擎在执行搜索时如何区分一个或另一个?

在纯粹的内容分析级别上,它不能。这意味着搜索引擎必须查看其他信号来确定应该对哪个信号进行排名。

这些信号之一就是链接。获取更多链接,您可以赢得排名。

但是,如果您要与更强大的竞争对手抗衡,那么在将其加入链接构建之前,您可能需要进行漫长的战斗。这使您重新寻找另一个竞争优势。

实现这一目标的最佳方法是花费额外的精力为每种产品编写独特的说明。根据您提供的产品数量,这最终可能会是一个挑战,但最终还是值得的。

看下面的插图。如果所有灰色页面代表具有相同产品描述的同一产品,则黄色代表具有唯一描述的同一产品。

如果您是搜索引擎,那么您想排名哪个?

独特的说明图

自身重复内容

与相似但重复的内容相比,具有唯一内容的任何页面都将自动具有固有的优势。这可能足以超越您的竞争者,但无疑这是不仅在搜索引擎中而且在您的客户中脱颖而出的基准。

从技术上讲,搜索引擎对所有重复内容都一视同仁,因此自身重复内容与非自身重复实际上没有什么不同。

但是自身的是可避免的,因为这是您可以实际控制的一种重复类型。

自身重复内容通常源于不良的网站架构。一个强大的网站架构是一个强大的网站的基础。当开发人员不遵循对搜索友好的最佳做法时,由于这种自我竞争,您可能会失去宝贵的机会来使内容排名。

是的,搜索引擎可以确定应将某些重复内容视为一个相同的内容,并且算法可以在分析您的网站时将其考虑在内,但不能保证一定会。

但是我们不能把希望放在不可控因素之上。现在,让我们深入研究一些常见的自身重复内容问题和解决方案。

问题:产品分类重复

太多的电子商务网站都遭受这种重复。这通常是由内容管理系统引起的,该系统允许您按类别组织产品,其中可以在多个类别中标记单个产品。

这本身并不坏(对访问者来说可能很好),但是这样做时,系统会针对出现单个产品的每个类别生成一个唯一的URL。

假设您正在一个家庭维修站点,并且正在寻找有关安装浴室地板的书籍。您可以通过以下任一导航路径找到所需的书:

  • 首页>地板>浴室>书本
  • 首页>浴室>书本>地板
  • 首页>书籍>地板>浴室

这些都是可行的导航路径,但是当为每个路径生成唯一的URL时就会出现问题:

  • https://www.myfakesite.com/flooring/bathroom/books/fake-book-by-fake-author
  • https://www.myfakesite.com/bathroom/books/flooring/fake-book-by-fake-author
  • https://www.myfakesite.com/books/flooring/bathroom/fake-book-by-fake-author

我见过这样的网站为每个产品创建多达十个URL,从而将一个5k产品网站变成一个具有45k重复页面的网站。那是个问题。

如果上面的示例产品生成了十个链接,那么这些链接最终将被分成三种方式。

而如果同一个产品的竞争对手页面具有相同的十个链接,但只有一个URL,那么哪个URL可能在搜索中表现更好?竞争对手的!

不仅如此,搜索引擎还限制了其抓取带宽,因此他们可以将其用于索引独特且有价值的内容。当您的网站有很多重复的页面时,引擎很有可能会停止抓取,甚至没有索引到您唯一内容的一小部分。

这意味着数百个有价值的页面将不会在搜索结果中显示,而被索引的页面是相互竞争的重复项。

解决方案:主URL分类

解决此问题的一种方法是仅将产品标记为一个类别,而不是多个。这解决了重复性问题,但对于购物者而言,不一定是最佳的解决方案,因为它消除了其他导航选项来查找他们想要的产品。因此,将其从列表中删除。

另一种选择是从URL完全删除任何类型的分类。这样,无论用于查找产品的导航路径如何,产品URL本身始终是相同的,并且可能看起来像这样:

  • https://www.myfakesite.com/products/fake-book-by-fake-author

这可以修复重复项,而不会更改访问者浏览产品的方式。这种方法的缺点是您会丢失URL中的类别关键字。虽然这对SEO的整体带来很小的好处,但是一点点都可以帮助您。

如果您想将解决方案提高到一个新的水平,并在保持用户体验的同时获得最大的优化价值,请构建一个选项,除其他产品外,还可以将每个产品分配到“主”类别。

在浏览主类别时,可以继续通过多个导航路径找到产品,但是可以通过使用主类别的单个URL来访问产品页面。

这可能会使URL看起来像这样:

  • https://www.myfakesite.com/flooring/fake-book-by-fake-author 
  • https://www.myfakesite.com/bathroom/fake-book-by-fake-author 
  • https://www.myfakesite.com/books/fake-book-by-fake-author

尽管确实需要一些额外的编程,但后一种解决方案是最佳的整体解决方案。

规范标签 canonical

您只需为每个产品添加一个字段,即可为您分配一个规范的URL,这只是一种奇特的说法,即“您想在搜索中显示的URL”。

规范标签如下所示:

  • <link rel =“ canonical” href =““ https://www.myfakesite.com/books/fake-book-by-fake-author” />

尽管访问者使用了URL,但每个重复URL上的幕后规范标记都将指向单个URL。

从理论上讲,这告诉搜索引擎不要为非规范的URL编制索引,并确定规范的URL为唯一价值页面,赋予他权重。

这在大多数情况下都有效,但是实际上,搜索引擎仅将规范标记用作“信号”。然后,他们将选择应用或忽略它们。

相关阅读:canonical标签是什么,有什么作用

问题:URL冗余重复

最基本的网站体系结构问题之一是如何在浏览器中访问页面。

默认情况下,几乎可以使用稍微不同的URL访问站点的每个页面。如果未选中,则每个URL都将导致具有完全相同内容的完全相同页面。

仅考虑主页,可以使用四个不同的URL来访问它:

  • http://site.com
  • http://www.site.com
  • https://site.com
  • https://www.site.com

在处理内部页面时,您可以通过添加尾斜杠来获得每个URL的附加版本:

  • http://site.com/page
  • http://site.com/page/
  • http://www.site.com/page
  • http://www.site.com/page/
  • 等等。

每个页面最多有八个备用URL!搜索引擎应该知道所有这些URL都应该被视为一个,但是哪个?

解决方案:301重定向和内部链接一致性

除了我在上面提到的规范标记之外,这里的解决方案是确保您具有所有备用版本的URL重定向到规范URL。

请记住,这不仅是首页问题。同一问题适用于您的每个网站URL。因此,实施的重定向应该是全局的。

确保强制每个重定向到规范版本。例如,如果规范URL为https://www.site.com,则每个重定向都应指向该URL。许多人都犯了错误,添加了如下所示的其他重定向跃点:

  • Site.com> https://site.com> https://www.site.com
  • Site.com> www.site.com> https://www.site.com

而是,重定向应如下所示:

  • http://site.com> https://www.site.com/
  • http://www.site.com> https://www.site.com/
  • https://site.com> https://www.site.com/
  • https://www.site.com> https://www.site.com/
  • http://site.com/> https://www.site.com/
  • http://www.site.com/> https://www.site.com/
  • https://site.com/> https://www.site.com/

通过减少重定向跃点的数量,您可以加快页面加载速度,减少服务器带宽并减少一路上可能出现的错误。

最后,您需要确保站点中的所有内部链接也都指向规范版本。

虽然重定向应该解决重复的问题,但是如果服务器或事物实现方面出现问题,则重定向可能会失败。

如果发生这种情况,即使是暂时的情况,仅在内部链接规范页面也可以防止突然出现大量重复内容问题。

最后

SEO最常见的神话之一是重复的内容惩罚。

搜索引擎可能不会积极惩罚重复的内容,但这并不意味着不会因此而产生自然后果。所以在被惩罚之前应该积极解决问题,独特的内容能让您的网站脱颖出来。

本站文章禁止转载,违者必究
阅 213
0

在网站SEO领域中,消除重复的内容可能是非常麻烦的一件事情。 重复内容有两种,两种都可能是一个问题: 自身重复 […]

湘公网安备 43011102001693号

    湘ICP备19003021号-1