资讯中心

网站优化

首页 >技术资讯 > 网站优化 >

谷歌SEO:网址太相似,会被认定为重复页面,不予收录

  最近很多客户朋友都在问:网站里有重复页面,会不利于谷歌SEO么?

谷歌SEO:网址太相似,会被认定为重复页面,不予收录

  首先我们要清楚什么是重复页面,就是指一个网站中出现相似重复的网站页面内容,判断页面是否重复的标准是谷歌搜索引擎,而不是人。谷歌官方虽未明确说重复内容会带来任何惩罚或负面信号,但早已明确不会索引收录重复的内容(没有收录的网站将错失排名机会,更别提流量了)

  同样在SEO业界都有这样的共识,URL是页面的唯一标识符,类似身份证ID一样,一个人只能有一个身份证ID,如果出现了多了,这个人,多半是有问题的。同理,在搜索引擎当中,搜索引擎更加青睐标识符明确、并且唯一的页面。这样搜索引擎可以更好地理解你的网站。

  为了避免不必要的抓取和索引工作,谷歌会尝试根据网站URL来预测页面可能包含相似或重复的内容。当Google抓取具有相似URL的页面并发现它们包含相同的内容时,它随后可以确定具有该URL结构的所有其他页面也具有相同的内容,进而将这些页面判定为重复页面,不予抓取收录。

  01为什么谷歌不喜欢重复的页面?

  

  

  无法索引

  

  搜索引擎无法索引,因为搜索引擎不知道,你的这个页面是否有索引的必要。

  无法判断

  

  搜索引擎无法判断,究竟是给哪一个页面优先排名。试想内容一样,URL不同,搜索引擎应该如何选择?可能你自己都没有办法选吧?

  不利于用户体验

  

  当用户选择分享你的链接(发布外链)的时候,应该选择哪一个呢?

  包括大家熟知的阿里巴巴国际站平台,也是非常强调产品查重的,其实也是为了符合谷歌搜索引擎不喜欢重复内容的“偏好”。

  02哪些操作会导致重复页面的发生?

  

  

  含有很多参数的页面

  

  很多商城网站的产品页面URL可能会配有多个参数。比如一件商品,有尺寸参数,有颜色参数,有型号参数。当你选择不同的产品的时候,URL中的参数可能会不同。

  不同的URL,搜索引擎会当作不同的页面去处理。但是,内容(商品图片,商品描述,或者评价部分)却是一模一样的。就很容易导致重复页面的发生。

  带3W和不带3W的页面

  

  大多数网站,会将WWW的域名和不带WWW的域名解析到同一个网站上。那么也就是说,在搜索引擎中出现了2个不同URL(带www和不带www的)但是内容相同。你是搜索引擎,应该给那个网站排名呢?谁先谁后?

  域名之后的后缀

  

  很多人的网站主域名访问时会有一个后缀(index.html、index.php之类)

  像这样:其实这个地址和是一模一样内容的页面。但是对于部分搜索引擎会当作两个页面去处理,同样会导致重复内容的出现。

  03可以采取什么措施来纠正此问题?

  

  

  找到重复的页面

  

  找到重复页面是很有必要的,可以使用Siteliner以及Copyscape这一类的工具为网站做一个系统的诊断,找到重复度非常高的页面,自己先做取舍,再让谷歌搜索引擎抓取、收录、排名。

  301跳转

  

  如果你有4组不同URL但是内容相同,从URL中选择一条标准的,将剩余的3组链接301跳转到第一个页面URL上。因为301跳转属于带权重跳转,可以将4组URL的权重统一。这样,搜索引擎不光可以识别唯一的页面,同时,唯一的那个页面也可以获得更好的排名。

  Canonical加以限制

  

  处理重复内容的另一个选择是使用Canonical标签进行标记。这样其实就是告诉搜索引擎,虽然有多个相同页面,但是真实需要参与排名的,只有我选中的那个特定页面。

  小结:

  Google总是出现这样或者那样的规则、并且不会告知任何人他们的算法排名,其实这都离不开Google的使命┄┄整合全球信息,供大众使用,使人人受益。让用户可以最大限度地检索到最相关、最可靠的信息。

顶部