谷歌SEO：网址太相似，会被认定为重复页面，不予收录

发布日期：2024-10-14 浏览次数：0

　　最近很多客户朋友都在问：网站里有重复页面，会不利于谷歌SEO么？

　　首先我们要清楚什么是重复页面，就是指一个网站中出现相似重复的网站页面内容，判断页面是否重复的标准是谷歌搜索引擎，而不是人。谷歌官方虽未明确说重复内容会带来任何惩罚或负面信号，但早已明确不会索引收录重复的内容（没有收录的网站将错失排名机会，更别提流量了）

　　同样在SEO业界都有这样的共识，URL是页面的唯一标识符，类似身份证ID一样，一个人只能有一个身份证ID，如果出现了多了，这个人，多半是有问题的。同理，在搜索引擎当中，搜索引擎更加青睐标识符明确、并且唯一的页面。这样搜索引擎可以更好地理解你的网站。

　　为了避免不必要的抓取和索引工作，谷歌会尝试根据网站URL来预测页面可能包含相似或重复的内容。当Google抓取具有相似URL的页面并发现它们包含相同的内容时，它随后可以确定具有该URL结构的所有其他页面也具有相同的内容，进而将这些页面判定为重复页面，不予抓取收录。

　　01为什么谷歌不喜欢重复的页面？

　　无法索引

　　搜索引擎无法索引，因为搜索引擎不知道，你的这个页面是否有索引的必要。

　　无法判断

　　搜索引擎无法判断，究竟是给哪一个页面优先排名。试想内容一样，URL不同，搜索引擎应该如何选择？可能你自己都没有办法选吧？

　　不利于用户体验

　　当用户选择分享你的链接（发布外链）的时候，应该选择哪一个呢？

　　包括大家熟知的阿里巴巴国际站平台，也是非常强调产品查重的，其实也是为了符合谷歌搜索引擎不喜欢重复内容的“偏好”。

　　02哪些操作会导致重复页面的发生？

　　含有很多参数的页面

　　很多商城网站的产品页面URL可能会配有多个参数。比如一件商品，有尺寸参数，有颜色参数，有型号参数。当你选择不同的产品的时候，URL中的参数可能会不同。

　　不同的URL，搜索引擎会当作不同的页面去处理。但是，内容（商品图片，商品描述，或者评价部分）却是一模一样的。就很容易导致重复页面的发生。

　　带3W和不带3W的页面

　　大多数网站，会将WWW的域名和不带WWW的域名解析到同一个网站上。那么也就是说，在搜索引擎中出现了2个不同URL（带www和不带www的）但是内容相同。你是搜索引擎，应该给那个网站排名呢？谁先谁后？

　　域名之后的后缀

　　很多人的网站主域名访问时会有一个后缀（index.html、index.php之类）

　　像这样：其实这个地址和是一模一样内容的页面。但是对于部分搜索引擎会当作两个页面去处理，同样会导致重复内容的出现。

　　03可以采取什么措施来纠正此问题？

　　找到重复的页面

　　找到重复页面是很有必要的，可以使用Siteliner以及Copyscape这一类的工具为网站做一个系统的诊断，找到重复度非常高的页面，自己先做取舍，再让谷歌搜索引擎抓取、收录、排名。

　　301跳转

　　如果你有4组不同URL但是内容相同，从URL中选择一条标准的，将剩余的3组链接301跳转到第一个页面URL上。因为301跳转属于带权重跳转，可以将4组URL的权重统一。这样，搜索引擎不光可以识别唯一的页面，同时，唯一的那个页面也可以获得更好的排名。

　　Canonical加以限制

　　处理重复内容的另一个选择是使用Canonical标签进行标记。这样其实就是告诉搜索引擎，虽然有多个相同页面，但是真实需要参与排名的，只有我选中的那个特定页面。

　　小结：

　　Google总是出现这样或者那样的规则、并且不会告知任何人他们的算法排名，其实这都离不开Google的使命┄┄整合全球信息，供大众使用，使人人受益。让用户可以最大限度地检索到最相关、最可靠的信息。

← 上一篇返回栏目列表