您现在的位置是:首页 > 文章详情

Google:互联网 60% 是重复内容

日期:2022-11-29点击:380

前几天在新加坡举行的 GoogleSearch Central Live 活动上,Google Webmaster 趋势分析师 Gary Illyes 称,互联网上六成的内容是重复的。

互联网上有大量重复内容是众所周知的事实,问题是比例有多大,作为最大最流行的搜索引擎,Google 给出了它的答案。

当然,大家更想知道 Google 如何定义“重复内容”。是 100% 完全相同的重复?还是标题不同但实际内容一致的重复,比如社交网络中的转载,或者进行搜索引擎优化之后的重复等。根据 Google 搜索中心文档的解释,重复内容一般是指在域内或跨域的实质性内容块,这些内容与使用同一种语言的其他内容完全匹配,或有一定体量的内容明显相似。

后面参加了此次会议的观众补充了 Gary Illyes 提出此说法时的上下文,主要是在解释 Google 如何处理“重复数据”,Google 在这里对“重复内容”的定义是基于抓取数据的考虑。

1.删除协议重复的内容 — 有利于 HTTPS
2.删除 www/non-www
3.删除包含无用参数的 URL (例如 sessionID?)
4.删除斜线/无斜线的变体
5.删除其他的校验和重复

原文链接:https://www.oschina.net/news/219746/google-60-percent-of-the-internet-is-duplicate
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章