报告称谷歌未对翻译内容进行索引

2022年2月,在“一个相当规模的多语言网站”工作的谷歌用户 Dave Holmes 在谷歌搜索控制台帮助社区上发布了一个帖子,反馈大量翻译页面未被谷歌索引。

2021年4月初,所有 Holmes 翻译的内容从“有效”变为“排除:已爬取-当前未编入索引。”如果一个网页没有被索引,即意味着它不会出现在相关内容的谷歌搜索引擎结果中,从而失去了更高的搜索结果排名(即SEO)。

由于托管平台和内容管理系统(CMS)的巨大变化,Holmes 的团队最初怀疑这是一个内部问题,但彻底梳理了代码后,却仍一无所获。他们还更新了 hreflang(一种用于指定网页语言的工具)和 canonical links(有助于防止SEO中的重复内容问题)。但问题仍未解决。

十个月后,这个问题引起了谷歌搜索倡导者 John Mueller 的注意,他在办公直播中回复了 Holmes。

Mueller 认为这可能与网站的URL参数有关——添加到URL末尾的附加信息有助于过滤和组织网站的内容。

Holmes 还解释说,当多个参数导致相同的内容时,谷歌的系统将翻译版本视为原始版本的简单副本,因此不值得索引。

随后他分享了如何使用搜索控制台中的URL参数工具以及如何将Holmes的参数重定向到更干净的参数,以便谷歌爬虫可以更好地识别和索引它们。

Holmes似乎并非孤例。WordPress 和 Shopify 等网站上的论坛也出现了类似的问题。