最近考虑把网站多语言话,那不得部考虑的一个因素就是Google的收录索引影响,在之前的一篇文章中老赵讨论了多语言网站的URL结构设计取舍后,本篇笔记我来记录一下我对Google官网SEO技巧中给予的多语言站点优化建议总结。
一、设计细节与注意要点
- 确定你的网站是基于语言来划分还是按照国家区域来划分的,这有助于你更合理的提供用户体验和后面的参数设定。
- 要在网站明显的地方提供语言或区域切换的链接按钮;
- 建议不要自动跳转到某个语言下,而是让用户自己手动切换。首先自动跳转并不一定满足访问者需求增加用户体验,另外,蜘蛛爬取时如果全是美国服务器的IP则无法抓取其它语言的网页了,注意搜索引擎是不会为了给你抓全所有语言网页而却刻意调动各区域服务器的爬虫的。
- 不要使用 IP 分析来切换国家地域调整内容。原因与上一条基本同理。
- 不要重复使用不同的URL结构,例如,你同时使用了二级域名和二级目录切换语言,势必会造成大量网页重复。具体那种更加适合你,可以参考多语言网站的URL结构是二级域名还是二级目录好。
二、通过hreflang注释将不同语言版本告知 Google
您可通过以下三种方式向 Google 指明某个网页的多个语言/语言区域版本:
- HTML
- HTTP 标头
- 站点地图
从 Google 的角度来看,这三种方法是等效的,您可以选择最适合您网站的方法。我着重记录一下html中的用法,您如果对其它两种方式感兴趣,可以通过本文下面的链接去Google官网详细阅读。
对于网页的每个变体(同内容的不同语言网页),请在
元素中添加一组 元素,并使每个网页变体(包括网页自身)分别对应一个链接。网页的每个版本中,这组链接都应是相同的。以下是每个 link 元素的语法:
<link rel="alternate" hreflang="lang_code" href="url_of_page" />
其中:
lang_code 此网页版本所针对的受支持的语言/区域代码,或 x-default(以与该网页上的 hreflang 标记未明确列出的任何语言匹配)。
url_of_page 此网页的特定语言/区域版本对应的完全限定网址。
请将 标记放在
示例
例如,Widgets, Inc 有一个面向美国、英国和德国境内用户的网站。以下网址包含的内容大致相同,但具有区域性差异:
具有区域性差异的网址
https://en.example.com/page.html 通用英语版首页,包含与从美国运至全球各地的运费相关的信息。
https://en-gb.example.com/page.html 英式英语版首页,显示以英镑为单位的价格。
https://en-us.example.com/page.html 美式英语版首页,显示以美元为单位的价格。
https://de.example.com/page.html 德语首页。
https://www.example.com/ 不针对任何语言或语言区域的默认页;它具有选择器,供用户选择自己的语言和区域。
请注意,Google 不会根据这些网址中针对特定语言的子网域(en、en-gb、en-us、de)确定网页的目标受众群体;您必须将网页明确地关联到对应的目标受众群体。
上方“具有区域性差异的网址”表格中列出的所有网页的
部分中都包含以下 HTML 代码。这会将美式英语、英式英语、通用英语和德语用户引导至对应的本地化网页,并将所有其他用户引导至通用首页。Google 搜索会根据用户的浏览器设置为他们返回适当的结果。<head>
<title>Widgets, Inc</title>
<link rel="alternate" hreflang="en-gb"
href="https://en-gb.example.com/page.html" />
<link rel="alternate" hreflang="en-us"
href="https://en-us.example.com/page.html" />
<link rel="alternate" hreflang="en"
href="https://en.example.com/page.html" />
<link rel="alternate" hreflang="de"
href="https://de.example.com/page.html" />
<link rel="alternate" hreflang="x-default"
href="https://www.example.com/" />
</head>
hreflang 属性的值由一个或两个可选的值组成,各个值之间用短划线分隔。例如 en-US。hreflang 属性的第一个代码是语言代码(采用 ISO 639-1 格式),后跟可选的第二个代码(采用 ISO 3166-1 Alpha 2 格式),表示备用网址的区域代码。
在使用hreflang注释时要注意一下几点:
- hreflang的值不能只有区域代码;
- 针对不匹配的语言配置使用 x-default 值;
- 防止缺少返回链接:如果网页 X 链接到网页 Y,那么网页 Y 必须要链接回网页 X;
- 语言代码要准确无误。
相关Google官方文档:https://developers.google.com/search/docs/specialty/international/localized-versions?hl=zh-cn