网页字符编码、语言代码设置与SEO
作者:SEO小工 时间:2008-10-22
关键字: 字符编码,语言代码,本地特性,XHTML
网页的encoding和lang是两个最基本的属性,虽然他们常常被忽视和省略,但这两个属性对于网站的用户友好性和网页SEO的作用却不可小视。
写这个内容,是因为昨天写了一篇解读google网站管理员博客上关于静态地址和动态地址的文章,发现了樂思蜀的博客,读到10个月前的一篇文章,感觉博主理解有些误差。
XHTML设置<html xmlns="http://www.w3c.org/1999/xhtml" xml:lang="zh-CN" lang="zh-CN">
非标准还可以在head中设置<meta http-equiv="Content-Language" content="zh-CN" />
网页编码在W3C标准中虽然可以省略,但还是建议在网页中设置:
XHTML标准文档的开始声明<?xml version="1.0" encoding="utf-8" ?>
还建议在head声明中<meta http-equiv="Content-Type" content="text/html; charset="utf-8" />
对于语言代码为了使搜索引擎识别目标用户的国家和区域特性,要针对性的设置,如:
en 英文,这个范围比较广,根据需要可以在后面加上国家代码,如:en_US 英文_美国;en-ca 英文_加拿大;en-za 英文_南非。
zh-Hant,中文繁体。zh-Hant-CN、HK、MO、TW、SG就分别是中文繁体的中国及中国香港奥门台湾和中文繁体的新加坡。
可见,一个网页的语言编码,可以准确地表示网页的目标地区及所有语言,而与页面文件的字符编码(gbk或utf-8)无关。更多参见国家语言代码。选择正确的网页字符编码,可以使不同的用户都能方便的浏览,而设置正确的语言代码,更可以告诉搜索引擎网页的目标用户,让网站在本地、特定语言的搜索中更具优势。更多请参考:国际化最好方法-指定语言代码.
http://seo.banmutian.org/thread-1268-1-1.html
樂思蜀的SEO之网页编码
网页编码相信都很熟悉了,樂思蜀想说的是,如果针对搜索引擎,UTF-8不是你的最佳选择。原因很简单:大家都知道,一个日本网站,在Google.com搜索结果中的排名可能很低,但可能在google.co.jp搜索结果中排名可能较高。
我们在制作网页时,应尽可能的使用区域性的编码(GB2312、iso-8859-1、windows-1252……),以便搜索引擎尽快或准确的将网站识别成“本地”的。当然也是根据访问者而定,如果涉及多语言访问者,必须考虑UTF-8的通用性。
诚然,区域性编码能够代表一些区域性的网站,但同是GB2312的中文网站,可能是针对中国大陆的,也可能是针对新加坡的,如果是英文编码,那可能针对的地区就更多了,这怎么办呢?其实这要用网页的语言代码来声明,如zh-cn代表中文-中国大陆,而zh-sg代表中文-新加坡。详见:搜索引擎如何识别本地性,下面说说网页设置方法。网页编码相信都很熟悉了,樂思蜀想说的是,如果针对搜索引擎,UTF-8不是你的最佳选择。原因很简单:大家都知道,一个日本网站,在Google.com搜索结果中的排名可能很低,但可能在google.co.jp搜索结果中排名可能较高。
我们在制作网页时,应尽可能的使用区域性的编码(GB2312、iso-8859-1、windows-1252……),以便搜索引擎尽快或准确的将网站识别成“本地”的。当然也是根据访问者而定,如果涉及多语言访问者,必须考虑UTF-8的通用性。
语言代码:lang | Content-Language
这个属性常常被省略,因为不影响我们看到的效果,但是对于SEO却有着作用,可以让搜索引擎正确的识别出网页的语言地区属性,使网页在本地区获得更多的优势,设置方法如下XHTML设置<html xmlns="http://www.w3c.org/1999/xhtml" xml:lang="zh-CN" lang="zh-CN">
非标准还可以在head中设置<meta http-equiv="Content-Language" content="zh-CN" />
网页编码:encoding | charset
对于中文站,很多人会使用GB2312编码,这没有问题,如果又做了一个英文版本,还使用gb2312编码,这个理论上是没有问题的,但是欧美的英文的用户不太可能安装gb2312的字符集,所以没法查看这个内容,不过新加坡的用户很可能支持这个编码,就没有问题,所以如果为了国际化方便,可能用utf8比较方便。当然,可能只有极少数人会出现这个错误。网页编码在W3C标准中虽然可以省略,但还是建议在网页中设置:
XHTML标准文档的开始声明<?xml version="1.0" encoding="utf-8" ?>
还建议在head声明中<meta http-equiv="Content-Type" content="text/html; charset="utf-8" />
网页编码和语言代码的确定
网页编码选择目标用户支持的就可以,如GBK,iso-8859-1,或为国际化方便,选都支持的utf8。对于语言代码为了使搜索引擎识别目标用户的国家和区域特性,要针对性的设置,如:
en 英文,这个范围比较广,根据需要可以在后面加上国家代码,如:en_US 英文_美国;en-ca 英文_加拿大;en-za 英文_南非。
常用中文网页语言代码设置
zh-Hans,中文简体。zh-Hans-CN,中文简体-中国,也常简写成zh-CN;而zh-Hans-HK,MO,TW就是中文简体-中国的香港、奥门和台湾。zh-Hans-SG,是中文简体-新加坡。zh-Hant,中文繁体。zh-Hant-CN、HK、MO、TW、SG就分别是中文繁体的中国及中国香港奥门台湾和中文繁体的新加坡。
可见,一个网页的语言编码,可以准确地表示网页的目标地区及所有语言,而与页面文件的字符编码(gbk或utf-8)无关。更多参见国家语言代码。选择正确的网页字符编码,可以使不同的用户都能方便的浏览,而设置正确的语言代码,更可以告诉搜索引擎网页的目标用户,让网站在本地、特定语言的搜索中更具优势。更多请参考:国际化最好方法-指定语言代码.
http://seo.banmutian.org/thread-1268-1-1.html
赞助商链接

