会员登录 | 会员注册 | 意见建议 | 网站地图

站长资源综合门户

当前位置:首页 > 搜索引擎 > charset中gbk或utf8对搜索引擎优化的影响

charset中gbk或utf8对搜索引擎优化的影响

时间:2012-05-14 18:43:00   作者:   来源:   点击:

看到有人问gbk和utf-8对搜索引擎优化的影响,我说点小我观点。

如果网站是面向国人的,建议使用gbk,来由如下:

1.gbk采取双字节暗示汉字,utf-8采取三个字节暗示汉字,从暗示一个汉字所占的字节数来讲,gbk相对utf-8可以节俭50%的空间。

2.目前开源的法度gbk编码相对成熟一些。

3.蜘蛛在爬行某个页面的过程中识别的charset属性值如果为gbk的话根基上可以确实为中文类型的网站(无需对后面的内容进行判断),如果为utf-8的话还需要进一步判断(例如检索全文中的字符有多少属于utf-8中文字符的范围)。

如果网站是外文的话判断utf-8吧。

还有一点需要注意的是由于gbk和utf-8的编码不合,如果网站在被收录之后更改charset的话,蜘蛛在抓取过程中如果不克不及实时的发现charset变动的话就会判定网页内容产生异常致使页面被K。

以我自己的论坛为例(以下例子与实际情况还有点收支,仅用来讲明年夜概意思),如图1所示,论坛采取的编码为gbk,阅读器正常显示。

图1:

如果强制阅读器以utf-8编码诠释的话就会是图2的样子。

图2:

同样的事理,如果之前采取的是utf-8编码,并且页面已经被搜索引擎收录,如果中途换成gbk编码的话,在蜘蛛爬行过程中如果蜘蛛不克不及实时发现charset属性值改变的话还会依照之前的编码进行解析,成果就是与之前正常的页面相比产生了很年夜的变动,进而致使页面被K的可能。

理论需要去实践,我用自己的一个页面进行了这个实验(页面地址http://sl.zoum5),之前采取的是utf-8编码,之后改成gbk。在5月5日时这个页面搜索关头词“收录批量查询”位于第一,今天在百度中已经失去了踪影,至于中途改变编码会不会影响之前堆集到的权重,还需要进一步不雅察。

截止到5月13日,被k的页面已经正常恢复了,延续了年夜概五六天的样子。

原文地址:.zoum5/搜索引擎优化/119.html

分享到:

网友评论