标点符(钱魏 Way)

Google Panda 更新那点事

在开始阅读这篇文章之前,您需要知道的是,任何针对英文Google 的算法调整最终会迁移至中文Google,类似的算法调整在不久的时间内百度也会跟进,所有提升搜索引擎用户体验的工作不管哪个搜索引擎都会去做。

在开始将Google Panda 之前,我们先来了解下Google Panda 的来历。09年的时候Google进行了咖啡因(Google Caffeine)的更新,主要解决了谷歌的抓取和索引速度。让谷歌可以获取的更加新鲜的内容(比如我的博客,一般会在3分钟内被谷歌抓取和索引)。但是快速的抓取和索引使网页质量判断明显下降,很多无用或者重复性质的内容被索引进去。也就是Google所称的shallow-content site 肤浅内容的网站,在这些内容里面大多是伪原创的文章,也可能是一些没有参考价值的原创的内容。

针对搜索结果页的页面质量,谷歌先前推出的Google +1 也是为了解决这方面的问题。但是这对于判断一个网页的内容质量肯定不是一个完整的解决方案,于是Google Panda出现了,并且它将不断的进行算法更新。Google panda的主要目的就是剔除那些低质量的页面。即一个有效的页面过滤机制(类似百度的页面价值判断)。需要说明的是Google Panda不是针对站点的惩罚,而是通过算法进行排名的调整。与此同时,原创内容和信息将获得更好的排名,如研究、深度报道和周到详见的分析等。

Google Panda的设计原理会是哪些?

  1. 进行定性研究(这是讲的个人,而不是一个很大的问卷),找出它们认为质量差得原因。通过算法将此部分页面排除掉。
  2. 使用结果来定义因素,将谷歌测量出来的低质量的页面进行分析建模。来匹配哪些质量差的页面。

从大量的Google Panda的讨论文章来看,Google Panda主要的判断依据是点击流(Clickstream)、页面内容(page content)和链接概况(link profiles),只要在这三者当中表现优异,就不会被列为肤浅的网站。从大量的分析看,目前Google Panda的适用级别为网页级别,并没有细化到关键词级别。同时大量低质量页面也会在无形中给整个站点带来影响。

点击流

准确的说应该是考察的是用户参与度,或者是用户针对页面的反馈信息。主要考察指标可能是:

1、页面跳出率与页面停留时间或者回访率

数据来源:Google Analytics,Google Toolbar和搜索结果页不同链接的点击时间间隔。

单纯的跳出率不能反映页面的质量,比如说我的博客文章,用户可能看了一篇文章就达到了预期的效果,如果停留时间可可以作为参考依据。只有当两个条件(跳出率高且停留时间短)同时满足时,Google才会判定这个是个肤浅的网站。

2、被大量用户屏蔽的网站

数据来源:Google Chrome插件:Personal Blocklist (by Google)

Personal Blocklist官方介绍:Personal Blocklist 扩展会将您希望阻止显示的网址样式提交给Google。当您阻止或者允许一个网址样式显示时,该扩展同时也会将展示此被阻止或者被允许的网址的搜索结果网页提交给Google。您同意Google可以自由使用此信息来改进我们的产品和服务。

3、社会化网络当中的链接流行度

数据来源:Google自己抓取主流的社会化网络中的链接,如Twitter、Facebook、delicious等。

页面内容

Google肯定会针对页面进行分析,主要考察的是页面中信息量。可能考察的信息为:

  1. 网站或页面是否存在大量的重复内容
  2. 网站或网页内包含的原创内容的占比
  3. 是否有大量的实质内容很少的页面存在
  4. 页面是否充斥大量无关广告,影响信息的接收
  5. 页面内是否有明显的SEO痕迹,有填充内容存在
  6. 如果是模板页面,模板页面的共有部分的数据量

链接情况

  1. 社会化网络中链接的流行度(前面已经提及)
  2. 是否存在大量的SPAM链接

如何应对Google Panda的更新? 

  1. 查找网站内流量质量最差的页面,并将这些页面区隔开来。设法修改你的低质量页面,但是不要太过,如果太过了容易招来惩罚。
  2. 给你网站的页面分类,按类别去查看数据,比如说广告数量、低质量内容百分比。按照情况进行修改会对搜索引擎屏蔽。(对于Wordpress的站点,可以参考下我的网站的Robots.txt文件哈 http://www.biaodianfu.com/robots.txt
  3. 如果您的站点是采集过来的内容,尝试移除他们或使用robots.txt来禁止Google 爬取,并停止采集,手动添加原创内容。
  4. 修改网站内的链接,保证每个页面只有一个唯一的链接。保证链接的唯一型。
  5. 修改那些过度优化的页面。去除重复堆积的文字等。
  6. 做一些提高用户体验的修改, 让页面具有更好的可读性,如修改字体大小,字体样式,字体颜色等
  7. 在页面上添加用户可能感兴趣的内容,提供提供相关内容的链接。
  8. 到社交网站上推广你的站点,或在网页内添加社会化按钮便于用户分享。
  9. 检查网站广告的覆盖率,减少页面中广告的数量,去除弹出广告。
  10. 停止SPAM行为吧,SPAM伤身!
码字很辛苦,转载请注明来自标点符《Google Panda 更新那点事》

评论