随着Google Panda的五次算法更新, 靠”技术”、“手段”的市场低端SEO服务越来越没有立足之地,“黑帽”的市场越来越小,而有品牌靠核心竞争力生存的SEO服务公司将会有更好的发展。

在开始将Google Panda 之前,我们先来了解下Google Panda 的来历。09年的时候Google进行了咖啡因(Google Caffeine)的更新,主要解决了谷歌的抓取和索引速度。让谷歌可以获取的更加新鲜的内容(比如我的博客,一般会在3分钟内被谷歌抓取和索引)。但是快速的抓取和索引使网页质量判断明显下降,很多无用或者重复性质的内容被索引进去。也就是Google所称的shallow-content site 肤浅内容的网站,在这些内容里面大多是伪原创的文章,也可能是一些没有参考价值的原创的内容。

以下是一些谷歌熊猫普遍更新的历史:

1.2011年2月23/24:Panda 1.0 谷歌熊猫启动

2.2011年4月11: Panda 2.0 — 添加Chrome屏蔽扩展数据从而影响了eHow, 和其他全球英文搜索结果.

3.2011年5月10: Panda 2.1—广泛算法跳转.

4.2011年6月16: Panda 2.2— 提高垃圾网页的检测, 以便减少级别高于原垃圾网站被Panda打击的发生率

5.2011年7月22:Panda 2.3—新的信号被用来检测并区分高质量网站和低质量网站,删除了重复网页的收录, 一些网站排名受到调整

业界一直认为Google Panda是机械更新,但其实它是通过机械学习原理(Machine learning)手动更新一些它的排序参数。通过这5次的更新,我们越来越能够揭开Panda的神秘面纱:基于机械学习原理Machine learning进行的一个长期化的搜索引擎参数由Search Quality Perspective 搜索质量理念向 User happiness Perspective用户高兴理念转化的调整与更新. SEOers 对于搜索引擎的优化工作也要本着这个理念进行相应调整。

哪些网站可算作优质网站?

谷歌的网站质量算法的定位在于通过减少劣质内容的罗列,帮助人们找到“优质”网站。Z近的“Panda”算法解决了通过算法来评估网站质量的艰巨任务。现在,谷歌希望解释一些推动谷歌算法开发的想法和研究。

当然,谷歌不是在披露自己算法中使用的实际排名信息,因为谷歌不希望人们去赌搜索结果,但是如果我们希望了解Google的思路,以下问题提供了一些有关谷歌如何看待这一问题的指导。

如果作为一名网站的浏览者,你是否喜欢此文章中提供的信息?

1.在你看来,此文章是由深谙主题的专家或爱好者所写,还是在性质上较为肤浅的文章?

2.此网站中是否有相同或相似主题的多余内容,只是关键词稍微有些变化?

3.你愿意向此网站提供你的信用卡信息吗?

4.文章是否有拼写、格式或事实错误?

5.文章主题是由网站读者的真实兴趣来主导,还是网站通过猜测可能在搜索引擎中排名较好的话题来确定?

6.文章是否提供原创内容、信息,原创报道,原创研究或原创分析?

7.与搜索结果中的其它网页相比,这个网页是否具有重大价值?

8.在内容方面有多少质量控制?

9.文章是否兼具描述事物的好坏两方面?

10.网站是否为其同主题网站方面的公认权威?

11.网站内容是否由许多创建者批量创建或外包创建的?或者由于网站网络巨大,单个网页或网站的关注度很低?

12.文章是经过精心编辑的,还是随意或匆忙创建的?

13.你是否相信此网站提供的健康相关的信息?

14.在看到这个网站名称时,你是否会视此网站为权威信息来源?

15.这篇文章是否提供关于主题的完整或全面的说明?

16.此文是否包含有深刻分析或不那么浅显的有趣信息?

17.对于这类网页,你是否希望添加到收藏夹,与朋友分享或向他人推荐?

18.这篇文章是否有过多分散注意力或干扰主要内容的广告?

19.你认为你会在纸质杂志、百科全书或书籍中读到本文吗?

20.此文章是否短小、没有实质内容,或者缺乏有帮助的具体内容?

21.此网页的制作属于非常关心和注意细节,还是不那么注意细节?

22.用户从此网站看到网页时会抱怨吗?

谷歌说,编写一个评估网页或网站质量的算法是更为艰巨的任务,但是谷歌希望以上问题提供了一些有关如何编写那些区分优质网站和劣质网站的算法的见解。所以你知道怎么更新来讨好google了吧!

如何应对Google Panda的更新?

1.查找网站内流量质量Z差的页面,并将这些页面区隔开来。设法修改你的低质量页面,但是不要太过,如果太过了容易招来惩罚。

2.给你网站的页面分类,按类别去查看数据,比如说广告数量、低质量内容百分比。按照情况进行修改会对搜索引擎屏蔽。(可以参考下网站的Robots.txt文件 http://www.wenjuntech.com.cn/robots.txt)

3.如果您的站点是采集过来的内容,尝试移除他们或使用robots.txt来禁止Google 爬取,并停止采集,手动添加原创内容。

4.修改网站内的链接,保证每个页面只有一个唯一的链接。保证链接的唯一型。

5.修改那些过度优化的页面,去除重复堆积的文字等。

6.做一些提高用户体验的修改,让页面具有更好的可读性,如修改字体大小,字体样式,字体颜色等

7.在页面上添加用户可能感兴趣的内容,提供提供相关内容的链接。

8.到社交网站上推广你的站点,或在网页内添加社会化按钮便于用户分享。

9.检查网站广告的覆盖率,减少页面中广告的数量,去除弹出广告。

10.停止SPAM行为吧,SPAM伤身!

各位看完,也就明白了为什么你的网站在今年,从google上来的流量为何变动这么大了吧。