问:收录对排名有没有影响?
答:有。
外链是站外投票,内链是站内投票,网站页面收录越好,站内投票越好

问:一个页面为什么不被收录?
答:
a:抓的问题
爬的过程是否能正常顺利的爬行会影响后面的过滤
有蜘蛛访问过但是没收录,这个说法是不对的,抓取不等于收录,被搜索引擎过滤了没有存放进数据库
【抓过程的2个路径】
1.URL地址数据>待捉取URL>爬行蜘蛛>捉取回页面>带过滤页面
2.URL地址数据>待捉取URL>爬行蜘蛛>捉取回页面>提取出新的连接>合并新连接(就是对域名进行归类放在相应的域名下面)>URL地址数据库

>由于每天数据的过多,搜索引擎对页面的抓取是有个周期和抓取频率的
能否人为控制蜘蛛的抓取频率,在百度站长平台的压力反馈里面可以进行调整,但是不能随意更改
>百度是根据网站的数据更新而默认的抓取频率,老站更新量加大可以适当调大,收录容易。新站收录慢可以适当调整,但是一定要保证有页面,否则负面影响就是降权
>提取合并后,随着抓取频率和周期的加长,URL链接数据会越来越多
>什么时候这些链接会被删除
1.当一个链接多次访问产生404就会被从数据库列表删除
2.当页面过滤时候发现页面没价值,也会被删除
3.严重作弊会被全部删除
二级域名的作弊是不会影响顶级域名的被K,反之亦然,二者是独立域名

>除了被动提取模式,还有主动提取模式,就是【提交】
网站地图,会有网站所有页面的链接,不用蜘蛛去爬,不用怕网站结构的复杂会导致蜘蛛爬不到或者时间长

b:选的问题
服务器的存储空间是有限的,不可能保存所有页面,故而存在过滤筛选
谷歌硬盘比百度大,一般在谷歌收录比百度多(多十倍)

>如何筛选页面
1.通过用户的需求进行选
2.索引价值
计算机只能运行数值,页面被抓取之后会进行评分,达到标准会被建立索引,未达到不会被收录,用户是看不到的
页面评分是多个因素产生的,经常会出现临界点(100标准、合格100.1、不合格99.9),有时可能收录、排名等会不断浮动。
>页面索引价值评分
1.感兴趣的受众群大小
eg:同一篇文章放在新浪的受众就比小站点大
2.该页面的稀缺程度(可替代性)
内容唯一原创,但原创不一定质量高,内容必须有相关性
3.该页面的质量高低
http://www.lanseyun.com
页面广告、速度、代码等
4.该页面的时效性特征强弱
具有时效性的特征:新增资源、热点、互联网突然爆发的词语、包含百度风云榜里面的热词
有时效性特征的页面会比较容易收录、带来流量,但是必须和网站主题有相关性,否则有害无益,而且这些流量不是真实的流量,跳出率停留率等都会给网站带来负面影响。

webseo.com.cn 2014-3-6 10:38