标点符(钱魏 Way)

百度的快照与页面上的时间

前几天写了百度超越时空的快照,今天再补充点内容来说明百度的快照与网页上时间的关系及网页上的时间和快照时间的算法中去除,以本站为例,使用site指令对搜索结果页进行分析,图片如下。

baidu cache 

从上图可以看出除了首页外其他快照的时间均与网站上出现的时间一致。网页上出现的时间即日志发布时间。百度以此作为依据是好的想法,但是如果我在页面上添加一个不是日志发布的时间,或者时间显示就是当前时间,百度的快照更新频率是否会更快些。

关于首页的快照为什么显示不准确,我看了下百度的快照,快照里的时间是停留在8月27号,但快照内容却停留在25号,我想出现这个现象的主要原因是首页上出现的时间过多,所以百度把抓取时间定为快照时间,而在那几天也是我没写日志的的那些天,所以才会出现了如此的状况。

关于搜索结果页TAG现象的理解,搜索结果中出现的TAGs均为改TAGs下只有一篇文章,所以日期才会只有一条,所以百度快照才能以此为参考。还有为什么那些有多篇文章的的TAGs没有收录,也有可能与页面上出现两个日期相关。

码字很辛苦,转载请注明来自标点符《百度的快照与页面上的时间》

评论