今天在Google sitemap的中文论坛上,一名ID为vastelec的网友提到这么个问题:
On 9月14日, 上午9时20分, vastelec <vaste…@tom.com> wrote:
> 例如,搜: site:www.vastelec.com/
> 搜: site:www.vastelec.com
> 两者就相差一个”/”,搜索出来的网页数量相差很多很多,请高手解释一下
这个问题,其实已经由来已久了,把我的回复贴上来,大家可以讨论讨论。:)
并非所有网站都有这种情况。
记得以前Matts还是谁也说过了关于通过site和link语句查询出的结果数。并不是绝对准确,尤其是link,你要是和管理员工具里的报告比较一下就清楚了。
个人认为,这个数据经常记录,比较一个趋势还是有意义的,绝对较真就没什么意义了。因为通过这类查询命令,你最多能查看1000条左右信息(10条×100页)。
也有一些搜索引擎论文性质的报告曾经提过,部分(没人验证过是否是部分)搜索引擎的这个结果数是通过后台返回数据的时间在前端服务器上计算出来的,因此并非绝对与收录数相等。
另外,搜索引擎的服务器和数据中心都呈分布式的,不同的服务器上查询出来的结果会有差别,以Google为例的话,我的经验是一些网站的数据同步会超过1周。
最后,有时候连续刷新几次搜索结果页面,可能你也会发现数据有较大的变化。如果是这样,就需要检查是否是你的网站有部分内容被丢进了sandbox。


