百度推出互联网论坛收录开放协议! 最近刚帮两个站点建立了sitemap,还在想着如果百度也能有这样的工具就好了。因为其中一个站点提交sitemap一周后,在Google的收录量和来自Google的流量都增加了一倍! 没想到21号,百度正式推出了《互联网论坛收录开放协议》。除了欣喜百度也终于开始放开身价向着Google与站长间越来越开放的交流氛围学习之外,也不由得感叹,百度此举,实在是具有中国式的智慧啊。 sitemap协议由Google发起,最后由四家国际顶级搜索引擎共同宣布支持,成为网站地图真正的权威标准。而标准格式的xml文件,也确实能够帮助搜索引擎更好地与站长进行对话,更好地了解一个网站的全貌,并可以加速完成对网站主体的抓取过程。在这种前提下,百度不论如何算是失了先手。如果声明支持标准格式sitemap,自是落于人后。通过自扩充标准xml语法的方式,找准搜索引擎最难处理,同时又相对空白的论坛网站地图标准下手,实在是太明智了。 门户网站、垂直网站URL的拓扑结构都可以设计得很简单,sitemap协议已经完全可以满足这类网站的需要;博客、播客类网站有了RSS也能满足“即时信息”这个最大的需要。只有BBS这块硬骨头一直不好啃。其实sitemap也是支持字扩展语法的,但是这个扩展是交给每个站长可以自由发挥,这其实就是xml的标准扩展,只要声明自己的xsd就可以了。但是百度把它做成了自己的标准。这个标准可以预见在不久的将来就会以各种中文论坛开始,逐步成为另一个权威标准。这其中的意义做互联网的都不难看到。 可惜的是,百度开放协议太复杂,1个URL共有15个参数,除非配置程序了,看来是不可能用手工完成了。 协议写法转录如下: XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。 *<document>——标记整个XML文件内容的开始和结束。后面的” xmlns:bbs =” http://www.baidu.com/search/bbs_sitemap.xsd“是该xml文件遵守百度《互联网论坛收录开放协议》的声明,如没有该段声明,xml文件不支持下面的<bbs:reply>等语法。 *<webSite>——站点地址。 *<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。 *<updatePeri>——sitemap 更新周期,以小时为单位。搜索引擎将遵照此周期访问该页面,使页面上的内容更及时地被百度 spider 发现。 *<updatetime>——该 xml 文件最近一次的更新时间 。 *<version>——论坛所使用程序的版本。 *<item>——标记每个帖子信息的开始和结束,标记内为单个帖子信息。 *<link>——帖子的 url 地址,即帖子第一页的地址,请尽量去除url中不必要的参数。 <title>——帖子标题。 <pubDate>——帖子主贴的发布时间 。 <bbs:lastDate>——帖子最后一条回复的发布时间 。 <bbs:reply>——帖子总的回复数,不包括主贴。 <bbs:hit>——帖子总的查看次数。 <bbs:mainLen>——帖子主贴的长度,单位字节 。 <bbs:boardid>——帖子所在版面,提供版面的 id 。 <bbs:pick>——是否设为精华,精华标为 1 ,非精华标为 0 。 推荐时间格式:年月日小时分钟秒 如:2005-11-09 10:37 | 2005/11/09 10:37:00 | 2005.11.09 10:37:00 | [...]


