百度的贴吧没有提供rss聚合,使得其他网站很难取得帖子列表。所以想在自己的门户上列出某个贴吧最新的帖子列表,看来得另想办法。
获取其他网站的内容最简单的办法就是获取html代码,然后从中分离出想要的内容。要想获取html代码那就离不开xmlhttp了,可是一个贴吧 首页的代码量少说也有几十K,读取全部代码再分离,效率堪忧。只好另辟蹊径——用Wap站的贴吧。代码量少,只有几K,分析起来也比较容易。唯一不足的就 是wap一页只有十条记录。
不废话了,看代码。正则表达式写得太烂了,见谅!
Continue reading “用xmlhttp获取百度贴吧的帖子列表”