如何抓取微信公共号的推送内容

时间:2015-01-18 13:10:40   收藏:0   阅读:1256

最近业务需要,大体就是从一些相关的微信公共号来抓取每日推送的内容来。

想来想去没有什么思路,好在前几天看到搜狗可以搜索微信公共号,一看果然有戏。

技术分享

技术分享

这样一来就能看到该微信号完整的历史信息了。哈哈,然后果断用jsoup抓之

但是高兴的好像早了点,发现网页的渲染用的是jsonp,貌似jsoup不能执行js,然后分析了一下来源。

发现数据来自这样一个链接

http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFtz7I769OeSHNhnxcWbsas8s&page=1&t=1421556435543

返回的格式如下

技术分享技术分享


然后剩下的事情就简单啦,直接从里面拿到第一个文章的链接就行啦。

为了方便大家,我把我写的程序打成了一个jar包,方便大家调用。

由于本人不是写java的,可能有更好的实现方式,稍等把源码上传到OSchina上,欢迎大家指正

jar包下载地址 点此,可以获文章的标题,内容,图片的url以及时间等等。

使用方法非常简单

//openId
		WechatSpider spider = new WechatSpider("oIWsFt1cKphwPhDydMD0b_fi7n80");
		System.out.println(spider.getTitle());

欢迎大家指证。

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!