最近单位需要我做个做个可以抓取微信公众号文章的功能,说实话本人一个菜鸟,居然要完成这样的工作,真的太难了。本来想说做个爬虫就好了,但是微信公众号文章的抓取通常是到搜狗微信搜索上去抓取,结果他的反爬虫机制让我这个菜鸟无从下手。后来在“伟大”的百度帮助下,我找到了现成的抓取爬虫。不过是python写的。解决了抓取问题,接下来就是本地化的问题。我用了PHP的file_get_contents()函数,将临时链接的文章信息全部保存为字符串信息保存在数据库中,这样就不担心链接过时问题了。
接下来上代码,抓取的爬虫链接在此
http://blog.csdn.net/niuxiaojia09/article/details/55260770
Controller层