一、主题式网络爬虫设计方案
1.主题式网络爬虫名称:爬取百度热搜
2.主题式网络爬虫爬取的内容与数据特征分析:百度热搜排行,标题,热度
3.主题式网络爬虫设计方案概述:先搜索网站,查找数据并比对然后再输入代码进行爬取。难点在于文件的生成和读取。
二、主题页面的结构特征分析
1.主题页面的结构与特征分析
2.Htmls页面解析
三、网络爬虫程序设计
1.数据爬取与采集
2.对数据进行清洗和处理
4.将以上各部分的代码汇总
四、结论
1.所得结论:热度越高排名越靠前。
2.小结:通过这次做题让我发现了自己在学习Python这方面的能力有待提高,学好Python对我来说是一项挑战。在此次任务中我找了资料和观看视频,但是还是没有很好的做好任务,学习能力有待提高,希望改善学习方法,争取学好Python。