糗事百科实例:
爬取糗事百科段子,假设页面的URL是 http://www.qiushibaike.com/8hr/page/1
要求:
- 使用requests获取页面信息,用XPath / re 做数据提取
- 获取每个帖子里的
用户头像链接
、用户姓名
、段子内容
、点赞次数
和评论次数
- 保存到 json 文件内
参考代码
1 | import json |
刘泰丞的个人博客
爬取糗事百科段子,假设页面的URL是 http://www.qiushibaike.com/8hr/page/1
用户头像链接
、用户姓名
、段子内容
、点赞次数
和评论次数
1 | import json |
本文标题:爬虫糗事百科实例
文章作者:GavinLiu
发布时间:2018年05月02日 - 23:05
最后更新:2018年05月02日 - 23:05
原始链接:http://gavinliu4011.github.io/post/f825a662.html
许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。
微信支付
支付宝