Python爬虫练习指南:
以下每一行记录代表一个独立的关卡,如果你是初学者,建议按序号倒序(即序号从大到小)进行学习。
建议先自行动手分析并写出Python代码进行测试,也可以通过顶部“视频教程”链接打开B站查看对应的视频教程。
序号 | 编号 | 名称 | 推荐星级 | 难度 | 示例代码 | 发布日期 | 访问量 |
---|---|---|---|---|---|---|---|
1 | N03 | 限制访问频率不低于1秒 | 普通 | 示例代码 | 2023-09-30 | 8031 | |
2 | N02 | 使用Base64编码的图片爬取与解码还原 | 普通 | 示例代码 | 2023-07-16 | 8840 | |
3 | H01 | CSS样式偏移混淆文本内容的解析与爬取 | 困难 | 示例代码 | 2023-06-25 | 13742 | |
4 | N01 | User-Agent与Referer校验反爬 | 普通 | 示例代码 | 2022-11-05 | 17376 | |
5 | E03 | 无序号翻页 | 容易 | 示例代码 | 2022-11-01 | 21635 | |
6 | E02 | 带验证码的登录爬取 | 容易 | 示例代码 | 2022-09-17 | 27866 | |
7 | E01 | 用户名密码登录爬取后台数据 | 容易 | 示例代码 | 2022-08-21 | 18053 | |
8 | S08 | http post请求的数据爬取 | 很容易 | 示例代码 | 2021-06-27 | 58655 | |
9 | S07 | ajax动态加载数据的爬取 | 很容易 | 示例代码 | 2021-06-26 | 19242 | |
10 | S06 | 带iframe的页面源码分析及数据爬取 | 很容易 | 示例代码 | 2021-06-25 | 13094 |