Python爬虫练习指南:

以下每一行记录代表一个独立的关卡,建议先自行动手分析并写出Python代码进行测试,也可以通过顶部“视频教程”链接打开B站查看对应的视频教程。

如果你是初学者,建议按序号倒序(即序号从大到小)进行学习。

序号 编号 名称 推荐星级 难度 示例代码 发布日期 访问量
1 N05 CSS Sprites (雪碧图)反爬
普通 示例代码 2024-02-18 525
2 N04 CSS伪元素反爬
普通 示例代码 2024-01-11 2132
3 H06 初识浏览器指纹:Selenium是如何被反爬的
困难 示例代码 2023-12-22 1325
4 H05 js逆向破解时间戳反爬
困难 示例代码 2023-11-26 2640
5 H04 js加密混淆及简单反调试
困难 示例代码 2023-11-11 2245
6 H03 网页滚动加载的原理及爬取(JavaScript加密混淆逆向基础)
困难 示例代码 2023-10-20 57546
7 H02 高分电影列表复杂页面的解析(仿豆瓣电影)-xpath高级用法
困难 示例代码 2023-10-10 6771
8 N03 限制访问频率不低于1秒
普通 示例代码 2023-09-30 3147
9 N02 使用Base64编码的图片爬取与解码还原
普通 示例代码 2023-07-16 6510
10 H01 CSS样式偏移混淆文本内容的解析与爬取
困难 示例代码 2023-06-25 10607
11 N01 User-Agent与Referer校验反爬
普通 示例代码 2022-11-05 15018
12 E03 无序号翻页
容易 示例代码 2022-11-01 15423
13 E02 带验证码的登录爬取
容易 示例代码 2022-09-17 16801
14 E01 用户名密码登录爬取后台数据
容易 示例代码 2022-08-21 14132
15 S08 http post请求的数据爬取
很容易 示例代码 2021-06-27 53660
16 S07 ajax动态加载数据的爬取
很容易 示例代码 2021-06-26 17252
17 S06 带iframe的页面源码分析及数据爬取
很容易 示例代码 2021-06-25 11137
18 S05 网页图片的爬取及本地保存
很容易 示例代码 2021-06-24 15858
19 S04 分页参数分析及翻页爬取
很容易 示例代码 2021-06-23 18552
20 S03 lxml库进阶语法及解析练习
很容易 示例代码 2021-06-22 15290
21 S02 http请求分析及头构造使用
很容易 示例代码 2021-06-21 14146
22 S01 requests库及lxml库入门
很容易 示例代码 2021-06-20 32211

粤ICP备2021093459. All rights reserved.