Python爬虫练习指南:

以下每一行记录代表一个独立的关卡,如果你是初学者,建议按序号倒序(即序号从大到小)进行学习。

建议先自行动手分析并写出Python代码进行测试,也可以通过顶部“视频教程”链接打开B站查看对应的视频教程。

序号 编号 名称 推荐星级 难度 示例代码 发布日期 访问量
1 E04 被屏蔽IP后使用代理服务器爬取页面
容易 示例代码 2024-07-23 324
2 N06 网页表单爬取(RPA初阶)
普通 示例代码 2024-03-26 4342
3 N05 CSS Sprites (雪碧图)反爬
普通 示例代码 2024-02-18 3844
4 N04 CSS伪元素反爬
普通 示例代码 2024-01-11 4416
5 H06 初识浏览器指纹:Selenium是如何被反爬的
困难 示例代码 2023-12-22 2777
6 H05 js逆向破解时间戳反爬
困难 示例代码 2023-11-26 4564
7 H04 js加密混淆及简单反调试
困难 示例代码 2023-11-11 3890
8 H03 网页滚动加载的原理及爬取(JavaScript加密混淆逆向基础)
困难 示例代码 2023-10-20 60739
9 H02 高分电影列表复杂页面的解析(仿豆瓣电影)-xpath高级用法
困难 示例代码 2023-10-10 12145
10 N03 限制访问频率不低于1秒
普通 示例代码 2023-09-30 4844
  • 共3页
  • 1
  • 2
  • 3