入门基础
保姆式引导关卡 + 免费在线视频教程,从Python环境的搭建到最简单的网页爬取,让零基础的小白也能获得成就感。
进阶提升
在已经入门的基础上强化练习,在矛与盾的攻防中不断提高技术水平,通过大量的模仿练习掌握常见的爬与反爬套路。
挑战实验室
以闯关的形式挑战各个关卡任务,验证自身实力的时候到了。
循序渐进的爬虫实战项目
1. 最简单的SSR网站页面的爬取及解析,适合入门练手。
2. 简单反爬:对HTTP Headers 的 User-Agent 进行校验。
3. HTML源代码分析及lxml解析练习。
4. 网站数据页面最简单翻页练习。
5. 图片爬取及本地保存练习。
6. HTML代码分析练习,需要分析出真正的数据URL。
7. Ajax动态加载分析及爬取练习。