文章列表 - Python 爬虫练习网站

Spiderbuf

Golang fyne 编译报错：cannot use AppWindow 的解决方法

发布日期：1745427083 阅读数：390

Golang 除了开发 Web 应用是一把好手外，还可以开发跨平台的桌面应用，fyne 就是 Golang 的其中一个 GUI 库，支持 Windows、macOS、Linux，虽然还不是很完美，但胜在 UI 还算好看，用来开发一些小的工具类桌面应用还是够用了。毕竟 Wails 或者 Electron 对于一个小工具来说有点重了。因为现在开发桌面端应用比较少，fyne 也是现学现卖，在开发的过程中也遇到了一些诡异的问题，在此记录下来，免得以后头疼。先看 go build 异常信息： Build Error: go build -o /Users/user/scraping -gcflags...

C06 - Python爬虫练习通关提示

发布日期：1744684539 阅读数：1021

Selenium 在一定程度上是万能的，只不过可能需要一些配置或者模拟一下人类的某些行为，让 Selenium 的自动化操作更接近真实的人类行为。JavaScript 逆向遇到瓶颈时，往往会出现细节决定成败的局面，要站在更高的层次全面思考问题，通往爬虫成功的钥匙往往就在眼皮底下而你没去注意它。...

Selenium move target out of bounds 的解决方法

发布日期：1744535615 阅读数：533

MoveTargetOutOfBoundsException 在使用 Selenium 开发爬虫对网页元素进行拖动操作的过程中，出现了如下异常信息： selenium.common.exceptions.MoveTargetOutOfBoundsException: Message: move target out of bounds 从异常信息可以知道，是因为我们拖动的目标元素超出了 html 父元素的边界。 client = webdriver.Chrome() client.get('你的爬虫目标网址') time.sleep(5) # 事件参数对象 actionChains = Act...

C03-爬虫实战示例代码

发布日期：1744479718 阅读数：774

coding=utf-8 import requests from lxml import etree from selenium import webdriver from selenium.webdriver.common.by import By import time import json import hashlib import random import numpy as np base_url = ‘https://spiderbuf.cn/web-scraping-practice/scraper-practice-c03’ myheaders = ...

Python爬虫实战C03爬虫实战练习案例解析

发布日期：1744479668 阅读数：738

打开Python爬虫实战练习C03页面爬虫实战练习C03，看到页面上是鸢尾花数据集(Iris Dataset)。先点击“立即验证”看看这一关要求校验什么数据，发现是要求“Sepal Width列的总和”。回到C03的页面，把页面都浏览一遍。在页面底部发现了有分页的页码。这时候先按快捷键 F12 打开浏览器开发者工具，切换到 Network 标签，点击其中一个页码，发现浏览器向 scraper-practice-c03 这个地址发送了一个 POST 请求。点击这个请求，在开发者工具右边切换到 Payload 选项卡，发现了以下的发送参数： { xorResult: 1744472901, ...

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24