Spiderbuf
爬虫练习
Python习题
技术文章
在线工具
捐赠
Python爬虫实战C02爬虫实战练习案例解析
发布日期:
1740665416
阅读数:517
打开Python爬虫实战练习C02页面 爬虫实战练习C02,看到页面上是一个拖拽式的验证码,下面有一行提示”拖动滑块验证码成功后加载数据。。。”。 这时候先按快捷键 F12 打开浏览器开发者工具,切换到 Network 标签,然后尝试着拖动验证码。此时会发现把验证码拖到最右边后,页面加载了一个数据表格出来,里面是一些广州到各大热门城市的机票价格。 我们点击一下页面上的”立即验证”,先看看这一个爬虫案例是要求我们获取并计算什么数据。打开后发现是让我们计算机票的平均价格。 鉴于刚才我们拖动验证码到数据加载完毕,都没有在开发者工具中看到有新的 HTTP...
C02 - 爬虫实战示例代码
发布日期:
1740665377
阅读数:555
coding=utf-8 import requests from lxml import etree from selenium import webdriver from selenium.webdriver import ChromeOptions, ActionChains from selenium.webdriver.common.by import By import time import base64 import json import numpy as np base_url = ‘https://spiderbuf.cn/web-scraping-pract...
Golang gin template: "index" is an incomplete or empty template 的解决方法
发布日期:
1740651328
阅读数:197
在使用 Golang gin 框架开发产品里,在加载 html 模板里,出现了异常信息:template: “index” is an incomplete or empty template,这个异常信息是在路由对应的函数运行的时候才会出现的,而且是在 html 模板目录下有子目录的且子目录与父目录有同名 html 模板文件的情况下才会出现。下面我们来看看这个异常信息出现的原因以及解决方案。 先建立一个 Golang gin 的工程,然后在该工程目录下执行 shell 命令 go get github.com/gin-gonic/gin 引用 gin 框架,工程目录有...
Uncaught TypeError: htmx.Swap is not a function
发布日期:
1740564663
阅读数:214
Uncaught TypeError: htmx.Swap is not a function 在使用 htmx 开发一个产品的时候,使用 htmx.Swap JavaScript API 函数时,在浏览器控制台输出了以下异常信息: Uncaught TypeError: htmx.Swap is not a function 我引用的 2.0.3 版本的 htmx.min.js 文件是通常官方文档中安装章节里的 URL 直接下载到本地然后引用的。就是如下中的 src 的 URL。 <script src="https://unpkg.com/htmx.org@2.0.3/di...
C05 - Python爬虫实战案例练习提示
发布日期:
1740502419
阅读数:1009
拖拽式验证码检测的维度是多样化的,除了检测人类手的抖动之类,其它跟人类特性有关的要素也会成为检测是否为爬虫的依据。可以仔细想一想,有哪些是机器人或者代码能轻易做到完美的,但人类却不行的。现在的验证码主要是通过当前用户是否具备人类的笨识别爬虫的,所以有时候你要让你的代码变得笨一点。逆向 JavaScript 时也需要留意一些重要的信息跟字符串,这些有可能成为爬虫成功与否的关键。...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21