文章列表 - Python 爬虫练习网站

Spiderbuf

HTML中 svg 颜色不生效的解决方法

发布日期：1744442836 阅读数：388

在前端开发中，svg 因为可以直接嵌入到 HTML 代码里面，与HTML/CSS 融合，通过 CSS 控制样式（如颜色、透明度），所有现代浏览器均原生支持 SVG，移动端和桌面端显示一致，并且 SEO 友好等好处而被广泛使用。但最近在一些产品开发的过程中，发现了一个诡异的问题：部分 svg 图标无法通过 CSS 控制填充色及前景色，也就是说完全无法控制 svg 的任何颜色，但相同一个 html 中有些 svg 是可以正常控制的。在网上也没有找到相关的解决方法，问了 DeepSeek、ChatGPT、Gemni 等 AI 都没有找到解决方法，这些 AI 几乎都是千篇一律地让我使用 CSS 去控...

HTMX + 原生 CSS 实现 HTML 模态弹出窗口的解决方案

发布日期：1742141626 阅读数：581

HTMX + 原生 CSS 实现 HTML 模态弹出窗口可能是因为开发习惯不同，很多小伙伴还没完全适应 htmx 带来的全新的交互方式，导致有时候一些交互操作不知道应该怎么处理，比如经常用到的模态弹出窗口。在使用 Vue 或 React 时，是直接接收后台传过来的 Json 数据，然后通过 JavaScript 代码实现窗口弹出效果。但如果在 htmx 也这么做的话，虽然也能实现，但这种做法就失去了 htmx 的灵魂。下面就教大家怎么使用 htmx 实现地道的 html 模态弹出窗口及关闭。 htmx 完整项目源码完整的 htmx 模态弹出窗口源码已经上传至 GitHub 使用到的 ht...

手把手教你用 Python 爬虫下载视频，小白也能轻松搞定

发布日期：1740672483 阅读数：1467

我们来分享一下就是怎么爬取这个视频。其实一直以来在后台就会时不时的有粉丝来问我说怎么去爬这些网页的视频，还有就是就是问了就是说怎么爬这个blob的一些链接。那其实这两个东西的话基本都是一样。那我们先看一下我们这个blob是什么，那这个就是一个MDN的(文档) Blob 对象表示一个不可变、原始数据的类文件对象。它的数据可以按文本或二进制的格式进行读取，也可以转换成 ReadableStream 来用于数据操作。它的有一个解释就是说它这个blog对象就是一个类，文件对象就是文本或者二进制。那视频的话基本就是二进制的流，那我们去看这个视频的时候可以播放，等到我们按照常规的这个分析的时候，我们...

Python爬虫实战C02爬虫实战练习案例解析

发布日期：1740665416 阅读数：1067

打开Python爬虫实战练习C02页面爬虫实战练习C02，看到页面上是一个拖拽式的验证码，下面有一行提示”拖动滑块验证码成功后加载数据。。。”。这时候先按快捷键 F12 打开浏览器开发者工具，切换到 Network 标签，然后尝试着拖动验证码。此时会发现把验证码拖到最右边后，页面加载了一个数据表格出来，里面是一些广州到各大热门城市的机票价格。我们点击一下页面上的”立即验证”，先看看这一个爬虫案例是要求我们获取并计算什么数据。打开后发现是让我们计算机票的平均价格。鉴于刚才我们拖动验证码到数据加载完毕，都没有在开发者工具中看到有新的 HTTP...

C02 - 爬虫实战示例代码

发布日期：1740665377 阅读数：1087

coding=utf-8 import requests from lxml import etree from selenium import webdriver from selenium.webdriver import ChromeOptions, ActionChains from selenium.webdriver.common.by import By import time import base64 import json import numpy as np base_url = ‘https://spiderbuf.cn/web-scraping-pract...

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24