我们来分享一下就是怎么爬取这个视频。 其实一直以来在后台就会时不时的有粉丝来问我说怎么去爬这些网页的视频,还有就是就是问了就是说怎么爬这个blob的一些链接。那其实这两个东西的话基本都是一样。 那我们先看一下我们这个blob是什么,那这个就是一个MDN的(文档) Blob 对象表示一个不可变、原始数据的类文件对象。它的数据可以按文本或二进制的格式进行读取,也可以转换成 ReadableStream 来用于数据操作。 它的有一个解释就是说它这个blog对象就是一个类,文件对象就是文本或者二进制。那视频的话基本就是二进制的流,那我们去看这个视频的时候可以播放,等到我们按照常规的这个分析的时候,我们...
打开Python爬虫实战练习C02页面 爬虫实战练习C02,看到页面上是一个拖拽式的验证码,下面有一行提示”拖动滑块验证码成功后加载数据。。。”。 这时候先按快捷键 F12 打开浏览器开发者工具,切换到 Network 标签,然后尝试着拖动验证码。此时会发现把验证码拖到最右边后,页面加载了一个数据表格出来,里面是一些广州到各大热门城市的机票价格。 我们点击一下页面上的”立即验证”,先看看这一个爬虫案例是要求我们获取并计算什么数据。打开后发现是让我们计算机票的平均价格。 鉴于刚才我们拖动验证码到数据加载完毕,都没有在开发者工具中看到有新的 HTTP...
coding=utf-8 import requests from lxml import etree from selenium import webdriver from selenium.webdriver import ChromeOptions, ActionChains from selenium.webdriver.common.by import By import time import base64 import json import numpy as np base_url = ‘https://spiderbuf.cn/playground/c02&rsq...
在使用 Golang gin 框架开发产品里,在加载 html 模板里,出现了异常信息:template: “index” is an incomplete or empty template,这个异常信息是在路由对应的函数运行的时候才会出现的,而且是在 html 模板目录下有子目录的且子目录与父目录有同名 html 模板文件的情况下才会出现。下面我们来看看这个异常信息出现的原因以及解决方案。 先建立一个 Golang gin 的工程,然后在该工程目录下执行 shell 命令 go get github.com/gin-gonic/gin 引用 gin 框架,工程目录有...
Uncaught TypeError: htmx.Swap is not a function 在使用 htmx 开发一个产品的时候,使用 htmx.Swap JavaScript API 函数时,在浏览器控制台输出了以下异常信息: Uncaught TypeError: htmx.Swap is not a function 我引用的 2.0.3 版本的 htmx.min.js 文件是通常官方文档中安装章节里的 URL 直接下载到本地然后引用的。就是如下中的 src 的 URL。 <script src="https://unpkg.com/htmx.org@2.0.3/di...