单python文件,执行后会将视频爬取下载到同级videos目录,这里爬取的视频请求路径每次访问都会返回一个text/html字符串。不保证有效性。
返回的text/html字符串格式是:
<video src="//xxx/videos/13.mp4" muted controls preload="auto" autoplay="autoplay" controls="controls" type="video/mp4">
所以网页看到的效果就是直接打开播放视频,因此python要进行解析路径,提取出视频链接。
videobatch.py 代码
import requests import re import os print("可堪回首,佛狸祠下,一片神鸦社鼓") print("实战场景: 下载一个视频文件到本地 \n") # 发送请求获取包含视频链接的文本 url = "https://tucdn.wpon.cn/api-girl/index.php" # 下载视频文件 for num in range(2): response = requests.get(url) text = response.text # 使用正则表达式提取视频链接 video_url = re.search(r'<video src="(.*?)"', text).group(1) response = requests.get("https:" + video_url, stream=True) if response.status_code == 200: if not os.path.exists('videos'): os.makedirs('videos') video_filename = os.path.basename(video_url) with open(os.path.join('videos', video_filename), 'wb') as