python通过url爬取视频资源到本地

技巧分享 · 15 天前 · 47 人浏览

单python文件,执行后会将视频爬取下载到同级videos目录,这里爬取的视频请求路径每次访问都会返回一个text/html字符串。不保证有效性。

返回的text/html字符串格式是:

<video src="//xxx/videos/13.mp4" muted controls preload="auto" autoplay="autoplay" controls="controls" type="video/mp4">

所以网页看到的效果就是直接打开播放视频,因此python要进行解析路径,提取出视频链接。

videobatch.py 代码

import requests
import re
import os
 
print("可堪回首,佛狸祠下,一片神鸦社鼓")
print("实战场景: 下载一个视频文件到本地 \n")
# 发送请求获取包含视频链接的文本
url = "https://tucdn.wpon.cn/api-girl/index.php"
 
# 下载视频文件
for num in range(2):
    response = requests.get(url)
    text = response.text
 
    # 使用正则表达式提取视频链接
    video_url = re.search(r'<video src="(.*?)"', text).group(1)
    response = requests.get("https:" + video_url, stream=True)
    if response.status_code == 200:
        if not os.path.exists('videos'):
            os.makedirs('videos')
 
        video_filename = os.path.basename(video_url)
        with open(os.path.join('videos', video_filename), 'wb') as


脚本
验证码:
Theme: Jasmine by Kent Liao