python通过url爬取视频资源到本地

AI摘要

本文介绍了如何使用Python通过URL爬取视频资源并保存到本地。首先，通过requests库发送请求获取包含视频链接的文本，然后使用正则表达式提取视频链接。最后，通过requests.get方法下载视频文件，并保存到同级目录下的videos文件夹中。代码示例中展示了如何实现这一过程。

此内容根据文章生成，不代表个人观点，仅用于文章内容的解释与总结

单python文件，执行后会将视频爬取下载到同级videos目录，这里爬取的视频请求路径每次访问都会返回一个text/html字符串。不保证有效性。

返回的text/html字符串格式是：

<video src="//xxx/videos/13.mp4" muted controls preload="auto" autoplay="autoplay" controls="controls" type="video/mp4">

所以网页看到的效果就是直接打开播放视频，因此python要进行解析路径，提取出视频链接。

videobatch.py 代码

import requests
import re
import os
 
print("可堪回首，佛狸祠下，一片神鸦社鼓")
print("实战场景: 下载一个视频文件到本地 \n")
# 发送请求获取包含视频链接的文本
url = "https://tucdn.wpon.cn/api-girl/index.php"
 
# 下载视频文件
for num in range(2):
    response = requests.get(url)
    text = response.text
 
    # 使用正则表达式提取视频链接
    video_url = re.search(r'<video src="(.*?)"', text).group(1)
    response = requests.get("https:" + video_url, stream=True)
    if response.status_code == 200:
        if not os.path.exists('videos'):
            os.makedirs('videos')
 
        video_filename = os.path.basename(video_url)
        with open(os.path.join('videos', video_filename), 'wb') as