当前位置: 首页 > news >正文

实战二:开发网页端界面完成黑白视频转为彩色视频

​一、需求描述

设计一个简单的视频上色应用,用户可以通过网页界面上传黑白视频,系统会自动将其转换为彩色视频。整个过程对用户来说非常简单直观,不需要了解技术细节。

效果图

​二、实现思路

总体思路:

  1. 用户通过Gradio界面上传黑白视频
  2. 视频被传递给video_colorize函数
  3. 函数使用ModelScope平台提供的UNet模型进行视频上色
  4. 处理后的视频路径被返回给Gradio界面
  5. Gradio界面显示上色后的视频

2.1 导入依赖库

import gradio as gr
import os
import torch
import tempfile
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
  • gradio: 用于创建Web界面的库,可以快速构建机器学习模型的演示界面
  • os: Python标准库,用于处理文件和目录操作
  • torch: PyTorch深度学习框架
  • tempfile: Python标准库,用于处理临时文件和目录
  • modelscope: 阿里云开源的模型即服务框架,提供了大量预训练模型
    • OutputKeys: 定义了模型输出的标准键名
    • pipeline: 用于创建模型推理管道
    • Tasks: 定义了支持的任务类型

2.2 安全设置和临时目录配置

# 添加安全全局变量设置
torch.serialization.add_safe_globals([slice])
# 设置临时目录
temp_dir = "D:/condaLearning/temp"
os.makedirs(temp_dir, exist_ok=True)
tempfile.tempdir = temp_dir
  • torch.serialization.add_safe_globals: 添加安全的全局变量,用于模型加载
  • os.makedirs: 创建临时目录
    • exist_ok=True表示如果目录已存在则不报错
  • tempfile.tempdir: 设置临时文件的默认目录

2.3 视频上色video_colorize函数

def video_colorize(input_video):# 在临时目录中创建输出文件路径output_video_path = os.path.join(temp_dir, 'colored_video.mp4')# 创建视频上色管道colorizer = pipeline(Tasks.video_colorization, model='damo/cv_unet_video-colorization', device='cuda')# 进行视频上色result = colorizer(input_video)# 返回处理后的视频路径return result[OutputKeys.OUTPUT_VIDEO]
  • os.path.join:该函数用于将多个路径组合成为输出文件的路径output_video_path,该路径为D:/condaLearning/temp/colored_video.mp4
  • pipeline: 创建模型推理管道
    • Tasks.video_colorization: 指定任务类型为视频上色
    • model='damo/cv_unet_video-colorization': 使用ModelScope中的视频上色模型damo/cv_unet_video-colorization
    • device='cuda': 使用GPU进行推理
  • colorizer(input_video): 执行视频上色
  • result[OutputKeys.OUTPUT_VIDEO]: 获取处理后的视频路径

2.4 Gradio界面创建

# 创建Gradio界面
demo = gr.Interface(fn=video_colorize,inputs=gr.Video(label="上传黑白视频"),outputs=gr.Video(label="上色后的视频"),
)
  • gr.Interface: 调用Gradio的Interface类,来创建Gradio界面
    • fn=video_colorize: 指定处理函数为video_colorize
    • inputs=gr.Video: 使用视频上传组件,标签为"上传黑白视频"
    • outputs=gr.Video: 使用视频显示组件,标签为"上色后的视频"

2.5 启动应用

if __name__ == "__main__":demo.launch(share=False)
  • demo.launch: 启动Gradio服务器
    • share=False: 不创建公共链接,只在本地运行

三、完整代码

import gradio as gr
import os
import torch
import tempfile
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks# 添加安全全局变量设置
torch.serialization.add_safe_globals([slice])# 设置临时目录
temp_dir = "D:/condaLearning/temp"
os.makedirs(temp_dir, exist_ok=True)
tempfile.tempdir = temp_dir# 定义视频上色函数
def video_colorize(input_video):# 在临时目录中创建输出文件路径output_video_path = os.path.join(temp_dir, 'colored_video.mp4')# 创建视频上色管道colorizer = pipeline(Tasks.video_colorization, model='damo/cv_unet_video-colorization', device='cuda')# 进行视频上色result = colorizer(input_video)# 保存上色后的视频到临时目录# 直接返回结果中的视频路径,而不是尝试写入文件return result[OutputKeys.OUTPUT_VIDEO]# 创建Gradio界面
demo = gr.Interface(fn=video_colorize,inputs=gr.Video(label="上传黑白视频"),outputs=gr.Video(label="上色后的视频"),
)if __name__ == "__main__":demo.launch(share=False)

四、效果展示

运行成功后,生成URL:http://127.0.0.1:7860
在这里插入图片描述
浏览器打开生成的URL:http://127.0.0.1:7860
在这里插入图片描述
打开准备好的黑白视频 ​​在这里插入图片描述

处理后的视频
在这里插入图片描述

五、问题与解决

问题一:ModuleNotFoundError: No module named ‘xxx’(下图为示例)
在这里插入图片描述
解决一:pip install xxx

#过程中遇到需要安装的依赖包
pip install gradio
pip install modelscope
pip install addict
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip install datasets==3.3.0
pip install simplejson
pip install sortedcontainers
pip install opencv-python
pip install ffmpeg

问题二:ImportError: cannot import name ‘get_metadata_patterns’ from ‘datasets.data_files’ 在这里插入图片描述

解决二:pip install datasets==3.3.0

问题三:PermissionError: [Errno 13] Permission denied: ‘D:\XXX\temp\gradio\09d4c3363b495e6c51b91b4c04a11b213ff48ceb3f09a20b7b46a238dfaf17ca\luomajiari.mp4’
在这里插入图片描述

解决三:按照报错信息,将路径下的mp4缓存的文件删除

http://www.lqws.cn/news/200845.html

相关文章:

  • 腾讯开源视频生成工具 HunyuanVideo-Avatar,上传一张图+一段音频,就能让图中的人物、动物甚至虚拟角色“活”过来,开口说话、唱歌、演相声!
  • 微前端 - Native Federation使用完整示例
  • 计算机是如何⼯作的
  • 【Linux shell】shell中的变量——构建脚本逻辑的基石
  • qt使用笔记二:main.cpp详解
  • PostgreSQL 的扩展pageinspect
  • 基于Python学习《Head First设计模式》第八章 模板方法模式
  • 基于Python学习《Head First设计模式》第七章 适配器和外观模式
  • moon服务器引擎-协议生成报错
  • 意识上传伦理前夜:我们是否在创造数字奴隶?
  • Scade 语言概念 - 方程(equation)
  • 1990-2023年 地级市人工智能企业数量-社科经管实证数据
  • Linux 文件系统与 I/O 编程核心原理及实践笔记
  • Python Cookbook-7.12 在 SQLite 中储存 BLOB
  • 华为云Flexus+DeepSeek征文|Dify - LLM 云服务单机部署大语言模型攻略指南
  • 又是一年高考季
  • 台式机电脑CPU天梯图2025年6月份更新:CPU选购指南及推荐
  • 《经济学原理》第9版第6章供给、需求和政府政策
  • 性能优化笔记
  • IT学习方法与资料分享
  • Srping Cloud Gateway 跨域配置 CorsWebFilter
  • 使用 Ansible 在 Windows 服务器上安装 SSL 证书系列之二
  • Qt Quick Test模块功能及架构
  • java_网络服务相关_gateway_nacos_feign区别联系
  • DeepSeek09-open-webui使用
  • 第二十八课:深度学习及pytorch简介
  • 现代C++特性(一):基本数据类型扩展
  • 低功耗MQTT物联网架构Java实现揭秘
  • 基于Spring Boot的云音乐平台设计与实现
  • C++类和对象(上)