当前位置：首页 > news >正文

简单通过SenseVoice给自己配置一个语音转文字服务

news 2025/7/8 9:37:37

首先把代码下载下来
git@github.com:FunAudioLLM/SenseVoice.git

然后写一个docker文件

FROM ubuntu:latestRUN apt-get update -y
RUN apt-get install -y python3-full python3-pip 
RUN mkdir -p /SenseVoice
WORKDIR /SenseVoice
RUN python3 -m venv .
ENV USE_CUDA=0
EXPOSE 7860
ENV GRADIO_SERVER_NAME="0.0.0.0"
RUN ./bin/pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cpu
COPY . .
RUN ./bin/pip install -r requirements.txt

由于这里我是Mac电脑不带GPU，所以就用了pytorch的不带GPU的安装模式，如果需要对应GPU的安装方式，可以去pytorch官网看。

第三部，启动容器，把7860端口映射。启动，就可以在http://localhost:7860/?上看到服务了。
在这里插入图片描述
然后就可以录音，通过录音进行转换了。考虑我是苹果全家桶，苹果语音转文字的情况使用。

 ./ffmpeg -i test.m4a output.wav

http://www.lqws.cn/news/473689.html

相关文章：

【Docker基础】Docker镜像管理：docker pull详解

flutter环境变量记录

Spring Cloud OpenFeign：微服务调用的终极利器

面试题-定义一个函数入参数是any类型，返回值是string类型，如何写出这个函数，代码示例

从C++编程入手设计模式——观察者模式

Matplotlib绘制矩阵图，plt.matshow/imshow 与 ax.pcolor(pcolormesh)方法的使用

Python的6万张图像数据集CIFAR-10和CIFAR-100说明

PowerBI HtmlContent生成表格

【软考高级系统架构论文】论企业应用系统的数据持久层架构设计

MinIO入门教程：从零开始搭建方便快捷的分布式对象存储服务

一文详解归并分治算法

Linux -- 文件描述符和重定向

Java 面试指南：深度解析 Spring Boot 与微服务架构

OpenBMC构建之旅：从命令到镜像的内存执行全解析

Java 包装类详解

机器学习15-XGBoost

吴恩达：从斯坦福到 Coursera，他的深度学习布道之路

一套基于粒子群优化（PSO）算法的天线波束扫描MATLAB实现方案

Vibe Coding - 进阶 Cursor Rules

深度学习的可解释性——SketchXAI：人类草图可解释性初探

LangChain-5-agent

【51单片机2位数码管100毫秒的9.9秒表】2022-5-16

CNN工作原理和架构

15.1 LangChain多轮对话训练实战：打造高自然度语言学习Agent的三大核心技术

编程基础：调用访问

MagicTryOn: 变革性的AI视频虚拟试衣体验

磁性传感器在电机控制闭环系统中的反馈作用

α射线检测DIY 空霸KB6011云母窗口魔改版 5250饼管新固件下载

VMWare-Centos7.x 忘记 Linux 密码