当前位置: 首页 > news >正文

简单通过SenseVoice给自己配置一个语音转文字服务

首先把代码下载下来
git@github.com:FunAudioLLM/SenseVoice.git

然后写一个docker文件

FROM ubuntu:latestRUN apt-get update -y
RUN apt-get install -y python3-full python3-pip 
RUN mkdir -p /SenseVoice
WORKDIR /SenseVoice
RUN python3 -m venv .
ENV USE_CUDA=0
EXPOSE 7860
ENV GRADIO_SERVER_NAME="0.0.0.0"
RUN ./bin/pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cpu
COPY . .
RUN ./bin/pip install -r requirements.txt

由于这里我是Mac电脑不带GPU,所以就用了pytorch的不带GPU的安装模式,如果需要对应GPU的安装方式,可以去pytorch官网看。

第三部,启动容器,把7860端口映射。启动,就可以在http://localhost:7860/?上看到服务了。
在这里插入图片描述
然后就可以录音,通过录音进行转换了。考虑我是苹果全家桶,苹果语音转文字的情况使用。

 ./ffmpeg -i test.m4a output.wav
http://www.lqws.cn/news/473689.html

相关文章:

  • C++多态
  • 【Docker基础】Docker镜像管理:docker pull详解
  • flutter环境变量记录
  • Spring Cloud OpenFeign:微服务调用的终极利器
  • 面试题-定义一个函数入参数是any类型,返回值是string类型,如何写出这个函数,代码示例
  • 从C++编程入手设计模式——观察者模式
  • Matplotlib绘制矩阵图,plt.matshow/imshow 与 ax.pcolor(pcolormesh)方法的使用
  • Python的6万张图像数据集CIFAR-10和CIFAR-100说明
  • PowerBI HtmlContent生成表格
  • 【软考高级系统架构论文】论企业应用系统的数据持久层架构设计
  • MinIO入门教程:从零开始搭建方便快捷的分布式对象存储服务
  • 一文详解归并分治算法
  • Linux -- 文件描述符和重定向
  • Java 面试指南:深度解析 Spring Boot 与微服务架构
  • OpenBMC构建之旅:从命令到镜像的内存执行全解析
  • Java 包装类详解
  • 机器学习15-XGBoost
  • 吴恩达:从斯坦福到 Coursera,他的深度学习布道之路
  • 一套基于粒子群优化(PSO)算法的天线波束扫描MATLAB实现方案
  • Vibe Coding - 进阶 Cursor Rules
  • 深度学习的可解释性——SketchXAI:人类草图可解释性初探
  • LangChain-5-agent
  • 【51单片机2位数码管100毫秒的9.9秒表】2022-5-16
  • CNN工作原理和架构
  • 15.1 LangChain多轮对话训练实战:打造高自然度语言学习Agent的三大核心技术
  • 编程基础:调用访问
  • MagicTryOn: 变革性的AI视频虚拟试衣体验
  • 磁性传感器在电机控制闭环系统中的反馈作用
  • α射线检测DIY 空霸KB6011云母窗口魔改版 5250饼管 新固件下载
  • VMWare-Centos7.x 忘记 Linux 密码