当前位置：首页 > news >正文

【AI实践】Mac一天熟悉AI模型智能体应用（百炼版）

news 2025/6/29 12:45:33

准备环境

MacOS M1电脑

下载安装：vscode

下载Miniconda：Download Anaconda Distribution | Anaconda

Qwen-TTS

非实时TTS

将生成的音频，保存到本地。文档见https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=https%3A%2F%2Fhelp.aliyun.com%2Fdocument_detail%2F2879134.html&renderType=iframe

修复了tts请求时，response出错的情况（比如API_KEY不对）

import os
import requests
import dashscopetext = "那我来给大家推荐一款T恤，这款呢真的是超级好看，这个颜色呢很显气质，而且呢也是搭配的绝佳单品，大家可以闭眼入，真的是非常好看，对身材的包容性也很好，不管啥身材的宝宝呢，穿上去都是很好看的。推荐宝宝们下单哦。"
response = dashscope.audio.qwen_tts.SpeechSynthesizer.call(model="qwen-tts",api_key=os.getenv("DASHSCOPE_API_KEY"),text=text,voice="Cherry",
)# ====== 开始检查 response 是否有效 ======
print(response)
if not hasattr(response, 'output') or response.output is None:print("响应中没有 output 字段，请检查权限或模型是否开通")exit()if not hasattr(response.output, 'audio') or response.output.audio is None:print("响应中没有 audio 数据，请检查返回内容")exit()if not hasattr(response.output.audio, 'url'):print("响应中 audio 没有 url 字段，请检查返回结构")exit()# ====== 结束检查 response 是否有效 ======audio_url = response.output.audio["url"]save_path = "downloaded_audio.wav"  # 自定义保存路径try:response = requests.get(audio_url)response.raise_for_status()  # 检查请求是否成功with open(save_path, 'wb') as f:f.write(response.content)print(f"音频文件已保存至：{save_path}")
except Exception as e:print(f"下载失败：{str(e)}")

问题1：pip install pyaudio失败

解决方案：

（1）先安装brew：/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"，重启

（2）再安装brew install portaudio

（3）再安装pip install pyaudio

生成的TTS音频文件，放到了本地。适合音频生成离线播报场景，比如PPT。

不适合实时的语音交互，我们需要实时TTS。

实时TTS

按照官方demo跑就好。

我们把实时TTS封装成函数api，并提供了api测试demo；

函数封装代码：qwen_play_tts.py

# coding=utf-8import os
import dashscope
import pyaudio
import time
import base64
import numpy as npdef qwen_play_tts(text, voice="Ethan", api_key=None):"""使用通义千问 TTS 进行流式语音合成并播放:param text: 合成文本:param voice: 发音人:param api_key: Dashscope API Key（可选，默认读取环境变量）"""api_key = api_key or os.getenv("DASHSCOPE_API_KEY")if not api_key:raise ValueError("DASHSCOPE_API_KEY is not set.")p = pyaudio.PyAudio()stream = p.open(format=pyaudio.paInt16,channels=1,rate=24000,output=True)responses = dashscope.audio.qwen_tts.SpeechSynthesizer.call(model="qwen-tts",api_key=api_key,text=text,voice=voice,stream=True)for chunk in responses:audio_string = chunk["output"]["audio"]["data"]wav_bytes = base64.b64decode(audio_string)audio_np = np.frombuffer(wav_bytes, dtype=np.int16)stream.write(audio_np.tobytes())time.sleep(0.8)stream.stop_stream()stream.close()p.terminate()# 示例调用
if __name__ == "__main__":sample_text = "你好，这是一段测试语音。"qwen_play_tts(sample_text)

api测试代码：qwen_api_test.py

from qwen_play_tts import qwen_play_ttsqwen_play_tts("这是一个函数调用测试。")

查看全文

http://www.lqws.cn/news/559855.html

前端React和Vue框架的区别

Spring AI Alibaba 入门指南：打造企业级 AI 应用

全面拥抱vue3

编译安装交叉工具链 riscv-gnu-toolchain

鸿蒙 Scroll 组件深度解析：丝滑滚动交互全场景实现

uni-app项目实战笔记26--uniapp实现富文本展示

中国农村统计年鉴-Excel版（1985-2024年）

机器学习框架（1）

c#激光设备行业ERP软件进销存软件库存管理软件财务管理软件

kubernetes部署3节点高可用elasticsearch v8.14.3

OpenCV图像噪点消除五大滤波方法

Cesium快速入门到精通系列教程十一：Cesium1.74中高性能渲染上万Polyline

Java笔记

机器学习配置环境

Ultralytics YOLO超参数调整指南（一）

利用ROS打印novatel_msgs/INSPVAX

JSON简介及其应用

创客匠人解析：身心灵赛道创始人 IP 打造核心策略

动捕关节数据采集系统设计与实现

Java安装与使用教程

实现一个AI大模型当前都无法正确实现的基础二叉树读取算法

TCP 在高速网络下的大数据量传输优化：拥塞控制、效率保障与协议演进

OpenAI：Let’s Verify Step by Step 解读

权电阻网络DAC实现电压输出型数模转换Multisim电路仿真——硬件工程师笔记

Http请求参数的区别

户外人像要怎么拍？

行为型 - 责任链模式详解

gantt-task-react的改造使用

MCP基础知识一

【原理图设计】5Vto3.7Vto1.5V电源板一

准备环境

Qwen-TTS

非实时TTS

实时TTS

相关文章：