当前位置: 首页 > news >正文

如何正确处理音频数据:16位整数与32位浮点数

在音频处理领域,音频数据的格式对后续的分析和处理至关重要。常见的音频格式包括16位整数和32位浮点数。本文将介绍如何正确处理这两种格式的音频数据,包括使用 scipy.io.wavfile 读取音频、使用 librosa 进行处理,以及使用 soundfilesf)写入音频文件。

1. 16位整数音频

在这里插入图片描述

1.1 读取音频

16位整数音频通常以 int16 格式存储。使用 scipy.io.wavfile 读取音频文件时,返回的数据类型为 numpy.int16

import numpy as np
from scipy.io import wavfile# 读取 WAV 文件
sample_rate, audio_data = wavfile.read('your_audio_file_16bit.wav')# 打印数据类型和范围
print(f'Data type: {audio_data.dtype}')
print(f'Data range: {audio_data.min()} to {audio_data.max()}')

1.2 处理音频

在使用 librosa 处理音频数据之前,需要将16位整数数据转换为浮点数格式,并归一化到 [-1, 1] 的范围。

import librosa# 如果数据是整数格式(例如 int16),则需要归一化
if audio_data.dtype == np.int16:audio_data = audio_data.astype(np.float32) / 32768.0  # 归一化到 [-1, 1]# 使用 librosa 进行处理
audio_data_processed = librosa.effects.preemphasis(audio_data)

1.3 写入音频

使用 soundfile 库将处理后的音频数据写入文件时,需要将浮点数数据转换回16位整数格式(如果需要)。

import soundfile as sf# 将浮点数数据转换为 int16
audio_data_int16 = (audio_data_processed * 32768).astype(np.int16)# 写入 WAV 文件
sf.write('output_16bit.wav', audio_data_int16, sample_rate)

2. 32位浮点音频

在这里插入图片描述

2.1 读取音频

32位浮点音频通常以 float32 格式存储。使用 scipy.io.wavfile 读取音频文件时,返回的数据类型为 numpy.float32

# 读取 WAV 文件
sample_rate, audio_data = wavfile.read('your_audio_file_32bit.wav')# 打印数据类型和范围
print(f'Data type: {audio_data.dtype}')
print(f'Data range: {audio_data.min()} to {audio_data.max()}')

2.2 处理音频

32位浮点音频数据通常已经在 [-1, 1] 的范围内,因此可以直接使用 librosa 进行处理。

# 使用 librosa 进行处理
audio_data_processed = librosa.effects.preemphasis(audio_data)

2.3 写入音频

使用 soundfile 库将处理后的音频数据写入文件时,可以直接写入浮点数数据。

# 写入 WAV 文件
sf.write('output_32bit.wav', audio_data_processed, sample_rate)
http://www.lqws.cn/news/453385.html

相关文章:

  • Agent轻松通-P3:分析我们的Agent
  • CppCon 2017 学习:Mocking Frameworks Considered
  • 您的元服务存在问题,不符合元服务UX设计规范
  • 从零开始:飞牛云NAS+Docker搭建WordPress全流程
  • (链表:哈希表 + 双向链表)146.LRU 缓存
  • XML在线格式化工具
  • MySQL基础多表查询
  • docker安装datax详细步骤
  • AUTOSAR实战教程--OS调试利器ORTI文件使用说明OSEK调试方法
  • OBCP第二章 OceanBase 存储引擎高级技术学习笔记
  • 63 网络交互的过程中目标设备的选择
  • PROFIBUS DP 转 EtherCAT 网关:冶金自动化高效协同的基石
  • 深入剖析HashMap与LinkedHashMap应用
  • 前端页面Javascript数组
  • python之使用cv2.matchTemplate识别缺口滑块验证码---实现最佳图像匹配
  • 主流测距技术深度解析:激光雷达、UWB、微波与视觉方案的全面对比
  • 今日行情明日机会——20250620
  • 响应式数据可视化大屏解决方案,重构工业交互体验
  • 【深度学习基础与概念】笔记(一)深度学习革命
  • 【Golang】go build 命令选项-ldflags用法
  • Spring @ModelAttribute注解全解析:数据绑定与模型管理
  • ceph 通过 crush rule 修改故障域
  • DataWhale-零基础络网爬虫技术(二er数据的解析与提取)
  • LeetCode热题100—— 169. 多数元素
  • leetcode 291. Word Pattern II和290. Word Pattern
  • 解锁数据宝藏:数据挖掘之数据预处理全解析
  • 在Django中把Base64字符串保存为ImageField
  • 思辨场域丨AR技术如何重塑未来学术会议体验?
  • LVS vs Nginx 负载均衡对比:全面解析
  • leetcode-2966.划分数组并满足最大差限制