如何进行Python音频的数据扩充-创新互联

今天就跟大家聊聊有关如何进行Python 音频的数据扩充,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

创新互联凭借在网站建设、网站推广领域领先的技术能力和多年的行业经验,为客户提供超值的营销型网站建设服务,我们始终认为:好的营销型网站就是好的业务员。我们已成功为企业单位、个人等客户提供了网站设计、做网站服务,以良好的商业信誉,完善的服务及深厚的技术力量处于同行领先地位。

经典的深度学习网络AlexNet使用数据扩充(Data Augmentation)的方式扩大数据集,取得较好的分类效果。在深度学习的图像领域中,通过平移、 翻转、加噪等方法进行数据扩充。但是,在音频(Audio)领域中,如何进行数据扩充呢?

音频的数据扩充,主要有以下四种方式:

  • 音频剪裁(Clip)

  • 音频旋转(Roll)

  • 音频调音(Tune)

  • 音频加噪(Noise)

音频解析基于librosa音频库;矩阵操作基于scipy和numpy科学计算库。

以下是Python的实现方式:

音频剪裁

import librosafrom scipy.io import wavfile
y, sr = librosa.load("../data/love_illusion.mp3")  # 读取音频print y.shape, sr
wavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])  # 写入音频

音频旋转

import librosaimport numpy as npfrom scipy.io import wavfile
y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频y = np.roll(y, sr*10)print y.shape, sr
wavfile.write("../data/raw/xxx_roll.mp3", sr, y)  # 写入音频

音频调音,注:cv库的resize函数含有插值功能。

import cv2import librosafrom scipy.io import wavfile
y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频ly = len(y)
y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze()
lc = len(y_tune) - ly
y_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, sr
wavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)  # 写入音频

音频加噪,注:在添加随机噪声时,保留0值,否则刺耳难忍!

import librosafrom scipy.io import wavfileimport numpy as np
y, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频wn = np.random.randn(len(y))
y = np.where(y != 0.0, y + 0.02 * wn, 0.0)  # 噪声不要添加到0上!print y.shape, sr
wavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)  # 写入音频

看完上述内容,你们对如何进行Python 音频的数据扩充有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注创新互联-成都网站建设公司行业资讯频道,感谢大家的支持。

文章标题:如何进行Python音频的数据扩充-创新互联
当前路径:https://www.cdcxhl.com/article8/dpooop.html

成都网站建设公司_创新互联,为您提供定制网站网站收录响应式网站品牌网站制作网站改版搜索引擎优化

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

成都app开发公司