
音频处理
zoe9698
Nothing
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
音频处理中需要用到的关于声乐的基本概念
参考文献:图解泛音及形成原理音的高度:=音的振动频率(正比) 音高的计量:钢琴上每七个白键一个循环,分别叫做CDEFGAB(为何不是从A开始,而是从C开始?这是个历史问题。。。),也就是我们熟知的”Do Re Mi Fa So La Si”,过了一个循环就下标加一,又叫升八度,即,C1, C2, C3, C4…高八度的声音,频率高一倍,也就是说,C2比C1的频率高一倍,C3比C2的频...转载 2019-04-12 17:17:45 · 9747 阅读 · 0 评论 -
基于深度学习的音乐推荐系统(一)音频频谱图绘制
采集mp3音频样本 数据量小可以直接客户端批量下载,网易云下载的是mp3格式,每天每个id下载限度300首。数据量大写爬虫。 mp3音频样本转为wav格式样本 这一步涉及到python的文件路径编程,主要用到的是os库函数。from pydub import AudioSegmentimport os,sys#单个转码# print(sys.argv[0])...原创 2019-04-14 13:19:20 · 6664 阅读 · 3 评论 -
基于深度学习的音乐推荐系统(二)用于语谱图分类的卷积神经网络结构
Tensorflow1.13极客云GPU服务器极客云注册地址用这个链接可以免费获得10元优惠券,好像是不需要充值就可以用。本系统用单核GPU,最便宜的那种就行。该CNN的训练样本分为两类一共10类音频,每类100首歌曲,每首歌曲分割为11张图。即每类1100张图。训练集:每类的前1000张图。测试集:每类的后100张图。代码如下:train_li...原创 2019-06-07 10:56:52 · 4475 阅读 · 4 评论 -
基于深度学习的音乐推荐系统(三)使用已训练的卷积神经网络提取语谱图特征并计算图像间相似度
该模块包含几部分:调用训练好的并且已经保存的CNN模型(仅四层卷积层部分) 逐个读取tfrecords文件中的元素,并送入已训练好的CNN中,给每个图片提取128个特征 每首歌包含11个图片,即11*128个特征,将每首歌的11*128个特征之间进行余弦相似度计算 逐个歌曲计算,返回每个歌曲的最相似的三首歌歌名,以列表的形式 调用训练好的并且已经保存的CNN模型(仅四层卷积层部分)...原创 2019-06-07 21:45:58 · 4929 阅读 · 9 评论