音乐信息提取-1-音频表示

news2025/7/20 17:10:10

音频信号是声音的一种表示,它表示由振动引起的气压随时间的波动(数字信号处理-1-关于声音与波)。

1 波形与时域

音频信号在时域上的表示就是波形随时间的变化,可以将波形的幅度值理解为声压。

声音是连续的,但数字记录是离散的,一段连续的波形我们只能按时间分成很小的间隔去记录。这里就涉及到采样率,记为 fs( sampling frequency) 或 sr(sampling rate),也就是一分钟采样多少次。CD 光盘中采样率一般为 44100 Hz。
在这里插入图片描述

%matplotlib inline
import numpy, scipy, matplotlib.pyplot as plt, IPython.display as ipd
import librosa, librosa.display
import stanford_mir; stanford_mir.init()

# 返回波形数组,采样率
x, sr = librosa.load('audio/c_strum.wav')
# 播放器
ipd.Audio(x, rate=sr)
# 波形
plt.figure(figsize=(15, 5))
librosa.display.waveshow(x, sr, alpha=0.8)

2 音色

音色(Timbre)是区别声音的一种显著特征。

2.1 音色与时间

音色的一个特征是它的时间演变。信号的包络线(envelope)是一条平滑曲线,它近似于波形随时间变化的幅度极值,是波形的一种简化近似。

包络通常由 ADSR 模型建模,该模型描述了声音的四个阶段:起音、衰减、延音、释放( attack, decay, sustain, release)。

起音阶段,声音逐渐增强,通常在很宽的频率范围内带有类似噪声的成分。 这种在声音开始时的类似噪音的短时声音通常被称为瞬态(transient)。

衰减阶段,声音稳定并达到稳定的周期性模式。

维持阶段,能量保持相对恒定。

释放阶段,声音逐渐消失。
在这里插入图片描述

2.1 音色与频谱

用于表征音色的另一个属性是分音(Partials)的存在及其相对强度。 分音是音乐中的主要频率,最低分音是基频( fundamental frequency)。

如下图幅度值最大的 1000Hz 即是主要分音,最低分音 500Hz 即是基频
在这里插入图片描述

x, sr = librosa.load('audio/oboe_c6.wav')
ipd.Audio(x, rate=sr)

X = scipy.fft.fft(x[10000:14096])
X_mag = numpy.absolute(X)
plt.figure(figsize=(14, 5))
plt.plot(f[:2000], X_mag[:2000]) # magnitude spectrum
plt.xlabel('Frequency (Hz)')

参考:
公开 wav 格式音频,针对音乐信息提取
musicinformationretrieval.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/37730.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring创建、Bean对象的存储和读取

文章目录1、创建Spring项目1.1 创建Maven项目1.2 添加 Spring 框架支持1.3 添加启动类并添加main(非必要步骤)2、存储Bean对象2.1 添加Spring配置文件(第一次添加)2.2 创建Bean对象2.3 将Bean对象注册到Spring容器中3、读取并使用…

秋招挂麻了,就差去送外卖了,10w字Java八股啃完,春招必拿下

最近看到一名前腾讯员工发的帖子,总结的近期面试结果,真的就是那三个字:挂麻了…… 一个毕业后就在腾讯的高级程序员,由于种种原因,离职出来了。趁着金九银十求职季,互联网大厂小厂面试了一圈,感…

AcWing 搜素与图论

搜索 DFS 全排列 代码 #include<iostream> using namespace std;int vis[10], a[10];void dfs(int step, int n) {if (step n 1){for (int i 1; i < n; i)printf("%d ", a[i]);printf("\n");return;}for (int i 1; i < n; i){if (!vis[i…

计算机网络笔记5 传输层

文章目录前言一、运输层概述二、运输层的端口与复用、分用的概念三、UDP协议 和 TCP协议 对比用户数据报协议 UDP&#x1f4a6;&#xff08;User Datagram Protocol&#xff09;传输控制协议 TCP&#x1f4a6;&#xff08;Transmission Control Protocol&#xff09;四、TCP协议…

作用域和作用域链

文章目录1.作用域&#xff08;Scope&#xff09;1.1 什么是作用域1.2 全局作用域1.3 函数作用域1.3 块级作用域2. 作用域链2.1 自由变量2.2 作用域链2.3 *自由变量的取值2.4 作用域与执行上下文的区别3.总结1.作用域&#xff08;Scope&#xff09; 1.1 什么是作用域 当前的执…

easy-rules规则引擎最佳落地实践

写作目的 这是一个头部互联网公司中的一个问题。因为有很多业务产品线&#xff0c;作为一个新人或者团队外的人员是很难区分不同的产品线之间的区别的&#xff0c;因此需要给某个产品线一个描述。但是随着业务的发展&#xff0c;产品线下可能又根据某个字段进一步划分&#xf…

招生CRM系统|基于Springboot实现培训机构招生CRM管理系统

作者主页&#xff1a;编程指南针 作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、掘金特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容&#xff1a;Java项目、毕业设计、简历模板、学习资料、面试题库、技术互助 收藏点赞不迷路 关注作者有好处 文末获取源…

Mongodb操作基础 分片

Mongodb分片 MongoDB分片是MongoDB支持的另一种集群形式&#xff0c;它可以满足MongoDB数据量呈爆发式增长的需求。当MongoDB存储海量的数据时&#xff0c;一台机器可能无法满足数据存储的需求&#xff0c;也可能无法提供可接受的读写吞吐量&#xff0c;这时&#xff0c;我们就…

基于内容的个性化推荐算法

一、什么是推荐算法 随着移动互联网的高速发展与智能手机的普及&#xff0c;海量的有用信息虽然为人们提供了更多的价值&#xff0c;然而信息的泛滥也意味着为了寻找合适的信息必须付出更多的时间成本。事实上&#xff0c;有时候仅仅是浏览和简单的查询来寻找有用的信息变得相…

「强烈收藏」Python第三方库资源大全,1000+工具包

前言 awesome-python 是 vinta 发起维护的 Python 资源列表&#xff0c;内容包括&#xff1a;Web 框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等。 &#xff08;文末送读者福利&#xff09; …

超全!程序员必备的20个学习网站,看这一篇就够了!

之前一直想出个程序员学习清单&#xff0c;终于腾出时间弄出来了&#xff0c;也趁此机会整理了收藏夹。 此篇对于新手程序员比较有用&#xff0c;技术老鸟们也可以查缺补漏。 话不多说&#xff0c;纯纯干货呈上&#xff0c;赶紧点个赞收藏&#xff0c;以后会用得上&#xff01;…

CMake中include_directories的使用

CMake中include_directories命令用于在构建(build)中添加包含目录,其格式如下: include_directories([AFTER|BEFORE] [SYSTEM] dir1 [dir2 ...]) 将给定的目录添加到编译器(compiler)用于搜索包含文件的目录。相对路径被解释为相对于当前源目录。 包含目录被添加到当前C…

【网络】tcpdump、Wireshark 案例超详细介绍

文章目录网络分层应用层找到服务器的 IP查接口、对象的耗时删除指定网站的Cookie表示层、会话层tcpdump、wireshard传输层telnet: 路径可达性测试nc: 路径可达性测试netstat&#xff1a;查看当前连接状态iftop&#xff1a;查看当前连接的传输速率netstat -s: 查看丢包和乱序的统…

万字 HashMap 详解,基础(优雅)永不过时

本文已收录到 AndroidFamily&#xff0c;技术和职场问题&#xff0c;请关注公众号 [彭旭锐] 提问。 前言 大家好&#xff0c;我是小彭。 在上一篇文章里&#xff0c;我们聊到了散列表的整体设计思想&#xff0c;在后续几篇文章里&#xff0c;我们将以 Java 语言为例&#xff…

【王道计算机组成原理Note】5.5 指令流水线

5 指令流水线 5.1 指令流水的定义 一条指令的执行过程可以分成多个阶段(或过程)。根据计算机的不同&#xff0c;具体的分法也不同。 取指&#xff1a;根据Pc内容访问主存储器&#xff0c;取出一条指令送到IR中。分析&#xff1a;对指令操作码进行译码&#xff0c;按照给定的寻…

Visio 安装暴雷记录

Visio 安装记录起因&#xff1a; office2016家庭学生版中&#xff0c;安装visio2021后&#xff0c;插入word的vsdx图形右键显示unkown类型&#xff0c;无法识别&#xff0c;给学习工作带来很多麻烦&#xff01;   搜查一圈没找到对应可用的方法&#xff0c;想着可能是visio20…

MobPush for Flutter

集成准备 这是一个基于 MobPush 功能的扩展的 Flutter 插件。使用此插件能够帮助您在使用 Flutter 开发应用时&#xff0c;快速地实现推送功能。 在pubspec.yaml文件中加入下面依赖 dependencies:mobcommonlib:mobpush_plugin: 然后执行&#xff1a;flutter packages get 导…

倍增(小试牛刀)

二分每次折半&#xff0c;倍增每次2的倍数 原理先存储每个小区间的最值也就是初始化&#xff0c;之后直接查询 1. 把数列按倍增分成小区间 对数列的每个元素&#xff0c;把从它开始的数列分成长度为1、2、4、8、…的小区间。下图给出了一个分区的例子&#xff0c;它按小区间…

java--JVM

JVM1.JVM的内存结构2.哪些部分会出现内存溢出3.方法区与永久代、元空间之间的关系4.JVM内存参数5.JVM垃圾回收算法&#xff08;1&#xff09;标记清除&#xff08;2&#xff09;标记整理&#xff08;3&#xff09;标记复制6.GC和分代回收算法7.三色标记和并发漏标问题8.垃圾回收…

【分布式技术专题】「Zookeeper中间件」给大家学习一下Zookeeper的”开发伴侣”—Curator-Framework(基础篇)

CuratorFramework基本介绍 CuratorFramework是Netflix公司开源的一套Zookeeper客户端框架&#xff0c;它作为一款优秀的ZooKeeper客户端开源工具&#xff0c;主要提供了对客户端到服务的连接管理和连接重试机制&#xff0c;以及一些扩展功能&#xff0c;它解决了很多ZooKeeper…