语音信号频率域特征及语谱图分析文献综述

 2022-11-29 04:11

一、文献综述

1.摘要

语音信号的语谱图和频谱图都是用来进行语音分析的其中两种图,以语音信号作为对象,绘制频谱图和语谱图,分析频谱图和语谱图的特征。语谱图的实际应用之一是可用于确定不同的讲话人,识别不同人的声音记录,不同的人的语谱声纹是不同的,在下次遇到同一个人的声音时能进行识别。类似于一个人的身份证或者指纹的作用。而汉语言各方言中高元音的氛围6种情况:插化、舌尖化、边檫化、鼻音化、央化、裂化[1]

关键词:傅里叶变换、共振峰、谱曲、语谱

2.正文

说话人发音器官的先天差异主要表现在语音的频率结构上,语音的短时谱中包含有激励源和声道的特性,可以反映说话人的生理差别。这说明语音信号的短时谱能展示说话人的个性特征,可以作为说话人识别应用的特征参数。对于人的听觉来说,浊音(Voice)是最重要的语音信号[2],而清音信号无明显特征,很难提取有用的听觉线索对其进行分离。

(1)声音研究状况

先理解一下声音,声波从声源的四面八方传播,而频率是指单位时间的周期数。而波长是指两个波峰之间相隔的时间距离。研究语 音 的历史 己 有2 0 0 0多年,汉 语 最 早 的韵 书 是 三 国时 魏 人 李 登 所 作的《 声 类 》,表 明 我 国 对 于 语音的 研 究也 有1 0 0 0多 年的 历 史。现 代技 术 的 应 用这 类 工 作 包 括 语音 合成、语音 识 别、计 算机语 音 处 理 和 建立 数据 库 等 几个 方 面[3]。现代声学的研究比较深入了,可以进行一定程度的语音识别,但是识别的精度和环境要求方面还有待提升,特别是在杂音的环境中如何像人耳一样提取特定音色的声音的难度更大。

(2)声音的存储方式

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版