图书介绍
语音信号处理【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- 赵力等编著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111534600
- 出版时间:2016
- 标注页数:282页
- 文件大小:50MB
- 文件页数:295页
- 主题词:语声信号处理-高等学校-教材
PDF下载
下载说明
语音信号处理PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
第2章 语音信号处理的基础知识5
2.1 语音发音及感知系统5
2.1.1 语音发音系统5
2.1.2 语音听觉系统6
2.1.3 人耳听觉特性7
2.2 语音信号生成的数学模型10
2.2.1 激励模型11
2.2.2 声道模型12
2.2.3 辐射模型15
2.2.4 语音信号的数字模型15
2.3 语音基本概念与参数16
2.3.1 声压与声强16
2.3.2 响度17
2.3.3 频率与音高17
2.4 语音信号的数字化和预处理17
2.4.1 预滤波、采样、A/D转换18
2.4.2 预加重与去加重18
2.5 语音信号处理的应用19
2.6 思考与复习题22
第3章 语音信号处理的常用算法23
3.1 矢量量化23
3.1.1 矢量量化的基本原理23
3.1.2 矢量量化的失真测度26
3.1.3 线性预测失真测度27
3.1.4 识别失真测度28
3.1.5 矢量量化器的最佳码本设计29
3.2 隐马尔可夫模型31
3.2.1 概述31
3.2.2 隐马尔可夫模型的定义34
3.2.3 隐马尔可夫模型的基本算法36
3.2.4 隐马尔可夫模型的结构类型41
3.3 神经网络43
3.3.1 神经网络概述43
3.3.2 人工神经网络的构成45
3.3.3 神经网络模型及算法47
3.3.4 基于神经网络的模式识别应用52
3.4 思考与复习题53
第4章 语音信号分析55
4.1 概述55
4.2 语音分帧55
4.3 语音信号的时域分析57
4.3.1 短时能量及短时平均幅度分析58
4.3.2 短时过零率分析59
4.3.3 短时相关分析60
4.3.4 短时平均幅度差函数63
4.4 语音信号的频域分析64
4.4.1 利用短时傅里叶变换求语音的短时谱65
4.4.2 语音的短时谱的临界带特征矢量66
4.5 语音信号的倒谱分析67
4.5.1 同态信号处理的基本原理67
4.5.2 复倒谱和倒谱68
4.5.3 Mel频率倒谱系数70
4.6 语音信号的线性预测分析72
4.6.1 线性预测分析的基本原理72
4.6.2 线性预测方程组的求解74
4.6.3 LPC谱估计和LPC复倒谱76
4.6.4 线谱对(LSP)分析78
4.6.5 LPC与LSP参数的转换79
4.7 语音信号的小波分析80
4.7.1 短时傅里叶变换81
4.7.2 连续小波变换81
4.7.3 离散小波变换82
4.8 思考与复习题84
第5章 语音信号特征提取技术85
5.1 概述85
5.2 端点检测85
5.2.1 双门限法85
5.2.2 自相关法87
5.2.3 谱熵法88
5.2.4 比例法89
5.2.5 对数频谱距离法90
5.3 基音周期估计92
5.3.1 自相关法92
5.3.2 平均幅度差函数法95
5.3.3 倒谱法96
5.3.4 简化逆滤波法98
5.3.5 基音检测的后处理99
5.4 共振峰估计100
5.4.1 带通滤波器组法101
5.4.2 倒谱法102
5.4.3 线性预测法102
5.5 思考与复习题104
第6章 语音增强105
6.1 概述105
6.2 语音特性、人耳感知特性及噪声特性105
6.2.1 语音特性105
6.2.2 人耳感知特性106
6.2.3 噪声特性106
6.3 滤波器法107
6.3.1 陷波器法107
6.3.2 自适应滤波器108
6.4 相关特征法110
6.4.1 自相关处理抗噪法语音增强技术110
6.4.2 利用复数帧段主分量特征的降噪方法111
6.5 非线性处理法112
6.5.1 小波降噪法112
6.5.2 同态滤波法113
6.6 减谱法115
6.6.1 基本原理115
6.6.2 基本减谱法的改进116
6.7 Weiner滤波法117
6.7.1 基本原理117
6.7.2 Weiner滤波的改进形式118
6.8 思考与复习题118
第7章 语音识别120
7.1 概述120
7.2 语音识别原理和识别系统的组成123
7.2.1 预处理和参数分析124
7.2.2 语音识别系统构成126
7.3 孤立字(词)识别系统129
7.3.1 基于改进的二次分类函数的汉语塞音语音识别系统130
7.3.2 基于动态时间规整(DTW)的孤立字(词)识别系统132
7.3.3 基于概率尺度DP识别方法的孤立字(词)识别系统134
7.3.4 基于隐马尔可夫模型(HMM)的孤立字(词)识别系统135
7.4 连续语音识别系统136
7.5 连续语音识别系统的性能评测139
7.5.1 评测方法及系统复杂性和识别能力的测度139
7.5.2 综合评估需要考虑的其他因素142
7.6 思考与复习题143
第8章 说话人识别144
8.1 概述144
8.2 说话人识别方法和系统结构145
8.2.1 预处理146
8.2.2 说话人识别特征的选取146
8.2.3 特征参量评价方法148
8.2.4 模式匹配方法149
8.2.5 说话人识别中判别方法和阈值的选择150
8.2.6 说话人识别系统的评价151
8.3 应用VQ的说话人识别系统151
8.4 应用DTW的说话人确认系统153
8.5 应用HMM的说话人识别系统154
8.5.1 基于HMM的与文本有关的说话人识别154
8.5.2 基于HMM的与文本无关的说话人识别155
8.5.3 基于HMM的指定文本型说话人识别155
8.5.4 说话人识别HMM的学习方法156
8.5.5 鲁棒的HMM说话人识别技术156
8.6 应用GMM的说话人识别系统157
8.6.1 GMM的基本概念157
8.6.2 GMM的参数估计157
8.6.3 训练数据不充分的问题159
8.6.4 GMM模型的识别问题159
8.7 尚需进一步探索的研究课题160
8.8 思考与复习题161
第9章 语音编码163
9.1 概述163
9.2 语音编码的评价指标165
9.2.1 语音编码的依据165
9.2.2 语音压缩系统的性能指标和评测方法167
9.3 语音信号的波形编码172
9.3.1 脉冲编码调制(PCM)172
9.3.2 自适应预测编码(APC)176
9.3.3 自适应增量调制和自适应差分脉冲编码调制177
9.3.4 子带编码(SBC)180
9.4 语音信号的参数编码186
9.4.1 线性预测声码器186
9.4.2 LPC-10编码器188
9.5 语音信号的混合编码191
9.6 思考与复习题194
第10章 语音合成与转换196
10.1 概述196
10.2 语音合成算法197
10.2.1 共振峰合成法199
10.2.2 线性预测合成法201
10.2.3 PSOLA算法合成语音202
10.3 文语转换系统(TTS)205
10.4 常用语音转换的方法207
10.4.1 频谱特征参数转换207
10.4.2 基音周期转换209
10.4.3 韵律信息转换210
10.5 语音转换的研究方向211
10.6 思考与复习题211
第11章 语音信号情感处理213
11.1 概述213
11.2 情感理论与情感诱发实验214
11.2.1 情感的心理学理论214
11.2.2 实用语音情感数据库的建立215
11.2.3 情感语料的诱发方法217
11.2.4 情感语料的主观评价方法219
11.3 情感的声学特征分析221
11.3.1 情感特征提取221
11.3.2 特征降维算法226
11.4 实用语音情感的识别算法研究228
11.4.1 支持向量机228
11.4.2 K近邻分类器229
11.4.3 高斯混合模型的基本原理230
11.5 跨语言的语音情感识别232
11.6 应用与展望233
11.6.1 载人航天中的应用的设想233
11.6.2 情感多媒体搜索234
11.6.3 个人机器人235
11.6.4 总结与展望235
11.7 思考与复习题236
第12章 语音隐藏237
12.1 概述237
12.2 国内外研究现状及存在的问题238
12.2.1 信息隐藏学科发展238
12.2.2 语音信息隐藏国内外研究现状239
12.2.3 存在的主要问题240
12.3 语音信息隐藏基础241
12.3.1 语音信息隐藏基本概念及理论241
12.3.2 信息隐藏算法分类242
12.3.3 信息隐藏技术应用243
12.4 常用评价指标244
12.4.1 感知透明性244
12.4.2 鲁棒性245
12.4.3 信息容量246
12.5 基本语音信息隐藏算法246
12.5.1 回声隐藏算法246
12.5.2 相位编码算法247
12.5.3 扩频算法247
12.5.4 Patchwork算法248
12.5.5 量化算法249
12.6 总结与展望249
12.7 思考与复习题251
第13章 声源定位252
13.1 概述252
13.2 双耳听觉定位原理及方法253
13.2.1 人耳听觉定位原理253
13.2.2 人耳声源定位线索255
13.2.3 声源估计方法256
13.3 传声器阵列模型258
13.3.1 均匀线阵259
13.3.2 均匀圆阵260
13.4 基于传声器阵列的声源定位算法分类260
13.4.1 基于最大输出功率的可控波束形成算法261
13.4.2 基于到达时间差的定位算法262
13.4.3 基于高分辨率谱估计的定位算法265
13.5 总结与展望270
13.6 思考与复习题271
附录 汉英名词术语对照272
参考文献280
热门推荐
- 3762470.html
- 180300.html
- 537263.html
- 2324986.html
- 1124626.html
- 1592935.html
- 143926.html
- 1958728.html
- 2825735.html
- 2041377.html
- http://www.ickdjs.cc/book_1854223.html
- http://www.ickdjs.cc/book_1452800.html
- http://www.ickdjs.cc/book_2471757.html
- http://www.ickdjs.cc/book_1040820.html
- http://www.ickdjs.cc/book_1148595.html
- http://www.ickdjs.cc/book_1295366.html
- http://www.ickdjs.cc/book_3379904.html
- http://www.ickdjs.cc/book_2241824.html
- http://www.ickdjs.cc/book_64074.html
- http://www.ickdjs.cc/book_2725373.html