作者 |
梁瑞宇 |
丛书名 |
出版社 |
机械工业出版社* |
ISBN |
9787111694755 |
简要 |
简介 |
内容简介 本书介绍了现代语音信号处理的基础、原理、方法和应用,并且给出一些相关算法的Python库和调用函数。全书共15章,第1章介绍了语音信号处理的发展历程、人工智能基础和相关研究方向;第2~4章介绍了语音信号处理的一些基础理论、方法和参数;第5章介绍了神经网络与深度学习的基础知识;第6~15章将语音信号处理的研究方向分为前端处理(包括语音增强、回声消除、声源定位和波束形成)、后端应用(包括语音识别、说话人识别和语音情感计算)和其他研究(包括语音合成与转换、语音隐藏和助听器声信号处理)三个部分,并介绍了相关研究的基础理论和算法原理。在附录中,介绍了学习Python语言的PyCharm软件的快速使用教程,并对文中常用的Python库进行了说明。 本书可作为计算机和通信与信息系统等学科相关专业的高年级本、专科学生和研究生的教材或教学参考用书,也可作为从事语音信号处理的科研工程技术人员的辅助读物和参考用书。 |
目录 |
前言 第1章绪论 1.1语音信号的发展历程 1.2语音信号处理的研究方向 1.3人工智能与语音处理 1.4本书结构 第2章语音信号处理的基础知识 2.1语音的产生与感知 2.2语音信号产生的数学模型 2.3语音信号的数字化 2.4语音信号的表征 2.5思考与复习题 第3章语音信号分析方法 3.1语音信号预处理 3.2语音信号的时域分析 3.3语音信号的频域分析 3.4语音信号的倒谱分析 3.5语音信号的线性预测分析 3.6思考与复习题 第4章语音信号特征提取技术 4.1端点检测 4.2基音周期估计 4.3共振峰估计 4.4思考与复习题 第5章神经网络与深度学习 5.1神经网络及其发展 5.2神经元 5.3误差逆传播算法 5.4前馈神经网络 5.5卷积神经网络 5.6循环神经网络 5.7常用的深度学习框架 5.8思考与复习题 第6章语音增强 6.1基础知识 6.2谱减法 6.3维纳滤波 6.4基于深度学习的语音增强方法 6.5思考与复习题 第7章回声消除 7.1回声消除基础知识 7.2回声消除算法 7.2.1LMS算法 7.3啸叫检测与抑制 7.4总结与展望 7.5思考与复习题 第8章声源定位 8.1双耳听觉定位原理及方法 8.2传声器阵列模型 8.3房间混响模型 8.4基于传声器阵列的声源定位方法 8.5总结与展望 8.6思考与复习题 第9章波束形成技术 9.1基本理论 9.2固定波束形成器 9.3自适应波束形成 9.4后置滤波 9.5思考与复习题 第10章语音识别 10.1基本理论 10.2语音识别原理与系统构成 10.3基于动态时间规整的语音识别系统 10.4基于隐马尔可夫模型的语音识别系统 10.5人工智能与语音识别 10.6性能评价指标 10.7思考与复习题 第11章说话人识别 11.1说话人识别的原理 11.2应用VQ的说话人识别系统 11.3应用GMM的说话人识别系统 11.4基于深度学习的说话人识别 11.5总结与展望 11.6思考与复习题 第12章语音情感计算 12.1情感的心理学理论 12.2语音情感数据库 12.3情感的声学特征分析 12.4语音情感识别经典算法 12.5深度学习模型 12.6语音情感计算的应用与展望 12.7思考与复习题 第13章语音合成与转换 13.1帧合成技术 13.2经典语音合成算法 13.3语音信号的变速和变调 13.4基于深度学习的语音合成模型 13.5总结与展望 13.6思考与复习题 第14章语音隐藏 14.1信息隐藏基础 14.2语音信息隐藏算法 14.3常用评价指标 14.4总结与展望 14.5思考与复习题 第15章助听器声信号处理 15.1听力损失与语音理解障碍 15.2压缩与响度补偿 15.3回声抑制算法 15.4降频算法 15.5总结与展望 15.6思考与复习题 附录 附录APyCharm快速使用教程 附录B常用Python库及其说明 参考文献 |