作者:孙广路著
出版社: 中国水利水电出版社
CIP号:2017122306
书号:978-7-5170-5526-6
出版地:北京
出版时间:2017.6
定价:¥39
本书在机器学习、自然语言处理等相关领域知识基础上,研究语料库构建方法,提出了基于最底层非终结节点抽取,基于中文chunklink自动抽取算法和基于人工标注的三种不同的中文组块分析语料库获取方法;应用多种有指导的机器学习方法建立组块分析模型,提升了分析系统的性能;提出基于语义类和词类先验知识的新特征,有效地避免了自动词性标注带来的级联错误的问题;建立具有词法分析和组块分析功能的中文自然语言处理一体化模型,改进语言处理技术。本书还将自然语言处理技术应用到垃圾邮件过滤和问答式信息检索中,提出了有效的应用方法,获得了良好的应用效果。 本书可作为计算机科学与技术、语料库语言学等相关学科专业高年级本科生和或研究生教材,也可供从事上述领域研究工作的学生、科研人员及工程技术人员等参考。