文本挖掘预处理相关基础技术分析与应用研究

文本挖掘预处理相关基础技术分析与应用研究

作者:

出版社: 中国市场出版社

CIP号:2015262467

书号:978-7-5092-1420-6

出版地:北京

出版时间:2015.11

定价:¥39.0


简介

本著作将在对比分析并发现现有文本挖掘技术存在不足的基础上,提出改进文本预处理精度的算法。文中涉及的主要技术包括文本收集、文本预处理、处理后的文本的中文分词、预抽取训练样本及使用KNN方法进行文本训练和文本分类等。通过对系统功能的分析,本研究把系统分成了文本预处理、中文分词、文本特征向量的提取、文本特征向量的训练和分类等四部分。本课题实现了文本收集、文本预处理和中文分词等文本挖掘的关键技术,并在研究的基础上提出了一套特征抽取及文本挖掘的方案,为后续的研究奠定了基础。

推荐

车牌查询
桂ICP备20004708号-3