作者:
出版社: 东北师范大学出版社
CIP号:2018131390
书号:978-7-5681-4605-0
出版地:长春
出版时间:2018.6
定价:¥35
该书为网络技术研究专著。作者在分析和总结了大学生网络舆情主题分类中文本分类框架、文本表示模型、文本预处理、特征选择、特征提取、特征加权、文本分类器以及分类性能评估的基础上,对文本特征加权和文本表示策略进行了深入研究。面向均衡数据集,提出了两种特征加权算法;面向失衡数据集,提出了一种特征加权算法,共计三种有监督特征加权算法。此外,针对有监督特征加权算法,提出了一种最优文本表示策略。