作者:王宏志著
出版社: 哈尔滨工业大学出版社
CIP号:2018253125
书号:978-7-5603-7753-7
出版地:哈尔滨
出版时间:2018.11
定价:¥48
本书融入了作者最新的研究成果,对大数据进行了有效数据清洗,提高其可用性及应用性,同时解决了大数据的规模大、速度快、多源异构等特征,为数据清洗带来了可扩展性低、缺少知识、错误混在等挑战性问题,并围绕大数据质量的一致性、完整性、实体同一性等多个维度,提出了大数据清洗的关键技术,有效地纠正大数据中的错误,从而达到解决大数据上的数据质量的目的。