基于统计分析的数据挖掘中数据处理综述
A survey of data processing in data mining based on statistical analysis
陈科,张保明,王宇灵,谢明霞
摘要(Abstract):
数据是一切数据挖掘工作的前提。文章将基于统计分析的数据挖掘中的数据处理工作分为前期处理和后期处理两部分,对其过程和处理方法作了综合论述,并通过实例比较分析进一步证明了数据处理对于知识发现的必要性和重要性。
关键词(KeyWords): 数据挖掘;统计分析;数据标准化;单一样本t检验;P-P概率图
基金项目(Foundation):
作者(Author): 陈科,张保明,王宇灵,谢明霞
参考文献(References):
- [1]李德仁,王树良,史文中,王新洲.论空间数据挖掘和知识发现[J].武汉大学学报.信息科学版,2001,26(6):491-499.
- [2]李德仁,王树良,李德毅.空间数据挖掘理论与应用[M].北京:科学出版社,2006.
- [3]王新洲.论空间数据处理与空间数据挖掘[J].武汉大学学报.信息科学版,2006,31(1):1-4,8.
- [4]陆远权,杨丹.关于人口质量区域差异的聚类分析[J].统计与决策(理论版),2007,(12):80-82.
- [5]张路.基于多元统计分析的遥感影像变化检测方法研究[D].武汉:武汉大学,2004-12.
- [6]庄楚强,何春雄.应用数理统计基础[M].广州:华南理工大学出版社,2006.