中科院数学与系统科学研究院

数学研究所

 

计算机科学研讨班

 

报告人    张师超 教授广西师范大学

 KDD全过程利用缺失数据的模型与方法

  2017.12.21(星期四),13:30-14:15

  点:数学院南楼N204

  要:传统利用缺失数据的最佳策略是:在知识发现过程(数据预处理、数据挖掘和模式评估)中,缺失数据是在数据预处理阶段填充,在数据挖掘阶段被利用。与此不同,本报告提出在KDD过程中全程充分利用缺失数据,例如,数据预处理阶段的缺失填充中将先填充好的样本用于后续缺失样本的填充,在数据挖掘阶段有选择的利用填充的样本,在模式评估阶段考察填充的缺失样本对模式质量的影响程度。本报告介绍利用缺失数据的策略,以及由此导出的新研究课题。

附件
相关文档