相关题库

咨询

其他联系方式

所属系列课程

评价

基于SPSS MODELER软件的数据挖掘,钱兵,本次课程旨在数据挖掘流程、传统常用挖掘算法的原理和软件操作的培训。以实际案例数据为基础,讲解如何从数据预处理、挑选合适算法,直到模型检验。 第一讲 数据预处理及基础挖掘算法1 1. 字段选择 2. 数据清洗 3. 字段扩充 4. 数据编码 5. KNN算法(K Nearest Neighbors) 第二讲 基础挖掘算法2 1. 训练和测试样本数据的选取 2. 进入模型的变量筛选 3. 决策树(ID3、C5.0、CART、CHAID) 4. 回归分析(线性、非线性、Logistic回归、时间序列分析) 第三讲 进阶挖掘算法1 1. 关联规则(支持度、信赖度、提升度及Apriori 算法) 2. 聚类分析(阶层式聚类、分割式聚类) 3. 神经网络 第四讲 进阶挖掘算法 1. 支持向量机 2. 集成算法(Bagging、Boosting、Random Forest) 3. 模型评估(混乱矩阵(正确率、响应率、捕捉率、F-指标)、ROC曲线、 GINI图) 适用人群:1、 无数理基础,但有较强数据分析挖掘兴趣的学生或从业人员; 2、 有一定数理统计基础的学生或从业人员。