R语言销售数据欺诈侦测,IT与互联网,数据处理,艾数教育,【课程目标】
本课程是基于R语言编程的对一个销售数据欺诈的甄别方法,通过数据挖掘方法可以大大的减少用人力甄别的工作量,提高工作效率。
学员能够了解一个完整的数据挖掘方案思路和具体操作步骤。
【课程大纲】
1. 基础知识概述
简要介绍欺诈侦测技术、应用场景、具体应用等内容。
2. 案例问题描述
介绍本案例问题、数据来源、最终数据挖掘要求结果。
3. 案例数据探索
对本案例的销售数据进行七个步骤的详细分析探索。
4. 案例数据预处理
通过分析数据缺失机制,采用不同的处理方法对数据进行预处理,为后续数据挖掘做准备。
5. 案例思路及评价方法
根据案例的数据情况,介绍了三种案例思路:无监督、有监督和半监督,以及模型的评价指标。
6. 不同数据挖掘方案
基于DMwR包和Fraud包,分别比较了三种数据挖掘算法:箱线图规则 (BPrule,无监督),简单贝叶斯 (NaiveBayes,有监督),自训练的简单贝叶斯 (NaiveBayes-ST,半监督),并得出了最优销售数据挖掘算法方案。
7. 总结与展望
对整个课程的思路和每部分内容做了回顾,并介绍了课程的后续问题研究思路。
【课时总长】3h
【课程资料】
学习了本门课的同学加课程咨询QQ,注明云课堂账号,提供所有课程相关学习资料。 适用人群:具备R语言和统计学基础知识,营销部门的相关人员。