剑指京东Offer:流失模型,石小秀老师,1. 用plotly,matplotlib进行数据可视化
2. 进行特征处理:对不均衡数据进行下采样/上采样,scale, RF填补缺失值,合并特征,去掉多重共线性,连续变量离散化,object变量数值化,热编码。
3. 用LR,RF , XGBoost,LightGBM进行模型训练,调整threshold,调参与预测
4. 用recall score, F1 score, ROC,PRC,confusion matrix和乘以经济增益的confusion matrix,KS(Kolmogorov-Smirnov)来进行模型评估
5. 模型Votting,测试不同的vote weights,提升模型预测的recall, F1 score
6. 用XGBoost选取新的特征组合,结合原始数据,用LR进行模型训练,调整threshold,调参数,进行预测
7. 根据feature对客户画像和行为进行分析,对即将可能发生的风险进行预防,比如给予promotion 适用人群:想要进入好企业,拿高薪的小伙伴。