阅读历史 |

第18章 肝完方案(1 / 2)

加入书签

林荃歌开始工作,这一肝就到了深夜。

她揉了揉酸疼的肩膀,看了看手机,居然已经12点了。

有不少信息,最主要的是有殷连承的信息。

她不确定这里有没有监控,只能快速回复:抱歉老大,才看见。未提及债券,正全力准备比赛。昨日偶遇明瑜麟,他向您投来联姻的橄榄枝。

这大少爷似乎实时在线,立刻回复了ok,也不知回复什么,就ok了。

还有四天要奋战,林荃歌准备循序渐进,先下去看看有什么吃的,再好好休息休息。

她出了房门,走廊上灯光明亮,她下了楼,楼下更是金碧辉煌,水晶吊灯散发出璀璨光芒。

她刚走到楼下,就有女佣迎上来:“何先生,您是不是需要夜宵?”

“谢谢。都有什么?”

“广式点心好吗?”

“好。麻烦啦。”广式点心正合她意,她跟着女佣走到了餐桌前。

没想到,居然又是满满当当的一大桌。

就快睡了,她便少少用了一些。

她吃饭的当头,刘嫂立刻去禀报了姚霖彦。

姚霖彦正和郑雅勋二人打游戏,听见禀报表示知道了。

“阿彦,我们上次明明拿了决赛第五,你为何骗他?”

“那不是要人家,没有负担地参赛嘛!你是不是找死,突然冲出来。”

“靠!我不是晃神了嘛!对了,你为什么非用他,上次那个不是挺好的?”

“上次那个虽然有经验,但是没什么冲击力。这小子很机灵,我觉得第一有希望。这次我非把第一的奖金拿到手不可。”

“简家肯定横插一脚,银行是他们家的,第一名肯定是自己人。”

“你看着吧,这小子说不定会给我们惊喜。决赛有电视台,简家再怎么一手遮天,也不敢当着电视台的面,动我们商家。”

这边,用完夜宵,林荃歌便跟着刘嫂去了房间里休息。

哎!这么些天,也不能更换假阳具和假胸,幸好不用跑来跑去,不然她真的会被自己熏死。

之后的连续三天,她都沉浸在建模中,无法自拔。

她甚至昼伏夜出,作息颠倒,幸好24小时有人提供食物,不然她真的会晕过去。

第二天就要交方案了,趁着晚饭时间,林荃歌直接找了姚霖彦,将方案递给他看。

姚霖彦正和郑雅勋二人热火朝天地打游戏,见她进来,二人都不由自主地放下了手里的鼠标,各自接过稿子。

“成稿了?”姚霖彦上上下下地翻着稿子。

“是。”

“你简单给我们说说。”

“好。”林荃歌直接走到姚霖彦身边,在文稿中展示她的思路。

“我先是构造了客户违约风险预测模型框架。”林荃歌指了指最上方的图表,“然后构建了xgboost、catboost两个模型。”

“通过观察训练集与测试集样本,发现测试集中出现的部分客户贷款记录是训练集中所没有的,这意味着训练出来的模型将学习不到测试集中这部分贷款记录信息,从而导致模型出现预测误差。”

林荃歌翻页,又指了指建模后对数据的分析。

她又指着四张对比图表:“根据特征的违约频率分布可视化,可以明显看到分布比较混乱。减少特征分布混乱的数据导致的噪声问题,提高模型的学习能力。”

林荃歌点点结论:“当学历水平与最高学历水平相等时,用户违约率极低,仅有02273,在一定程度上反映了客户的信用水平。”

她翻页后,继续跟进图标分析:“下面,我进行了更细粒度的特征挖掘。”

她指了指下面的图形阐释:“在风控领域,标签对主体特征非常敏感,所以我们通过构造欺诈率特征来表征类别特征,获得了极高的收益。但在实际的构建过程中,直接使用均值会造成标签泄漏,这里我们采用kfold方式进行欺诈率特征提取。

“将训练集分为5个fold,每个fold使用其余4个fold的欺诈率作为特征。”

“对全量训练集五折交叉验证后,在线下auc指标增加的情况下,选取训练集中isnew=1的数据集进行线下的五折交叉验证,当线下auc与线上auc都增加时,才保留该部分特征。”

“通过rank加权几何平均来得出最后的融合。这样的模型就能够预测客户是否会出现信用违约行为。”

林荃歌说完,看了看两人:“您二位觉得这样如何?”

“明天就交稿了,你带我们去看看模型。”

姚霖彦直接站了起来,郑雅勋也跟着站了起来。

“好。”

三人直接回了书房,林荃歌将模型展示给二人看,并让姚霖彦选取了其中一个客

↑返回顶部↑

书页/目录