随着互联网金融得火热程度,金融风控行业的风险管控力量不断形成并并迅速壮大起来,对于不同金融产品以及不同目标用户对应的风控模型也日趋完善起来。本次赛题基于互联网金融中被公认为风险最高的细分领域——小额微贷(借款金额低于1000AUD)为基础,通过对应的技术来分析微额贷款“申请借款用户的征信状况,分析其是否逾期”,比如数据挖掘及分析技术等…

  • 作品征集

    10.15-12.15

  • 10.15-12.15

    作品海选

  • 入围作品投票

    10.15-12.15

  • 10.15-12.15

    复赛评审

  • 决赛

    12.20-02.15

所有参赛人员及队伍,视为已同意《竞赛作弊管理规则》及其他相关规定。队长对其队员的参赛行为负责。

  • 主办方将从比赛排名前20名的参赛队中筛选进入答辩的队伍。
  • 为了符合真实应用场景的要求。测试集(test_x.csv)中的数据不得用于模型训练。(请使用semi-supervised learning的参赛者特别注意本条规则)团队人数上限 5 人。
  • 入围答辩的参赛队,需提供竞赛解决方案的详细说明文档、代码及代码说明等资料。

扫码添加微信报名!

刘伟博士

专家

新西兰GHD公司技术主管,数据科学家
人工智能,自动机器学习平台创始人
新加坡国立大学phD
出版过15篇数据科学相关的论文与著作

张铁耀

专家

复旦大学管理科学硕士
成功领导多个商业银行金融风控模型与策略开发
实施汇丰银行巴塞尔协议项目,担任FICO模型总监
对深度学习算法有深入的研究项目

西海岸的Coder

专家

美国谷歌Google软件工程师
对机器学习,数据分析有深入研究
研究方面对智能语音识别

  • 主办单位

  • 支持单位

    耀数科技人工智能平台

赛题任务

构建优秀的分类器,准确预测测试集中每个样本标签类别

数据描述

这次数据竞赛,我们为参赛者准备了大量非常珍贵的、来自小额借款行业第一线的实战数据。数据集中共有551个特征,以用户的多维度行为数据为主。包含多种数值特征,且均经过脱敏处理。

训练集

训练集包含两个文件, train_x.csv中存有10000个样本的特征信息,uid为样本的id,x0、x1、x2...为特征,共计74个特征。train_y.csv中存有10000样本的标签信息,uid为样本的id,y为样本的标签:1为正样本(人品杠杠滴),0为负样本(人品堪忧);

训练集

测试集包含test_x.csv文件,该文件共有7495 个样本,字段同train_x.csv。

评价指标

评分指标采用auc,评分算法如下:

给定预测结果y_pred和标准答案y_true,均为np.array()类型 from sklearn.metrics import roc_auc_score score = roc_auc_score(y_true, y_pred)

提交说明

选手提交结果为一个csv文件submission.csv,编码为UTF-8,第一行为表头。

每行记录包含2列,第一列为UID,第二列为预测标签Label。

提交文件参考(具体请参考示例文件): UID,Label,0,02,1,4,1

排名 选手名 得分 提交次数 最后提交时间
1 Jack RMSE 57.703 1 2019-11-24
2 winnie RMSE 57.779 1 2019-11-27
3 Victor RMSE 58.313 2 2019-11-23
4 HS Yang RMSE 60.205 1 2019-11-26
5 Alan RMSE 60.205 1 2019-11-26
6 Johnny Zhu RMSE 60.205 1 2019-11-26
7 Sine RMSE 113.027 1 2019-11-27