2017-07-27 00:00:00 MaxCompute原(ODPS)创建dual表 大家以前写sql写func的时候习惯性会用from dual来进行测试,dual表在传统数据库中是一个“神秘”的表,网上有很多网友都对该表进行了测试,该表只有一行一列,其实该表和系统中的其他表一样。 发现odps项目里没有, 然后就手动建了个表。 看上去没啥问题, 我后来运行任何函数, 都没有任何返回值, 我就纳闷了,怎么啥都不对, 后来经高人提点, 是不是你手动建的dual表里没内容,我突然间恍然大悟, 遂了一条数据到第一行中, 再次运行,就有值了。 所以这里也提醒大家: Func的运行, 表里至少要有一条数据。 Func的运行, 表里至少要有一条数据。 Func的运行, 表里至少要有一条数据。 重要的事情一定要说三遍!!! -- 删除表 DROP TABLE IF EXISTS dual; -- 创建表 CREATE TABLE
2017-07-27 00:00:00 使用MaxCompute进行网贷业务风控预测分析 摘要:网络借贷指在网上实现借贷,借入者和借出者均可利用这个网络平台,实现借贷的“在线交易”。网络借贷分为b2c和c2c模式。一切认证、记账、清算和交割等流程均通过网络完成,借贷双方足不出户即可实现借贷目的,而且一般额度都不高,无抵押,纯属信用借贷。网络借贷的风险不言而喻,构建一个准确率高的风控系统显得格外重要,现在我们利用某网络贷款网站提供的几年来贷款风险数据(经过脱敏处理),使用机器学习的方法构造一个能准确从借款人的资料中判断其违约的可能性(借钱不还)。 数据信息:包括信用违约标签(因变量,违约或者不违约)建模所需的基础与加工字段(自变量)相关用户的网络行为原始数据本着保护借款人隐私的目的,数据字段已经经过脱敏处理。Master表(每一行代表一个成功成交借款样本,每一个样本包含200多个各类字段)Log_Info(借款人的登录信息)Userupdate_Info(借款⼈修改信息) 一、违约评估架构1.数据源:数据包括某借贷网站提供的借款人资料以及是否按时还款等情况构成的记录,一共3万条记录;2.数据同步至阿里云:使用DataX工具将数据导入到在ODPS建立的表中;3.流程计算...