分析泰坦尼克号沉船数据 机器学习告诉你谁获救概率更大
【大数据文摘-阿里云栖社区】成立啦
首次活动报名:21天快速搭建推荐系统
讲师:阿里云算法专家,阿里云推荐引擎技术负责人 郑重(卢梭)
时间:6月16日晚20:00
报名方式详见文末
◆ ◆ ◆
1、实验流程
让我们假设这样一个略显沉重的应用场景:泰坦尼克号沉船事件。通过分析泰坦尼克号沉船事件幸存者和丧生者的数据,机器学习是否能够判断拥有什么样的属性的人有更大的概率获救?
◆ ◆ ◆
2、数据准备
原始数据
将数据导入MaxCompute,
• PassengerId:用户的ID号
• Survived:乘客是否获救,“1”表示获救,“0”表示没有获救。目标队列(target)
• Pclass:乘客的社会阶层,“1”表示Upper,“2”表示Middle,“3”表示Lower
• Sex:乘客的性别,“1”表示男,“