机器学习实现海量新闻自动分类
通过最佳实践帮助您实现上述案例效果
Step1:数据导入MaxCompute
1.1 创建需要上传的本地数据
新闻文本表:
| 字段名 | 含义 | 类型 | 描述 |
| category | 新闻类型 | string | 体育、女性、社会、军事、科技等 |
| title | 标题 | string | 新闻标题 |
| content | 内容 | string | 新闻内容 |
源数据:nlp_use
stop_words表:
| 字段名 | 含义 | 类型 | 描述 |
| point | 用户名 | string | 人 |
| stop_words | 标点符号 | string | " " ,等 |
源数据:stop_words
1.2 创建MaxCompute表
1.2.1 开通MaxCompute
阿