Spark机器学习4·分类模型(spark-shell)
线性模型
- 逻辑回归--逻辑损失(logistic loss)
- 线性支持向量机(Support Vector Machine, SVM)--合页损失(hinge loss)
- 朴素贝叶斯(Naive Bayes)
- 决策树
0 准备数据
kaggle2.blob.core.windows.net/competitions-data/kaggle/3526/train.tsv
sed 1d train.tsv > train_noheader.tsv
0 运行环境
cd /Users/erichan/Garden/spark-1.5.1-bin-cdh4
bin/spark-shell --name my_mlib --packages org.jblas:jblas:1.2.4-SNAPSHOT --driver-memory
