KTV 歌曲推荐-PCA 降维+逻辑回归-性别预测及过拟合处理
前言 上一篇使用逻辑回归预测了用户性别,由于矩阵比较稀疏所以会影响训练速度。所以考虑降维,降维方案有很多,本次只考虑PCA和SVD。 PCA和SVD原理 有兴趣的可以自己去研究一下 https://medium.com/@jonathan_hui/machine-learning-singular-value-decomposition-svd-principal-component-analysis-pca-1d45e885e491 我简述一下: PCA是将高维数据映射到低维坐标系中,让数据尽量稀疏 SVD就是非方阵的PCA 实际使用中SVD和PCA并无太大区别 如果特征大于数据记录数,并不能有好的效果,具体原因自己可以去看。 代码 数据获取和处理 以前文章写过很多次,这里略过 原数据shape为:2000*1900 PCA和矩阵转换 查看最佳维度数 %matplotlib inline import numpy as np import matplotlib.pyplot as plt from sklearn.decomposition import PCA pca = PCA(...

