《Scikit-Learn与TensorFlow机器学习实用指南》 第02章 一个完整的机器学习项目(上)
(第一部分 机器学习基础)第01章 机器学习概览 第02章 一个完整的机器学习项目(上)第02章 一个完整的机器学习项目(下)第03章 分类第04章 训练模型第05章 支持向量机第06章 决策树第07章 集成学习和随机森林第08章 降维 (第二部分 神经网络和深度学习)第9章 启动和运行TensorFlow 本章中,你会作为被一家地产公司雇佣的数据科学家,完整地学习一个项目。下面是主要步骤: 项目概述。 获取数据。 发现并可视化数据,发现规律。 为机器学习算法准备数据。 选择模型,进行训练。 微调模型。 给出解决方案。 部署、监控、维护系统。 使用真实数据 学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找数据的资源: 流行的开源数据仓库:UC Irvine Machine Learning RepositoryKaggle datasetsAmazon’s AWS datasets 准入口(提供开源数据列表)http://dataportals.org/http://opendatamonitor.eu/ht...
