让你少走弯路:这有一份开展机器学习的简短指南
这是一份关于开展机器学习的简短指南,以下为译文。 简单任务: 假设你有一个问题,并且你喜欢用机器学习来解决它,然后在现实项目中使用该系统。我喜欢简单分享下我的方法,目的是给初学者提供基本的指导并记录这些东西来提醒自己。 当遇到任何问题,首先有很多的学习算法,建立的大数据知识应用在针对某些特定问题的模型上,所有的这些想法都遵循以下三个阶段: 1定义基于度量的目标 2建立系统 3用更多的数据优化系统 下面查看这些步骤的更多细节 定义目标和指标 人类水平 VS 可接受 第一件事情,是需要从系统性能中调整预期质量。我们所期望的人类水平的表现,如果它是医疗诊断系统,或者它是一个简单的移动应用程序,我们可能更喜欢成本较低的。这一决定定义了系统的成本(时间,金钱和工程)。当我们增加期望时,也需要投入更多的成本。 什么指标用于度量 针对面临的相关问题,定义合适的指标衡量系统性能。它应该匹配问题的性质。可能的选择是以下这些; l精确 - 目标分类 l复查 - 医疗诊断 l大量错误 - 房屋租赁价格预测 lF评分 - 文献分类分类 定义合适的指标会造成巨大的特性差异。它涉及在你开发解决方案的人工环...
