在一头扎进机器学习前应该知道的那些事儿
摘要: 本文简单总结了机器学习的几大任务及其对应的方法,方便初学者根据自己的任务选择合适的方法。当掌握机器学习基本知识以及清楚自己所要处理的任务后,应用机器学习就不会那么难了。
机器学习一直是一个火热的研究领域,深度学习方法的提出又为这个领域添了一把火,使得很多人对该领域感兴趣并想投身于该领域的研究之中。那么,对于想从事机器学习领域的人来说,有哪些是应该首先了解的内容呢?本文将简单的介绍下机器学习的基本相关知识。
机器学习是指使计算机系统使用统计技术学习数据的过程,而不需要具体的编程程序。该方法是一个主动学习的算法,使得它能够从数据中学习并进行预测。机器学习与计算统计、数学优化以及数据学习密切相关,通常被用来进行预测、分析等任务。机器学习一般用于处理两类任务:
有监督学习:输入给计算机的示例带有标签(期望输出),基于标签调整建立的模型,以学习输入到输出的映射规则。
无监督学习:输入给计算机的示例没有标签,建立的模型必须通过自身学习产生输出。无监督学习涉及到从数据中发现
隐藏的模式,包含特征学习。
机器学习这个术语对于大多非该领域的人来说听起来很高级,但其实不然。只要你清楚机器学习的基本概念以及相关方法后,机器学习其实很简单,即根据相关任务,选择合适的机器学习方法,让机器学习并处理特征以完成相应的任务。因此,在学习和应用机器学习之前,我们首先应该明确自己的任务是什么,以及适合使用哪种机器学习方法来完成。
如果我们想了解算法背后的基本理论以及其工作原理,那么精通概率与统计、线性代数和微积分对我们而言显得至关重要。此外,了解诸如Python等编程语言将使你能够容易得实现相关算法,理论基础与编程能力二者在手,机器学习我有。此外,理解相关的数学知识和应用也是很有必要的,无论是通过线下自学或者是网络在线培训等学习方法,都必须实践,实践可以增加自己对基本知识的理解,同时也能锻炼其编程能力。
在学习机器学习之前,掌握以下知识是很有必要的:
线性代数
微积分
概率论
程序设计
最优化理论
下面是一些最常见的机器学习任务以及相关方法,对其理解后方便在后续工程中应用。
回归
回归主要涉及连续变量或数值变量的估计,比如估计房价、股票价格、产品价格等使用回归估计。即根据相关的数据建立回归曲线,对新的数据进行预测估计。以下机器学习方法用于解决回归问题:
核回归(Kernel regression)
支持向量回归(Support vector regression)
高斯过程回归(Gaussian process regression)
线性回归(Linear regression)
LASSO回归(Least absolute shrinkage and selection operator)
回归树(Regression tree)
分类
分类与离散变量或数据类别的预测有关。比如区分垃圾邮件、病人患有哪种疾病、交易是否属于欺诈行为等任务,都是使用分类方法处理的。以下方法可以用于解决分类问题:
核判别分析(Kernel discriminant analysis)
人工神经网络(Artificial neural networks)
K邻近算法(K-nearests neighbors)
Boosted trees
随机森林(Random forests)
逻辑回归(Logistic regression)
支持向量机(Support vector machine)
深度学习(Deep learning)
朴素贝叶斯(Naive Bayes)
决策树(Decision trees)
聚类
聚类一般应用于数据自然分组。比如产品特征识别、客户细分等任务都是聚类的一些应用场景。以下机器学习方法用于聚类问题:
均值漂移(Mean-shift)
K-均值(K-means)
主题模型(Topic models)
层次聚类(Hierarchical clustering)
多元查询
多元查询是用来寻找相似目标。下面的方法可用于解决与多元查询有关的问题:
近邻取样(Nearest neighbors)
最远邻居(Farthest neighbors)
范围搜索(Range search)
降维
降维是指降低多个随机变量的维度,将其分为特征提取和特征选择。常用的降维方法如下:
流线学习方法/核主成分分析(Manifold learning/KPCA)
独立分量分析(Independent component analysis)
主成分分析(Principal component analysis)
非负矩阵分解(Non-negative matrix factorization)
压缩感知(Compressed sensing)
高斯图模型(Gaussian graphical models)
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
MySQL 主从复制
MySQL的主从复制实现的原理就是 binlog 日志,那么我们主节点负责数据库写操作,而从节点负责读操作,这样在从节点上不需要使用事务,能够大大提高数据库的性能。那么这个时候面临的问题就是从节点如何来同步主节点数据的问题,就用到了我们之前说过的 binlog 日志。从节点通过 binlog 日志来与主节点进行数据同步。 视频链接:http://www.roncoo.com/course/view/658088f6e77541f5835b61800314083e 三台节点,一个 master,两个 slave,规划如下 master 192.168.153.201 slave1 192.168.153.152 slave2 192.168.153.153 三台节点都是使用 CentOS6.9 操作系统,数据库使用的是 mysql5.7。 配置 master 1.创建用户并授权,比如我们的用户叫做 repl,创建用户语法如下: createuser‘repl' 2.授权。用户必须具备 replication slave 权限,除此之外不需要其他的权限 grantreplicationsl...
- 下一篇
zabbix实战--Zabbix 自动发现、自动注册
龙果运维平台开源地址:https://github.com/roncoo/roncoo-cmdb Zabbix3.0入门到生产环境应用实战:http://www.roncoo.com/course/view/fb3050a5b34b42f39ccad83ebebc89c1 一、软件版本 操作系统:CentOS-6.5-x86_64 zabbix版本:3.0.3 二、实现目标: 1、能够发现网络内主机。并且添加相应主机模板。 2、主机是去自动移除主机。 3、主机上线自动添加主机。 三、基于发现规则的条件: 1、IP地址段 2、基于服务器,比如说FTP、SSH、WEB等 3、基于zabbix-Agent 4、还有snmp 四、配置发现主机添加模板: 1、定义发现规则: 配置--》自动发现--》创建自动发现规则。 *IP范围为agent地址发现的范围,延迟最好设置时间够长,这里设置30s只是为了方便测试。(定义IP范围,咱们可以定义不同应用添加不同模板) 2、定义发现后执行的动作(添加主机模板等操作): 配置--》动作--》创建自动发现动作: 条件选型卡: 1、选择我...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Mario游戏-低调大师作品
- 2048小游戏-低调大师作品
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- 设置Eclipse缩进为4个空格,增强代码规范
- Windows10,CentOS7,CentOS8安装Nodejs环境
- MySQL8.0.19开启GTID主从同步CentOS8
- Docker快速安装Oracle11G,搭建oracle11g学习环境