在一头扎进机器学习前应该知道的那些事儿-低调大师

在一头扎进机器学习前应该知道的那些事儿

2018-11-29 788

摘要：本文简单总结了机器学习的几大任务及其对应的方法，方便初学者根据自己的任务选择合适的方法。当掌握机器学习基本知识以及清楚自己所要处理的任务后，应用机器学习就不会那么难了。

机器学习一直是一个火热的研究领域，深度学习方法的提出又为这个领域添了一把火，使得很多人对该领域感兴趣并想投身于该领域的研究之中。那么，对于想从事机器学习领域的人来说，有哪些是应该首先了解的内容呢？本文将简单的介绍下机器学习的基本相关知识。

机器学习是指使计算机系统使用统计技术学习数据的过程，而不需要具体的编程程序。该方法是一个主动学习的算法，使得它能够从数据中学习并进行预测。机器学习与计算统计、数学优化以及数据学习密切相关，通常被用来进行预测、分析等任务。机器学习一般用于处理两类任务：

有监督学习：输入给计算机的示例带有标签（期望输出），基于标签调整建立的模型，以学习输入到输出的映射规则。

无监督学习：输入给计算机的示例没有标签，建立的模型必须通过自身学习产生输出。无监督学习涉及到从数据中发现

隐藏的模式，包含特征学习。

机器学习这个术语对于大多非该领域的人来说听起来很高级，但其实不然。只要你清楚机器学习的基本概念以及相关方法后，机器学习其实很简单，即根据相关任务，选择合适的机器学习方法，让机器学习并处理特征以完成相应的任务。因此，在学习和应用机器学习之前，我们首先应该明确自己的任务是什么，以及适合使用哪种机器学习方法来完成。

如果我们想了解算法背后的基本理论以及其工作原理，那么精通概率与统计、线性代数和微积分对我们而言显得至关重要。此外，了解诸如Python等编程语言将使你能够容易得实现相关算法，理论基础与编程能力二者在手，机器学习我有。此外，理解相关的数学知识和应用也是很有必要的，无论是通过线下自学或者是网络在线培训等学习方法，都必须实践，实践可以增加自己对基本知识的理解，同时也能锻炼其编程能力。

在学习机器学习之前，掌握以下知识是很有必要的：

线性代数

微积分

概率论

程序设计

最优化理论

下面是一些最常见的机器学习任务以及相关方法，对其理解后方便在后续工程中应用。

回归

回归主要涉及连续变量或数值变量的估计，比如估计房价、股票价格、产品价格等使用回归估计。即根据相关的数据建立回归曲线，对新的数据进行预测估计。以下机器学习方法用于解决回归问题：

核回归（Kernel regression）

支持向量回归（Support vector regression）

高斯过程回归（Gaussian process regression）

线性回归（Linear regression）

LASSO回归（Least absolute shrinkage and selection operator）

回归树（Regression tree）

分类

分类与离散变量或数据类别的预测有关。比如区分垃圾邮件、病人患有哪种疾病、交易是否属于欺诈行为等任务，都是使用分类方法处理的。以下方法可以用于解决分类问题：

核判别分析（Kernel discriminant analysis）

人工神经网络（Artificial neural networks）

K邻近算法（K-nearests neighbors）

Boosted trees

随机森林（Random forests）

逻辑回归（Logistic regression）

支持向量机（Support vector machine）

深度学习（Deep learning）

朴素贝叶斯（Naive Bayes）

决策树（Decision trees）

聚类

聚类一般应用于数据自然分组。比如产品特征识别、客户细分等任务都是聚类的一些应用场景。以下机器学习方法用于聚类问题：

均值漂移（Mean-shift）

K-均值（K-means）

主题模型（Topic models）

层次聚类（Hierarchical clustering）

多元查询

多元查询是用来寻找相似目标。下面的方法可用于解决与多元查询有关的问题：

近邻取样（Nearest neighbors）

最远邻居（Farthest neighbors）

范围搜索（Range search）

降维

降维是指降低多个随机变量的维度，将其分为特征提取和特征选择。常用的降维方法如下：

流线学习方法/核主成分分析（Manifold learning/KPCA）

独立分量分析（Independent component analysis）

主成分分析（Principal component analysis）

非负矩阵分解（Non-negative matrix factorization）

压缩感知（Compressed sensing）

高斯图模型（Gaussian graphical models）

微信关注我们

原文链接：https://blog.roncoo.com/article/132761

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

微服务可靠性设计

1. 背景微服务化之后，系统分布式部署，传统单个流程的本地API调用被拆分成多个微服务之间的跨网络调用，由于引入了网络通信、序列化和反序列化等操作，系统发生故障的概率提高了很多。微服务故障，有些是由于业务自身设计或者编码不当导致，有些是底层的微服务化框架容错能力不足导致。在实际项目中，需要从业务和平台两方面入手，提升微服务的可靠性。 1.1. 无处不在的故障 1.1.1. 分布式部署和调用传统单体架构一个完整的业务流程往往在同一个进程内部完成处理，不需要进行分布式协作，它的工作原理如下所示：图1-1 传统单体架构本地方法调用微服务化之后，不同的微服务采用分布式集群部署方式，服务的消费者和提供者通常运行在不同的进程中，需要跨网络做RPC调用，它的工作原理如下所示：图1-2 微服务分布式RPC调用分布式调用之后，相比于传统单体架构的本地方法调用，主要引入了如下潜在故障点：序列化与反序列化：微服务的请求和应答都需要经过序列化和反序列化，做消息的跨网络通信，由于数据结构不一致、不支持的数据类型、对方编解码错误等都会导致序列化和反序列化失败，进而导致微服务调用失败。网络问题：常...

2018-11-29

875

龙果运维平台开源地址：https://github.com/roncoo/roncoo-cmdb Zabbix3.0入门到生产环境应用实战：http://www.roncoo.com/course/view/fb3050a5b34b42f39ccad83ebebc89c1 一、软件版本操作系统：CentOS-6.5-x86_64 zabbix版本：3.0.3 二、实现目标： 1、能够发现网络内主机。并且添加相应主机模板。 2、主机是去自动移除主机。 3、主机上线自动添加主机。三、基于发现规则的条件： 1、IP地址段 2、基于服务器，比如说FTP、SSH、WEB等 3、基于zabbix-Agent 4、还有snmp 四、配置发现主机添加模板： 1、定义发现规则：配置--》自动发现--》创建自动发现规则。 *IP范围为agent地址发现的范围，延迟最好设置时间够长，这里设置30s只是为了方便测试。（定义IP范围，咱们可以定义不同应用添加不同模板） 2、定义发现后执行的动作（添加主机模板等操作）：配置--》动作--》创建自动发现动作：条件选型卡： 1、选择我...

2018-11-29

1062

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。