言简意赅了解十大常见AI算法
感知机 二分类 二分类的线性分类模型,也是判别模型。 目的是求出把训练数据进行线性划分的分离超平面。 感知机是神经网络和支持向量机的基础。 学习策略:极小化损失函数。损失函数对应于误分类点到分离超平面的总距离。 基于随机梯度下降法对损失函数的最优化算法,有原始形式和对偶形式。 K近邻法 K-nearest neighbor, K-NN 多分类和回归 是一种分类和回归方法,有监督学习。在训练数据集中找到和新的输入实例最接近的K个实例,这k个实例的多数类别就是这个新实例的类别。 三要素:K的选择,距离度量,分类决策规则。 实现方法:kd树(二叉树)快速搜索K个最近邻的点。 K值选择:反映了对近似误差和估计误差的权衡。交叉验证选择最优的K值,K小,模型复杂,K大,模型简答。 朴素贝叶斯法 多分类 用于NLP 朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的分类方法。首先学习输入输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。 后验概率最大等价于0-1损失函数的期望风险最小化。 是典型的生成学习方法,由训练数据求出联合概率分布,再求出条件概率分布(后...