基于Spark的机器学习实践 (八) - 分类算法
0 相关源码
1 朴素贝叶斯算法及原理概述
1.1 朴素贝叶斯简介
◆ 朴素贝叶斯算法是基于贝叶斯定理和特征条件独立假设的一种分类方法
◆ 朴素贝叶斯算法是一种基于联合概率分布的统计学习方法
◆ 朴素贝叶斯算法实现简单,效果良好,是一种常用的机器学习方法
1.2 贝叶斯定理
◆ 朴素贝叶斯算法的一个基础是贝叶斯定理
贝叶斯定理(英语:Bayes' theorem)是[概率论]中的一个[定理],描述在已知一些条件下,某事件的发生概率。
比如,如果已知某癌症与寿命有关,使用贝叶斯定理则可以通过得知某人年龄,来更加准确地计算出他罹患癌症的概率。
通常,事件A在事件B已发生的条件下发生的概率,与事件B在事件A已发生的条件下发生的概率是不一样的。
然而,这两者是有确定的关系的,贝叶斯定理就是这种关系的陈述。
贝叶斯公式的一个用途,即通过已知的三个概率而推出第四个