service phone

021-63212618

Design Works 家装风格

service phone 021-63212618

金龙娱乐最简单、详细朴素贝叶斯算法原理

文章来源:admin    时间:2020-05-07

  

  俭朴贝叶斯的道理归根结底即是操纵先验概率去估量后验概率。相闭先验概率和后验概率请参考先验概率和后验概率最纯粹剖析。

  1.假设有一数据集X,包蕴X1到Xn条数据,每条数据包蕴m个特色(m维),能够暗示为:

  倘使测试集数据1正在y=1的景况下概率最大,则数据1的输出为种别1,金龙娱乐同理可得其他。

  6.俭朴贝叶斯算法正在这里假设m个特色是彼此独立的(现实景况并不独立,这里只是为了利便运算,是以算法正在这一步估量会有偏差存正在),金龙娱乐公式能够进一步推导为:

  看待上述公式的求解,须要分为三种景况,第一种景况是数据集X的第一维特色(以第一维特色举例)取值是离散的,则第一维特色适宜众项式漫衍:

  仅仅由于一个特色取值不存正在就断定目下种别概率为0,是不屈允的,是以正在这里引入了拉普拉斯滑腻:

  第二种景况是数据集X的第一维特色(以第一维特色举例)取值是离散且希罕的,那们咱们只闭怀第一维特色的取值是否存正在(不为0),倘使存正在记为1,不存正在记为0。则第一维特色适宜伯努利漫衍:

  第三种景况是数据集X的第一维特色(以第一维特色举例)取值是毗连的,俭朴贝叶斯假设第一维特色的先验概率为正态漫衍:

  $$ 个中\mu_1为锻炼会集第1为特色取值的均匀值,\sigma^2_1为锻炼会集第1为特色取值的方差 $$

  8.Xtest1的y=1的景况推导出来后,能够依此类推y=2到k的景况,数据的最终输出为概率最大的y的值。再以此类推其余测试集的输出,算法下场( ̄▽ ̄)。

地址:上海市闸北区永兴路258弄1号兴亚广场1706室     座机:021-63212618    手机:18365625186
Copyright © 2002-2019 金龙娱乐家装设计作品有限公司 版权所有    网站地图