MapReduce--Logistic Regression (逻辑回归)

时间:2014-04-30 22:37:39   收藏:0   阅读:830

逻辑回归是有监督分类算法。

设带有标签的数据集

mamicode.com,码迷

其中

mamicode.com,码迷

我们定义条件概率函数mamicode.com,码迷

mamicode.com,码迷mamicode.com,码迷

即:

mamicode.com,码迷

其中:

mamicode.com,码迷mamicode.com,码迷

根据已知数据集我们定义极大似然函数:

mamicode.com,码迷

mamicode.com,码迷

对于最大化上式(属于无约束最优化),可以采用牛顿法或者梯度上升法,求最大值。

因为

mamicode.com,码迷

所以

mamicode.com,码迷

用牛顿法,对于处理分布式有些困难,我们用梯度上升法

即:

mamicode.com,码迷

显然这一步可以通过MapReduce的原理。

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!