分享免费的编程资源和教程

网站首页 > 技术教程 正文

一分钟带您掌握“逻辑回归”

goqiw 2025-01-10 13:23:11 技术教程 31 ℃ 0 评论



在这篇文章中,我将用简单的术语来解释逻辑回归。它可以被认为是一个逻辑回归的假人帖子,但是,我从来没有真正喜欢这个表达。

在机器学习世界中,逻辑回归是一种参数分类模型,尽管名称中有“回归”一词。

这意味着逻辑回归模型是具有一定数量的固定数量参数的模型,这取决于输入特征的数量,并且它们输出分类预测,例如,植物是否属于某个物种。

实际上,逻辑回归背后的理论与线性回归的理论非常相似,所以如果你不知道线性回归是什么,花5分钟阅读这个超级简单的指南:

链接:https://towardsdatascience.com/linear-regression-explained-d0a1068accb9

在Logistic回归中,我们不像线性回归那样直接将直线拟合到我们的数据。取而代之的是,我们将一条称为Sigmoid的S形曲线拟合到我们的观测结果中。

让我们仔细研究一下这个数字。

首先,就像我们之前说过的那样,逻辑回归模型是分类模型;特别是二元分类模型(它们只能用于区分两个不同的类别-例如,如果一个人肥胖或不给自己重,或者如果给定房屋的大小则房子是大还是小)。这意味着我们的数据有两种观测值(类别1和类别2观测值),就像我们在图中可以观察到的那样。

注意:这是Logistic回归的一个非常简单的示例,实际上,使用这些模型,使用广泛的功能而不仅仅是一个功能,可以解决更困难的问题。

其次,我们可以看到,Y轴从0变为1。这是因为S型函数始终将这两个值作为最大值和最小值,这非常适合我们将样本分为两个不同类别的目标。通过计算X 的S型函数(即输入特征的加权和,就像在线性回归中一样),我们得出属于两个类别之一的观测值的概率(显然在0到1之间)。

S形函数的公式如下:

如果我们想预测一个人是否肥胖,则首先要计算他们的体重的加权总和(对词法冗余感到抱歉),然后将其输入到S型函数中:

1)计算输入的加权和

2)计算肥胖的概率

好吧,这看起来很酷,但不是说这是一个机器学习的模型吗?我们怎样训练它?这是个好问题。有多种方法可以训练逻辑回归型号(适合我们的数据的 S 形线)。我们可以使用像梯度下降这样的迭代优化算法来计算模型的参数(权重),或者我们可以使用概率方法,如最大似然。

如果你不知道这些是什么,梯度下降在线性回归的帖子中解释了,机器学习的最大可能性的解释可以在这里找到:

链接:https://towardsdatascience.com/probability-learning-iii-maximum-likelihood-e78d5ebea80c

一旦我们使用了这些方法之一来训练我们的模型,我们就准备做出一些预测。让我们看一个例子,说明训练逻辑回归模型的过程,并使用它进行预测:

  • 首先,我们将收集已被诊断为肥胖和未被诊断为肥胖的患者及其相应体重的数据集。
  • 之后,我们将训练模型,以使S形线适合数据并获得模型的参数。使用最大似然训练后,我们得到以下参数:
  • 现在,我们可以作一些预测了:假设我们有两个病人;一是120公斤,一是60公斤。让我们看看将这些数字插入模型时会发生什么:

我们可以看到,第一个病人(60公斤)肥胖的可能性非常低,但是,第二个病人(120公斤)肥胖的可能性非常高。

在前面的图中,我们可以看到逻辑回归模型为讨论的示例提供的结果。现在,考虑到任何病人的体重,我们可以计算他们肥胖的概率,并给我们的医生一个快速的第一轮信息!

总结和其他资源

逻辑回归是最简单的机器学习型号之一。它们易于理解、可解释,并能产生相当好的效果。这篇文章的目的是为那些不是机器学习实践者提供一种简单的方式来理解逻辑回归的非数学方式,所以如果你想更深入,或正在寻找更深刻的数学解释,请看以下视频,它很好地解释了我们在这篇文章中提到的一切。

链接:https://youtu.be/yIYKR4sgzI8


本文由未艾信息(www.weainfo.net编译,

想看更多译文,欢迎大家点击上面的链接进行查看~

也可以关注我们的公众号:为AI呐喊

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表