添加--ml.md逻辑回归介绍

This commit is contained in:
haotian 2025-02-05 14:06:48 +08:00
parent 1deba768fb
commit 218dd5eb77

View File

@ -61,4 +61,37 @@
缺点:
线性假设:假设自变量和因变量之间存在线性关系,可能不适用于非线性数据。
对异常值敏感:异常值可能对模型产生较大影响。
多重共线性:自变量之间高度相关时,模型表现可能不佳。
多重共线性:自变量之间高度相关时,模型表现可能不佳。
逻辑回归:基于线性回归,引入sigmoid函数来将线性回归的连续值映射到01之间.
原理:
同逻辑回归,最后采用sigmoid函数将连续值映射到01之间,根据设定的阈值来划分正负样本,或者使用预测的值作为其发生概率.
目标:
最大化似然函数(最小化对数损失函数)
也就是真的真,假的假.
适用场景:
二分类问题:
垃圾邮件检测:判断邮件是否为垃圾邮件。
疾病诊断:判断患者是否患有某种疾病。
信用评分:判断客户是否会违约。
多分类问题(通过扩展):
手写数字识别识别手写数字0-9
图像分类:将图像分类到多个类别中。
概率预测:
客户流失预测:预测客户流失的概率。
点击率预测:预测广告点击的概率。
解释性模型:
特征重要性分析:通过系数大小判断特征对结果的影响。
因果关系分析:分析自变量对因变量的影响。
优缺点:
优点
简单易懂:模型结构简单,易于理解和实现。
计算高效:训练和预测速度快,适用于大规模数据。
解释性强:系数直接反映自变量对因变量的影响。
概率输出:提供概率估计,便于后续决策。
缺点
线性决策边界:假设自变量和因变量之间存在线性关系,可能不适用于非线性数据。
对异常值敏感:异常值可能对模型产生较大影响。
多重共线性:自变量之间高度相关时,模型表现可能不佳。