机器学习 | 逻辑回归

原创

已于 2022-12-24 14:42:48 修改 · 2k 阅读

·

2

·

标签

#逻辑回归 #python

于 2022-12-23 13:56:07 首次发布

本文详细阐述了逻辑回归的基本原理，包括其在二分类问题中的应用，列举了优点（如计算效率高、易于理解）和缺点（如欠拟合、适应性局限）。重点介绍了适用场景，如信用评分、营销预测等，并探讨了常见面试问题，如非线性处理、sigmoid选择原因、模型调整技巧和与其他算法的对比。

一.基本原理

面对一个分类问题，建立代价函数，通过优化方法迭代求解出最优的模型参数，然后测试验证我们这个求解的模型的好坏。逻辑回归是一种分类方法，主要用于二分类问题，应用于研究某些事件发生的概率

二.优缺点

优点

计算代价不高，易于理解和实现
速度快，适合二分类问题
简单易于理解，直接看到各个特征的权重
能容易更新模型吸收新的数据
不受多重共线性的影响（可通过正则化消除）

缺点

容易产生欠拟合
分类精度不高
很难处理样本不平衡问题
准确率不是很高，因为形式简单（类似于线性模型），很难拟合数据的真实分布
很难解决非线性问题，因为逻辑决策面是线性的
无法筛选特征，应用中常用GBDT（筛选特征）+ 逻辑回归组合
对数据和场景的适应能力有局限性，不如决策树算法适应性那么强

三.适用场景

是很多分类算法的基础组件：它的好处是输出值自然地落在0到1之间，并且有概率意义。因为它本质上是一个线性的分类器，所以处理不好特征之间相关的情况。虽然效果一般，却胜在模型清晰，背后的概率学经得住推敲。它拟合出来的参数就代表了每一个特征对结果的影响。也是一个理解数据的好工具
一般分类问题都可以使用，尤其因变量是二分类
不要求自变量和因变量是线性关系
信用评分卡
计算营销活动成功率
特定某天是否发生地震
广告点击预测
概率辅助决策
寻找危险因素

四.推导

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。