线性分类模型--感知机(perceptron)

这篇博客介绍了线性分类模型的重要代表——感知机。文章详细阐述了感知机的定义,通过几何解释帮助理解其工作原理,并探讨了感知机的经验损失函数及其优化目标,旨在帮助读者掌握如何求解损失函数最小的权重和偏置。

线性分类模型--感知机(perceptron)

1. 引言-分类问题

    分类是监督学习的一个核心问题,在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问题,基本概念可以参考《机器学习方法概论1》。监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(classifier)。分类器对新的输入进行输出的预测(prediction),称为分类(classification),可能的输出称为(class),分类的类别为多个时,称为多类分类问题,主要研究的都为二分类问题[1]。许多机器学习方法都是可以用来解分类问题,比如:感知机、朴素贝叶斯、支持向量机、决策树、逻辑回归、AdaBoost、神经网络等等。下面就着重介绍最简单的感知机是怎么来解决二分类问题的,要知道,神经网络和支持向量机都是在感知机上扩展的,或者说感知机是神经网络和支持向量机的基础,所以把感知机弄清楚对于其它算法的理解还是挺有必要的。注意:感知机是一种线性分类模型,就是说数据必须是线性可分的(虽然实际中很难达到要求,但是可以通过一些方法将数据集变为线性可分),属于判别模型( Discriminative Model )对于判别模型与生成模型的概念可以参考《生成模型(Generative)与判别模型(Discriminative)》。

2. 感知机 

2.1 感知机的定义

   假设输入X在n维特征空间中,输出Y的取值为{ +1,1 },假设小写的x表示一个实例的特征向量,对应于输入特征空间中的点,函数值f(x)表示输出实例的类别,把由输入特征空间到输出空间的如下函数f(x)称为感知机:
               
其中w和b为感知机的参数,由于x是n维的,w.x是内积,w当然也是n维的,和输入特征空间的维数相对应,把w经常称为权值向量(weight vector)或权值(weight),w.x是内积得到的是一个实数值,b当然就是一个实数值了,不然向量和一个数怎么相加呢,通常把b叫作偏置(bias)。sign是符号函数,对应于两个类别值+1,1。
                      

2.2 感知机的几何解释

   感知机的几何解释就是一个n维的线性方程

                                   
对应于n维特征空间中的一个超平面(2维的空间中上述线性方程就是一条直线,3维的空间中就是一个平面),其中w是超平面的法向量b是超平面的截距这里对于截距的理解我觉得只是一个形象的说法,并不能对应于直线方程或者平面方程中看待的截距值一样,我们知道截距是一个实数值,非距离,有正有负,直线的截距也有纵截距和横截距之分,把x变为一个2维的,线性方程就是一条直线,得出的b肯定不是横截距值或者纵截距值,截距值应该还跟w的值有关即x前的系数值有关,这里不知道大家是怎么理解的。至于w是法向量,这个不难理解,因为我们知道平面标准方程中的三个未知数的系数所组成的向量就是法向量 设向量(A,B,C)是一个过点(x0,y0,z0)的一个法向量,则它与平面上的所有向量均垂直,平面上的向量均可表示为:(x-x0,y-y0,z-z0),因为向量(A,B,C)与向量(x-x0,y-y0,z-z0)垂直,所以其数量积为0,即:A(x-x0)+B(y-y0)+C(z-z0)=0整理得:Ax+By+Cz+D=0, 可见,标准方程中,三个未知数的系数所组成的向量(A,B,C),就是平面的一个法向量。

2.3 感知机定义的目标函数(经验损失函数)

            假设训练数据集是线性可分的,感知机学习的目标是能够求得一个能够将训练集正实例点和负实例点完全正确分开的分离超平面,也就是能够求解出正确的w和b的值。我们知道在监督学习问题中是将预测值f(x)真实值Y的不一致或者错误程度定义了一个损失函数,通过最小化损失函数求解f(x)的参数,参考《机器学习方法概论1》。这里对于二分类的感知机而言,我们从它的几何意义去理解,而且我觉得只要大家抓住这个几何意义理解后面的内容会非常容易。感知机的损失函数就是误分类的点到超平面的总距离
首先,我们知道对于线性方程(2.3)而言,n维输入特征空间中的一点x0到超平面的距离为:
                                                                                                                     

对于误分类的样本来说:
假设有M个误分类点,因此误分类点到超平面的距离总和是:
不考虑前面的求w的L2范数值 ,就得到了二分类感知机的损失函数
显然,误分类点越少,且误分类点离超平面越近,损失函数值就越小,那么怎样求解使这个函数最小值的w和b呢。

2.4 求解使损失函数最小的w和b

      上述的求解使损失函数最小的w和b就是一个最优化问题,求解的方法就是随机梯度下降法(stochastic gradient descent)。梯度下降法要是讲的话也有很多的内容,详见《梯度下降法求解感知机模型》。


[1] 李航,《统计学习方法》,第1章,1.8节
内容概要:本文提出了一种基于非合作博弈理论的居民负荷分层调度模型,并结合双层鲸鱼优化算法(Two-level Whale Optimization Algorithm)进行高效求解,模型与算法均通过Matlab代码实现。研究针对电力系统中居民侧用电负荷的复杂调度问题,引入非合作博弈机制刻画各用户之间的利益竞争关系,实现负荷的分层优化分配;同时设计双层优化架构,上层优化资源配置,下层模拟用户自主决策行为,提升了模型的实用性与合理性。通过智能优化算法求解多层级、非凸非线性的博弈模型,有效提高了调度方案的收敛性与全局寻优能力,适用于现代智能电网中的需求侧管理与能源优化场景。; 适合人群:具备电力系统基础理论知识和Matlab编程能力,从事智能电网、能源优化调度、需求侧管理、博弈论应用等方向的科研人员、高校研究生及工程技术人员。; 使用场景及目标:①应用于居民区电力负荷的分层优化调度系统设计与仿真分析;②为非合作博弈在多主体能源系统建模中的应用提供方法论支持;③利用双层鲸鱼算法解决具有嵌套结构的复杂双层优化问题,提升求解效率与调度方案的可行性。; 阅读建议:建议读者结合提供的Matlab代码深入理解模型构建逻辑与算法实现流程,重点关注博弈模型的效用函数设计、纳什均衡求解思路以及双层优化结构的迭代机制,宜配合实际用电数据开展复现实验以验证模型有效性与鲁棒性。
内容概要:本文围绕基于自适应神经模糊推理系统(ANFIS)智能控制器的可再生能源微电网功率管理系统展开研究,结合Simulink仿真实现,深入探讨了微电网中功率的智能调控与经济机组组合调度问题。通过引入ANFIS控制器,有效应对风能、光伏等可再生能源出力的波动性与不确定性,提升系统运行的稳定性与电能质量。研究内容涵盖微电网多源协调控制策略、功率平衡管理、优化调度模型构建及仿真验证,实现了对分布式电源、储能系统和负荷的协同优化,兼顾经济性与可靠性目标,并通过仿真平台验证了所提方法的有效性与优越性。; 适合人群:具备电力系统、自动化或新能源相关专业背景,熟悉Matlab/Simulink仿真环境,从事微电网能量管理、智能控制、能源优化等领域研究的研究生、科研人员及工程技术人员。; 使用场景及目标:①用于高比例可再生能源接入场景下的微电网能量管理系统研发与教学实践;②为实现微电网功率稳定控制与经济高效运行提供先进的智能控制解决方案;③支撑高水平学术论文复现、科研课题攻关及实际工程项目的仿真验证与方案优化。; 阅读建议:建议结合提供的Simulink模型与相关代码进行动手实践,重点关注ANFIS控制器的设计流程、规则库构建与参数调优方法,并通过与传统PID或MPC控制策略的对比实验,深入理解其在动态响应与鲁棒性方面的优势。同时可进一步拓展文中提出的优化调度逻辑,应用于多目标、多约束的复杂实际应用场景中。
内容概要:本文档聚焦于“直流电机双闭环控制Matlab仿真”,系统阐述了基于Matlab/Simulink平台实现直流电机双闭环控制系统(主要包括速度环与电流环)的设计与仿真全过程。通过构建直流电机的数学模型,结合PI控制器进行调控,实现对电机转速和电枢电流的高精度动态控制,验证控制策略的稳定性与响应性能。文档详细介绍了仿真模型的搭建流程、关键参数的整定方法、系统动态波形的分析手段以及仿真结果的有效性验证,体现了经典自动控制理论在实际电机系统中的工程应用,是电机控制与电力电子技术相结合的典型研究案例。; 适合人群:具备自动控制原理、电机与拖动基础、电力电子技术和Matlab/Simulink仿真能力的电气工程、自动化、机电一体化等专业的本科生、研究生及从事电机驱动系统研发的工程技术人员。; 使用场景及目标:①作为高校课程设计或实验教学材料,帮助学生深入理解双闭环调速系统的工作机理与工程实现;②服务于科研项目,为新型电机控制算法(如滑模、模糊PID等)的开发与性能对比提供基础仿真验证平台;③作为工业界产品前期设计的仿真工具,用于评估不同控制策略在动态响应、抗干扰能力和稳态精度方面的可行性。; 阅读建议:建议读者在学习过程中紧密结合自动控制理论知识,亲手在Simulink环境中搭建完整的双闭环仿真模型,通过反复调整PI控制器的比例与积分参数,观察并分析转速、电流的阶跃响应曲线,从而深刻理解反馈控制的本质、系统稳定性条件以及参数整定对动态性能的影响,进而掌握电机控制系统的设计精髓。
内容概要:本文研究了基于Benders分解与输电网运营商(TSO)和配电网运营商(DSO)协调机制的不确定环境下输配电网双层优化模型,旨在提升高比例可再生能源接入背景下电网系统的协调性与鲁棒性。模型上层以系统整体经济性为目标进行优化调度,下层采用Benders分解实现TSO与DSO之间的信息交互与协同决策,通过引入割平面迭代机制保障求解的收敛性与全局最优性。研究充分考虑新能源出力与负荷需求的不确定性,构建了具有强适应性的双层优化框架,并基于Matlab完成了模型的编程实现与仿真验证,有效解决了多主体、多层级、多不确定性因素耦合下的电力系统优化调度难题。; 适合人群:具备电力系统分析、运筹学与优化理论基础,熟悉Matlab编程环境,从事智能电网、能源互联网、分布式能源集成、电力市场等方向的研究生、科研人员及工程技术人员。; 使用场景及目标:①研究高渗透率可再生能源条件下输配电网协同优化调度策略;②掌握Benders分解在电力系统双层优化建模中的应用方法与实现技巧;③构建TSO-DSO多主体协调机制,实现跨层级电网资源的高效互动与决策解耦;④提升对不确定性建模、分解算法设计及大规模优化问题求解能力。; 阅读建议:建议读者结合Matlab代码逐模块剖析模型构建流程,重点理解Benders割的生成逻辑、主从问题的信息传递机制及收敛判据设定,推荐在标准IEEE测试系统上复现实验以深入掌握模型特性与算法性能。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值