手书阿水
码龄12年
求更新 关注
提问 私信
  • 博客:45,163
    45,163
    总访问量
  • 13
    原创
  • 5
    粉丝
  • 49
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
加入CSDN时间: 2014-12-10
博客简介:

qq_24394635的博客

查看详细资料
个人成就
  • 获得35次点赞
  • 内容获得14次评论
  • 获得114次收藏
  • 博客总排名2,244,837名
创作历程
  • 2篇
    2020年
  • 10篇
    2019年
  • 2篇
    2018年
成就勋章
TA的专栏
  • 集成学习
    2篇
  • 机器学习
    6篇
  • 实践错误记录
    1篇
  • kettle
    1篇
  • ETL
    1篇

TA关注的专栏 1

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

兴趣领域 设置
  • 大数据
    flink
  • 人工智能
    opencv语音识别计算机视觉机器学习深度学习神经网络自然语言处理tensorflowpytorch图像处理nlp数据分析
创作活动更多

芯创视界・嵌入式视频创作征集大赛

嵌入式工程的价值,藏在每一次硬件调试、代码迭代与项目落地之中。 让我们因热爱相聚,用镜头与一众开发者互通心得、彼此启发,记录下探索的每一步,分享思路与经验。 让更多人看见嵌入式开发的魅力,也让每一次创作成为推动技术传播与社区成长的力量。 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/0d445ffce72b42f997aaf1b030a652aa.png#pic_center)

18人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

集成学习:XGBoost算法目标函数推导

XGBoost全名叫(eXtreme Gradient Boosting)极端梯度提升,GBDT(gradient boosting decision tree)的改进 XGBoost的核心算法思想: 1、不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差。 2、当我们训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的...
原创
博文更新于 2020.02.12 ·
736 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

集成学习:通过数学推导AdaBoost的训练误差可以无限接近于0,以及其树的权重可以推导出来

集成学习,将多个独立分类器(此处称为基学习器)组合在一起,共同完成任务。如bagging(减小方差)、boosting(偏差)或stacking(改进预测) 其中Boosting,主要算法有AdaBoost/GBDT/Xgboost/LightGBM 关于Boosting的两个核心问题:   1)在每一轮如何改变训练数据的权值或概率分布?   通过提高那些在前一轮被弱分类器分错样例的权值,减小前一...
原创
博文更新于 2020.02.12 ·
1202 阅读 ·
2 点赞 ·
1 评论 ·
2 收藏

机器学习:模型评估与性能度量总结

#1、常见术语说明 过拟合:模型由于学习的“太好”,在训练集上表现很好(训练误差小),而在新样本上表现很差(泛化误差大)。 欠拟合:与过拟合相对的概念,模型对训练集还没有完全学习好,在训练集上就表现不好(训练误差大)。 误差:模型预测值与真实值之间的差异。 训练误差(经验误差):模型在训练集上的误差。 泛化误差:模型在新样本上的误差。 #2、模型评估方法 利用训练样本(“训练集”)之外的测试样本(...
原创
博文更新于 2020.01.17 ·
3678 阅读 ·
1 点赞 ·
0 评论 ·
8 收藏

机器学习之:SVM总结

机器学习之:SVM总结 SVM是一种有监督的学习方法,主要针对小样本数据进行学习、分类和预测,类似的根据样本进行学习的方法还有决策树归纳算法等。在解决小样本、非线性及高维模式识别中表现出许多特有优势,多用于解决二分类问题 SVM(Support Vector Machine即支持向量机)核心思想,即构建一个超平面,使得该超平面能将不同类别的样本间隔开(单纯只是满足将不同类别样本隔开的超平面可能有很...
原创
博文更新于 2019.12.31 ·
1589 阅读 ·
1 点赞 ·
0 评论 ·
9 收藏

机器学习:决策树总结

决策树是一种基于树状结构进行决策的策略,是一种有监督的机器学习算法 决策树优点:   简单易懂   易解释   可视化   适用性广   既可以处理离散值也可以处理连续值(ID3只能处理离散值)   可用于寻找重要特征变量   不需要提前归一化预处理   使用决策树预测的代价是O(log2m)O(log_2m)O(log2​m), m为样本数。 决策树缺点:   容易过拟合。可以通过设置节点最少样...
原创
博文更新于 2019.12.31 ·
1014 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

机器学习:随机森林RF总结

1、随机森林(Random Forest,简称RF),顾名思义就是以树为基本单位的集成学习模型。每棵树都会得到一个分类结果,进行投票,森林最终选择投票最多的类别作为最终结果。随机体现在,用于训练单个决策树的样本与特征是通过随机选择产生。其中样本的抽取多选择有放回的随机抽取。随机抽取的优点在于极大地避免了因为决策树之间过高的的相似性从而导致的过拟合问题。 2、决策树的生长模式: 如果训练集中的样本数...
原创
博文更新于 2019.12.31 ·
2418 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

python报错:Do not support special JSON characters in feature name

最近在做一个lightGBM模型时,出现报错: LightGBMError:Do not support special JSON characters in feature name 通过排除,发现错误原因:在数据集的特征名称中出现了类似’Unnamed: 0’的名称,处理后,程序可正常运行。所以猜测这可能由于数据集的特征名称中含有特殊字符导致的,至少我目前遇到的问题是这样 ...
原创
博文更新于 2019.12.30 ·
10863 阅读 ·
11 点赞 ·
12 评论 ·
2 收藏

sigmoid函数手推求导

sigmoid函数因其连续单调且可微等特点被广泛运用,如逻辑回归 sigmoid函数图像如下(图片来自百度百科): 以下是sigmoid函数的求导步骤,并得到其导函数与自身的关系 ...
原创
博文更新于 2019.12.28 ·
412 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

机器学习:逻辑回归总结(上)

首先逻辑回归是一种有监督的分类问题,名字中含有回归二字,是因为在多年前关于回归与分类的定义与现在有所不同,这一历史原因造成 逻辑回归可以视为广义的线性模型在因变量y服从二元分布时的一种特殊情况;在使用最小二乘法求解线性回归时,认为因变量y服从正态分布 为了能够得到最终的分类结果,我们引入sigmoid函数将利用回归模型得到的数值映射到(0,1)区间,其后通过比较映射结果与给定阈值的大小关系得到最终...
原创
博文更新于 2019.12.27 ·
361 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

【python可视化方案】pyecharts + Django 框架

背景:基于对于可视化的巨大需求以及成本因素,利用pyecharts + Django 的可视化方式,显然是一种比较优的选择 通过可视化可寻找:模式、关系和异常 环境:强迫症患者,历来都是用最新版本 Django:2.1.0 python:3.x (win10是3.7,Ubuntu是3.5) 操作系统环境:win10与Ubuntu 1、Django安装: Django是利用python...
原创
博文更新于 2019.12.13 ·
4287 阅读 ·
2 点赞 ·
0 评论 ·
25 收藏

kettle报错:Binary_file_(standard input) matches

在进行数据迁移时报错:Binary file (standard input) matches 环境:Ubuntu 16.04.2 kettle:7.0 具体信息如下所示:
原创
博文更新于 2019.02.27 ·
677 阅读 ·
3 点赞 ·
1 评论 ·
0 收藏

kettle发送的邮件附件无法预览,也无法下载

最近因为一些工作上的需求,需要通过kettle实现跑数据,并且最终把数据结果通过邮件发送给指定的同事!但是在这个过程中出了点问题,即实现了邮件发送附件的功能,但是却无法打开邮件中的附件! QQ邮箱打开附件提示如下:(尝试过多个浏览器,均是如此) kettle配置如下:首先通过转换任务生成Excel 其次利用作业(.job)实现邮件发送,并携带附件 邮件正文内容均正常,且实现了附件发送 ...
原创
博文更新于 2019.01.21 ·
1087 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Navicat Premium 12.0.23安装与激活

本文介绍Navicat Premium 12.0.24的安装、激活与基本使用。 说明:博主所提供的激活文件理论支持Navicat Premium 12.0.16 - 12.0.24简体中文64位,但已测试的版本为Navicat Premium 12.0.22、12.0.23和12.0.24简体中文64位。 说明:博主所提供的压缩包格式均为RAR5,即WinRAR 5.0以上的版本才能正常解压,...
转载
博文更新于 2018.09.16 ·
668 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Linux环境部署kettle

本博客主要是记录了鄙人第一次在Linux环境部署kettle的经历,以及其中遇到的部分问题,不一定很全面,仅供参考交流 博客内容主要分为:JDK安装、kettle安装、安装JDK与kettle可能遇到的问题、以及定时执行job等 一、JDK安装(注意版本) 首先检测是否已经安装,利用java -version如果已安装,则忽略JDK安装步骤 其次还需要关注,其版本是否兼容 JDK安装...
原创
博文更新于 2018.08.08 ·
16172 阅读 ·
9 点赞 ·
0 评论 ·
52 收藏