accuracy_score

【Python机器学习系列】建立梯度提升模型预测心脏疾病

这是Python机器学习系列原创文章,我的第204篇原创文章。一、引言对于表格数据,一套完整的机器学习建模流程如下:针对不同的数据集,有些步骤不适用即不需要做,其中橘红色框为必要步骤,由于数据质量较高,本文有些步骤跳过了,跳过的步骤将单独出文章总结!同时欢迎大家关注翻看我之前的一些相关文章。GradientBoostingClassifier是一种基于梯度提 …

什么是模型训练以及如何用Python语言实现

一、什么是模型训练?模型训练是让计算机通过数据学习规律的过程,最终得到一个能解决特定任务(如分类、预测)的模型。 例如: - 分类任务:根据用户输入的文本判断情感是“正面”还是“负面”。 - 回归任务:根据房屋面积、位置等数据预测房价。 模型训练的核心步骤(结合知识库内容):1. 数据准备:收集并清洗数据,确保数据质量。 2. 数据预处理:标准化、编码、分割 …

【Python机器学习系列】建立KNN模型预测小麦品种(案例+源码)

这是我的第329篇原创文章。一、引言对于表格数据,一套完整的机器学习建模流程如下:针对不同的数据集,有些步骤不适用,其中橘红色框为必要步骤,欢迎大家关注翻看我之前的一些相关文章。前面我介绍了机器学习模型的二分类任务和回归任务,接下来做一下机器学习的多分类系列,由于本系列案例数据质量较高,有些步骤跳过了,跳过的步骤将单独出文章总结!在Python中,可以使用S …

用Python进行机器学习(6)随机森林

上一节我们讲到了决策树这个算法,但是一棵决策树可能会存在过拟合的现象,而且对数据微小的变化也比较敏感,为了解决这些问题,我们可以通过多棵树的方式,也就是今天要介绍的随机森林。随机森林算法也就是Random Forest,它是一种集成学习算法,所谓集成学习,就是通过多个能力比较弱的机器学习模型的预测结果来得到一个更好的预测结果。随机森林的这一种方式叫做Bagg …

用Python进行机器学习(5)-决策树

决策树是一种树形结构,树结构中的每个节点都可以理解为是一个规则,通过对规则处理的结果进行分类,最终完成对整体数据的分类,当然也可以用于回归。下面我们就来拿一个是否去爬山的案例来说明,比如通过判断明天是否下雨、是否降温来决定是否去爬山,可以构造出如下的决策树:要实现一个决策树,最核心的就是要确定每个节点要通过哪个特征来分类,比如在我们上面举的例子中,到底是先判 …

AI算法之怎么利用Python实现支持向量机SVM算法

摘要:支持向量机(Support Vector Machine, SVM)是一种经典的机器学习算法,主要用于分类问题。其核心思想是找到一个“最佳分界线”(在高维空间中是一个“超平面”),将不同类别的数据尽可能地区分开,并且让这条分界线距离最近的数据点尽可能远一些,从而提升模型的泛化能力,也就是在新数据上的表现。这篇文章深入浅出地讲解了SVM的工作原理,包括它 …

用Python进行机器学习(7)朴素贝叶斯

朴素贝叶斯算法一听就是根据人名来定义的,这个算法包括两部分:第一部分是贝叶斯定理,这个我们在概率论中应该都学习过,下面会简单回顾一下,第二部分是朴素,也就是假设各个特征互相独立,虽然在现实情况中可能各个特征也会有一些相关性,也就是这个假设不完全成立,但是在实际中朴素贝叶斯的效果还是很不错的。下面简单回顾一下贝叶斯定理,即P(A|B) = [P(B|A) × …

一切模型皆可联邦化:高斯朴素贝叶斯代码示例

来源:DeepHub IMBA本文约1500字,建议阅读5分钟本文将以高斯朴素贝叶斯分类器为例创建一个联邦学习系统。联邦学习是一种分布式的机器学习方法,其中多个客户端在一个中央服务器的协调下合作训练模型,但不共享他们的本地数据。一般情况下我们对联邦学习的理解都是大模型和深度学习模型才可以进行联邦学习,其实基本上只要包含参数的机器学习方法都可以使用联邦学习的方 …

用Python进行机器学习(8)分类任务的模型评估

前面我们已经介绍了不少机器学习的算法,已经可以执行像回归、分类、聚类等任务,比如对于一个分类问题而言,到底哪个算法更好呢?或者同样的算法下训练出的不同的模型,到底哪个更好呢?这就需要用到模型评估了,本节的内容我们以二分类为例,通常多分类问题都可以转化为多个二分类问题,后面我们再介绍其他的任务类型。在介绍模型评估的指标签之前,先介绍预测结果和正确结果之间的四种 …

【Python机器学习系列】建立决策树模型预测小麦品种

这是我的第314篇原创文章。一、引言对于表格数据,一套完整的机器学习建模流程如下:针对不同的数据集,有些步骤不适用,其中橘红色框为必要步骤,欢迎大家关注翻看我之前的一些相关文章。前面我介绍了机器学习模型的二分类任务和回归任务,接下来做一下机器学习的多分类系列,由于本系列案例数据质量较高,有些步骤跳过了,跳过的步骤将单独出文章总结!在Python中,可以使用S …