Python集成学习之Blending算法详解-巨人网络通讯

主页 > 知识库 > Python集成学习之Blending算法详解

Python集成学习之Blending算法详解

一、前言

普通机器学习：从训练数据中学习一个假设。

集成方法：试图构建一组假设并将它们组合起来，集成学习是一种机器学习范式，多个学习器被训练来解决同一个问题。

集成方法分类为：

Bagging(并行训练)：随机森林

Boosting（串行训练）：Adaboost; GBDT; XgBoost

Stacking:

Blending:

或者分类为串行集成方法和并行集成方法

1.串行模型：通过基础模型之间的依赖，给错误分类样本一个较大的权重来提升模型的性能。

2.并行模型的原理：利用基础模型的独立性，然后通过平均能够较大地降低误差

二、Blending介绍

训练数据划分为训练和验证集+新的训练数据集和新的测试集

将训练数据进行划分，划分之后的训练数据一部分训练基模型，一部分经模型预测后作为新的特征训练元模型。
测试数据同样经过基模型预测，形成新的测试数据。最后，元模型对新的测试数据进行预测。Blending框架图如下所示：
注意：其是在stacking的基础上加了划分数据

三、Blending流程图

第一步：将原始训练数据划分为训练集和验证集。
第二步：使用训练集对训练T个不同的模型。
第三步：使用T个基模型，对验证集进行预测，结果作为新的训练数据。
第四步：使用新的训练数据，训练一个元模型。
第五步：使用T个基模型，对测试数据进行预测，结果作为新的测试数据。
第六步：使用元模型对新的测试数据进行预测，得到最终结果。

四、案例

相关工具包加载

import numpy as np
import pandas as pd 
import matplotlib.pyplot as plt
plt.style.use("ggplot")
%matplotlib inline
import seaborn as sns

创建数据

from sklearn import datasets 
from sklearn.datasets import make_blobs
from sklearn.model_selection import train_test_split
data, target = make_blobs(n_samples=10000, centers=2, random_state=1, cluster_std=1.0 )
## 创建训练集和测试集
X_train1,X_test,y_train1,y_test = train_test_split(data, target, test_size=0.2, random_state=1)
## 创建训练集和验证集
X_train,X_val,y_train,y_val = train_test_split(X_train1, y_train1, test_size=0.3, random_state=1)
print("The shape of training X:",X_train.shape)
print("The shape of training y:",y_train.shape)
print("The shape of test X:",X_test.shape)
print("The shape of test y:",y_test.shape)
print("The shape of validation X:",X_val.shape)
print("The shape of validation y:",y_val.shape)

设置第一层分类器

from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier

clfs = [SVC(probability=True),RandomForestClassifier(n_estimators=5,n_jobs=-1,criterion='gini'),KNeighborsClassifier()]

设置第二层分类器

from sklearn.linear_model import LinearRegression
lr = LinearRegression()

第一层

val_features = np.zeros((X_val.shape[0],len(clfs)))
test_features = np.zeros((X_test.shape[0],len(clfs)))

for i,clf in enumerate(clfs):
    clf.fit(X_train,y_train)
    val_feature = clf.predict_proba(X_val)[:,1]
    test_feature = clf.predict_proba(X_test)[:,1]
    val_features[:,i] = val_feature
    test_features[:,i] = test_feature

第二层

lr.fit(val_features,y_val)

输出预测的结果

lr.fit(val_features,y_val)
from sklearn.model_selection import cross_val_score
cross_val_score(lr,test_features,y_test,cv=5)

到此这篇关于Python集成学习之Blending算法详解的文章就介绍到这了,更多相关Python Blending算法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python 算法题——快乐数的多种解法
python使用ProjectQ生成量子算法指令集
Python机器学习算法之决策树算法的实现与优缺点
python3实现Dijkstra算法最短路径的实现
Python实现K-means聚类算法并可视化生成动图步骤详解
Python自然语言处理之切分算法详解
python入门之算法学习
Python实现机器学习算法的分类

标签：惠州益阳上海黔西黑龙江常德鹰潭四川

巨人网络通讯声明：本文标题《Python集成学习之Blending算法详解》，本文关键词 Python,集成,学,习之,Blending,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Python集成学习之Blending算法详解》相关的同类信息！

Python集成学习之Blending算法详解

目录一、前言二、Blending介绍三、Blending流程图四、案例一、前言普通机器学习：从训练数据中学习一个假设。集成方法：试图构建一组假设并将它们组合起来，集成学习是一种机...

10-18

斗鱼携手摩拜单车跨界合作玩转英雄联盟S7全球总决赛

九月底的武汉阴雨连绵，但对于喜爱电竞的本地年轻人来说，这座城市的“温度”正在急剧上升。位于沌口的武汉体育中心内...

10-16

Win7网络连接不上且提示错误797的原因及解决方法

Win7系统经常性出现网络连接不上的问题，错误代码显示的是797，很可能的原因网卡问题或者是路由器设置错误。本文就来介...

10-20

智慧交通发展加快，物联网卡将迎来春天

传统的交通已经满足不了日益增长的车辆管理，那么只有物联网卡与交通结合起来的智慧交通才是今后的趋势智能交通是指...

11-27

400电话办理的花费包括哪些

做一件事情之前如果你会做好所有的准备，那么所有的事情都会是非常简单和容易的，但是如果你准备不足就很有可能会出现...

05-15

400电话申请的资费为何能够降下来

在经过了很多年的发展以后，对于很多企业来说，在经营的过程中已经总结出了属于自己的一套方法，而能够获得成功的企业...

05-15

使用北纬蜂巢卡会影响征信吗?

北纬蜂巢卡是有一定知名度的虚商卡，但由于它不是由三大运营商推出的，有朋友就担心使用北纬蜂巢卡会影响征信，到底会...

09-16

购物中心抖音短视频代运营有哪些推广特点？

所谓的短视频营销，就是将品牌或许产品融入到视频中，通过剧情和段子的方式将其演绎出来，类似于广告，但又不是广告，...

03-01

电信400电话套餐开通400电话，如何选择400号码呢？

目前一个400电话号码最低需要第一次存998元，没有其他费用。具体费用根据客户选择的号码不同，费用也不同。根据中国联...

01-12

机器人上下料使用介绍

外呼任务【机器人上下料使用介绍】 7、手动应答/访问【机器人上下料使用介绍】 4、设定编号说明规则【机器人上下料使用...

10-30

彭水县电话机器人售后（彭水县电话机器人售后电话）

本文目录一览：1、电话机器人2、哈工大扫地机器人重庆哪里修3、有谁用过电销机器人?哪个公司的比较好?4、科沃斯售后电话...

07-04

Freebsd 下运行QQ For Linux 的方法

必須滿足： 1 FreeBSD 版本為6.0 以上,FreeBSD 5 未測試 2 系統安裝的 linux_base 不能是 fc4 版的，即不能是linux_base-fc-4，其它的均可...

10-20

号码状态检测识别准确，呼叫中心平台软件资源多交付力强

为了进一步扩大自己的经营范围，不少企业在寻找更贴合自己的呼叫中心平台软件。本公司的呼叫中心平台经受住了时间的检...

07-12

电话机器人的原理是什么（电话机器人有用吗）

本文目录一览：1、电话机器人是什么,有什么用?2、智能语音机器人工作原理3、电话机器人?4、电话机器人是什么工作原理5、...

06-19

电话机器人源码部署（电话机器人源码部署什么意思）

本篇文章给大家谈谈电话机器人源码部署，以及电话机器人源码部署什么意思对应的知识点，希望对各位有所帮助，不要忘了...

06-02

兰州电销外呼系统供应商（兰州电话销售）

本篇文章给大家谈谈兰州电销外呼系统供应商，以及兰州电话销售对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

04-08

福州高频次电话销售系统哪家好-厂家特选

福州高频次电话销售系统哪家好详尽的通话记录，将沟通内容进行文字化处理，呼叫中心系统机器人自动对客户进行分类化处...

01-16

知识产权的占有制度及其现状

解决知识产权能否适用占有制度的问题，我们必须首先探讨知识产权的客体能否成为占有的标的。知识产权的客体为人类精神...

10-23

05-16

部署Oracle 12c企业版数据库( 安装及使用)

在计算机信息安全领域中，数据库系统无疑有着举足轻重的地位。比如：SQL Server、MySQL、DB2、Oracle等，都是比较知名的数据库...

10-18

电话外呼系统有哪些软件（电话外呼系统有哪些软件可以用）

本文目录一览： 1、电销外呼软件2、电销外呼软件有哪些？3、外呼软件有哪些？4、哪些电话电话外呼体系比较好，功用完善...

04-22

宁波销售外呼系统公司的简单介绍

本篇文章给大家谈谈宁波销售外呼系统公司，以及对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。本文目录一...

05-17

面对面沟通营销活动

F2F到底是什么？F2F就是中文的面对面沟通营销，用你的沟通服务去完成你的MVC客户群和争取你的MGC客户群，让你真正地认识那...

10-22

亚洲最大的企业财税处理中心落户上海

由安居企业会计代理有限公司投资的安居财务中国总部项目，一期工程将于近期在上海市松江区永丰街道启动建设。项目建成...

10-22

信阳电销回拨外呼系统（信阳电销回拨外呼系统怎么样）

本篇文章给大家谈谈信阳电销回拨外呼系统，以及信阳电销回拨外呼系统怎么样对应的知识点，希望对各位有所帮助，不要忘...

03-22

教育培训行业软件crm

在这个瞬息万变的世界，信息化的发展推动人才的发展，导致21世纪人才成为了最昂贵的需求。活到老，学到老！在风起云涌...

10-26

机器人培训云呼_电话机器人

【机器人培训】 6。真实的人声：真实的人声在原始对话中100％甜美，并体验真实的吸引力。【机器人培训】企业呼叫中心...

10-31

天津防封号电销机器人批发网,群呼线路批发网-提醒!

天津防封号电销机器人批发网,群呼线路批发网电销机器人依托云计算技术，稳定运行。并且可以不断获得升级迭代，通过大...

12-17

辽宁招聘专用语音ai机器人软件-[信誉保证]

辽宁招聘专用语音ai机器人软件顾客在寻找电子销售软件时需要重点考虑能否避免高频封号，降低投诉几率。为什麽要说是减...

05-17

陕西房产语音电销机器人办理费用-大家都知道

陕西房产语音电销机器人办理费用DM投放，微客服等功能助力客户开发，使销售更加准确获客。外呼系统使用智慧营销，销售...

05-17

哈尔滨打电话机器人（哈尔滨打电话机器人多少钱）

今天给各位分享哈尔滨打电话机器人的知识，其中也会对哈尔滨打电话机器人多少钱进行解释，如果能碰巧解决你现在面临的...

05-16

鼎信通达对接电话机器人（鼎信通达对接电话机器人设备）

本文目录一览： 1、goip网关是什么2、鼎信电话分机怎么编码3、96110机器人电话会录音吗4、电话智能客服机器人5、电话机器人...

11-28

成都营销电销机器人报价（电销机器人成交率）

本篇文章给咱们谈谈成都营销电销机器人报价，以及电销机器人成交率对应的知识点，期望对各位有所协助，不要忘了保藏本...

05-17

长城移动电销卡套餐-电销卡销户

长城移动电销卡套餐-电销卡销户电销卡销户巨人通信主营企业通信业务，重点销售电销卡、电销防封卡、不封号电话、外呼...

06-23

北京电话机器人公司_汇港通官网

在人工智能、电话机器人、人工智能、语音机器人和自动电话销售机器人的新期间，人工智能期间开释了人工，使生人不妨做...

10-30

为什么选择中国电信进行400电话申请？（为什么400电话申请要选择中国电信呢）

市场上400电话的运营商包括中国联通、中国移动和中国电信。很多企业在选拔过程中都会在400电话申请中寻找中国电信。我们...

07-21

人工智能会是下一个20年颠覆人类社会的技术

一、现在是弱人工智能时代吗？人工智能的定义：从广义上讲，人工智能是由算法和数据组成；从狭义上讲，人工智能实际...

10-20

为什么公司都愿意申请400电话？

现在许多企业发展很快，尤其是服务通信方面越来越专业化。过去人们传递信息不太顺畅，具有滞后的特点。但如今信息技术...

04-03

400电话如何选400电话选号小技巧

在申请400电话时，任何人都希望处理一个好的400号码。毕竟一个好的400号码可以吸引消费者的注意力，给企业带来更多的客...

01-12

中小企业多媒体呼叫中心解决方案

多媒体呼叫中心是一种集计算机、电信技术、网络技术、数据库技术、互联网技术于一体的多功能呼叫中心系统；多媒体呼叫...

12-07

长沙市稳定防封电话卡办理

想要体验5G就要购买5G手机，不过5G手机的价格目前处于高位。包括手机生产厂商以及运营商在内，很多业内人士已经多次稳定...

03-26

白酒电话营销使用介绍

有意通过呼叫任务筛选的客户可以进行手动操作，也可以在事后由销售人员进行跟踪访问。我们可以根据呼叫场景进行不同...

10-30

鸡西电话机器人价格 AI电话系统汇港通科技

帮助中小企业提率，提升管理，优化运维。移动crm通过大数据、云计算整合云通信，为企业提供整合“员工管理、客户管理、...

10-31

支撑团队的服务意识是需要平时培养砸下根基

在呼叫中心中，支撑团队一般包括质检员、培训师、班长、后端受理人员等，如果呼叫中心越大，该类人员配置数量就相应增...

10-22

老式电脑安装Win10还是Win7系统流畅?

用Win10肯定快，那用了好几年的旧电脑呢？有种说法是，旧电脑配置低，更适合安装Win7。但是，好奇的小编还是想亲自验证一...

10-20

供应智能电销机器人的公司（供应智能电销机器人的公司有哪些）

本文目次一览： 1、抉择智能德律风呆板人的话，哪家的对照好？ 2、有谁用过电销呆板人？哪个公司的对照好？ 3、电销呆板...

11-25

400开头的电话号怎么申请电话400开头的是什么号码

400开头的电话号怎么申请电话400开头的是什么号码以下内容由巨人小编整理发布。公司的营业执照副本扫描件；公司法人身...

05-16

智能化外呼系统

随着人工智能技术的发展，近半年来涌现了大量基于人工智能的呼叫中心业务服务商和集成商。商务上的需求非常强烈，整个...

10-26

长春电销外呼系统有效果吗（电销呼叫系统怎么

本文目录一览：1、外呼体系真的能够处理电销呼出问题吗？2、外呼体系怎么样？3、做电销用体系呼叫和人工手动作用距离大...

11-29

电子商务外包企业争食2000亿蛋糕

阿里巴巴、百度、腾讯，一度有业内人士把它们认做互联网行业难以撼动的三巨头，没有谁再能引领新模式来望其项背。...

10-22

4.4 呼叫中心的数量

。。在企业最初的呼叫中心整体规划中，以及创建运营模式与方针中，最早要进行决策的一个问题就是要确定建设多少个呼...

10-22

Python集成学习之Blending算法详解

10-18

本页收集关于Python集成学习之Blending算法详解的相关信息资讯供网民参考！

推荐文章

上一篇：基于Python3中运算符 **和*的区别说明

下一篇：Pytorch中求模型准确率的两种方法小结

一起分享吧