Python 数据化运营之KMeans聚类分析总结-巨人网络通讯

主页 > 知识库 > Python 数据化运营之KMeans聚类分析总结

Python 数据化运营之KMeans聚类分析总结

Python 数据化运营

1、内容介绍

以 Python 使用 Keans 进行聚类分析的简单举例应用介绍聚类分析。

聚类分析 或 聚类 是对一组对象进行分组的任务，使得同一组（称为聚类）中的对象（在某种意义上）与其他组（聚类）中的对象更相似（在某种意义上）。它是探索性数据挖掘的主要任务，也是统计数据分析的常用技术，用于许多领域，包括机器学习，模式识别，图像分析，信息检索，生物信息学，数据压缩和计算机图形学。

2、一般应用场景

（1）目标用户的群体分类：根据运营或商业目的挑选出来的变量，对目标群体进行聚类，将目标群体分成几个有明显的特征区别的细分群体，在运营活动中为这些细分群体采用精细化、个性化的运营和服务，提升运营的效率和商业效果。

（2）不同产品的价值组合：按特定的指标变量对众多产品种类进行聚类。将产品体系细分成具有不同价值、不同目的、多维度产品组合，在此基础上制定相应的产品开发计划、运营计划和服务计划。

（3）探索、发现孤立点及异常值：主要是风控应用。孤立点可能会存在欺诈的风险成分。

3、聚类的常见方法

分为基于划分、层次、密度、网格、统计学、模型等类型的算法，典型算法包括K均值（经典的聚类算法）、DBSCAN、两步聚类、BIRCH、谱聚类等。

4、Keans聚类实现

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn import metrics
import random

# 随机生成100组包含3组特征的数据
feature = [[random.random(),random.random(),random.random()] for i in range(100)]
label = [int(random.randint(0,2)) for i in range(100)]

# 转换数据格式
x_feature = np.array(feature)

# 训练聚类模型
n_clusters = 3  # 设置聚类数量
model_kmeans = KMeans(n_clusters=n_clusters, random_state=0)  # 建立聚类模型对象
model_kmeans.fit(x_feature)  # 训练聚类模型
y_pre = model_kmeans.predict(x_feature)  # 预测聚类模型
y_pre

实现如图：

5、聚类的评估指标

inertias 是K均值模型对象的属性，表示样本距离最近的聚类中心的总和，它是作为在没有真实分类结果标签下的非监督式评估指标。该值越小越好，值越小证明样本在类间的分布越集中，即类内的距离越小。

# 样本距离最近的聚类中心的总和
inertias = model_kmeans.inertia_

adjusted_rand_s：调整后的兰德指数（Adjusted Rand Index），兰德指数通过考虑在预测和真实聚类中在相同或不同聚类中分配的所有样本对和计数对来计算两个聚类之间的相似性度量。调整后的兰德指数通过对兰德指数的调整得到独立于样本量和类别的接近于0的值，其取值范围为[-1, 1]，负数代表结果不好，越接近于1越好意味着聚类结果与真实情况越吻合。

# 调整后的兰德指数
adjusted_rand_s = metrics.adjusted_rand_score(label, y_pre)

mutual_info_s：互信息（Mutual Information, MI），互信息是一个随机变量中包含的关于另一个随机变量的信息量，在这里指的是相同数据的两个标签之间的相似度的量度，结果是非负值。

# 互信息
mutual_info_s = metrics.mutual_info_score(label, y_pre)

adjusted_mutual_info_s：调整后的互信息（Adjusted Mutual Information, AMI），调整后的互信息是对互信息评分的调整得分。它考虑到对于具有更大数量的聚类群，通常MI较高，而不管实际上是否有更多的信息共享，它通过调整聚类群的概率来纠正这种影响。当两个聚类集相同（即完全匹配）时，AMI返回值为1；随机分区（独立标签）平均预期AMI约为0，也可能为负数。

# 调整后的互信息
adjusted_mutual_info_s = metrics.adjusted_mutual_info_score(label, y_pre)

homogeneity_s：同质化得分（Homogeneity），如果所有的聚类都只包含属于单个类的成员的数据点，则聚类结果将满足同质性。其取值范围[0,1]值越大意味着聚类结果与真实情况越吻合。

# 同质化得分
homogeneity_s = metrics.homogeneity_score(label, y_pre)

completeness_s：完整性得分（Completeness），如果作为给定类的成员的所有数据点是相同集群的元素，则聚类结果满足

完整性。其取值范围[0,1]，值越大意味着聚类结果与真实情况越吻合。

# 完整性得分
completeness_s = metrics.completeness_score(label, y_pre)

v_measure_s：它是同质化和完整性之间的谐波平均值，v = 2 （均匀性完整性）/（均匀性+完整性）。其取值范围[0,1]，值越大意味着聚类结果与真实情况越吻合。

v_measure_s = metrics.v_measure_score(label, y_pre)

silhouette_s：轮廓系数（Silhouette），它用来计算所有样本的平均轮廓系数，使用平均群内距离和每个样本的平均最近簇距离来计算，它是一种非监督式评估指标。其最高值为1，最差值为-1,0附近的值表示重叠的聚类，负值通常表示样本已被分配到错误的集群。

# 平均轮廓系数
silhouette_s = metrics.silhouette_score(x_feature, y_pre, metric='euclidean')

calinski_harabaz_s：该分数定义为群内离散与簇间离散的比值，它是一种非监督式评估指标。

# Calinski和Harabaz得分
calinski_harabaz_s = metrics.calinski_harabasz_score(x_feature, y_pre)

6、聚类效果可视化

# 模型效果可视化
centers = model_kmeans.cluster_centers_  # 各类别中心
colors = ['#4EACC5', '#FF9C34', '#4E9A06']  # 设置不同类别的颜色
plt.figure()  # 建立画布
for i in range(n_clusters):  # 循环读类别
    index_sets = np.where(y_pre == i)  # 找到相同类的索引集合
    cluster = x_feature[index_sets]  # 将相同类的数据划分为一个聚类子集
    plt.scatter(cluster[:, 0], cluster[:, 1], c=colors[i], marker='.')  # 展示聚类子集内的样本点
    plt.plot(centers[i][0], centers[i][1], 'o', markerfacecolor=colors[i], markeredgecolor='k',
             markersize=6)  # 展示各聚类子集的中心
plt.show()  # 展示图像

如图：

7、数据预测

# 模型应用
new_X = [1, 3.6,9.9]
cluster_label = model_kmeans.predict(np.array(new_X).reshape(1,-1))
print ('聚类预测结果为: %d' % cluster_label)

到此这篇关于Python 数据化运营之KMeans聚类分析总结的文章就介绍到这了,更多相关Python 数据化运营内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python实现的KMeans聚类算法实例分析
Python KMeans聚类问题分析
python kmeans聚类简单介绍和实现代码
python中kmeans聚类实现代码
Python实现Kmeans聚类算法

标签：乌鲁木齐银川安庆湘西三亚呼伦贝尔葫芦岛呼伦贝尔

巨人网络通讯声明：本文标题《Python 数据化运营之KMeans聚类分析总结》，本文关键词 Python,数据,化,运营,之,KMeans,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《Python 数据化运营之KMeans聚类分析总结》相关的同类信息！

Python 数据化运营之KMeans聚类分析总结

目录 Python 数据化运营 1、内容介绍 2、一般应用场景 3、聚类的常见方法 4、Keans聚类实现 5、聚类的评估指标 6、聚类效果可视化 7、数据预测 Python 数据化运营 1、内容介绍以 Python 使用...

10-18

百应电话机器人呼和浩特（百应智能语音机器人）

今日给各位共享百应电话机器人呼和浩特的常识，其间也会对百应智能语音机器人进行解说，假如能可巧处理你现在面对的问...

11-06

网站被百度K站或降权的原因所在 k站后的收获

1、群发垃圾外链首先我网站前段时间用过一个外链群发工具，用这个工具使劲的发垃圾外链，一天上它两千多，所以网站被...

10-19

河北销售外呼系统厂家区别（外呼系统哪里有卖）

本文目录一览： 1、外呼系统哪家公司做得好？？？2、电销外呼系统哪个好了？市面上的太多了！有可以推荐的吗？3、电话...

11-28

上海不封号电话呼叫软件多少钱,外呼系统办理商家-热门

上海不封号电话呼叫软件多少钱,外呼系统办理商家然后通过电信、铁通和网通的电话网拨回。2.再次利用手机的三方呼叫功能...

12-16

01-15

百应电话机器人哪里买（百应智能电话机器人）

本文目录一览： 1、电话机器人多少钱？ 2、我在福建想买一款电话机器人，有这种公司吗？ 3、智能电话机器人多少钱？好用...

11-25

电销机器人的特点跟优势（机器人电销怎么样）

本文目录一览： 1、电话板滞人在电销畛域的手艺优势是什么？ 2、电销板滞人相对于电销营业员有什么优势？ 3、电销板滞人...

11-25

广东正规外呼系统（广州外呼营销）

本篇文章给咱们谈谈广东正规外呼体系，以及广州外呼营销对应的知识点，期望对各位有所协助，不要忘了保藏本站喔。本...

05-18

印媒揭秘小米如何用三年成为印度市场第一

小米通过 2014 年 7 月份的在线闪购意外打开了之前并不自信的印度市场，至今保持着最初的业务模式不变，依托着自身强大的...

10-19

基隆市电话机器人维修中心（基隆电子厂的位置）

本文目录一览：1、科沃斯扫地机器人维修点2、电话机器人好用不?3、关于智能电话机器人,你了解的有多少?科沃斯扫地机器人...

07-15

泰州电销防封外呼软件咨询

泰州电销防封外呼软件咨询,泰州电销防封外呼软件怎么样,泰州电销防封外呼软件好用吗外呼软件灵活搭建企业电销中心，...

11-23

慧营销crm外呼系统丹丹（慧营销外呼系统官网）

本文目次一览： 1、有什么好的德律风呼唤零碎能够保举一下 2、外呼零碎哪家好，慧营销外呼零碎价钱几何 3、晓得有什么品...

11-25

揭阳市好用高频外呼卡办理

深圳移动联合华为、移动研究院，对现网上干扰问题进行好用高频外呼卡办理深入分析，创新地提出专属辅载波方案，在受干...

02-23

忘记了400电话的经销商找谁续费呢？

忘记了400电话的经销商找谁续费呢？ 400电话采用代理商制度，如果您忘记了自己的经销商的联系方式，不知道怎么续费的话...

12-22

51SAP同大汉资讯共同成立SAP人才外包服务中心

51SAP同大汉资讯共同成立SAP人才外包服务中心,双方因此进行了会见座谈，并成功签署了相关的合作协议。大汉资讯是专门针对...

10-22

关于石家庄人工电销系统费用的信息

本文目录一览： 1、电销系统通常是多少钱一月或者半年的？2、电销外呼系统多少钱一个月？3、电销公司搭建一套电话销售...

04-22

关于400电话彩铃内容，浙江400企业彩铃

关于400电话彩铃内容，浙江400企业彩铃400电话代理商为你解答。 400电话，彩铃上传和录制内容需要和平台提交公司的证件相...

07-20

电销机器人外呼设置（智能语音电销机器人怎么操作）

本篇文章给大家谈谈电销机器人外呼设置，以及智能语音电销机器人怎么操作对应的知识点，希望对各位有所帮助，不要忘了...

02-23

南京移动群呼系统开发-看这里

南京移动群呼系统开发进行业务需求或服务满意度的调查，或者客户回访等活动。外呼系统没有什么排名不排名的。因为系统...

01-16

外呼系统智能语音机器人（ai智能机器人外呼系统）

本文目录一览： 1、AI智能外呼机器人好一点的有哪些？2、电话机器人和外呼体系相比较哪个作用好一些？3、AI语音机器人有...

11-28

linux grep搜索命令的使用方法

用grep搜索文本文件如果您要在几个文本文件中查找一字符串，可以使用 grep命令。grep在文本中搜索指定的字符串。假设您...

10-20

宜春自动外呼系统（宜春外呼软件）

今日给各位共享宜春主动外呼体系的常识，其间也会对宜春外呼软件进行解说，如果能可巧处理你现在面对的问题，别忘了重...

05-17

福州餐饮加盟语音ai机器人供应商-有效！

福州餐饮加盟语音ai机器人供应商任务完成后，可以查看外呼结果列表。目前对呼叫中心系统比较普遍接受的定义是：呼叫中...

05-17

贵港语音外呼系统代理商的简单介绍

今天给各位分享贵港语音外呼系统代理商的知识，其中也会对进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站...

11-06

西安餐饮加盟AI机器人多少钱一台-哪家专业？

西安餐饮加盟AI机器人多少钱一台降低电话费用，抬高通话时间，比如一些企业用户网络在线呼叫系统直接和客户打交道的业...

05-17

天津外呼系统哪家好（外呼系统哪个好）

本文目次一览： 1、有晓得的么外呼零碎哪家的对照好？ 2、哪些德律风德律风外呼零碎对照好，功用欠缺呢？ 3、外呼零碎哪...

11-25

400电话怎么代理怎样才能选择一家靠谱的400电话外包公司？

400电话规范了客户服务流程，提升了用户服务体验。申请400电话已经成为一种趋势。除了找通信运营商，还有很多400电话代...

01-12

联通电话机器人安装（联通电话机器人安装流程）

本文目录一览：1、联通上门送机器人,要求用花呗扫联通app码付610块钱,然后每个月他们帮忙...2、打电话是人工助理接听怎么...

06-20

成都呼叫中心外呼系统价钱（成都电话外呼系统

本文目录一览：1、成都呼叫中心哪家好?咱们是做金融的,电销部急需一套电销体系,要求能够猜测式外呼,体系安稳2、呼叫中心...

11-29

如何参加win10预览计划？win10预览版升级教程(附预览版升级为正式版步骤)

win10预览版怎么升级？ Win10预览版一般都会比当前的Win10正式版功能上也会多很多，主要是面向测试用户的。那么，怎么升级...

10-19

CentOS 7实现DNS+DHCP动态更新详解

windows域里有一个功能，dhcp把新分发的ip数据发给DNS服务器，这样只要知道一个人的电脑名字就可以很方便的远程。 linux当然...

10-20

广州防封外呼系统（广州电话外呼系统）

今天给各位分享广州防封外呼系统的知识，其中也会对广州电话外呼系统进行解释，如果能碰巧解决你现在面临的问题，别忘...

05-16

北京哪种网络电话好用

很多人在担心网络电话的一些问题，例如小公司缺技术，满足不了客户在功能方面的需求;而大公司服务的客户又太多，售后...

10-25

通讯企业彩铃录音内容

1、引领尊贵品味，倡导靓号文化！欢迎致电郑州翔翔通讯我们秉承“诚信第一信誉至上”的原则长期出售移动、联通、电信...

11-27

物联网卡的流量是真实流量吗？三个角度分析

近年来，随着物联网发展速度的加快，物联网卡这个专有名词也在反复出现在大家的视觉当中，无论是网上，还是现实生活中...

10-13

电销机器人能够识别方言吗（电销机器人是什么意思）

本文目录一览： 1、电销机器人能辨认四川话吗？ 2、电销机器人是只能辨认普通话吗？ 3、电销机器人能辨认多少种方言？...

11-26

北京外呼线路语音-慧营销-企蜂云

导致企业迫切的需要提升自我的服务，切实做到为客户解决问题，提升客户满意度，减少成本和增加拓客契机。最近很多客户...

10-25

四川语音外呼系统厂家（成都电话外呼系统）

本篇文章给大家谈谈四川语音外呼系统厂家，以及成都电话外呼系统对应的知识点，希望对各位有所帮助，不要忘了收藏本站...

11-06

ajax 防止用户反复提交的2种解决方案

可在服务器端加载方法：复制代码代码如下: private void OnLoading() { System.Text.StringBuilder sb = new System.Text.StringBuilder(); sb.Append...

10-18

400电话申请,让企业服务更规范专业的400电话办理服务

随着社会的发展，第三产业的比例逐渐增加，企业不再仅仅从事生产，外部沟通和服务也非常重要。良好的发展不能与良好...

01-12

重庆电信电话群呼公司-信誉保证

重庆电信电话群呼公司主动营销、节日/生日问候、投诉满意度回访、欠费催缴和通知等各类服务。企业电销系统是根据市场...

01-15

常州教育外呼系统什么价格,电销机器人-了解详情

常州教育外呼系统什么价格,电销机器人所以不可否认的就是电销机器人的出现的确实给电销行业带来很多的便利，业务人员...

12-17

腾讯地图添加店面位置，腾讯地图店面位置添加

腾讯地图怎么免费添加位置？如果经常去同一个地方，可以在腾讯地图上添加地址，本期视频就教大家如何在腾讯地图添加...

11-26

400电话怎么办理?400号码如何申请?400电话上下班转接不同号码

很多公司，尤其是一些新成立的公司，要想节省大量的通信成本，就必须开400电话。因为400电话有很强的智能系统，包括接听...

01-13

上海高频次AI机器人办理费用,回拨线路一企嗨-[安全可靠]

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务难以启动； 2）销售人员号码被标注，...

12-17

广州房产电销专用机器人如何办理-解读

广州房产电销专用机器人如何办理目前国内手机用户已达9亿，广州网络电话用户规模则到100万，市场发展前景很大。而相对...

05-18

“互联网+”给力服务外包释放市场潜力

什么是服务外包？义乌小商品城（600415）内的林女士在电商平台售卖衣服已有5年。60后的她不会电脑不懂摄影，平日里，网店...

10-22

流量卡从商家买靠谱吗，和在运营商购买有什么区别？

相信大家都从网络上买过纯流量卡，但是从运营商这边买的基本上没有，你这知道这是为什么吗？从商家买和从运营商买有什...

10-13

400电话是什么,如何收费开通400电话收费标准是多少

400电话是运营商为企业事业单位推出的电话业务，个人无法处理。它是一个虚拟号码，通过绑定手机、固定电话和其他物理...

01-12

如何便捷地办理郴州400电话？——详解四个方面的相关知识-郴州400电话办理

随着城市经济的不断发展，越来越多的企业、机构开始使用400电话。它为企业提供了有效的客户服务，使客户与企业之间的沟...

07-21

Python 数据化运营之KMeans聚类分析总结

10-18

本页收集关于Python 数据化运营之KMeans聚类分析总结的相关信息资讯供网民参考！

推荐文章

上一篇：用Python写脚本自动评论再也不怕碰到喷子

下一篇：Python做个自定义动态壁纸还可以放视频

一起分享吧