基于KL散度、JS散度以及交叉熵的对比-巨人网络通讯

主页 > 知识库 > 基于KL散度、JS散度以及交叉熵的对比

基于KL散度、JS散度以及交叉熵的对比

在看论文《Detecting Regions of Maximal Divergence for Spatio-Temporal Anomaly Detection》时，文中提到了这三种方法来比较时间序列中不同区域概率分布的差异。

KL散度、JS散度和交叉熵

三者都是用来衡量两个概率分布之间的差异性的指标。不同之处在于它们的数学表达。

对于概率分布P(x)和Q(x)

1）KL散度（Kullback–Leibler divergence）

又称KL距离，相对熵。

当P(x)和Q(x)的相似度越高，KL散度越小。

KL散度主要有两个性质：

（1）不对称性

尽管KL散度从直观上是个度量或距离函数，但它并不是一个真正的度量或者距离，因为它不具有对称性，即D(P||Q)!=D(Q||P)。

（2）非负性

相对熵的值是非负值，即D(P||Q)>0。

2）JS散度（Jensen-Shannon divergence）

JS散度也称JS距离，是KL散度的一种变形。

但是不同于KL主要又两方面：

（1）值域范围

JS散度的值域范围是[0,1]，相同则是0，相反为1。相较于KL，对相似度的判别更确切了。

（2）对称性

即 JS(P||Q)=JS(Q||P)，从数学表达式中就可以看出。

3）交叉熵（Cross Entropy）

在神经网络中，交叉熵可以作为损失函数，因为它可以衡量P和Q的相似性。

交叉熵和相对熵的关系：

以上都是基于离散分布的概率，如果是连续的数据，则需要对数据进行Probability Density Estimate来确定数据的概率分布，就不是求和而是通过求积分的形式进行计算了。

补充：信息熵、交叉熵与KL散度

信息量

在信息论与编码中，信息量，也叫自信息（self-information），是指一个事件所能够带来信息的多少。一般地，这个事件发生的概率越小，其带来的信息量越大。

从编码的角度来看，这个事件发生的概率越大，其编码长度越小，这个事件发生的概率越小，其编码长度就越大。但是编码长度小也是代价的，比如字母'a'用数字‘0'来表示时，为了避免歧义，就不能有其他任何以‘0'开头的编码了。

因此，信息量定义如下：

信息熵

信息熵是指一个概率分布p的平均信息量，代表着随机变量或系统的不确定性，熵越大，随机变量或系统的不确定性就越大。从编码的角度来看，信息熵是表示一个概率分布p需要的平均编码长度，其可表示为：

交叉熵

交叉熵是指在给定真实分布q情况下，采用一个猜测的分布p对其进行编码的平均编码长度（或用猜测的分布来编码真实分布得到的信息量）。

交叉熵可以用来衡量真实数据分布于当前分布的相似性，当前分布与真实分布相等时（q=p），交叉熵达到最小值。

其可定义为：

因此，在很多机器学习算法中都使用交叉熵作为损失函数，交叉熵越小，当前分布与真实分布越接近。此外，相比于均方误差，交叉熵具有以下两个优点：

在LR中，如果用均方误差损失函数，它是一个非凸函数，而使用交叉熵损失函数，它是一个凸函数；

在LR中使用sigmoid激活函数，如果使用均方误差损失函数，在对其求残差时，其表达式与激活函数的导数有关，而sigmoid（如下图所示）的导数在输入值超出[-5,5]范围后将非常小，这会带来梯度消失问题，而使用交叉熵损失函数则能避免这个问题。

KL散度

KL散度又称相对熵，是衡量两个分布之间的差异性。从编码的角度来看，KL散度可表示为采用猜测分布p得到的平均编码长度与采用真实分布q得到的平均编码长度多出的bit数，其数学表达式可定义为：

一般地，两个分布越接近，其KL散度越小，最小为0.它具有两个特性：

非负性，即KL散度最小值为0，其详细证明可见[1] ;

非对称性，即Dq(p)不等于Dp(q) ; KL散度与交叉熵之间的关系

在这里，再次盗用[1]的图来形象地表达这两者之间的关系：

最上方cH(p)为信息熵，表示分布p的平均编码长度/信息量；

中间的Hq(p)表示用分布q表编码分布p所含的信息量或编码长度，简称为交叉熵，其中Hq(p)>=H(p)

;最小方的Dq(p)表示的是q对p的KL距离，衡量了分布q和分布p之间的差异性，其中Dq(p)>=0;

从上图可知，Hq(p) = H(p) + Dq(p)。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

pytorch 实现计算 kl散度 F.kl_div()
Python 机器学习工具包SKlearn的安装与使用
python数据分析之用sklearn预测糖尿病
pandas读取excel,txt,csv,pkl文件等命令的操作
python爬取之json、pickle与shelve库的深入讲解

标签：六盘水成都宿迁山东驻马店江苏兰州常州

巨人网络通讯声明：本文标题《基于KL散度、JS散度以及交叉熵的对比》，本文关键词基于,散度,以及,交叉,熵,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《基于KL散度、JS散度以及交叉熵的对比》相关的同类信息！

基于KL散度、JS散度以及交叉熵的对比

在看论文《Detecting Regions of Maximal Divergence for Spatio-Temporal Anomaly Detection》时，文中提到了这三种方法来比较时间序列中不同区域概率分布的差异。 KL散度、JS散度和交叉熵三者都是用来...

10-18

Ruby中的block、proc、lambda区别总结

在规则引擎中，Ruby 的闭包使用特别频繁，而且有 block，Proc和 lambda 等后几种形式的用法，很让人困惑。为了深入理解代码，...

10-18

廊坊电销卡好用吗

廊坊电销卡好用吗 "本公司是一家专业做电销卡的通讯公司！十年行业经验为为您保驾护航！卡种多，归属地齐全。满足不同...

12-15

手机坐席与PC端云呼叫中心有哪些区别

疫情期间坐席受制于网络条件或者没带电脑，手机坐席是坐席居家办公的一种新方式，适合没有电脑或者更愿意使用手机的坐...

12-07

10-23

浅谈400电话企业客服的有力工具

现在各行各业的发展都离不开互联网，企业更是如此，现在越来越多的企业开始了网络营销的征程，都想让自己的业务在互联...

12-22

云外呼系统质量

外呼系统是一种具有完善防封功能以及客户管理后台的系统，目前电销行业现在面临的问题就是现在封号问题严重，不管用哪...

11-27

有准确率很高的空号检测软件吗？

怎么解决手机空号这一麻烦事呢，用手机空号检测就能解决，现在手机空号检测的软件在网上一搜出来的太多，一时之间不知...

12-03

在正规平台办理电销卡的好处

选择电话营销时，重要的及时电话卡了，但是使用普通的电话卡因为电话的数量较多就很容易被封，那么就需要去办理电销卡...

12-04

精确定位店位置多少钱？精确定位位置？

北京现代4s店装gps定位多少钱？如果需要可以去汽配城和GPS公司安装，记着要软件客户端、账号和密码。你可以货比三家，一...

11-26

win7升级win8.1后360浏览器打不开了怎么办？

原先安装win7系统换为win8.1update（win8应该适用），之前安装在D盘的360极速/安全浏览器无法打开，可使用此方法。软件名称：...

10-20

福州房产电话呼叫软件在哪可以办理,电销系统-[热门]

福州房产电话呼叫软件在哪可以办理,电销系统因为电话营销机器人可以更好的进行智能交流，所以就会让广大客户的好感度...

12-17

客服中心服务量话量预测入门

服务预测与排班是大部分服务行业有效管理的关键环节，尤其是客服中心，对服务预测准确度要求高，对排班的舒适性和效率...

10-22

上半年重庆市服务外包执行额达4.7亿美元增长169%

重庆频道消息 6月30日,记者从"2013重庆市服务贸易工作会"上获悉,今年上半年我市服务外包执行额达4.7亿美元,同比增长169%。此...

10-22

突发：刚刚，美国官方宣布“封杀”中国移动！！！移动公司重磅回应...

12-04

商标注册人的权利和义务

（一）商标注册人的权利商标注册人的权利主要是指对注册商标所享有的专用权。我国《商标法》规定：经商标局核准注册...

10-23

智能外呼系统对接网关（智能外呼系统对接网关有什么用）

今天给各位分享智能外呼系统对接网关的知识，其中也会对智能外呼系统对接网关有什么用进行解释，如果能碰巧解决你现在...

11-06

干洗商标该如何选择合适的类别呢？

所谓三百六十五行行行出状元，现在社会工种也是特别多，只要想的出到，都是有市场的，很多人买的衣服都是品牌，自己又...

10-23

ai外呼电话机器人（ai外呼机器人费用）

本文目录一览： 1、这个猎星AI智能外呼机器人好用吗？2、ai智能电话机器人有什么作用？3、AI语音机器人有哪些好处4、智...

11-27

西安5G电话线路详情-专业服务

西安5G电话线路详情因此，对于从事电销业的企业，或对某些从事电话销售的企业来说，智能电销机器人是一个好的选择。目...

01-15

电销机器人未来趋势图分析（机器人销售前景）

本文目次一览： 1、AI智能电销呆板人阛阓前景如何样？ 2、德律风发售将来的走向是什么？ 3、中科嘉智电销呆板人将来的发...

11-26

建立品牌美誊度的策略

品牌竞争是市场竞争在经历了价格、质量、服务等各方面的较量之后进入的一个新阶段。品牌与产品不同，它强调系统性和全...

10-23

宁波教育AI电话机器人办理价格-放心省心

宁波教育AI电话机器人办理价格进员工难以跟进。流失率居高不下：销售工作单调乏味，流失率居高不下。现在对于很多的传...

01-16

现在最火的餐饮加盟项目有哪些？你觉得现在餐饮行业好做吗？

2018年最火的餐饮加盟店之贝克士汉堡现在社会的生活方式都是快节奏的，人们会为了节省更多的时间而去选择快餐。然而汉...

12-14

win8图片库加入图片的方法介绍

Win8系统中的Metro界面真是灰常漂亮啊，我就喜欢在这界面下用不过可以用的软件真是少。Metro界面中的相片下的图片库，你打...

10-20

联通116114为广交会客商提供无忧服务

第109届广交会期间，广东联通整合了116114业务的酒店机票预订、交通顾问等服务，为广交会客商提供无忧服务。据悉，1161...

10-19

大理州电销机器人培训（电销机器人话术剧情）

本文目录一览： 1、学习工业机器人到哪里学啊？2、电销机器人究竟多少钱？价格往来不断怎样这么大3、有谁用过电销机器...

04-22

电销顾客资源怎么找？

电销顾客资源怎么找？在电话销售过程中，正确的寻找到意向顾客是我们做电话销售人员的关键的一步。电话销售人员在每...

10-24

办400电话需要多少钱开通一个400电话需要多少钱？

400电话由主电话和被电话分担，即400电话承担市政电话接入费，被电话承担所有400电话接听费。影响400电话价格的因素很多...

01-12

嘉兴不封号呼叫中心软件多少钱,呼叫中心软件办理费用-信誉保证

嘉兴不封号呼叫中心软件多少钱,呼叫中心软件办理费用预计电销机器人将会大规模运用，智能电销机器人的市场份额将逐步...

12-17

重庆电销机器人代劳

汇港通自决研制鉴于大数据、云计划的产物。扶助大中小企业提率，提高管理，优化运维。移动crm经过大数据、云计划调整云...

10-31

易才博普奥为全球最大中文书籍零售商提供整体人力资源外包服务

CTI论坛(ctiforum)6月30日消息（记者杨佳林）：人力资源外包专家、服务外包产业专业人才租赁供应商---北京易才博普奥管理顾...

10-19

电话智能机器人怎么样，到底有没有效果

人工客服收到工作时间、效率以及工作量的限制，已经无法完全适应部分企业的呼叫业务。通过AI智能软件系统的协助，完成...

07-12

重庆高院终审判决假冒“简单搜索”网站赔偿百度80万元

来源：中国知识产权资讯网一个域名为“baidu”的搜索网站，却被法院判决赔偿百度公司80万元。这究竟是为何？ “百度推...

10-23

合肥智能电销网络线路办理服务商-诚信合作

合肥智能电销网络线路办理服务商它不只能提高企业的营销效率，还能帮助企业提高服务效率，除此之外，企业搭建智能电销...

01-16

400电话办理一年多少钱？解析金钱背后的谈判技巧、价格构成、影响因素和节省策略-400电话办

在商业社会中，电话交流作为最直接的联系方式，一直被视为商业合作的重要手段。而在以客户为中心的营销模式中，400电话...

07-21

windows2000下C盘权限设置

1.选取整个硬盘： system：完全控制 administrator：完全控制 (允许将来自父系的可继承性权限传播给对象) 2/programfiles/commonfiles：...

10-20

靓车spavip会所企业彩铃录音

您好，欢迎致电靓车spavip会所。我们以专业的技术，为您的爱车提供汽车美容、精品装具、镀晶、镀膜、防爆膜、封釉等专业...

11-27

Python基础之hashlib模块详解

目录一、hashlib简介二、hash对象的方法三、hashlib实际操作四、小小案例一、hashlib简介 1.什么叫hash: hash是一种算法（不同...

10-18

电销行业大革命，电销机器人到底带来了什么

电销领域革命，电销机器人究竟带给了哪些在2017年电销领域早已进入了一个乏力的环节：大家抵触电销的电話，只需已接...

01-15

阳江智能外呼系统（ai智能外呼系统销售）

本文目录一览： 1、自动外呼系统是什么，使用自动外呼营销系统违法吗？ 2、什么是智能外呼营销系统？求详细解答 3、自动...

11-24

viewport.exe进程是什么意思

进程文件： viewport or viewport.exe 进程名称： ATI/Appian HydraVision Desktop Manager 进程类别：存在安全风险的进程英文描述： viewpo...

10-19

巨人科技如何来管理员工

任何公司对自己员工的管理工作都是非常重要的，只有我们真正的做好各个方面的管理，你就会发现其实所有的事情都能够有...

05-15

AI电话机器人是骗局吗（ai电话智能机器人）

本文目录一览：1、ai电话诈骗是怎么回事儿?2、如何预防利用AI电话诈骗的骗局?3、ai电话诈骗,是真的吗?4、江苏镇江一骗子用...

06-20

电销卡公司封号咋办

对于电话销售人员来说，他们每天都要使用手机卡拨打电销电话，可以说呼出频率是非常高的，如果使用三大运营商发行的手...

12-16

400电话的智能网平台是怎么回事

对于400电话这样的一种业务，很多人是不了解的，甚至不知道这样一种业务的存在，毕竟自己从来没有接触过这样一种类型的...

05-16

一键呼救911呼叫中心！Uber推出呼叫功能提高救援效率

据境外媒体报道，让报警电话时用户的定位变得更准确，这不仅是在优化应急流程，更可能是在生死关头提高救援效率。FC...

10-19

什么是客服外包，怎么挑选靠谱公司合作？

什么是客服外包？客服外包，是指企业将客服工作交由其他企业负责，客服外包类型主要有：售前咨询、售后服务等。这对...

01-16

银川智能外呼系统价格（外呼系统收费）

本文目录一览： 1、外呼体系装置须要哪些用度？ 2、召唤焦点或外呼体系哪种又廉价又好的啊 3、智能外呼体系几何钱？ 4、...

11-26

400电话漏接短信功能意义有多大?

当企业漏接掉一个电话，400电话客服会在一定时间给企业发去漏接短信，这就很大程度上降低了企业漏接电话而造成的损失。...

12-22

消费级物联网专用卡14103怎么激活（电信物联卡14104激活）

141号段是电信物联卡号段，作为目前物联网市场上最大的物联卡运营商，电信物联卡其卡片的稳定性和质量得到的一致好评。...

11-07

基于KL散度、JS散度以及交叉熵的对比

10-18

本页收集关于基于KL散度、JS散度以及交叉熵的对比的相关信息资讯供网民参考！

推荐文章

上一篇：教你学会通过python的matplotlib库绘图

下一篇：python基础学习之组织文件

一起分享吧