主页 > 知识库 > 第四范式戴文渊:企业构建商业AI能力须五大核心要素

第四范式戴文渊:企业构建商业AI能力须五大核心要素

热门标签:使用U盘装系统 百度竞价点击价格的计算公式 美图手机 智能手机 硅谷的囚徒呼叫中心 网站建设 检查注册表项 阿里云
 

由机器之心主办的全球机器智能峰会( GMIS 2017 )在北京正式启幕。第四范式创始人、首席执行官戴文渊, LSTM 之父 Jurgen Schmidhuber ,前微软人工智能首席科学家邓力,今日头条副总裁马维英等人工智能领袖受邀出席了开幕当天的主论坛、并颁发主题演讲。作为人工智能工业应用的代表,戴文渊在此次大会上针对人工智能如安在工业界应用进行了关键性说明。

戴文渊认为,尽管组织核心的竞争模式已经从流量为王的互联网模式升级到了生产、运营效率贡献模式,舆论集体投奔人工智能,但人工智能目前尚未在工业界全面落地。这是因为企业构建商用人工智能须五大核心要素,即Big data(大数据)、Response(持续的反馈)、 Algorithm (算法)、 Infrastructure (计算资源)和 Needs (明确的需求),他将其概括为 “BRAIN” 。戴文渊建议企业采取 “ 专业化分工 + 专注核心环节 ” 的方式,充分借力人工智能平台,关注数据自己及业务需求,更加高效通过智能决策引擎让数据发挥价值。

Big Data ——有意义的过程数据

大数据是人工智能存在的基石。多来源、多类型的大数据可以从差别角度进行迫近真实的描述,而利用算法可以挖掘数据之间的多层次关联关系。针对数据,戴文渊提出真正能够产生人工智能的是过程数据(同“用户行为数据”)。

戴文渊提到,过去的互联网红利期虽然行业中有海量数据涌入,但大量的数据没有标和明确的定义,数据清洗及标签化难度相当高。他举例到,“统计局公布的各地区 PM2.5 统计数据并不能让我们产生预测 PM2.5 的能力,人工智能需要基于具体行为来掌握情况、学会技能。例如近期较受关注的智能投顾( Robo-Advisor ),就是让机器先学习投资经理们是如何进行投顾的行为数据,才能利用机器进行智能投顾。”

安身于行业应用视角,戴文渊指出,根据当下技术发展,一个优秀的人工智能模型需要一千万以上的数据样本。因此,在数据方面,企业需加强对用户每一个行为及其结果的记录意识。以在线广告为例,用户的搜索行为、广告内容及用户是否有点击行为等,都需要加以记录,最终形成渗透至每一个场景、每一台设备和每一种办事里的数据采集机制。

Response ——数字化的持续反馈

用户行为数据是机器学习的基础,如果想让机器学到最新的、即时的用户行为,戴文渊认为,能够形成持续的反馈闭环的人工智能系统是机器智能提升的前提。机器需要通过正、负反馈来不停学习、不停进步。以 AlphaGo 为例, AlphaGo 的自我博弈就是不停收集落棋结果的反馈,然后不停地更新本身的策略,经过无数次博弈与反馈,输出一个最优的行为策略。戴文渊体现,当下越来越多的新闻聚合平台开始转型为基于人工智能技术的个性化保举平台,这在过去数据不足的情况下是很难实现的,素质上是因为当前各新闻平台都开始记录并积累用户日志,让机器能够不停地学习如点击、阅读时长、转发、保藏、投诉等反馈数据。

此外,机器能够容易理解的反馈数据需要符合被标记标签的性质,Facebook上的“ like ”和“ dislike ”就是一种数字化的标记反馈。对此,戴文渊建议企业应该建立数字化、不间断的反馈数据闭环,将实时数据进行反馈,使模型具备自我进化能力。以第四范式“银行交易实时反欺诈解决方案”为例,新的数据、新的欺诈场景实时反馈给系统,与此同时,对数据进行“欺诈交易”或是“正常交易”的标注,再用标注过的数据继续模型的训练,让机器具备“火眼金睛”。

Algorithm ——高维度的算法能力

算法是人工智能决定效率提升的关键因素。戴文渊指出,人工智能技术的优势包罗超越人类想象的特征变量组合方式,能够做到“千人千面”甚至“千人万面”,大量无法统计的规则会被机器自主发现和抓取,从而充分挖掘“长尾用户”的行为规律,提高机器学习模型预测的精准度。这就需要超高维度的算法。

超高维度的算法,首先必要原始数据的绝对值很大,这对于大数据的分布式存储、处理技术具有较高要求。其次,利用万亿级的海量特征进行机器学习特征处理、模型训练以及线上办事,需要成千上万个节点进行协同工作,这对算法及系统的要求是全方位的 —— 从异步分布式的计算模式,到高性能的网络,再到海量的内存存储等都有极高的要求。对此,戴文渊提到去年 7 月,第四范式发布了新一代机器学习模型—— DSN ( Deep Sparse Network ,同 “ 深度稀疏网络 ” ),该算法底层是上千亿大小的宽度网络,其基本理念是随着数据量增大,模型的维度会随之升高大,从而保证“机器的智力”连结高水准。

Infrastructure ——高性能的计算能力

标签:通辽 怀化 黄山 贺州 山南 烟台 湘潭 湖北

巨人网络通讯声明:本文标题《第四范式戴文渊:企业构建商业AI能力须五大核心要素》,本文关键词  ;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 收缩
    • 微信客服
    • 微信二维码
    • 电话咨询

    • 400-1100-266