课程目标

本课程收集企业一线机器学习案例,学习本课程可以很好的掌握机器学习技术在企业中的实际应用,对后续企业数据价值发现起到借鉴作用。

适用人群

学习本课程需要具备一定的大数据技术基础,具备初步的企业大数据使用基础。

课程概述

本课程主要是机器学习案例分享,来自百度、苏宁、腾讯等企业一线大数据工程师和架构师通过自己的技术实践经验分享,给大家呈现了机器学习技术在各行业的使用场景,通过本课程的学习,您将可以更好的了解机器学习给企业带来的巨大价值。

一、大数据机器学习新方法

主题介绍:从发现逻辑(传统人工智能、关注规则和知识)和统计(强调数据特别是小样本说话)存在的不足,探索大数据的结 构和统计新学习理论、算法与实例,主要涵盖包括气象大数据精准降雨估计(国家气象局)、城市群环境动态监测(环保部任务)

讲师介绍:张文生,中国科学院大学机器学习首席教授。2001年博士毕业于中科院自动化 所,2002年起任中国科学院大学教授、博士生导师,目前兼任中国自动化学会智能控制专业委员会副主任、中国电子学会云计算专 委会委员、中国计算机学会人工智能与模式识别专业委员会委员、国家重大科技专项专家组成员等职。

二、基于深度学习的图片检索应用

主题介绍:传统的图片检索技术主要基于文本query和图片周边文本的匹配,而对图片本身的语义信息利用相对较少。近年来,受益于深度学习的快速发展,计算机视觉及自然语言理解等技术不断进步。对于文本和图片,我们可以提取出精准、丰富的语义信息,从而实现比传统方法更加准确的图文匹配。使用百度开源的PaddlePaddle深度学习平台,我们可以在亿级规模的文本和图片数据上轻松训练模型。我们使用深度图文语义模型,在正版图片检索引擎——百度像素上取得了很好的效果。

讲师介绍:朱剑锋 ,2010年毕业于北京大学元培学院统计学专业。先就职于深圳华大基因研究院,担任核心算法研究单元负责人,主要研究宏基因组、群体遗传学、序列比对、产前遗传筛查等方向,成果发表于Nature等期刊。后就职于京东商城推荐搜索组,负责离线推荐系统中的点击率预估算法设计、实现及优化。目前就职于百度深度学习实验室,从事图片检索相关方向,主要兴趣为深度学习在自然语言和图像处理中的应用。

三、会话系统实战-苏宁聊商平台

主题介绍:随着人工智能、大数据和云计算的飞速发展,人机会话已经无处不在,并成为研究和工业界的热点问题,各种闲聊陪伴和专业助理等智能聊天机器人已经在线上和线下广泛应用,取得不错效果。本次分享会介绍会话系统的演进、基本构成、相关架构,涉及的模型、算法等,并结合实际案例,分享苏宁的聊商平台是如何实现人机沟通和交互的。

讲师介绍:李伟,清华大学博士,在微软亚洲研究院、雅虎北研、百度等公司实习和工作,从事过搜索、推荐、个性化和广告等相关产品的架构、系统、算法和数据等任务。目前担任苏宁技术研究院人工智能实验室技术总监,参与聊商平台、智能家居以及其他智能驱动业务线的研发。

四、机器学习技术在房屋估价中的应用

主题介绍:房屋估价是链家网为买家、卖家、经纪人三方提供议价基础的工具,目前日均调用量8W次,超过链家网每日电话+IM数量。房屋估价为早期用户提供与平台发生交互的入口,为潜在买房者和卖房者提供价格预估,有效增大用户粘性。目前,北京平均准确率80%(估价误差在5%以内认为估价准确),平均误差4.3%。

讲师介绍:宋鑫 链家网数据挖掘资深研发工程师,毕业于中科院软件所,现就职于链家网商业搜索部,主要负责链家网房屋估价和展位调度相关技术工作。在加入链家之前,在百度负责一些物料审核相关数据挖掘工作。

五、BML百度机器学习云平台

主题介绍:大规模机器学习云平台,简称BML(Baidu Machine Learning),是由百度基础架构部自主研发,面向百度开放云的机器学习、数据挖掘、数据分析的用户,致力于引领大数据时代模型技术的浪潮,通过大数据建模技术,为各行各业带来实实在在的业绩提升,让各行业的开放云用户使用上与百度搜索,广告,地图等各种产品一样高效前沿的机器学习技术。

讲师介绍:刘伟 百度基础架构部高级架构师,2009年加入百度,现任基础架构部高级架构师,负责各种大规模机器学习算法及其框架研发;在百度工作期间从事过凤巢大规模模型训练、广告触发、海量语料机器翻译、语义深度学习、搜索网页排序和深度学习平台等公司战略级核心项目,其中深度学习平台项目还获得2014年百度最高奖。

六、腾讯深度学习并行化实践

主题介绍: 1、深度学习的机遇与挑战; 2、Mariana DNN:基于单机多GPU卡的DNN数据并行框架; 3、Mariana CNN:基于单机多GPU卡的CNN并行框架; 4、Mariana Cluster:基于CPU集群的DNN并行框架; 5、Mariana Cluster演进:广告并行优化和单机性能极致追求; 6、GPU Cluster的探索; 7、业界深度学习并行框架的最新进展; 8.系统和算法双重视角理解深度学习。

讲师介绍:金涬 腾讯数据平台部高级工程师。博士,2005年毕业于清华大学计算机系,现任腾讯数据平台部高级工程师。主要研究方向为机器学习、深度学习、基于大数据的精准广告推荐技术。


课程目录

1 第1章:大数据机器学习新方法
2 第2章:基于深度学习的图片检索应用
3 第3章:会话系统实战-苏宁聊商平台
4 第4章:机器学习技术在房屋估价中的应用
5 第5章:BML百度机器学习云平台
6 第6章:腾讯深度学习并行化实践

课程评价

课程讲师

DTCC大会
  • 课程数
    59
  • 学生数
    7888
中国数据库技术大会(简称DTCC)是国内数据库及大数据领域专业的技术交流盛会。DTCC每年邀请百余位行业专家,就热点技术话题进行分享,为数据库人群、大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交流平台。

最近学习用户 150人报名试学

  • niuniuluo

  • sunwenyi

  • 哎呀我的天呐