课程目标

本课程主要介绍数据仓库建设与数据治理。通过本课程的学习,能熟练根据企业业务场景建设自己的仓库,同时还能对数据做一些处理,只有通过治理过的数据,才能为后续的数据分析,数据挖掘和可视化提供更加精准和全面的保障。

适用人群

本课程适合具备一定DBA基础,了解数据库开发,愿意或计划往大数据方向发展的人群。

课程概述

本课程重点介绍数据仓库和数据治理案例,通过企业的成功案例分享经验,帮助后来者少走弯路,以及如何绕过前辈踩过的坑。

数据仓库和数据治理是保证大数据分析的前提,经过这么多年的技术发展,企业都留存了各种各样的数据很多,无论是结构化或费结构化的数据都会有涉猎,到了大数据时代,都希望通过过去的数据能帮助企业提高一些效率,降低一些成本。但是我们过去开发的一些不规范,导致我们的数据需要重新梳理后统一的管理和存储,因此我们需要多数据进行更好的存储和治理,为后续大数据行为提供保证。


一、网易考拉数据业务架构实践

主题介绍: 网易考拉经过3年多的发展,已经成为中国领先的的跨境电商平台。随着业务的飞速发展,如何支撑庞大的数据业务和需求,实现用户生命周期管理和个性化营销,已成为数据技术团队的关键问题。本次分享包含:1.考拉大数据架构的变迁升级历史;2.我们如何收集并计算全站数据,并进行高效的ETL开发和数据仓库建设。3.基于受众定向技术产生的海量算法规则标签,如何进行高性能的用户画像查询和探索;4 基于个性化技术,如何实现海量个性化营销方案自动部署实施和AB效果追踪。

讲师介绍:陈文翔  网易考拉 资深数据开发工程师

2011年毕业于浙大计算机系,2012年加入网易杭研院,参与开发移动数据分析系统(DA)和市场推广分析系统(MA),2013年,开始负责易信数据仓库建设和数据产品的开发。2015年,开始领导考拉数据技术团队,负责考拉数据仓库,数据门户,实时大屏,数据营销系统等数据产品的开发工作。



二、数据仓库自动化如何帮助大型企业开发缩短到几天,并实现治理与合规

主题介绍: 本次课程,将介绍如何通过数据仓库自动化工具,让数仓开发从半年以上缩到几天、几周,令对业务更熟悉的开发者自助实现原型或数仓、Hadoop数据湖和Data Vault。通过自动完成编码、运维和文档,帮助Vodafone、乐购、沃尔沃、美光半导体等的BI和大数据团队提升价值,提高数据治理水平,减少对手工开发的依赖,从容应对监管合规的要求。

讲师介绍:杨旸  怡和科技 中国区技术和合作伙伴总监

十年以上开发、售前和架构经验。宾州州立大学电子工程硕士,从硅谷的思科电信事业部开始,历经VoIP、医疗信息、电商、SQL-On-Hadoop、数据仓库、GPU等领域。现带领团队,为大型企事业提供大数据、数仓、物联网等平台和数据方案。



三、复杂业务环境下的大数据治理实践

主题介绍: 猎聘网业务规模的高速发展,线上产品与线下销售、客服业务的高度融合,猎头、企业、经理人多角色的招聘生态闭环,多元化与多组织层次的数据统计与运营分析需求......在这些复杂业务环境下如何做好数据治理实践的?猎聘DIG数据平台中MySql、GreenPlum、Hive多源数据库共存,整合了结构化和半结构化的数据,为实时统计、T+N的企业管理报表、机器学习提供更适合的基础设施,同时以数据生命周期和数据血缘的管理作为数据治理的两大核心脉络。线上、线下不同业务形态的数据,在时间、地域、组织等不同维度上,在数据产生、成长、下线、归档不同的生命阶段,设置不同的数据监测和管理策略,保证数据仓库中数据的及时性和有效性。通过制定数据标准、规范协作流程、自研监测与预警工具,保证业务数据、数仓明细数据,核心指标等各个数据加工链条节点上的数据一致性和质量可靠性。

讲师介绍:满成见  猎聘网 数据仓库架构师

2016年加入猎聘网,负责猎聘数据仓库平台架构设计与模型开发,有八年数据仓库设计与数据治理项目实施经验。



四、Druid在滴滴应用实践及平台化建设

主题介绍: Druid是一款支持数据实时写入、低延时、高性能的OLAP引擎,具有优秀的数据聚合能力与实时查询能力。在大数据分析、实时计算、监控等领域都有特定的应用场景,是大数据基础架构建设中重要的一环。Druid在滴滴承接了包括实时报表、监控、数据分析、大盘展示等应用场景的大量业务,作为大数据基础设施服务于公司多条业务线。本次演讲我们将介绍Druid的核心特性与原理,以及在滴滴内部大规模使用中积累的经验。

讲师介绍:刘博宇  滴滴出行 高级软件开发工程师

滴滴出行高级软件开发工程师,就职于滴滴基础平台大数据架构部。负责Druid集群维护与研发工作。


课程目录

1 第1章:网易考拉数据业务架构实践
2 第2章:数据仓库自动化如何帮助大型企业开发缩短到几天,并实现治理与合规
3 第3章:复杂业务环境下的大数据治理实践
4 第4章:Druid在滴滴应用实践及平台化建设

课程评价

课程讲师

DTCC大会
  • 课程数
    59
  • 学生数
    7888
中国数据库技术大会(简称DTCC)是国内数据库及大数据领域专业的技术交流盛会。DTCC每年邀请百余位行业专家,就热点技术话题进行分享,为数据库人群、大数据从业人员、广大互联网人士及行业相关人士提供最具价值的交流平台。

最近学习用户 166人报名试学

  • niuniuluo

  • kabbk

  • ITPUB学院