Apache冰山-架构下的外观

   
  • 杰森·休斯技术宣传主任

会议摘要

数据湖的建立是为了实现数据的民主化——允许越来越多的人, 工具, 以及利用数据的应用程序. 实现它所需的一个关键功能是对用户隐藏底层数据结构和物理数据存储的复杂性. 事实上的标准是Hive表格式, Facebook在2009年发布的,解决了其中的一些问题, 但数据不足, 用户, 应用规模. 那么答案是什么呢? Apache的冰山. Apache的冰山 表格格式现在被许多领先的科技公司使用和贡献,比如 网飞公司、苹果、Airbnb、LinkedIn、Dremio、Expedia和AWS.加入杰森·休斯, 德雷米奥的技术总监, 了解Hive表格式的不足以及冰山表格式解决这些问题的架构细节, 以及冰山计划带来的好处.您将学习:

  • 在大规模使用Hive表格式时出现的问题,以及为什么十大网赌靠谱网址平台需要一种新的表格式
  • 对表格式结构进行简单而优雅的更改如何产生巨大的积极影响
  • Apache冰山表的底层架构, 对冰山表的查询是如何工作的, 以及在对表进行CRUD操作时表的底层结构是如何变化的
  • 这种架构设计带来的好处

准备好开始? 这里有一些资源可以帮助你

案例研究

案例研究

Dremio以高性能的湖屋支持Moonfare的高性能文化

Moonfare将亚马逊网络服务(AWS)上基于postgresql的数据仓库替换为Dremio数据湖,为数据工程师提供服务, 分析师和业务用户为业务智能和预测分析提供高性能平台,使他们能够做出更好的数据驱动决策.

阅读更多

案例研究

案例研究:DB Cargo允许用户使用Dremio的所有数据

德国联邦铁路集团(DB)是全球领先的交通和物流公司之一. 德国铁路货运业务部负责管理德国铁路货运业务.

阅读更多
案例研究

案例研究

案例研究:亚马逊使用Dremio加速供应链决策

亚马逊的供应链金融分析团队使用Dremio开发了一个新的分析架构,以简化ETL流程, 加快查询, 并在统一的数据视图上提供分析.

阅读更多

免费开始

没有时间限制-完全免费-就是你喜欢的方式.

现在注册

请参阅Dremio在行动

今天还没准备好开始? 看看运行中的平台.

观看演示
友情链接: 1 2 3 4 5 6 7 8 9 10