Delta Lake 和 Apache Hudi 两种数据湖产品全方面对比

  • 时间:
  • 浏览:1
  • 来源:大发PK10APP下载_大发PK10APP官方

数据湖分析服务Data Lake Analytics发布支持OSS多版本优化、控制台等多项优化及改进

Apache Spark中国技术交流社区历次直播回顾(持续更新)

Hudi(Hoodie) 是 Uber 为了处里大数据生态系统中还要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问提,该项目在2016年开

Data Lake 三剑客——Delta、Hudi、Iceberg 对比分析

数据湖分析服务 Data Lake Analytics发布SQL补全、缓存等多项优化

Data Lake Analytics助力加和科技广告智能业务 - 性能提升4倍+,临时业务需求承接率提升3000%+

内外部化大数据分析平台设计

由于您发现本社区含有涉嫌抄袭的内容,欢迎发送邮件至:yqgroup@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

Apache Spark3.0哪些样?一文追到Apache Spark最新技术发展与展望

Apache iceberg:Netflix 数据仓库的基石

Apache Spark3.0哪些样?一文追到Apache Spark最新技术发展与展望

DLA支持Parquet/ORC表的Alter Table Add Column

下拉加载更多

Data Lake 三剑客——Delta、Hudi、Iceberg 对比分析

Delta Lake 是数砖公司在2017年10月推出来的4个项目,并于2019年4月24日在美国旧金山召开的 Spark+AI Summit 2019 会上开源的4个存储层。它是 Databricks Runtime 重要组成次要。为 Apache Spark 和大数据 workloads 提供 ACID 事务能力,其通过写和快照隔离之间的乐观并发控制(optimistic concurrency control),在写入数据期间提供一致性的读取,从而为构建在 HDFS 和云存储上的数据湖(data lakes)带来可靠性。Delta Lake 还提供内置数据版本控制,以便轻松回滚。

【译】Delta Lake 0.4.0 新内外部演示:使用 Python API 就地转换与处里 Delta Lake 表

Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎

Apache Spark中国技术交流社区历次直播回顾(持续更新)