阿里云 数据湖构建 Data Lake Formation

阿里云 数据湖构建 Data Lake Formation

数据湖是一个集中式存储库,可存储任意规模结构化和非结构化数据,支持大数据和AI计算。数据湖构建(Data Lake Formation,DLF)作为云原生数据湖架构核心组成部分,帮助用户快速地构建云原生数据湖解决方案。数据湖构建提供湖上元数据统一管理、企业级权限控制,并无缝对接多种计算引擎,打破数据孤岛,洞察业务价值。

1、开源生态构建数据湖

用户已经基于阿里云开源大数据生态系统(E-MapReduce,实时计算Flink,DLA等产品)来构建自己的数据处理分析平台,而在数据量飞速膨胀的 [阅读全文]

腾讯云 数据湖构建 Data Lake

腾讯云 数据湖构建 Data Lake

数据湖解决方案以 COS 为数据湖底座,支持多种格式数据海量存储;通过数据湖加速器 GooseFS 无缝对接各类计算和机器学习平台,打破数据孤岛。

多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据,同时可以按原样存储数据。

计算弹性:通过计算与存储分离,实现计算资源的弹性伸缩,满足客户对计算资源的灵活调度。

成本最优:为集中式存储池,可快速扩展或缩减存储资源,实现存储数据冷热分层,降低大数据分析与机器学习存储成本。

服务集成:无缝支持腾讯云各类计算 [阅读全文]

华为云 数据湖构建 Data Lake

华为云 数据湖构建 Data Lake

数据湖探索(Data Lake Insight,简称DLI)是完全兼容Apache Spark、Apache Flink、openLooKeng(基于Presto)生态,提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。企业使用标准SQL、Spark、Flink程序就可轻松完成多数据源的联合计算分析,挖掘和探索数据价值。

[阅读全文]