Amundsen中怎么实现数据血缘功能

Amundsen中怎么实现数据血缘功能,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

新的概念

Lineage:这是一个术语,代表了数据流的传递过程,从一个实体到另一个实体。特别是ETL的过程,重点关注表到表,列到列的数据流转过程。

Upstream:数据从上游流向下游,Upstream就代表着当前的数据来源。

Downstream:代表了使用了当前数据的相关实体。

 表级别

页面分为Upstream以及Downstream两个选项卡。

每个选项卡将包含从中继承或使用数据的表的列表。这允许用户以非常简单的方式查看。

Amundsen中怎么实现数据血缘功能

 列级别

和表级别相似,可通过扩展列的元数据来查看。

Amundsen中怎么实现数据血缘功能

当然这还只是初步的设计,未来可能会有更多的变化,我们会持续关注~

附一张Apache Atlas此功能的实现图

Amundsen中怎么实现数据血缘功能


看完上述内容,你们掌握Amundsen中怎么实现数据血缘功能的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注亿速云行业资讯频道,感谢各位的阅读!

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。