SNP Glue是SNP的集成技术,适用于任何云平台。它最初是围绕SAP和Hadoop构建的,现在已经发展为一个集成平台,虽然它仍然非常专注SAP,但可以将几乎任何数据源与任何数据目标集成。
我们客户非常感兴趣的数据目标之一是Snowflake。Snowflake是一个基于云的数据仓库平台,旨在处理和分析大量数据。它是一种软件即服务(SaaS)解决方案,允许组织使用云基础设施存储、管理和分析数据,而无需管理底层硬件或软件。
企业如何使用SNP Glue和Snowflake?
下面是一个使用SNP Glue将SAP与Snowflake集成的实际客户示例:
想象一下,一家总部位于德国,但在全球范围内运营的大公司。他们有30多个SAP生产系统,他们从中获取数据(主要使用SAP自己的SLT)。它的范围是巨大的,我们谈论的是每个系统数以万计的表。现在,通过SNP Glue,我们可以获取所有这些数据,并使用Glue自己的CDC(更改数据捕获)——有时与SLT的增量捕获一起使用,将所有SAP数据包括不断更改的数据复制到云端的基于Snowflake的数据仓库中。
为什么公司会使用Snowflake?
Snowflake基于SQL的关键特性“弹性”(即可伸缩性),并附带了强大的数据处理特性来覆盖ETL(提取-转换-加载)中的“T”,这对于现代集成体系结构(主要是关于ELT而不是ETL)来说很有意义,只是为了解耦数据集成和数据转换的复杂性。简而言之,Snowflake是数据平台(以前称为数据仓库)的某种程度上与云无关的SaaS产品。
Snowflake支持通过连接器和api与各种数据科学和人工智能工具集成。你可以使用流行的人工智能库和框架与Snowflake一起构建和训练模型。
用简单的话来总结:Snowflake是一个在集群系统上的非常强大的数据库,它是按规模构建的,并提供了大量的优势。
保留你的选择余地
话虽如此,每个超大规模企业都有一个相互竞争的技术,例如redshift (AWS)、Synapse(微软)、Big Query (GC),甚至DataBricks。在众多技术优势中,Snowflake有一些优势,其中之一是它是真正与云无关的,因此不会将客户推向供应商锁定。
客户使用SNP Glue与基于云的数据仓库集成,选择Snowflake是因为它是一个真正的SaaS解决方案,像数据库一样理解SQL(但像Hadoop一样扩展),并且像数据库一样快速返回数据。
使您的SAP数据集成更容易
有了SNP Glue,就有可能实现SAP与Snowflake之间的本地集成。显而易见的起点是与安全性和身份验证的技术集成。然后是“真正的”数据集成,从模式创建开始:SNP Glue可以分析SAP数据源并在Snowflake上创建相应的数据模型。
数据复制可以是表驱动的(即基于表的数据复制,有或没有增量捕获),也可以是事件驱动的(在这种情况下,您将使用Snowpipe进行数据流)。
是什么让Snowpipe这么酷?
表驱动的数据集成是经典的集成方法,它是全表加载,然后是增量捕获(又名CDC)和近实时数据复制。在初始满负载之后,传输相当小的数据包。这一切通常都是基于经典数据库表,而不是业务对象。根据数据传输的频率(可能会产生非常小的包),可以实现近乎实时的提取和数据集成,但这将以Snowflake上频繁的所谓增量合并为代价。
Snowpipe允许在新数据到达时将数据连续加载到Snowflake表中。这对于需要为分析、报告或其他应用程序提供新信息的场景特别有用。Snowpipe可以与各种工具和工作流集成,使其可用于实时分析、报告和其他数据驱动型应用程序。
为了恰当地结束这篇文章,我想用一句古老的“最后一句话”作为结束语:正在构建SNP Glue以本地集成SAP数据和Snowflake的同一个团队正在使用Snowflake的应用程序框架在Snowflake上开发一个本地应用程序。我们的目标是在Snowflake上实现(并极大地改进)包括delta合并在内的数据流,即将更新的记录集成到数据仓库中。