Projection 和 Aggregation到底有什么区别?
看名字就能看出来的。
那么在什么场景下用呢?
1. Projection就是投影,也就是说你本来的源里有什么,就直接给你拿出来。
除了这个,它使用的场景就是:
只映射需要的列。 添加计算列。 定义列的参数给源数据做过滤。
也就是说在这个节点里,只投影。是没有办法给值添加一些聚集的语义,让它去选最大值或者最小值啥的。默认的聚集功能就是在更粗的维度上进行sum。
2. 聚集节点。在聚集节点里,会把字段分为维度和值。但是在投影节点虽然是decimal类型,但是还是只是个字段没有细分。
到聚集节点下值类型就会有聚集类型设置。
同时维度类型可以设置transparent filter 和 Keep flag等。因为你要告诉系统,上面的值到底要在哪些维度上做聚集。有些维度不需要做聚集的,要求放过。人家金额值可能就只想按照销售组来分组聚集,不想按照销售组下面的销售类别来聚集。