业务背景:
某客户想了解旗下各品类对其他品类的连带率,比如某一个品类A的订单量是100,其中既有品类A又有品类X的订单是50个,那么A对X的连带率是50%。
客户提供过来的基础数据中,有很多维度比如城市、商圈、大仓等,但订单量和共同订单量这两个指标的主键是这几个:

客户的目的是品类直接的连带情况,因此,需要group by 日期、品类1 和品类2去做sum的聚合,理想的输出形式是??

即日期一致的情况下,所有品类1相同的条目中,"品类1订单量"字段应该是相等的。但实施后发现并非如此,即出现了下面这种情况

经过排查后发现:
客户提供的数据没有问题,但需要对数据进行一个预处理的步骤,即将缺失的维度做填充: