数据方面的思考(一个值得思考的问题):数据差异化

发布时间 2023-08-07 20:52:55作者: 凌晨与风

今日在一个问题与同事上产生了分歧,起因很简单。两个大屏展示的同一个指标数据对不上,从同事的角度上来说,两个大屏的数据要对上,但是我不这么看。

事件的过程:

1.两个大屏,一个负责展示数据仓库的数据内容,一个负责对外展示客户集团的数据情况

2.这个数据展示用的是同一个数据来源,但是数据中包含了正常数据和废弃数据,一个是包含了正常数据和废弃数据,一个是筛掉了废弃的数据,因此数据仓库的数据量大于对外展示的数据

我的看法:

1.两个大屏的定位不一样,展示数据仓库的内容和对外展示客户集团的数据情况肯定会存在差异,因为对外展示的数据情况肯定是以集团现有业务情况相符合,因此存在差异很正常。

2.两个指标虽然从含义上同一个东西,但是实际意义不一样。

  首先数据定位上,既然集团保留了废弃数据,说明也是有它的价值所在,从另一个角度来说:这个废弃的数据也是客户数据资产的一种。那么在数据仓库中展示的数据总量理应是正常数据和废弃数据的总和。

  对外展示的数据应该是开放的、与现有业务相符合的情况,因此在展示的数据理应要去掉废弃的数据,展示相对正确、正在使用的数据。

问题探讨

做一个假设,如果这两个大屏的数据量相等会有什么问题:

  1.对外展示的数据以数据仓库的数据情况为主,则对外展示的数据就会与业务情况不准,且会很混乱,无法给人带来数据层面上的分析,出现这种情况肯定是不合适的,因此去掉废弃数据,或者一个指标数据拆分成多个维度展示,这样才能达到利用数据进行分析的效果。

  2.数据仓库的数据以对外展示的数据为主,则数据仓库展示的数据不是实际数据仓库建设情况,从业务角度上来说影响不大,因为数据仓库的数据情况基本上不会对外展示,但是会引出另一个问题,我叫他为数据差异化,这个下面在说。

  3.两者数据相同,则就是同一个指标数据用两个大屏展示,如果说两个大屏分属不同的部门负责,我认为可以展示且数据应该保持一致,但是两个大屏如果属于同一个部门负责,则我认为这种行为没有意义,且是浪费资源的情况,完全可以把另一个指标数据空出的位置用于展示其他方面。不然是否会引出一个问题:两个大屏的定位和职责就混淆不清楚。

数据差异化

  数据差异化是我引出来的一个思考,往往在使用数据时,针对不同的场景一定要求同一个指标的数据一致,这种是否有什么意义?

  如果说同一个指标数据在所有的场景下都保持一致,那么当这个数据出现问题了,怎么暴露出来?我觉得根本无法暴露。

  一个问题是怎么发现的?有对比,往往就是通过对比发现问题,不管是生活也好,工作也好,数据也罢,一个事务的状态是随时变化的,数据也是随时变化的。

举一个不恰当的例子:人生病了会咳嗽,如果在一个普遍咳嗽的世界,不咳嗽就是差异,就是问题,在一个不咳嗽的世界,咳嗽就是差异,就是问题。那么由此可见,问题的暴露是通过对比出来的。

举一个不恰当的例子:一棵小树今天20厘米,明天30厘米,通过对比就会发现小树长高了10厘米,是长势良好还是有问题,就可以反应出来,如果说一颗小树今天10厘米,明天20厘米,不和昨天对比,那么永远无法知道小树的状况。

  那么引申下去,数据也要通过对比发现问题。因此我觉得对比显示差异化,得出结论

问题反思

那么怎么通过数据分析出想要的结果

  分析的结论只是一个最终的答案,分析的过程是展示得到答案的过程,过程不一样,得到的答案会不一样。因此怎么在合适的场景下选择合适的分析的过程,这个没有标准,我也不知道。就目前来看,分析的过程无非就是统计汇总、数据对比,是否还有其它的方式这个值得探究。

回到问题本身

  如果说客户要求数据要这么一致,那么尊重客户的需求是首位的,但是自己本身也要提出建议,其次怎么对客户进行引导也是我们需要做的一部分任务。

结论

  1.做事情不要害怕出问题,只要问题暴露出来了才能知道问题所在,才会得到处理和解决。

  2.也不要一定要求所有数据的都保持一致、准确,只能说是保证相对准确,相对是指在什么场景的正确数据。

  3.数据没有差异化,那就无法暴露问题,不能暴露出来的问题不叫问题,叫隐患。

这是我的一个思考,我觉得可以讨论的一个数据问题