贪吃的公司
疫情前,某中大型互联网公司,依靠流量红利高速发展,开启最热门的事业部架构多线发展,同时利用率先上市的资本优势接连收购了垂直赛道的若干公司,一时风光无限。高速增长的业务和不断吃进的公司,持续带来巨量的新增数据,而每个人、每个部门都忙于各自方向的“高速裸奔”,疏于数据的基建和治理,号称最数字化的互联网公司并没有享受到数字化的红利,甚至深陷数据太多的泥潭。正所谓:飞奔一时爽,经营泪两行。于是贪吃而深陷数据泥潭之中的公司,面临各种需要解开的“乱麻”。
其一在宏观,各子业务没有统一的指标体系,即使有相同的,也因为数据血缘的关系(从数据采集方法到定义和统计方法也存在较大差异),可比性极差,最终无法做到各子业务之间的协同、评估以及资源合理分配。
其二在微观,本来基于海量数据可加强对用户的理解(行业称之为“用户画像”),通过千人千面为每个用户提供更精准的服务推荐。但由于数据质量堪忧,在对外投流的用户获取和在对内推荐的人货匹配等场景的应用,表现都差强人意。除了计算成本高昂,匹配精准性很不理想。服务推荐更是经常“张冠李戴”,把大几千万的房产推荐给找零工的小年轻。
这些运营,都远低于业界顶尖水平,也影响了公司的长期发展和短期表现。
被逼的治理
面对这些泥潭,数据治理在所难免。

随后CEO拍板,SVP牵头:研发和业务暂时缓一缓,抽出部分精力和人员聚焦在数据治理之上。最终目的是为该企业的长期发展奠定一个更坚实的基础和底座。
如下图的数据治理大项目正式启动,横跨了全公司的技术数据中台部门以及各业务线技术部。

成功的铁三角
数据治理项目要成功需要三大核心因素,可理解为成功的铁三角。所幸,在这次的数据治理项目中,这三角都得以较好实现,最终保证了较好结果。
其一,组织上协同,体制和流程适配不少数据治理项目,往往败于高开低走:大老板出席下启动会,之后团队慢慢干活然后了无声息偃旗息鼓。而在这个项目中,CEO负责面子,摇旗呐喊提供情绪价值和创造项目的法理基础;SVP负责里子,日常推进和扫除各种雷区、排忧解难。同时,基于这家大厂当时的前中后台的组织架构,项目主要由中台牵头,并要求各前台的事业部指派数据工程师团队作为配合单元,共同组建起此次数据治理项目的虚拟团队组。这保证了利益和风险的共享共担,不能让首先提出数据治理需求的中台唱独角戏。

其二,产出要足够可视化。失败的数据治理往往折戟于产出难量化难显性,不明觉厉却又言之不明。降本效果 = (治理前的存储成本 + 治理期间新增的存储成本 - 治理后的存储成本) + (治理前的计算成本 + 治理期间新增的计算成本 - 治理后的计算成本) - 治理所用人力成本。
这个公式部分讲清楚了数据治理产出的定量价值,主要集中在降低数据的存储和计算成本。如下图所示,在经过数据治理的项目之后,这家公司的年数据新增量在保持高位甚至加速增长的同时,年存储增量则大幅下跌60%以上,甚至这种下跌的趋势,还因为数据治理带来更经济的架构和更合理的底座,维持了三年以上。

然而,上面的公式仅仅反映数据治理在降本方面的贡献,而没有完全阐述其在增效方面的价值。而后者需要通过另外的维度来展现。在本项目中,通过决策效率、管理效率和员工效率的提升来充分展示,主要统计了完成单位任务所需时间的降低。

其三,节奏要把握好,克服数据治理的J Curve。协同的组织是“果”的保障,量化的产出是“果”的具象,然而这两者还不足够保证数据治理的成功,等待“善果”的耐心往往并不足够。
因为数据治理最有挑战的部分是:项目需要经历一个初期没有任何产出和价值体现的静默期,俗称J Curve(先抑后扬的J形曲线,这个术语最早出自于PE/VC这类流动性较差的私募基金)。这个时候最需要项目操盘人和公司管理层有良好的沟通,把握好产出的节奏,为项目争取足够的时间和空间。

因此,数据治理千万要避免“憋大招”的预期管控和节奏设定,最好的节奏是“从小胜利走向大胜利”,即最好找出第一个Quick Win的点。这次的数据治理项目,执行团队锚定用户画像——用户增长环节中投放的核心环节。
因为在数据治理项目之前,数据资产在存储和调用方面的无序和混乱,用户画像的生成极其低效率、高时延和低精度,根本达不到当下最前沿的用户画像跨平台的实时计算和反馈。但是在数据治理之后,如下图所反映的,生成一个用户画像所需要的的数据标签的路径,从左图的满屏幕乱飞线,已经逐步过渡到右图的简单清晰和规则高效。因为可以尽量把用户数据汇总到数据中心(扮演Hub的角色),各种数据计算都优先和尽量在数据中心发生。而最终实现了对用户标签的超低延时和多维度刻画的计算,得以满足跨平台针对用户的实时跟踪和及时出价的精准投放需求,大大提升了投流的ROI,而ROI恰恰是高度显性的定量指标。同时,在数据中心的构建过程中,就可以为用户画像和流量投放服务,而不需要在大厦建成之后才展现效果,属于边建设边产出。所以用最短的时间与合适的节奏,渡过了艰难的J Curve。