新闻资讯

<<返回上一页

抖音集团指标管理与消费体系建设实践

发布时间:2024-11-15 05:37:19点击:

抖音集团,作为字节跳动国内信息和服务业务的核心板块,旗下拥有抖音、今日头条、西瓜视频等众多知名产品。相信大家的手机里都安装了不止一个抖音集团的 App。

平台管理的数据量在几年前就已超过 EB 级别,指标资产数据超过 600PB,这为我们的数据管理带来了巨大的挑战。

我们的数据平台承载着一项重要使命:成为推动增长的敏捷数智引擎。

火山引擎数智平台的整体架构分为四个层次:数据引擎层、数据建设管理层、数据分析应用层和解决方案与咨询服务层。这四层协同工作,覆盖了数据从采集到分析的全生命周期。

我们的数据产品有两个核心特点:敏捷和易用。

首先,敏捷体现在速度和灵活性上。数据流程全面加速,无论是数据采集、加工还是分析消费,都实现了实时性,系统能够处理十亿级数据的亚秒级查询。

其次,在易用性方面,我们致力于打造低门槛、快速上手和广泛协同的数据处理环境。即使没有技术或统计学背景,团队成员也能轻松搭建数据门户、开展 AB 测试。平台支持无代码操作,让每个人都能快速成为数据的探索者和分析者。

此外,数据产品具有无缝协同能力,与飞书、日历、业务系统等工具的整合,让数据随时随地为决策服务。

总结而言,我们的数据团队致力于通过敏捷和易用的产品,实现对业务的高标准服务。我们的目标是达到"0987"的服务标准——0 重大线上问题,90% 的需求满足率,80% 以上的分析师查询数仓覆盖率,以及超过 70% 的业务用户满意度。

抖音的业务发展可划分为三个显著的阶段:探索期、成长期和成熟期。

在探索期,我们的焦点在于快速迭代和业务导向,迅速适配业务调整,寻找可持续的增长模式。这一时期,我们面临的主要挑战是缩短交付周期,以实现快速的市场响应。

随着业务步入成长期和成熟期,数据质量和效率的重要性日益凸显。我们遭遇了三大主要难点:

面对这些挑战,我们认识到要提升数据质量和效率,必须针对性地解决指标管理、口径和消费的统一问题。我们的解决思路是构建一个生产促进消费、消费反馈促进管理的闭环能力。这样的良性循环不仅确保了指标体系的价值,也使其在抖音业务中能够持续、有效地运转。

整个解决方案分为三层:

接下来探讨指标管理实践中的一些关键问题。

我们认为,要实现高效的指标管理,必须解决以下三个核心问题:

综上所述,我们的目标是在流程和机制上解决指标的持续保鲜问题,并推动指标中台产品能力的迭代升级,以解决指标一致性和管理效率问题。通过这些措施,建立一个更加健壮、灵活且高效的指标管理体系。

接下来通过一个具体的例子来阐述我们整体的协作流程。比如一位分析师提了一个指标需求,在指标平台中进行了需求登记。我们的业务应用层数据 BP 数仓同学接到这个指标需求之后,会去判断这个指标以前有没有建设过,是否能够复用,如果没有的话,会先去做指标的拆解。在拆解过程中,如果发现了一些指标的基础元素上的缺失,比如缺少一些原子指标或者修饰词等,就会引入基建同学或者公共层数据同学来进行基础元素的完善。最终应用层的同学去做好指标模型的开发。

在面向需求交付的过程中,我们一般情况下也是希望对接业务的数据同学能够端到端地完成需求交付的闭环。当然如果需要依赖的核心公共层数据缺失,那么会引入公共层的同学去完善公共数据的建设。最终把模型注册到指标平台,以服务化的方式给到下游去进行消费。

整体协作流程中的关键步骤包括:

要保证整套流程能够持续运转下去,需要有权责分明的组织设计,确保从需求提出到指标实现的每个环节都有明确的责任主体,每个角色都能在其专业领域内发挥最大的作用。这不仅可以提高工作效率,也能够保障数据的质量和一致性。

4.如何保障指标的一致性

要确保指标的一致性,主要从两个方面考虑:

(1)指标拆解的规范性:指标拆解过程必须遵循严格的规范,确保每个指标的精确性和一致性。

(2)指标中台产品能力的唯一性校验:通过指标唯一性校验和原子指标/修饰词的相似性校验来确保指标在平台上的一致性和准确性。

5.如何提升指标拆解效率

指标拆解是数据管理中最为耗时的部分,提升这一环节的效率非常重要。我们从以下两个方面着手提升指标拆解和管理的效率。

我们也在探索通过大模型的方式去完成自动化拆解,只需要把对应的表和字段录入进去,通过大模型就可以自动拆解出原子指标修饰词和时间周期。

7.指标先生产后管理实践

我们团队对业务需求的承诺是明确的——保证 90% 的需求满足率。为了达到这个目标,敏捷性成为我们优先考虑的关键因素。

在处理普通业务需求时,特别是在短视频业务中,我们采取了一种灵活的策略。为了保持敏捷,我们不会对这类需求进行前期的指标管理。相反,我们直接开发并上线 ClickHouse 表,以快速响应业务需求。

随着业务的发展,当这些表格需要被应用到决策看板时,我们会异步进行指标的录入和拆解。这样做不仅保证了业务的敏捷性,同时也确保了数据的可管理性和可分析性。

当然,如果遇到性能问题,比如当表格不再满足 SLA 要求时,我们会进行模型的重构和指标下沉到公共层。这一过程是我们数据管理成熟度的体现,确保了数据的长期稳定性和可用性。

通过我们的中台产品一体化架构,即使在异步进行指标管理时,也只需 20 分钟就能完成单表的指标管理工作。这大大提升了我们的效率,同时也保证了数据的质量和一致性。

1.指标生产的模型设计原则

指标生产的模型设计遵循从明细到汇总的层次化设计原则,依次构建了明细层、轻粒度汇总层和粗粒度汇总层。

在轻粒度汇总层,我们希望能够覆盖尽可能多的维度,下游偏应用层的指标开发尽可能依赖于轻粒度汇总层,而不要直接去依赖于明细层,当然也会兼顾性能和成本。另外,一般选择单业务过程,当然如果多个过程从业务视角上来看总是连在一起去看的,那么也会把他们放在一个模型里面去做加工计算。

粗粒度汇总层往往最终应用是给到下游直接去做消费,所以需要关注其性能,以及指标业务上的扩展性。从实践经验来看,粗粒度汇总层一般情况下选择三个左右的维度为宜。

2.指标生产的质量保证体系

首先要明确保障的对象和内容。需要从业务视角出发,清晰界定我们所要保障的对象。这包括:

第二,要保障方案的实施,通过工具化和平台化来赋能整个保障过程。这涉及到:

在需求交付的全链路流程中,数据质量的保障是至关重要的。例如:

总之,数据质量的保障是一个系统工程,需要我们在每一个环节都投入关注和努力。

3.指标生产的稳定性方案

在对外的商业化的数据产品,或者面向于服务管理层的业务时会非常注重指标生产的稳定性,我们主要面临两个核心问题:

为了应对这些挑战,我们提出了一个三层解决方案:

总结而言,通过建立规范、优化链路和日常化治理,我们能够系统性地提升指标生产的稳定性,确保我们的数据处理既高效又可靠。

1.指标专题的概念和优势

指标消费的核心思路是构建整个抖音官方的指标专题。指标专题可以理解为一组维度和指标的集合,类似于虚拟表,屏蔽了底层的物理实现,具有如下优势:

2.指标专题的管理和维护

指标专题是指标查找、理解口径、使用指标的一站式入口,服务于产品、运营、分析师和战略等不同角色。它不仅提供了指标的综合搜索功能,还具备面向应用场景的专题应用能力。

面向对象的特点包括:

通过这些特点,不仅提高了指标管理的效率,也加强了数据的可访问性和透明度,为决策提供了坚实的数据支持。

3.指标列表-快速理解业户核心指标体系

我们的指标列表不仅是一个展示工具,更是一个强大的管理平台。

4.指标详情页-展现指标相关重要信息

指标详情页是一个全面展现指标相关信息的地方。包括三大组成部分:

指标专题消费的核心思路还是希望能够做到指标一次定义多处消费。指标专题的应用通过如下一些方式为工作效率带来了提升:

价值衡量是从生产视角和消费指标来审视指标管理的健康程度,比如有多少指标在管理中,有多少指标规范地下沉到了公共层。

从消费视角,我们会关注通过指标专题进行统一下游消费的比例是多少,还会关注消费后的业务反馈,通过指标专题给到下游消费是否对指标一致性和指标的可理解性得到提升。

上图中展示了电商业务的实践结果,从定性角度来看,指标体系对数据团队最大的收益是指标一致性和指标复用性带来的人效提升;对于分析师和业务同学来说,更多的是提升了整个指标的可理解性,并降低了沟通成本。

最后分享一下我们对未来工作的规划。首先,仍会致力于转变传统的数据交付方式,希望以指标及服务化的方式去提供稳定、可复用的数据产品。具体工作仍将围绕以下三个核心部分展开:

免责声明:凡未注明来自本站的稿件和图片作品,系转载自其它网站,及网友投稿,转载目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如若涉及侵权违规可向站长举报 。