数据管理敏捷化创新——数据治理小组的构建

  • 2016-01-27 14:16:34
  • DAMS翻译

这是构建敏捷数据仓库的基本步骤系列文章的第二篇。第一篇文章介绍了如何在开始的时候建立一个业务概念模型。这篇文章着重介绍如何让业务利益相关参与进来,培养一种“草根式”的数据治理能力。

公司越来越关注和数据有关的一切事情, 如数据分析,报表,仪表板,大数据,预测性分析,决策科学等等。所以数据治理变得越来越重要。一个良好的数据治理计划会让业务利益相关者参与进来。他们会参与到数据定义的决策中,同时支持组织内部数据的一致性使用。

数据治理模型可以是松散的,也可以是高度结构化的。结构化的数据治理通常需要我们组建一个数据治理委员会。这个委员会里需要有一个定义完美的章程,一些经过认定的数据管理员,以及相关的政策和规程。数据管理员“掌管”特定的数据集或者系统,并且负责决定相关的业务定义和标准。数据管理委员负责监督整体的数据治理流程,确保流程是可管理的,可持续的。对于那些重视数据质量,并且愿意投入时间和资源去确保数据质量的公司, 这是一个很好的方法。

我的工作经验主要与我所谓的“草根式”数据治理相关。数据治理的成功与否取决于能否让广大业务利益相关者参与进来。参与者需要致力于决策的作出, 将决策告知自己所在的部门,并且反馈他们部门的相关意见。在最理想的情况下,这些参与者会推动数据治理项目的进行。在我工作的过程中,我曾经联系过全公司的COO们,让他们委派相关人员参与到数据治理项目中。

我第一次做数据治理这项工作是在1980年代。当时,我们的小组叫做BAR,也就是业务领域代表的缩写。在第一次建立企业数据仓库的时候,我们成立了这个小组。它审查了业务概念模型以及逻辑数据模型。大部分的小组成员参与到了初期的审查当中并领导了这些模型的开发。这些模型是我们根据业务定义以及各种需求整合出来的。随着时间的推移,BAR小组定义了业务的关键性能指标(KPI),以及数据仓库的关键数据质量指标。12年以后,BAR小组依然存在,而数据仓库已经从3TB增长到84TB。BAR小组持续为公司提供基于未来愿景的业务决策,业务定义,数据质量过程管理,以及开发优先级的决策。 

在我最近临时参与的一个数据治理项目中,我召集了公司内所有主要部门的代表来一起工作。我们重新评估了业务概念模型以及逻辑数据模型。我们提供了关于数据仓库可交付物的样例以及我们正在开发的标准报表。 这个小组是我们业务定义和需求决策的主要来源。

最近有一个例子充分展现了数据治理小组的高效性。案例中,“支付”这个词的定义出现了问题。公司里三个不同部门对这个词有三种截而不同的定义。这种情形下,在一些面向公司上层的报告中,就会出现一些内容不一致的状况。有一个财务部的同事发现这个问题后,主动私下和与运营决策部门的代表见面。他们商量出一个改善建议,并且将结果交给数据治理小组进行评估和确认。听到这个消息的时候,我知道我们在数据管理方面的努力终于有了回报。这是一个伟大的进步!

建立一个成功的数据治理小组是推动敏捷开发的必要步骤。这个小组将成为敏捷开发流程的核心部分。它会评估和批准每一步的产出结果。它能够持续监控并保证我们在数据方面所构建的事物在公司内获有一致的认可。

建立敏捷数据仓库开发的基本步骤还包括:

建立一个可重复设计模式的高层架构

确保测试可靠性的方法以及一些相关工具

实施一个健壮的数据质量计划

给予开发团队自我管理敏捷开发途径并持续改进的空间

我将在未来的文章中陆续讲述剩余的步骤。


(翻译:新炬网络梁铭图,整理:DAMS,架构师联盟微信号:jiagoushi2015)