数据应用工程成熟度模型

在现代社会,随着企业的发展产生了大量的数据,生产部门有生产制造的数据记录,业务运营部门有营销数据,财务部门有经营数据,数据无处不在,数据又时时刻刻影响着企业运转中每个环节的决策。数据已经成为除了资金和人才以外企业新的资产价值增长点。数据本身并不代表价值,数据仅仅是以一定格式对事实进行记录,是原始材料;只有结合环境和上下文的数据才有意义,这就是信息;伴随着信息的积累,我们从趋势和关系的挖掘中总结出了规律,这些规律就变成了知识;然后依据知识在企业经营中进行决策和行动,能进一步促进企业的良性循环。

数据产生价值的过程需要经历获取、存储、评估、整理、增强、分析、应用等多个环节,在小数据时代这些过程都相对简单和成熟。随着近些年数据收集方式的增多、传感设备数量的增加,计算能力的增强和存储方式的改进,导致了人们可感知的数据量急剧增多;按照摩尔定律,数据生成和存储的生长速度一直在呈现指数增长。大数据应运而生,带来了俗称的大数据4V 特征:数量多(即数据集的规模)、多样性(即来自多种数据仓库、领域或类型的数据)、速度快(数据的流速)、多变性(在不同特征里的变化)。大数据的到来,使得在数据系统的演化进程中,人们对于高经济效益以及高效率的数据分析需求迫使现有技术不断变化。

伴随着大数据革命,必须考虑如下四个方面的相互作用:数据集的特征、对数据集的分析、数据处理系统的性能以及对经济效益的商业考虑。这些决定了数据应用的价值效果。通过不断的实践,我们总结出了当前大数据环境下的数据应用工程- 成熟度(LPDT)模型。

数据应用工程- 成熟度(LPDT)模型(以下简称“成熟度模型”)主要针对大数据环境下的数据应用工程提供方法论依据。可以用来指导企业评估自身所处的数据应用成熟度阶段,也可以用来指导企业如何晋级到更高阶的成熟度阶段。成熟度模型分为成熟度阶段(Level)、过程(Process)、维度(Dimensionality)和工具(Tool)四个方面展开。

  • 成熟度阶段(Level)分为Level1 业务系统化、Level2 业务数据化、Level3 数据资产化、Level4 业务智能化共四个阶段;除此以外,还有一个更高阶的隐藏阶段为Level5 企业智能化。成熟度阶段(Level)主要代表了企业在业务运转中应用数据能力的高低,可以通过过程(Process)、维度(Dimensionality)和工具(Tool)等多个维度去评估。本成熟度模型不设置详细的打分机制,只提供部分阶段的特征供企业自评估参考。
  • 数据应用过程(Process)分为数据理解(Understand)、数据准备(Prepare)、数据开发(Develop)、部署运营(Operation)四个阶段,基本涵盖了所有数据应用过程,其中每个过程还会细分子过程、入输出及操作项,这些会在后续的章节详细阐述。数据应用过程可以理解为一个数据应用的最小迭代原型,也可以理解为一个大项目或企业的整体数据应用,其中过程与过程之间也可能发生小的迭代和回溯。使用时应在抽象理解的基础上与企业的实际情况映射。
  • 数据维度(Dimensionality)是指贯穿于数据应用全过程的一些数据领域维度,是数据应用过程中必须考虑的方面,当前我们只考虑“元数据”、“质量”和“安全”三个维度展开,由于每个维度单独展开都是一个很大的话题,本文档中只结合数据应用过程有限地展开阐述。数据应用过程中还有很多其他维度本次暂不涉及,也欢迎各位使用者反馈。
  • 数据工具(Tool)是指结合数据应用过程和数据维度各个环节会用到的工具,可能是开源的,可能是定向开发的,可能是SaaS 的,可能是私有化部署,可能是免费的,可能是付费的。数据工具与过程和维度是相辅相成的关系,三者一起为成熟度阶段提供评估依据。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

推荐文章

沪公网安备 31010702002009号