什么是数据治理,为什么要进行数据标准化?

数据治理分析是将庞大数据量进行过滤整合,让用户可以跟进数据实时情况,方便用户更准确快速地对数据业务进行合理分析、判断,实现利用数据驱动业务,达到企业增值的目的。基于大数据技术研发的数据分析平台系统,通过从多个业务系统到ODS中间库、ODS中间库到数仓模型的加工过滤,再将模型绑定组件实现数据的可视化展现,可以使用户更加形象的对不同业务的数据进行观察分析。

既然是数据治理分析,那么在“分析”之前先要对数据进行“治理”。我们通常需要先将数据标准化,利用标准化后的数据进行数据分析,数据标准化也就是统计数据的指数化,数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。随着人们研究领域的不断扩大,所面临的评价对象日趋复杂,如果仅依据单一指标对事物进行评价往往不尽合理,所以需要多指标信息处理数据才能得到用户想要的更为准确更有用的业务数据。

数据管理,数据治理,数据中心,数据中台,数据湖都是什么意思,有什么关系呢?

数据治理和数据管理简单来说治理就是管理的管理。管理你得遵循一定得标准规范体系,一定得流程,一定得组织角色分工,而这些内容就必须先通过数据治理定义清楚。管理只是根据数据治理规范体系去执行管理和监督得职责。既管理执行得依据是治理规范体系。如下图:数据中台和数据湖这个要解释清楚不太容易,因此我尽量做简化。数据湖一般是公有云服务商提出得一个概念,即企业得结构化,非结构化数据都可以全部采集和存储到我这里来。

数据湖就是一个大得存储站,这个存储是分布式可无限扩展得,存储过来得数据也不会去清洗和加工,尽量保持原样。在存过来后,数据湖再提供一些标准得开放接口给你使用数据,这些接口包括了查询SQL类接口,计算引擎接口,流处理接口等。提供接口得目的也很简单,你能够方便得使用你存储过来得数据。数据湖得存储一般是分布式对象存储或分布式文件存储,即使你是结构化数据库采集过来得数据,仍然会转成统一的存储方法,方便扩展。

数据中台简单来说企业共享数据能力下沉并对外开放。数据中台包括了底层数据技术平台(可以是我们熟悉的大数据平台能力),中间的数据资产层,上层的数据对外能力开放。核心的资产层本身也分层,从最底层的贴源数据,到分域应用数据,再到上层的数据仓库和数据标签库。而数据湖更多对应到数据中台概念里面的数据贴源层。企业实际在建数据中台的时候实际很少用数据湖这个概念。


文章TAG:数字化治理是什么意思  数据治理  是什么意思  数字  数字化  治理  
下一篇