主数据与数据仓库相比,到底有什么不同?

主数据与数据仓库相比,到底有什么不同

目前主数据、大数据、数据仓库、Hadoop等概念都是市场上炒的很火的概念,但是很多人仅仅了解这些概念是互相有关联的,却不能很好的区分这些名词之间的区别,今天在这里我主要介绍一下主数据与数据仓库。在我看来主数据是指具有高业务价值的、可以在企业内跨越各个业务部门且能被重复使用的数据,是单一、准确、权威的数据。

而数据仓库是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。主数据可以看成是一类数据或多类数据,而数据仓库则是多类数据的合集。可以看出主数据其实是数据仓库的一部分。我们搭建数仓,基于一定的规则进行数据抽取,将数据沉淀,保障数据是可追溯的。基于不同的算法规则对数仓中的数据进行计算、汇聚来实现预测分析。

大数据究竟是什么?大数据有哪些技术呢?

近几年,大数据的概念逐渐深入人心,大数据的趋势越来越火爆。但是,大数据到底是个啥?怎么样才能玩好大数据呢?大数据的基本含义就是海量数据,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

数字经济的要素之一就是大数据资源,现在大家聊得最多的大数据是基于已经存在的大数据的应用开发。如今,大数据技术已应用在各行各业。小麦举个例子,讲述一下最贴近我们生活的民生服务是如何运用大数据。最近电视新闻提及到的“一网统管”精准救助场景,传统的救助方式往往通过困难家庭申请、审核、审批等多项程序,遇到需要跨部门、跨层级、跨街区协调解决的个案,还需要召开各级协调会的形式协商解决。

现在通过“精准救助”的方式,民政部门在平时的摸排中了解情况,将相关信息录入到“一网统管”数据中心,再根据数据模型识别出需要协助的家庭,随后形成走访工单派发给社工对其进行帮扶,从而提升救助的效率,做到雪中送炭。在数字化政府改造之前,每个部门只掌握各自分管的数据,形成“信息孤岛”;有了大数据分析平台后,所有的数据信息,便打通了“任督二脉”。

数据湖、数据仓库、数据中台,有什么区别?

数据湖、数据仓库和数据中台,他们并没有直接的关系,只是他们为业务产生价值的形式有不同的侧重。数据湖作为一个集中的存储库,可以在其中存储任意规模的所有结构化和非结构化数据。在数据湖中,可以存储数据不需要对其进行结构化,就可以运行不同类型的分析。数据仓库,也称为企业数据仓库,是一种数据存储系统,它将来自不同来源的结构化数据聚合起来,用于业务智能领域的比较和分析,数据仓库是包含多种数据的存储库,并且是高度建模的。

 3/4   首页 上一页 1 2 3 4 下一页 尾页

文章TAG:数仓大  数仓  读懂  原生  一文  数仓大公司有哪些  一文读懂云原生一体化数仓  
下一篇