什么是大数据?

这是一个非常好的问题,作为一名IT从业者,同时也是一名计算机专业的教育工作者,我来回答一下。首先,要想把大数据搞清楚,首先要明白大数据本身并不是一个单一的概念,如今的大数据已经发展成了一个庞大的生态体系,涉及到的产业链也在不断完善和发展。随着大数据技术体系逐渐成熟,大数据的落地应用已经开始逐渐展开,随着诸多行业企业纷纷实现业务上云,未来大数据的应用场景会越来越多,大数据所构建起来的价值空间也有很大的潜力。

早期在描述大数据的时候,往往从大数据本身的特点来入手,比如数据量大、速度快、数据类型多样化、价值密度低、真假难辨等等,但是对于普通人来说,即使知道了这些特点,对于大数据的概念依然是模糊的,依然不知道大数据到底用来做什么,能够与普通人产生哪些连接。实际上,要想了解大数据,首先要搞清楚大数据的目的,大数据的目的就是实现数据的价值化,大数据的所有操作几乎都是围绕数据价值化展开的,包括数据采集、数据整理、数据存储、数据分析和数据应用等等,这一系列环节都是围绕数据的价值增量来展开的,最终通过数据应用来完成价值体现。

简单的说,通过大数据能够让更多的数据产生价值,通过大数据能够让数据的价值进行传递(赋能)和提升,通过大数据能够让数据逐渐成为一个重要的生产材料,通过大数据能够衡量一个企业的价值和发展潜力等等,随着工业互联网的发展,未来大数据本身所承载的价值空间会越来越大。我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。

大数据是什么?

采集记录足够多的数据,使工作更加针对化和精准化,这是大数据吗?这不是大数据而只是数据化。什么是大数据呢?例如洛杉矶警方曾对以往的刑事案件做了统计,通过算法得出了第二天的高概率犯罪地点,然后有针对性的派警察去该处巡逻,从而使得当地的犯罪现象下降20%。这是大数据。再比如,经济学家都认为股票无法预测,而一位剑桥大学毕业的博士搞了个公司,对有史以来几乎所有的证券交易的数据进行记录,然后通过算法进行分析。

他对什么国家政策、公司业绩、行业走向等等一眼都不看,100%地排除主观意志的,只根据计算结果来进行投资,最后赚了大钱。这是大数据。大数据的精髓并不在于数据的精准和数量,而在于对内在规律的挖掘和对未来趋势的预测。其思路是:一个结果是有很多原因的,原因作用的强度可能是随机的,我们对其中作用的机理并不清楚。

我们难以找出规律性,但知道规律性就蕴含在结果数据之中,如果我们能建设合适的模型,写出好的算法,就有可能把这个规律性提炼出来,从而能科学地发现真相和预测未来。今天上午在贵州省大数据中心看到了大数据应用的事例。金润建设和鹏润达这两家企业分别投标200多次,一次也没中过,依然积极地投。投标是要成本的,这两家公司那里来的动力?通过大数据的知识挖掘技术,发现了它们总是陪着固定的一家公司一同招标,最后总是那家公司中标。

学习大数据有什么用?

大数据是我的研究方向之一,所以看到这个问题,一定要说一下我的看法。我认为目前学习大数据有以下几点主要优势:第一,目前是大数据时代,大数据驱动了这个时代的科技发展,大数据的发展空间巨大。大数据涉及到各行各业,可以说在未来社会中大数据将占据重要地位。第二,从政策层面给予大数据充分的认可和高度的关注,各级政府相继成立的大数据局为大数据的发展铺平了政策道路。

大数据是一个典型的政府搭台企业唱戏的局面,足见大数据对未来社会发展的重要程度。第三,目前处于大数据发展的初级阶段,人才缺口巨大,据行业内部保守估计人才缺口在百万级以上。随着大数据的不断发展,这个缺口可能会更大,所以目前学习大数据技术,就业机会比较多,待遇相对来说也比较高。第四,大数据涉及到的产业链比较长,涵盖了数据的采集、整理、传输、存储、安全、分析、呈现和应用,这就需要很多不同专业人才的参与,在大数据领域你总能找到适合自己发展的着力点。

怀来县大数据是干什么用的?

大数据中心有什么用?对老百姓应该说来,唯一的意义就在于能征你点地,对怀来县财政来说是一种可以增加财政收入的一个合适的渠道,说到这里,你可能会问,可以增加财政收入的渠道那么多,为啥大数据会特别适合怀来县,这就得提到怀来县的独特位置了,怀来县在于北京周边,可以说与北京一衣带水,当地政府执政第一要义就是做好北京的护城河,(湿地公园项目 这几年每年怀来都花费上亿来做绿化 ……)发展经济最好的办法,坐山吃山坐水吃水,到了怀来自然啦不吃香了。

不好意思,题外话说了太多!下面切入正题,大数据有啥用?大数据是将海量的、多维的、变化的、有价值的数据归集一起而形成的大数据,当然是一种资源,也能产生能量。同换一句话说,“无数据,不决策”是指有价值的、可支持决策的信息和数据,而不是指那些海量的、杂乱无章的、原始的大数据。“大数据工程”是一个全新的、科学的有机的系统工程 现在全国各地都在建设大数据中心或是大数据局,招投标许多名为“大数据项目”,实为“软件项目”。

测算的工程开发费用还是传统的硬件集成费用 软件开发费用,项目开发和监理方式还是“软件工程”方式,按照人月报工作量,验收文档还是开功能模块。这种方式忽略的项目最本质内容就是大数据的价值挖掘和提炼。大数据项目需要全新的“大数据工程”方式开发和建设。而不是简单地将各个信息系统的数据归集,然后做一个“大数据可视化”就完工了。

因为,这样的工程归集的只是“小数据”、统计数据以及各类信息,而不是大数据的归集。“大数据工程”是以面向场景应用为本,提炼挖掘、算法模型、业务流程再造、加工处理成有价值、可支持决策的“成品数据”,进而通过这些“成品数据”赋能决策,提高生产效率、实现精准营销和辅助社会治理。政府和企业归集的大数据资源,可以通过脱敏方式形成“开放数据资源”,构成丰富的有价值的社会资源。

政府机关和企事业单位可以根据各类场景应用的需求,获得相应的“开放数据资源”开发利用的授权,并且构建起相应场景应用的“专业大数据工程”,例如旅游大数据工程、医疗大数据工程、交通大数据工程,去加工提炼这些“开放数据”公共资源。数据不动、算法动社会开放大数据资源可以存储在政府监管的大数据中心或是“数据港”,各企事业单位或是个人要利用这些资源,可以获得授权,将相关的场景应用的大数据挖掘、相关性分析等模型和算法部署到“中间层”,通过大数据工程加工处理,形成“有价值的成品数据”赋能行业和产业。

这样就能保证数据的安全性和集约性,同时,也能评估出哪些领域的应用成果。而各类算法模型、各类专业的大数据工程以及所产生的计算结果等都可以作为有技术含量和专业KnowHow的知识产权保护。大数据难于确权,个人信息须保护一些城市和地区沿用传统的要素市场概念,匆匆创建“大数据交易中心”,以为可以像“钻石交易中心”、“黄金交易中心”、“人才交易中心”那样运作并盈利。

这些年过去,实际交易量和成功案例甚少。究其原因主要有三个方面:1、大数据资源与钻石、黄金、石油等物质资源不一样,不存在稀缺性和不可复制性;2、大数据难以确权,不像人才、知识、土地、房产有着明显的主体和边界;3、大数据不同于信息、知识,许多大数据都是公开数据、政府数据、公众数据、数字信号的归集,例如气象数据、路灯信号、交通视频等都是可以采集的,不归属于某一个体。

大数据之用的底线思维 网上流行的“大数据杀熟”,更有“大数据买披萨搞笑视频”,都不是真实的大数据,是对大数据的误解和误读,甚至是对大数据产业会有负面影响。这些打着大数据的幌子,干着收集或窃取了公民个人隐私信息(不是大数据)为实,例如医疗信息、家庭住址信息、个人身份信息等。这些信息本身已经是有价值的,而且具象的,信息的归属权明显的,都是归属公民自己的。

只有在征得个人同意和允许情况下才能有限度使用,就像欧洲出台的通用数据保护条例GDPR那样。大数据之用的底线思维,我们在八年前做国家旅游局的“全国旅游团队服务管理系统”和“全国旅游电子合同平台”就说过,大数据归集之后会有许多个人信息和敏感数据,经过脱敏存储,要符合“三级等保要求”,防止数据泄露或是被黑客攻击。

应用场景中有“三个不用”,即“涉及个人隐私的不能用,涉及企业商业机密的不能用,涉及国家安全的不能用”。大数据公司首先要对客户和用户负责,要有责任信和诚信的道德,就像储户相信银行那样,客户将数据和信息交给大数据公司开发和归集,就要保证用户数据安全,承担起“数据银行”的角色,不能将“储户的钱当做自有资金去投资或消费”。


文章TAG:数据  参谋  
下一篇