“每个人都在谈论大数据。它有多大?在理解大数据的概念时,通常会有几个明显的误区。一个是只有足够大的数据才能算是大数据的范畴;二是大数据与互联网隔离;第三,大数据是统计学;第四,大数据会“杀人”,应该尽量远离大数据。在大数据时代,任何体量的数据都可以用大数据技术进行处理,传统的结构化数据处理方法也被纳入到大数据的技术体系中。所以大数据技术本身对数据的大小没有绝对的要求,不代表数据量小就不能用。

大数据究竟多大才算是,该如何学习大数据?

大数据本身是基于数据价值化而构建出来的新概念,虽然概念比较新,但是数据却一直都在,所以大数据的核心并不在“大”上,而是基于大数据所构建出的一个新的价值空间。在理解大数据概念的时候,通常都有几个较为明显的误区,其一是只有足够大的数据才能算是大数据范畴;其二是大数据和互联网是隔离的;其三是大数据就是统计学;其四是大数据会“杀熟”,应该尽量远离大数据等等,

在大数据时代,任何体量的数据都可以采用大数据技术进行处理,传统的结构化数据处理方式也已经并入到了大数据的技术体系,所以大数据技术本身对于数据量的大小并没有绝对的要求,并不是说数据量小就不能采用大数据技术。大数据本身是互联网、物联网和传统信息系统共同发展所导致的结果,所以大数据与互联网存在紧密的联系,事实上目前互联网领域是推动大数据发展的重要力量,所以大数据与互联网本身就密不可分,

从互联网发展的前景来看,大数据是互联网价值的重要体现,所以未来大数据的价值必然会不断得到提升。由于目前大数据分析技术往往会采用统计学的方式,这导致不少人认为大数据就是统计学,实际上大数据在进行数据分析的过程中,不仅需要统计学技术,也需要机器学习相关技术,当然,统计学作为大数据的三大基础学科,在大数据技术体系中占有重要的地位。

目前大数据人才的培养既包括研究生教育(培养创新型人才),也包括专科教育和本科教育,随着大数据技术体系的逐渐成熟,学习大数据的过程也会更为顺利,我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。

多大的数据,才能称为大数据?

大数据BigData,据说源出自AlvinToffler上世纪70年代的作品《第三次浪潮》,最早提出大数据时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来,

”目前,一些专业人士将大数据概括为四大特征,即“4V”:数量大(Volume),数据量级已从TB(1012字节)发展至PB乃至ZB,可称海量、巨量乃至超量;多样性(Variable),数据类型繁多,多为网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息;速度快(Velocity),数据流往往为高速实时数据流,而且往往需要快速、持续的实时处理,处理工具亦在快速演进,软件工程及人工智能等均可能介入;低价值密度(Value),以视频安全监控为例,连续不断的监控流中,有重大价值者可能仅为一两秒的数据流,360度全方位视频监控的“死角”处,可能会挖掘出最有价值的图像信息。

大数据有多大?比如欧洲研究组织进行的核试验,每秒可以产生40TB的数据。一组名为《互联网上的一天》的数据告诉我们,一天之内,互联网生产的所有内容可以刻成1.68亿张DVD;发出的邮件多达2940亿封,相当于美国两年的纸质信件数量;200万社区帖子,相当于《时代》周刊770年的写作量;售出的手机数量为37.8万部,比全球每天出生的婴儿数量高出37.1万人。到2012年,数据量已经从TB(1024GB=1TB)跃升到PB(1024TB=1PB)、EB(1024PB=1EB),甚至ZB(1024EB=1ZB)。


文章TAG:大数据为什么叫大数据  数据  称为  
下一篇