(10)内置GridFS,支持海量存储。作为NoSQL数据库之一的MongoDB数据库能够完全满足和解决在海量数据存储方面的应用,越来越多的大网站和企业选择MongoDB代替Mysql进行存储。随着云计算的高速发展,越来越多的应用需要存储海量数据,并且对高并发和处理海量数据提出了更高的要求,传统的关系型数据库对于这些应用场景难以满足应用需求。

互联网如何海量存储数据?

互联网如何海量存储数据

目前存储海量数据的技术主要包括NoSQL、分布式文件系统、和传统关系型数据库。随着互联网行业不断的发展,产生的数据量越来越多,并且这些数据的特点是半结构化和非结构化,数据很可能是不精确的,易变的。这样传统关系型数据库就无法发挥它的优势。因此,目前互联网行业偏向于使用NoSQL和分布式文件系统来存储海量数据。

下面介绍下常用的NoSQL和分布式文件系统。NoSQL互联网行业常用的NoSQL有:HBase、MongoDB、Couchbase、LevelDB。HBase是Apache Hadoop的子项目,理论依据为Google论文 Bigtable: A Distributed Storage System for Structured Data开发的。

HBase适合存储半结构化或非结构化的数据。HBase的数据模型是稀疏的、分布式的、持久稳固的多维map。HBase也有行和列的概念,这是与RDBMS相同的地方,但却又不同。HBase底层采用HDFS作为文件系统,具有高可靠性、高性能。MongoDB是一种支持高性能数据存储的开源文档型数据库。支持嵌入式数据模型以减少对数据库系统的I/O、利用索引实现快速查询,并且嵌入式文档和集合也支持索引,它复制能力被称作复制集(replica set),提供了自动的故障迁移和数据冗余。

MongoDB的分片策略将数据分布在服务器集群上。Couchbase这种NoSQL有三个重要的组件:Couchbase服务器、Couchbase Gateway、Couchbase Lite。Couchbase服务器,支持横向扩展,面向文档的数据库,支持键值操作,类似于SQL查询和内置的全文搜索;Couchbase Gateway提供了用于RESTful和流式访问数据的应用层API。

Couchbase Lite是一款面向移动设备和“边缘”系统的嵌入式数据库。Couchbase支持千万级海量数据存储分布式文件系统如果针对单个大文件,譬如超过100MB的文件,使用NoSQL存储就不适当了。使用分布式文件系统的优势在于,分布式文件系统隔离底层数据存储和分布的细节,展示给用户的是一个统一的逻辑视图。

大数据都能应用在哪些方面?

互联网如何海量存储数据

大数据作为人类创造的资源本身具有无穷的价值,可以说所有的资源都是上天赐予的,或者地球给予我们的,但是只有大数据是我们人类经过漫长的积累,繁衍自己创造出来的巨大资源。为什么这么说呢?我们都知道,这个社会之所以发展是因为有需求,就这样产生了供给。供给和需求相互作用,平衡就可以让这个社会稳定地运行,运转,供需之间所产生的差异和不断的调整,是推整顿我们社会向前,运行的巨大动力。

 1/2   上一页 1 2 下一页 尾页

文章TAG:海量  存储  五盘  80TB  哪些方面  支持五盘位最高80TB海量存储  海量存储应用在哪些方面  
下一篇