`
reniaL
  • 浏览: 94180 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

NoSQL介绍及MongoDB入门

阅读更多

写在前面

本文是由一次演讲整理出来的,文中大部分资料来源于网络,感谢Wikipedia,Google和MongoDB官网。文中使用的MongoDB版本为1.2.4。

 

What is NoSQL

NoSQL一词首先是Carlo Strozzi在1998年提出来的,指的是他开发的一个没有SQL功能,轻量级的,开源的关系型数据库。注意,这个定义跟我们现在对NoSQL的定义有很大的区别,它确确实实字如其名,指的就是“没有SQL”的数据库。不过,NoSQL的发展慢慢偏离了初衷,Carlo Strozzi也发觉,其实我们要的不是"no sql",而应该是"no relational",也就是我们现在常说的非关系型数据库了。

2009年初,Johan Oskarsson举办了一场关于开源分布式数据库的讨论,Eric Evans在这次讨论中再次提出了NoSQL一词,用于指代那些非关系型的,分布式的,且一般不保证遵循ACID原则的数据储存系统的出现和兴起。 Eric Evans使用NoSQL这个词,并不是因为字面上的“没有SQL”的意思,他只是觉得很多经典的关系型数据库名字都叫"**SQL"(例如 MySQL,MS SQL,PostgreSQL),所以为了表示跟这些关系型数据库在定位上的截然不同,就用了"NoSQL"一词。

Wikipedia上对NoSQL的定义是这样的:NoSQL 是一项运动,这个运动推动了广义定义的非关系型数据储存系统的发展,并破除了长久以来关系型数据库一家独大的局面。论文和研究中一般将这些数据库称为结构化储存系统

 

为什么NoSQL变得流行

robbin的一篇文章(为什么要用非关系数据库? )很好地讨论了这个问题,这里只列出几个要点。

对数据库的“三高”需求
-- 高并发读写
-- 对海量数据的高效率读写
-- 高扩展性和高可用性

关系型数据库的特性地位下降
-- 事务一致性
-- 读写实时性
-- 复杂SQL,特别是多表关联查询

 

What is MongoDB

MongoDB 是一个面向文档的数据库系统。使用C++编写,不支持SQL,但有自己功能强大的查询语法。MongoDB使用BSON作为数据存储和传输的格式。BSON是一种类似JSON的二进制序列化文档,支持嵌套对象和数组。MongoDB很像MySQL,document对应MySQL的row,collection对应MySQL的table。

 

MongoDB在Windows上的安装运行很方便。直接下载、解压,然后运行 bin/mongod 即可启动服务器,运行 bin/mongo 即可运行命令行客户端。更多关于MongoDB的运行看这里 。MongoDB命令行客户端的脚本语法有些类似MySQL的:

show dbs // 列出所有数据库
use memo // 使用数据库memo。即使这个数据库不存在也可以执行,但该数据库不会立刻被新建,要等到执行了insert之类的操作时,才会建立这个数据库
show collections // 列出当前数据库的collections
db // 显示当前数据库
show users // 列出用户
 

MongoDB的查询语法很强大。例如,很多SQL可以做的,它都可以做:

coll.find() // select * from coll
coll.find().limit(10) // select * from coll limit 10
coll.find().sort({x:1}) // select * from coll order by x asc
coll.find().sort({x:1}).skip(5).limit(10) // select * from coll order by x asc limit 5, 10
coll.find({x:10}) // select * from coll where x = 10
coll.find({x: {$lt:10}}) // select * from coll where x <= 10
coll.find({}, {y:true}) // select y from coll

 

一些SQL不能做的,MongoDB也可以做:

coll.find({"address.city":"gz"}) // 搜索嵌套文档address中city值为gz的记录
coll.find({likes:"math"}) // 搜索数组
coll.ensureIndex({"address.city":1}) // 在嵌套文档的字段上建索引

 

索引:

coll.ensureIndex({productid:1}) // 在productid上建立普通索引
coll.ensureIndex({district:1, plate:1}) // 多字段索引
coll.ensureIndex({productid:1}, {unique:true}) // 唯一索引
coll.ensureIndex({productid:1}, {unique:true, dropDups:true|) // 建索引时,如果遇到索引字段值已经出现过的情况,则删除重复记录
coll.getIndexes() // 查看索引
coll.dropIndex({productid:1}) // 删除单个索引
 

安全与认证(该版本的MongoDB仅支持很基本的安全策略):

use shine // 如果要root权限,就用admin库
db.addUser("username", "password") // 普通权限,可读写
db.addUser("username", "password", true)  // 只可读,不可写
db.system.users.remove({user: username}) // 删除用户

 

数据导出、导入:

// json或csv格式,每次一个collection
mongoexport -d producttrade -c basic -o /home/data/mongo_backup/producttrade_100504.json
mongoimport -d producttrade -c basic --drop /home/data/mongo_backup/producttrade_100504.json

// 二进制数据格式,常用于备份、还原
mongodump -d shine -o /home/data/mongo_backup
mongorestore -d shine --drop /home/data/mongo_backup/shine

 

MongoDB in Java

这里 下一个MongoDB的Java驱动,把jar包扔到项目里去就行了。上面提到的通过脚本操作的功能,基本上都能在Java中找到实现。进行数据库连接的代码也十分简洁:

Mongo mongo = new Mongo();
db = mongo.getDB("shine");
coll = db.getCollection("producttrade");
DBCursor cur = coll.find();
// 对cur进行操作。。。

 

啰啰嗦嗦

  • 每个BSON对象大小不能超过4MB。MongoDB使用GridFS 来储存大文件。
  • 字段名限制:不能以"$"开头;不能包含".";"_id"是系统保留的字段,但用户可以自己储存唯一性的数据在字段中。
  • MongoDB为每个数据库分配一系列文件。每个数据文件都会被预分配一个大小,第一个文件名字为".0",大小为64MB,第二个文件".1"为128MB,依此类推,文件大小上限为2GB。
  • MongoDB没有新建数据库或者collection的命令,只要进行insert或其它操作,MongoDB就会自动帮你建立数据库和collection。当查询一个不存在的collection时也不会出错,Mongo会认为那是一个空的collection。
  • 一个对象被插入到数据库中时,如果它没有ID,会自动生成一个"_id"字段,为24位16进制数。
  • Java中,Mongo对象是线程安全的,一个应用中应该只使用一个Mongo对象。Mongo对象会自动维护一个连接池,默认连接数为10。
5
2
分享到:
评论
1 楼 xyq1558 2012-12-11  
数据文件大小,32位系统才有2GB限制,64位是没有这个要求的

相关推荐

    NoSQL Manager for MongoDB中文版(免安装).zip

    MongoDB是一种流行的开源、分布式文档型数据库,属于NoSQL数据库的一种。它以其灵活性、高性能、易扩展性以及支持丰富的数据模型而备受青睐。NoSQL Manager for MongoDB是一款专为MongoDB设计的强大管理工具,提供了...

    NoSQL介绍PPT

    常见NoSQL介绍——MongoDB 常见NoSQL介绍——MongoDB 常见NoSQL介绍——MongoDB 常见NoSQL介绍——MongoDB 常见NoSQL介绍——MongoDB 常见NoSQL介绍——MongoDB 常见NoSQL介绍——MongoDB 正在使用NoSQL的一些知名...

    主流NOSQL数据库之MongoDB快速入门.docx

    - **定义**:MongoDB是一款基于分布式文件存储的非关系型数据库(NoSQL),由C++语言开发,设计初衷是为了满足Web应用程序对高性能及可扩展性的需求。 - **特性**:具备高度的灵活性、易于水平扩展、丰富的查询语言...

    Big.Data.NoSQL.Architecting.MongoDB.epub

    Big Data, MongoDB not only enables the user in understanding the buzz words “Big Data” and “NoSQL”, it also delves in understanding one of the popular document-based NoSQL databases “MongoDB”....

    MongoDB入门.pdf

    ### MongoDB入门知识点详解 #### 一、NoSQL简介与MongoDB概述 - **NoSQL**:NoSQL(Not Only SQL)是一种非关系型数据库管理系统的总称,它突破了传统关系型数据库在处理大规模数据时的限制,尤其适用于大数据及高...

    NoSQL入门介绍

    1、NoSQL技术介绍 1.1、NoSQL是什么 1.2、NoSQL为什么会存在 1.3、NoSQL产品分类 1.4、NoSQL技术的特点 1.5、NoSQL技术的不足 1.6、NoSQL的适用场景 2、一些概念 2.1、CAP 2.2、ACID 2.2、BASE 3、常见NoSQL介绍 ...

    MongoDB入门教程 + 架构简析 + java使用MongoDB的简单程序

    首先,我们从"MongoDB入门教程"开始。MongoDB采用的是键值对存储方式,数据以JSON格式(BSON)存储,这使得数据的读写更加自然和高效。MongoDB支持丰富的查询语法,包括字段选择、条件操作、排序和分组,为开发者...

    MongoDB入门到精通 中文资料

    Mongo DB ,是目前在IT行业非常流行的一种非关系型数据库(NoSql),其灵活的数据存储方式,备受当前IT从业人员的青睐。Mongo DB很好的实现了面向对象的思想(OO思想),在Mongo DB中 每一条记录都是一个Document对象。Mongo...

    mongodb入门到精通

    根据提供的文件内容,我们将详细探讨MongoDB相关的知识点,并围绕NoSQL数据库的特点和优势,以及分布式系统理论中的CAP定理和ACID与BASE模型。 首先,MongoDB是一种流行的NoSQL数据库,它以文档的形式存储数据,与...

    MongoDB 入门

    在这个“MongoDB入门”主题中,我们将深入探讨MongoDB的基础知识、安装与配置、数据模型、查询操作以及高级特性。 首先,让我们了解MongoDB的基本概念。MongoDB以其“集合”(Collections)和“文档”(Documents)...

    mongoDB入门到精通.txt

    ### MongoDB入门到精通知识点概述 #### 一、MongoDB简介 MongoDB是一种开源的文档数据库,采用JSON格式存储数据,并提供了高性能、高可用性和自动扩展的能力。它属于NoSQL数据库的一种,非常适合处理大规模数据和...

    NoSQL数据库入门 高清PDF

    尽管文档的部分内容似乎与Linux公社网站介绍有关,但我们的重点将放在提取与NoSQL数据库相关的知识点上。 ### NoSQL数据库入门 #### 一、NoSQL简介 NoSQL(Not Only SQL)是指非关系型数据库,它的出现主要是为了...

    MongoDB入门学习

    ### MongoDB入门学习知识点详解 #### 一、MongoDB简介与特点 MongoDB是一种非常流行的开源文档型NoSQL数据库系统,以其高性能、高可用性及易扩展性而著称。相较于传统的关系型数据库如MySQL、Oracle等,MongoDB...

    mongodb入门

    本书《mongodb入门》是一本旨在帮助初学者快速学习MongoDB基本用法的入门小书。它适合那些希望在短时间内掌握MongoDB核心概念和操作的读者。作者Karl Seguin是一位拥有丰富技术背景的开发者,其经历跨越多个领域和...

    mongodb入门篇

    本篇文章将深入介绍MongoDB的基础知识,包括它的应用背景、主要特性、数据库概念、安装部署以及基本操作。 在国内,MongoDB被广泛应用于互联网公司,如电商平台、社交网络和大数据分析等场景。在国外,其应用更为...

    mongoDB入门列子及原理介绍.docx

    MongoDB 入门指南 MongoDB 是一种基于分布式文件存储的 NoSQL 非关系数据库,旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它具有以下几个特点: 1. 模式自由:MongoDB 的数据存储格式为 BSON(一种 JSON ...

    MongoDB入门篇1

    MongoDB入门篇1主要介绍了数据的基本概念,数据库管理系统(DBMS)的定义,常见的数据库管理系统,以及NoSQL数据库的相关知识。 1. 数据:数据是未经处理的原始记录,描述事物存在的符号,通常需要通过组织和分类...

    NoSQL 入门.ppt

    《NoSQL 入门.ppt》,是一个关于 NoSQL 入门的教程。PPT 格式,大小 1 MB。 内容预览: 1、NoSQL技术介绍 1.1、NoSQL是什么 1.2、NoSQL为什么会存在 1.3、NoSQL产品分类 1.4、NoSQL技术的特点 1.5、NoSQL技术的不足 ...

Global site tag (gtag.js) - Google Analytics