MongoDB 从入门到精通专题教程
最近有好多同事都在用mongodb,一个新的面向文档型介于面向对象与关系型之间免费的数据库,据说有拥有比传统数据库更高的性能。趁今天早上有空,就研究了一下。
首先上mongodb官网(www.mongodb.org)看了一下开始文档,下了个windows版的,装了一下,并且写了几个简单的例子,测试了一下,经过测试,mongodb确实好用,也很简单,当然其中也遇到了很多问题,因此为了能让以后的同学们更好的入门,所以做一个简单的介绍。如果你想尽快入门,则可以按照如下的步骤进行。
1,安装并启动数据库
从官网(www.mongodb.org/downloads)下载一个适合你平台的版本,我的系统是win7 64位的,下载文件也就10几M,将下载的文件解压放到任何目录,最好避免使用带空格和中文的目录,本机将其解压至C盘,并将文件夹改名为mongodb,这样也是为了后面输入目录更方便。
进入mongodb目录,我们发现有如下目录结构
|--mongodb
|-- bin
|-- mongo.exe
|-- mongod.exe ........
所以整个mongodb是非常简单的,以上列的也是我们最常用的命令,其它暂时不解释。
为了以后的操作方便,因此我们将当前的bin目录加入path,如果不会的可以百度Google。
现在打开一个命令窗口,键入mongod,则窗口会提示数据库启动失败,如果你仔细看控制台打出的消息,有如下这么一行:
dbpath (/data/db/) does not exist, terminating
目录/data/db/是Linux下面的表示法,代表着数据库默认的数据文件目录,而上面的提示的意思是说数据库目录不存在,那么我们就在mongodb止录下手动建立一个目录db,当然此时屏幕上可能有些乱,这时可输入cls进行清屏操作。再输入命令:mongodb --dbpath c:/mongodb/db,此时窗口打出几行日志,然后处于等待状态了,那么就表示数据库启动成功了!当然这个窗口不能关闭。
2,登录并操作数据库(Shell方式)
2.1,连接
打开命令窗口,键入mongo,如果系统提示:connecting to: test,表示连接成功。
2.2,查看所有库
键入show dbs,则会显示出当前数据库中所有的数据库名称。在mongodb里面是不用
去手动建立一个数据库的,你只要直接使用就好,如果不存在数据库引擎会帮我们
创建他们。这一点与传统数据库相比有些不同。
2.3,使用mydb
键入use mydb,使用数据库mydb,当然
mongodb会帮助我们自动创建他们,当然这个时候数据库还是空的,可以通过输入
show dbs来确认这一点。
2.4,新增记录
输入:
db.user.save({name:'Rod',age:30})
2.5,查看集合当中所有文档
db.user.find()可查看出当前库user集合中所有的文档,如下图所示:
{ "_id" : ObjectId("4df2201ac905b4e2a5f555cb"), "name" : "Rod", "age" : 30 }
此时发现,在文档的前面多了一列"_id",这是自动加进去的,不用管他。
2.6,删除记录
db.user.remove()将删除所有记录,db.user.remove({name:'Rod'})将删除指定记录
2.6,保存多条记录
输入:
for(var i=1;i<=20;i++) db.user.save({x:8,y:i})
,可以看出整个语法很像
JS,其实你正在使用的就是一个JavaScript Shell。此时可以输入db.user.find()
来查看所有记录。
2.7,迭代器的使用
我们再向集合中插入一条记录:db.user.save({x:'test'}),再次查看所有记录
db.user.find(),则发现只显示出了前20条记录。此时可以输入it(iteraor)来
查看余下的记录。
在mongodb里可以将cursor当成数组来使用,如下所示:
var cursor = db.user.find(); // 将游标缓存起来
printjson(cursor[4]); // 打印出第5条记录
注意此种方式会将前N行全查出来,所以对性能有较大影响。
2.8,根据条件查询
现要查询出y大于10的所有记录:
db.user.find({y:{$gt:10}});
其中$gt的意思就是“大于”,当然读者可推出其他N种表达。
2.9,查询指定列
db.user.find({x:8},{y:true});// 查询出x=8的所有记录的y列
db.user.find({},{y:true}); // 查询出所有的Y列
2.10,只查第一列
有的时候我们只需要第一行的值,如果自己编程实现显得有些麻烦,因此数据库为我们
提供了一个方法:db.user.findOne();
2.11,限制最大记录从而提高性能
我们可以通过limit来限制查询的最大行数,如下:
db.user.find().limit(4); // 只显示出前四条
2.12,修改记录
将第一条x为3的记录修改为后面的值,db.user.update({x:4},{x:4,y:1});
3,MongoDB 数据结构
从以上可以看出,每一个MongoDB包含了多个库(通过show dbs查看),这些库都是在第一次使用时自动创建的可以通过use dbName来使用指定库。每一个库包含了多个集合,可以使用命令show collections 显示所有集合,所以我们在操作文档的时候要手动指定集合(db.user.find),每个集合包含多份文档,也就是json对象。
4,利用java操作MongoDB
从官网下载java版本的驱动并将其加入classpath。
3.1,建立连接
Mongo m = new Mongo(); // 连接本地的27017端口
// or
Mongo m = new Mongo( "localhost" ); // 默认端口27017
// or
Mongo m = new Mongo( "localhost" , 27017 ); // 指定主机与端口
DB db = m.getDB( "mydb" ); // 取得指定的库
3.2,用户认证(可选)
在登录数据库时,在数据库启动时可以指定是否需要认证(mongod --auth .....),
此时连接时就需要用户名和密码(--serviceUser xx --servicePassword xx),如下:
boolean auth = db.authenticate(myUserName, myPassword);
3.3,得到指定库的所有集合
Set<String> colls = db.getCollectionNames();
for (String s : colls) {
System.out.println(s);
}
3.4,得到指定集合
DBCollection coll = db.getCollection("user");
3.5,插入文档
BasicDBObject doc = new BasicDBObject();
doc.put("name", "MongoDB");
doc.put("type", "database");
doc.put("count", 1);
BasicDBObject info = new BasicDBObject();
info.put("x", 203);
info.put("y", 102);
doc.put("info", info);
coll.insert(doc); // 保存
3.6,查询集合中的第一份文档
DBObject myDoc = coll.findOne();
3.7,增加多份文档
for (int i=0; i < 100; i++) {
coll.insert(new BasicDBObject().append("i", i));
}
3.8,统计集合中文档的条数
System.out.println(coll.getCount());
3.9,利用游标得到所有记录
DBCursor cur = coll.find();
while(cur.hasNext()) {
System.out.println(cur.next());
}
3.10,查询指定文档
BasicDBObject query = new BasicDBObject();
query.put("x", 8);
cur = coll.find(query);
while(cur.hasNext()) {
System.out.println(cur.next());
}
有时个为了方便我们也可以写成这种形式:
query.put("i", new BasicDBObject("$gt", 20).append("$lte", 30));
// i.e. 20 < i <= 30
3.11,创建一个索引
coll.createIndex(new BasicDBObject("i", 1));
// create index on "i", ascending
3.12,查询集合中的索引列表
List<DBObject> list = coll.getIndexInfo();
3.13,得到所有的库名
Mongo m = new Mongo();
m.getDatabaseNames();
3.14,删除一个库
m.dropDatabase("my_new_db");
4,MongoDB类型与java类型
4.1,自动成生主键
ObjectId id = new ObjectId();
ObjectId copy = new ObjectId(id);
4.2,正则表达式的运用
Pattern john = Pattern.compile("joh?n", CASE_INSENSITIVE);
BasicDBObject query = new BasicDBObject("name", john);
// finds all people with "name" matching /joh?n/i
DBCursor cursor = collection.find(query);
4.3,日期类型
java.util.Date now = new java.util.Date();
BasicDBObject time = new BasicDBObject("ts", now);
collection.save(time);
4.4, 数组
ArrayList x = new ArrayList();
x.add(1);
x.add(2);
x.add(new BasicDBObject("foo", "bar"));
x.add(4);
BasicDBObject doc = new BasicDBObject("x", x);
4.5,二进制数据
字节数组(byte[])会被自动包装成二进制类型。
4.6,时间
Timestamp会被转换成BSONTimestamp。
4.7,源代码数据
源代码数据代表了JavaScript代码。CodeWScope类代表了这种数据。
5,高级操作部分
5.1,数据据安全
为了使MongoDB安全生效,必须以--auth参数启动,同时还要在db.system.users文档中增加用户信息
如果在db.system.users中无数据,即使以--auth启动,对于本地的访问也是允许的。
增加一个新的用户:db.addUser("foo", "bar");
查询刚才增加的用户:db.system.users.find();
删除用户:db.removeUser("foo");
为了提高查询性能和安全性,也可增加只读用户:db.addUser("foo", "bar", true);
此时虽然用户已经有了,但是怎么去测试是否生效了呢?先进行认证测试一下,如下:
db.auth("foo", "bar");
如果在服务端打出1则表示认证通过,客户端可以使用了,如果是0表示不通过
那么在客户端可以通过如下代码进行认证:
db.authenticate("foo", "bar".toCharArray());
由此可知,所有的用户信息是加在数据库上面的,每个库都有自己的用户信息。
如此便可增加安全认证功能了!
2011.06.10 未完待续。。。。。。。。。。
5.2,引用vs 内嵌
在关系型数据库中,我们可以通过外键引用来表达一对多关联,建立中间表来表达多对多关联。在MongoDB中却没有这种机制,我们可以通过对象的引用关系来实现这种关联,也可以把关联的文档内嵌到文档当中。
对于引用这种方式,我们可以通DBRef这个类进行实现。
那么在实际工作当中,我们应该选择哪种存储方式,有如下规则:
1) 顶层对象应该有自己的集合
2) 明细对象应该被嵌入父对象,例如OrderDetail与Order
3) 拥有包含关系的对易用应该被嵌入
4) 对于多对多关联应该使用数据库引用
5) 对于那种稳定的比较小的集合可以在服务器端将其缓存起来从而提高性能
6) 不能去引用一个嵌入的对象,至少目前还无法实现
7) 我们很难去统计嵌入的对象
8) 如果嵌入的对象太多太大会导致单个对象达到他的最大值
9) 记住最后一条:如果遇到性能问题,那么请使用嵌入方式进行存储
5.3,数据库优化
1)对于排序的字段,请加入索引
现在根据y字段倒序显示:db.user.find().sort({y: -1});,为了提高性能那么需要在字段y上加入索引
db.user.ensureIndex({y:1});这样一来,就可以根据索引排序,而不是直接查绚集合中的所有文档。
2)限制最大记录数:db.user.find().limit(10);
3)只查询所需要的键,而不是所有全查出来:db.user.find({}, {y: 1});
4)统计记录条数利用count()方法:db.user.find().count();
5)强制使用指定索引:db.user.find().hint({y: 1});
5.4,高级查询
1)利用索引提高查询速度
首先我们在x字段上建立索引:db.user.ensuerIndex({x : 1});
然后再查询:db.user.find({x:8}, {_id: 0, x: 1}).explain(); 会有如下输出:
{
"cursor" : "BtreeCursor x_1",
"nscanned" : 19,
"nscannedObjects" : 19,
"n" : 19,
"millis" : 0,
"nYields" : 0,
"nChunkSkips" : 0,
"isMultiKey" : false,
"indexOnly" : true,
……………………….
}
其中"indexOnly" : true代表着此次查询启用了索引。
一般的查询不会利用索引,除非满足以下条件,
A) 必须列出要返回的字段名,这样才能决定是否需要启用索引
B) 必须显示的指出不显示_id字段{ _id : 0}
2)利用“.”(点号)进行对象间的导航
> db.user.find({}, {“x.y” : 1});
3)查询指定范围的值:db.user.find({y: {$gt : 4, $lt : 10}}); // 4 < y < 10
4)匹配所有$all:db.things.find( { a: { $all: [ 2, 3 ] } } );
5)存在性判断$exists:
db.things.find( { a : { $exists : true } } ); // 如果存在则返回
db.things.find( { a : { $exists : false } } ); // 如果不存在则返回
6)求余$mod:db.things.find( "this.a % 10 == 1"),也可写成如下形式:
db.things.find( { a : { $mod : [ 10 , 1 ] } } )
7)不等于$ne:db.things.find( { x : { $ne : 3 } } );
8)IN子句$in:db.things.find({j:{$in: [2,4,6]}});
9)Not In子句$nin:db.things.find({j:{$nin: [2,4,6]}});
10)OR条件$or:db.foo.find( { $or : [ { a : 1 } , { b : 2 } ] } )
11)利用正则表达式进行复杂匹配
db.customers.find( { name : /acme.*corp/i } );
db.customers.find( { name : { $regex : 'acme.*corp', $options: 'i' } } );
db.customers.find( { name : { $regex : /acme.*corp/i, $nin : ['acmeblahcorp'] } } );
i表示大小写不敏感
12)取反操作$not:db.customers.find( { name : { $not : /acme.*corp/i } } );
13)统计文档数:
nstudents = db.students.find({'address.state' : 'CA'}).count();
不要这样做,这样会导致客户端排序,增加网络传输
nstudents = db.students.find({'address.state' : 'CA'}).toArray().length; // VERY BAD
14)分页查询:
n = db.students.find().skip(20).limit(10).count(true);
15)排序sort():
db.myCollection.find().sort( { ts : -1 } ); // 按TS降序排列
分享到:
相关推荐
- **课程二**:Hadoop 2.x入门到精通,讲解分布式文件系统HDFS、资源管理框架YARN和MapReduce,以及如何部署和管理Hadoop集群。 这些课程旨在培养全面的大数据专业人才,从基础到实践,覆盖了大数据处理的各个环节...
qt 一个基于Qt Creator(qt,C++)实现中国象棋人机对战.
热带雨林自驾游自然奇观探索
冰川湖自驾游冰雪交融景象
C51 单片机数码管使用 Keil项目C语言源码
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
前端分析-2023071100789s12
Laz_制作了一些窗体和对话框样式.7z
1、文件内容:ocaml-docs-4.05.0-6.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/ocaml-docs-4.05.0-6.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、更多资源/技术支持:公众号禅静编程坊
学习笔记-沁恒第六讲-米醋
工业机器人技术讲解【36页】
内容概要:本文档详细介绍了在 CentOS 7 上利用 Docker 容器化环境来部署和配置 Elasticsearch 数据库的过程。首先概述了 Elasticsearch 的特点及其主要应用场景如全文检索、日志和数据分析等,并强调了其分布式架构带来的高性能与可扩展性。之后针对具体的安装流程进行了讲解,涉及创建所需的工作目录,准备docker-compose.yml文件以及通过docker-compose工具自动化完成镜像下载和服务启动的一系列命令;同时对可能出现的问题提供了应对策略并附带解决了分词功能出现的问题。 适合人群:从事IT运维工作的技术人员或对NoSQL数据库感兴趣的开发者。 使用场景及目标:该教程旨在帮助读者掌握如何在一个Linux系统中使用现代化的应用交付方式搭建企业级搜索引擎解决方案,特别适用于希望深入了解Elastic Stack生态体系的个人研究与团队项目实践中。 阅读建议:建议按照文中给出的具体步骤进行实验验证,尤其是要注意调整相关参数配置适配自身环境。对于初次接触此话题的朋友来说,应该提前熟悉一下Linux操作系统的基础命令行知识和Docker的相关基础知识
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
网络小说的类型创新、情节设计与角色塑造
毕业设计_基于springboot+vue开发的学生考勤管理系统【源码+sql+可运行】【50311】.zip 全部代码均可运行,亲测可用,尽我所能,为你服务; 1.代码压缩包内容 代码:springboo后端代码+vue前端页面代码 脚本:数据库SQL脚本 效果图:运行结果请看资源详情效果图 2.环境准备: - JDK1.8+ - maven3.6+ - nodejs14+ - mysql5.6+ - redis 3.技术栈 - 后台:springboot+mybatisPlus+Shiro - 前台:vue+iview+Vuex+Axios - 开发工具: idea、navicate 4.功能列表 - 系统设置:用户管理、角色管理、资源管理、系统日志 - 业务管理:班级信息、学生信息、课程信息、考勤记录、假期信息、公告信息 3.运行步骤: 步骤一:修改数据库连接信息(ip、port修改) 步骤二:找到启动类xxxApplication启动 4.若不会,可私信博主!!!
在智慧城市建设的大潮中,智慧园区作为其中的璀璨明珠,正以其独特的魅力引领着产业园区的新一轮变革。想象一下,一个集绿色、高端、智能、创新于一体的未来园区,它不仅融合了科技研发、商业居住、办公文创等多种功能,更通过深度应用信息技术,实现了从传统到智慧的华丽转身。 智慧园区通过“四化”建设——即园区运营精细化、园区体验智能化、园区服务专业化和园区设施信息化,彻底颠覆了传统园区的管理模式。在这里,基础设施的数据收集与分析让管理变得更加主动和高效,从温湿度监控到烟雾报警,从消防水箱液位监测到消防栓防盗水装置,每一处细节都彰显着智能的力量。而远程抄表、空调和变配电的智能化管控,更是在节能降耗的同时,极大地提升了园区的运维效率。更令人兴奋的是,通过智慧监控、人流统计和自动访客系统等高科技手段,园区的安全防范能力得到了质的飞跃,让每一位入驻企业和个人都能享受到“拎包入住”般的便捷与安心。 更令人瞩目的是,智慧园区还构建了集信息服务、企业服务、物业服务于一体的综合服务体系。无论是通过园区门户进行信息查询、投诉反馈,还是享受便捷的电商服务、法律咨询和融资支持,亦或是利用云ERP和云OA系统提升企业的管理水平和运营效率,智慧园区都以其全面、专业、高效的服务,为企业的发展插上了腾飞的翅膀。而这一切的背后,是大数据、云计算、人工智能等前沿技术的深度融合与应用,它们如同智慧的大脑,让园区的管理和服务变得更加聪明、更加贴心。走进智慧园区,就像踏入了一个充满无限可能的未来世界,这里不仅有科技的魅力,更有生活的温度,让人不禁对未来充满了无限的憧憬与期待。
1.版本:matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点:参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。
内容概要:本文介绍了使用 Matlab 实现基于 BO(贝叶斯优化)的 Transformer 结合 GRU 门控循环单元时间序列预测的具体项目案例。文章首先介绍了时间序列预测的重要性及其现有方法存在的限制,随后深入阐述了该项目的目标、挑战与特色。重点描述了项目中采用的技术手段——结合 Transformer 和 GRU 模型的优点,通过贝叶斯优化进行超参数调整。文中给出了模型的具体实现步骤、代码示例以及完整的项目流程。同时强调了数据预处理、特征提取、窗口化分割、超参数搜索等关键技术点,并讨论了系统的设计部署细节、可视化界面制作等内容。 适合人群:具有一定机器学习基础,尤其是熟悉时间序列预测与深度学习的科研工作者或从业者。 使用场景及目标:适用于金融、医疗、能源等多个行业的高精度时间序列预测。该模型可通过捕捉长时间跨度下的复杂模式,提供更为精准的趋势预判,辅助相关机构作出合理的前瞻规划。 其他说明:此项目还涵盖了从数据采集到模型发布的全流程讲解,以及GUI图形用户界面的设计实现,有助于用户友好性提升和技术应用落地。此外,文档包含了详尽的操作指南和丰富的附录资料,包括完整的程序清单、性能评价指标等,便于读者动手实践。
漫画与青少年教育关系