MongoDB 聚合group、aggregate、Map Reduce

wangshirufeng

浏览: 82980 次
性别:
来自: 长沙

最近访客更多访客>>

ding_zk

fhtwins

jt4221

musicull

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

mongodb

MongoDB Map Reduce

一：group 分组统计

语法：

{

key:<>, #统计的字段

cound:{} #筛选条件

reduce:function(current,result){} #对文档进行聚合的函数 current(分组统计过程中的一个文档),result(聚合结果文档)

initial:{} #初始化聚合结果文档(先于reduce执行)

finalize:function(){} #reduce函数执行完之后，返回之前执行的函数。可以用来修改result的值

}

准备数据：

db.stu.insert({'name':'zhangsan',sex:'男',age:18});

db.stu.insert({'name':'lisi',sex:'男',age:22});

db.stu.insert({'name':'lucy',sex:'女',age:16});

db.stu.insert({'name':'lilei',sex:'男',age:17});

db.stu.insert({'name':'hanmeimei',sex:'女',age:17});

db.stu.insert({'name':'mayun',sex:'男',age:51});

db.stu.insert({'name':'tony',sex:'男',age:48});

db.stu.insert({'name':'dinglei',sex:'男',age:46});

db.stu.insert({'name':'dengzhiqi',sex:'女',age:33});

db.stu.insert({'name':'liuyifei',sex:'女',age:31});

db.stu.insert({'name':'zhangchaoyang',sex:'男',age:52});

db.stu.insert({'name':'zhangxiaolong',sex:'男',age:38});

db.stu.insert({'name':'panxiaoting',sex:'女',age:40});

db.stu.insert({'name':'dingjunhui',sex:'男',age:41});

db.stu.insert({'name':'yaoming',sex:'男',age:39});

db.stu.insert({'name':'gaoyuanyuan',sex:'女',age:37});

db.stu.insert({'name':'yangmi',sex:'女',age:35});

db.stu.insert({'name':'zhaowei',sex:'女',age:39});

db.stu.insert({'name':'shengteng',sex:'男',age:37});

db.stu.insert({'name':'mali',sex:'女',age:35});

根据性别分组统计学生数量

db.stu.group({

key:{sex:1},

cond:{},

initial:{num:0},

reduce:function(current,result){

result.num += 1;

}

});

按性别统计年龄大于30的总年纪数

db.stu.group({

key:{sex:1},

cond:{age:{$gt:30}},

initial:{sum:0},

reduce:function(current,result){

result.sum += current.age;

}

});

按性别显示最大的年龄

db.stu.group({

key:{sex:1},

cond:{},

initial:{max:0},

reduce:function(current,result){

if(current.age>result.max){

result.max = current.age;

}

});

按性别统计年龄大于30的平均年龄

db.stu.group({

key:{sex:1},

cond:{age:{$gt:30}},

initial:{sum:0,num:0},

reduce:function(current,result){

result.sum += current.age;

result.num += 1;

finalize:function(result){

result.avg = result.sum/result.num;

}

});

官方文档：https://docs.mongodb.com/v2.6/reference/command/group/

注意：group 不支持分片集群，不能进行分布式运算。

二：aggregate 简单聚合

语法：

准备数据：同group

根据性别分组统计学生数量

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:1}}}]);

根据性别分组统计年龄大于30的学生数量

db.stu.aggregate([{$match:{age:{$gt:30}}},

{$group:{_id:'$sex',total:{$sum:1}}}]);

根据性别分组统计年龄大于30,且总数大于7的学生数量

db.stu.aggregate([{$match:{age:{$gt:30}}},

{$group:{_id:'$sex',total:{$sum:1}}},

{$match:{total:{$gt:7}}}]);

按性别统计总年龄数

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}}]);

按性别统计总年龄数,且按年龄总数降序排序,且只取前一行数据

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}},

{$sort:{total:-1}},

{$limit:1}]);

按性别统计总年龄数,且按年龄总数降序排序

db.stu.aggregate([{$group:{_id:'$sex',total:{$sum:'$age'}}},

{$sort:{total:-1}}]);

按性别统计平均年龄，且从高到低排序

db.stu.aggregate([{$group:{_id:'$sex',avg:{$avg:'$age'}}},

{$sort:{avg:-1}}]);

官方文档：https://docs.mongodb.com/manual/reference/command/aggregate/index.html

https://docs.mongodb.com/manual/reference/operator/aggregation-pipeline

三：Map Reduce

#原始数据
db.orders.insert({cust_id:"A123",amount:500,status:"A"});
db.orders.insert({cust_id:"A123",amount:250,status:"A"});
db.orders.insert({cust_id:"B212",amount:200,status:"A"});
db.orders.insert({cust_id:"A123",amount:300,status:"D"});

#按照cust_id分组统计amount之 且只统计 status是A的
db.orders.mapReduce(
	function(){emit(this.cust_id,this.amount);},
	function(key,values){return Array.sum(values)},
	{
		query:{status:"A"},
		out:"orders_totals"
	}
)