`
Zxb116
  • 浏览: 6316 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

GridFS

 
阅读更多
mongo自带有一个实现mongofliles,基本操作如下:
列出所有文件:
mongofiles list
上传一个文件:
mongofiles put xxx.txt
下载一个文件:
mongofiles get xxx.txt
查找文件:
mongofiles search xxx //会查找所有文件名中包含“xxx”的文件
mongofiles list xxx //会查找所有文件名以“xxx”为前缀的文件
参数说明:
–d 指定数据库 ,默认是fs,Mongofiles list –d testGridfs
-u –p 指定用户名,密码
-h 指定主机
-port 指定主机端口
-c 指定集合名,默认是fs
-t 指定文件的MIME类型,默认会忽略

原理:
GridFS在数据库中,默认使用fs.chunks和fs.files来存储文件。
1.fs.files集合存放文件的信息;
2.fs.chunks存放文件数据;

一个fs.files集合中的一条记录内容如下,即一个file的信息如下:
{
"_id" : ObjectId("4f4608844f9b855c6c35e298"), //唯一id,可以是用户自定义的类型
"filename" : "CPU.txt", //文件名
"length" : 778, //文件长度
"chunkSize" : 262144, //chunk的大小
"uploadDate" : ISODate("2012-02-23T09:36:04.593Z"), //上传时间
"md5" : "e2c789b036cfb3b848ae39a24e795ca6", //文件的md5值
"contentType" : "text/plain" //文件的MIME类型
"meta" : null //文件的其它信息,默认是没有”meta”这个key,用户可以自己定义为任意BSON对象
}

对应的fs.chunks中的chunk如下:
{
"_id" : ObjectId("4f4608844f9b855c6c35e299"), //chunk的id
"files_id" : ObjectId("4f4608844f9b855c6c35e298"), //文件的id,对应fs.files中的对象,相当于fs.files集合的外键
"n" : 0, //文件的第几个chunk块,如果文件大于chunksize的话,会被分割成多个chunk块
"data" : BinData(0,"QGV...") //文件的二进制数据,这里省略了具体内容
}

默认chunk的大小是256K:
public static final int DEFAULT_CHUNKSIZE = 256 * 1024;

写入:
如果文件大于chunksize,则把文件分割成多个chunk,再把这些chunk保存到fs.chunks中,最后再把文件信息存入到fs.files中。
读取:
先据查询的条件,在fs.files中找到一个合适的记录,得到“_id”的值,再据这个值到fs.chunks中查找所有“files_id”为“_id”的chunk,并按“n”排序,最后依次读取chunk中“data”对象的内容,还原成原来的文件。

自定义Gridfs的hash函数:
尽管从理论上,无论用什么hash函数,都有可能出现hash值相同,但内容不相同的文件,但是对于GridFS默认使用的md5算法,目前已出现长度和md5值都相同但内容不一样的文件。
如果想要自已改用其它hash算法,可以从驱动入手。因为GridFS在MongoDB中实际也只是两个普通的集合,所以完全可以自已修改驱动,替换下hash算法即可。


注意事项:
1. GridFS不自动处理md5相同的文件,对于md5相同的文件,如果想在GridFS中只有一个存储,要用户自已处理。Md5值的计算由客户端完成。
2. 因为GridFS在上传文件过程中是先把文件数据保存到fs.chunks,最后再把文件信息保存到fs.files中,所以如果在上传文件过程中失败,有可能在fs.chunks中出现垃圾数据。这些垃圾数据可以定期清理掉。
分享到:
评论

相关推荐

    Mongodb + GridFS +Java 操作Mongodb中存储的文件

    GridFS 是 MongoDB 提供的一种用于存储和检索大型文件的标准规范,它将大文件分割成多个小块(chunks)存储,方便高效管理和检索。在这个Java操作MongoDB中存储的文件实例中,我们将探讨如何利用GridFS API进行文件...

    Mongodb的gridfs的C#的例子

    MongoDB的GridFS是一种用于存储和检索大文件的系统,它是MongoDB数据库的一部分,特别适合存储超过16MB的单个文档。在C#中,我们可以利用MongoDB .NET驱动程序来操作GridFS。以下是对GridFS在C#中使用的详细讲解。 ...

    linux nginx-gridfs

    Linux Nginx-GridFS是将MongoDB的GridFS存储系统与Nginx Web服务器集成的一种解决方案,用于高效地提供静态文件服务,如视频、图片等大文件的存储和访问。这种组合允许你在高流量环境下实现高性能的内容分发,特别...

    mongdb+GridFS文件上传

    GridFS是MongoDB提供的一种用于存储和检索大型文件(如图片、视频等)的标准规范。在MongoDB中,单个文档的最大大小通常为16MB,但通过GridFS,可以将大文件分割成多个小块进行存储,方便管理和检索。 GridFS主要由...

    nginx-gridfs-0.8.tar.gz

    《Nginx集成MongoDB GridFS模块详解》 在当今的Web开发中,Nginx作为一款高性能的HTTP和反向代理服务器,以其轻量级、高效稳定的特点被广泛使用。而MongoDB作为NoSQL数据库的代表,因其灵活的数据模型和强大的数据...

    Laravel开发-gridfs

    GridFS是MongoDB数据库系统中的一个文件存储解决方案,它将大文件分割成多个小块存储,以便于管理和检索。当我们将这两个技术结合时,Laravel开发与GridFS的集成能为文件存储提供一种高效且灵活的方式,尤其适合处理...

    Laravel开发-laravel-gridfs-storage

    在本文中,我们将深入探讨Laravel开发中的一个特殊组件——`laravel-gridfs-storage`,这是一个将MongoDB的GridFS存储系统与Laravel框架的存储API整合的工具。MongoDB GridFS是一种分布式文件存储系统,它允许我们以...

    Nginx与Nginx-GridFS的安装与配置

    **Nginx与Nginx-GridFS的安装与配置** Nginx是一款高性能的HTTP和反向代理服务器,以其轻量级、高并发、稳定性好而被广泛应用于Web服务领域。Nginx-GridFS是Nginx的一个模块,用于提供对MongoDB的GridFS存储系统的...

    Mongodb GridFS图片文件存储解决方案

    GridFS 是 MongoDB 提供的一种用于存储和检索大文件的标准方法,如图片、视频或大型文档。在本文中,我们将深入探讨 GridFS 图片文件存储解决方案及其工作原理。 **GridFS 概述** GridFS 是 MongoDB 的一部分,它将...

    gridfs-nginx-plugin

    gridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-nginx-plugingridfs-...

    mongodb+GridFS文件的上传下载删除DEMO

    GridFS 是 MongoDB 提供的一种用于存储和检索大型文件(如图片、视频等)的标准机制,将大文件分成多个小块存储在 MongoDB 的集合中,以提高效率和可靠性。 在这个"mongodb+GridFS文件的上传下载删除DEMO"项目中,...

    nginx-gridfs.tar.gz

    **标题:“nginx-gridfs.tar.gz”** **描述:**GridFS是MongoDB数据库系统中的一个扩展,用于存储和检索大文件,如图像、视频或任何其他超过MongoDB单个文档大小限制的数据。这个压缩包“nginx-gridfs.tar.gz”很...

    Linux利用nginx-gridfs搭建部署nginx-gridfs-0.8.zip

    Linux利用nginx-gridfs搭建部署,nginx-gridfs-0.8 可用

    springboot 操作mongdb(包含GridFs存储文件) #资源达人分享计划#

    在本教程中,我们将深入探讨如何使用Spring Boot与MongoDB集成,特别关注使用GridFS进行文件存储。Spring Boot简化了Java应用的初始化和配置,而MongoDB作为一个文档型数据库,提供了非关系数据的灵活存储。GridFS是...

    nginx-gridfs

    **Nginx-GridFS** 是一个开源项目,它允许用户通过Nginx Web服务器直接访问存储在MongoDB中的文件,使用GridFS作为文件存储系统。这个解决方案将高性能的Nginx与MongoDB的分布式文件系统相结合,为大规模的静态内容...

    MongoDB数据库GRIDFS上传下载删除文件

    在MongoDB中,GRIDFS是一种特殊的数据存储方式,用于存储和检索大文件,如图片、视频或大型文档。它将文件分割成多个块(chunks),以便更高效地存储和检索。 1. **上传文件到MongoDB的GRIDFS** 在MongoDB中,使用...

    mongodb 所需jar包及gridfs java示例代码

    在本主题中,我们将深入探讨MongoDB的Java开发所需jar包以及如何使用GridFS进行文件存储。 首先,MongoDB的Java驱动程序通常包含以下核心jar包: 1. `mongodb-driver.jar`:这是与MongoDB服务器通信的基础库,包含...

    linux gridfs图片服务器和rmtp流媒体服务器部署完成

    linux gridfs图片服务器和rmtp流媒体服务器部署完成 技术:gridfs图片服务器 rmtp流媒体服务器 说明包含: nginx+grids+rmtp安装包 nginx+gridfs+rtmp服务器部署帮助文档.docx linux内网生产环境使用;文档比较...

    mongodb gridfs .NET(C#) 文件存储实例

    功能:基于mongodb gridfs实现简单文件上传、下载、搜索、删除。 开发环境:VS2012 mongodb驱动:官方Driver 上传控件:jquery uploadify 疑问:sort()方法可能有点问题 PS:有问题可以留言,欢迎交流~

    Mongodb基于GridFS存储文件

    Mongodb基于GridFS存储文件,通过流的方式存储文件图片,以及读取功能。本人亲自测试、编写。值得信赖

Global site tag (gtag.js) - Google Analytics