- 什么是mmap
mmap对于c程序员很熟悉,对于java程序员有点陌生。简而言之,将文件直接映射到用户态的内存地址,这样对文件的操作不再是write/read,而是直接对内存地址的操作。
在c中提供了三个函数来实现
[list]
- mmap 进行映射
- munmap 取消映射
- msync 进程在映射空间的对共享内容的改变并不直接写回到磁盘文件中,往往在调用munmap()后才执行该操作。
具体参照
http://blog.chinaunix.net/uid-24517893-id-164217.html
java中的map
java中的FileChannel,提供了map和force方法,map创建文件和内存的映射,
MappedByteBuffer buffer = fc.map(MapMode.READ_WRITE, 0, 1000);
返回一个MappedByteBuffer,这是一个DirectBuffer,其中包含一个内存地址,然后可用就做一些读写操作。
还有另外一个方法是force,是将内存的更新的内容刷到磁盘中。
在这里抛出一个问题,force是必须调用的,如果不调用force会怎样。
我试着写了一段小程序来试验
MappedByteBuffer buffer = fc.map(MapMode.READ_WRITE, 0, 1000);
for (int i = 0;i< 100000;i++){
buffer.put((byte)65);
}
System.out.println("write completed!");
System.in.read();
然后观察文件发现文件中是有1000个B的,那么就是说不调用force,内容也会落到磁盘中的。既然不用force内容也可以落到磁盘中,那force的作用什么呢?带着这个问题我查看了openJdk的force和map的实现和linux中mmap的实现。
JDK的force和map的实现
通过FileChannel->FileChannelImpl的native知道,对linux平台调用应该在D:\git\openjdk\jdk\src\solaris\native\sun\nio\ch下的FileChannelImpl.c
NIEXPORT jlong JNICALL
Java_sun_nio_ch_FileChannelImpl_map0(JNIEnv *env, jobject this,
jint prot, jlong off, jlong len)
mapAddress = mmap64(
0, /* Let OS decide location */
len, /* Number of bytes to map */
protections, /* File permissions */
flags, /* Changes are shared */
fd, /* File descriptor of mapped file */
off); /* Offset into file */
JNIEXPORT jint JNICALL
Java_sun_nio_ch_FileChannelImpl_force0(JNIEnv *env, jobject this,
jobject fdo, jboolean md)
{
jint fd = fdval(env, fdo);
int result = 0;
if (md == JNI_FALSE) {
result = fdatasync(fd);
} else {
result = fsync(fd);
}
return handle(env, result, "Force failed");
}
原来force是调用的fdatasync(fsync),这不是linux中buffered IO,write(2)以后需要调用的方法吗,难道mmap也是走的BufferdIO那一套,首先写到page cache,然后由pdflush定时刷到磁盘中,那这么说mmap只是在进程空间分配一个内存地址,真实的内存还是使用的pagecache。所以force是调用fsync将dirty page刷到磁盘中,但mmap还有共享之类的实现起来应该很复杂。
验证
为了验证上面的假设,我做了一个实验。在linux下起两个终端,A终端通过上面的程序向a.txt写入数据,B终端使用tailf a.txt观察数据的写入。奇怪的是A终端执行完,B终端立马就成看到数据,而不是等30s以后pdflush刷到磁盘以后才能看到,难道前面的假设错了?或者另一种可能tailf查看到也是在page cache中读取的。那只需查看下文件的page是不是dirty就知道了。
cat /proc/$(pidof java)/smaps|grep a.txt -A 10 -B 10
就可以查看一个文件的page是否是dirty。
重新实现使用如上脚本观察
2aaab30c4000-2aaab31b9000 rw-s 00000000 fd:00 81887299 /opt/zhanghailei/a.txt
Size: 980 kB
Rss: 980 kB
Shared_Clean: 0 kB
Shared_Dirty: 0 kB
Private_Clean: 0 kB
Private_Dirty: 980 kB
Swap: 0 kB
Pss: 980 kB
果然是dirty的,然后继续等待一段时间再次执行发现已经是clean,被刷到磁盘中。
2aaab30c4000-2aaab31b9000 rw-s 00000000 fd:00 81887299 /opt/zhanghailei/a.txt
Size: 980 kB
Rss: 980 kB
Shared_Clean: 0 kB
Shared_Dirty: 0 kB
Private_Clean: 980 kB
Private_Dirty: 0 kB
Swap: 0 kB
Pss: 980 kB
结论
1. mmap,底层还是走的BufferedIO,好处大概是减少了内核态和用户态的内存拷贝,这点不太确定,对内核不熟。
2. force,参数为true调用fsync,false调用fdatasync,fdatasync只刷数据不刷meta数据
3. 即使不调用force,内核也会定期将dirty page刷到磁盘,默认是30s。
分享到:
相关推荐
ShareMem通过mmap实现内存共享,可以提高跨语言、跨进程通信的效率,避免了传统的数据复制和缓冲区管理开销。 1. **JNI基础**: JNI是一种接口,允许Java代码和其他编程语言(如C/C++)进行交互。在Android中,...
java内存模型思维导图--内存模型抽象,重排序,final,顺序一致性,锁,volatile,concurrent包的实现
rocketmq支持任意时间的延时(可以精确到秒级) 基于时间轮和高效mmap文件实现;定时消息与延时消息在代码配置上存在一些差异,但是最终达到的效果相同:消息在发送到消息队列RocketMQ版服务端后并不会立马投递,...
里面包含了File类的作用、IO流、字节流字符流、异常处理、缓冲流、转换流、序列化、打印流的详细讲解
4. **FileChannel**:用于文件的读写,可以实现大文件的高效传输,支持内存映射(Mmap)技术,能直接将文件映射到内存中。 5. **SocketChannel**:用于网络通信,可以建立TCP连接,进行非阻塞的读写。在`NIOServer....
本教程将详细解释如何在Android中实现Java和C的Socket通信,特别是在涉及文件描述符传递的场景下。 1. **Java Socket基础** Java中的`java.net.Socket`类提供了网络通信的能力,它允许我们在两个应用程序之间建立...
在Java中,类成员的访问控制是通过四种不同的访问修饰符来实现的:`public`, `private`, `protected` 以及默认(通常称为包访问权限或者友好访问权限)。 - **public**: 公有修饰符,被声明为public的成员可以在...
此外,Java集合框架是处理数据集合的重要工具,包括List、Set、Queue和Map接口,以及ArrayList、LinkedList、HashSet、HashMap等实现类。脑图可能会展示这些集合的特性、操作和它们之间的关系。 线程和并发处理是...
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、...
Java三大框架,即Spring、Hibernate和Struts2,是Java Web开发中的核心组件,它们各自承担着不同的职责,共同构建出高效、稳定的Web应用程序。这些框架的熟练掌握,对于Java开发者来说至关重要。 Spring框架,全...
14. **定时任务实现**:掌握如何在Java中实现定时任务。 15. **I/O编程**:理解Java I/O流的装饰模式。 16. **网络编程**:熟悉Socket编程、URL处理、URLConnection和ServerSocket等。 17. **TCP与UDP**:理解TCP和...
《互联网大厂面试题第2季》脑图涵盖了IT领域中的关键知识点,特别是针对Java并发编程(JUC)、Java虚拟机(JVM)以及垃圾收集(GC)等内容。这些是现代互联网开发人员必备的技术能力,也是企业在招聘时重点考察的...
在这个实例中,"爬虫.mmap"可能是一个内存映射文件,用于提高程序读取大文件时的性能。内存映射文件允许将文件的一部分直接加载到内存中,这样程序可以直接访问这部分内容,而无需频繁地进行磁盘I/O操作。 "1.png...
这份"Crazy-JAVA-mind-map.zip"压缩包包含了一个名为"Crazy JAVA mind map.mmap"的思维导图文件,这个导图就是对《疯狂JAVA讲义》内容的高度概括和逻辑梳理,旨在帮助学习者更好地理解和记忆书中的知识点。...
- **直接内存(Direct Byte Buffer)**:Java NIO中的直接缓冲区可以分配在JVM堆外内存,减少从Java对象到本机内存的拷贝,从而实现零拷贝。 - **mmap(Memory Mapped File)**:Java的FileChannel提供了一个映射...
Java.Util.Concurrent是在并发编程中很常用的实用工具类。此包包括了几个小的、已标准化的可扩展框架,以及一些提供有用功能的类,没有这些类,这些功能会很难实现或实现起来冗长乏味。课程从技术原理和细节上,进行...
1.2.2 通过mmap+write实现的零拷贝,利用虚拟内存映射减少了一次CPU拷贝,提高了效率。而1.2.3 sendfile方法进一步优化,利用DMA(直接内存访问)收集拷贝功能,减少了更多的数据拷贝操作。 除了操作系统,这份面试...
- **实现**:连接池预先创建多个数据库连接并将其保存在一个池中,当应用程序请求一个新的数据库连接时,连接池会返回一个现有的连接,而不是创建一个新的连接。这种方式可以显著提高数据库访问效率,并减少资源...
用Netty实现的Spring-boot-protocol将springboot的WebServer更改为NettyTcpServer,为用户扩展了网络编程的能力。...sendFile, mmap. 示例:com.github.netty.http.example.HttpZeroCopyController.java4.HttpServlet
【Java学习资料】涵盖了许多Java开发的核心知识点,包括SSH(Struts、Spring、Hibernate)和SSM(SpringMVC、Spring、MyBatis)两大主流框架,以及版本控制工具svn和git,还有基础的Linux命令操作。这些内容是Java...