这篇文章主要是从原理, 手册和源码分析在PHP中查询MySQL返回大量结果时, 内存占用的问题, 同时对使用MySQL C API也有涉及.
昨天, 有同事在PHP讨论群里提到, 他做的一个项目由于MySQL查询返回的结果太多(达10万条), 从而导致PHP内存不够用. 所以, 他问, 在执行下面的代码遍历返回的MySQL结果之前, 数据是否已经在内存中了? -
while ($row = mysql_fetch_assoc($result)) {
// …
}
|
当然, 这种问题有许多优化的方法. 不过, 就这个问题来讲, 我首先想到, MySQL是经典的C/S(Client/Server, 客户端/服务器)模型, 在遍历结果集之前, 底层的实现可能已经把所有的数据通过网络(假设使用TCP/IP)读到了Client的缓冲区, 也有另一种可能, 就是数据还在Server端的发送缓冲区里, 并没有传给Client.
在查看PHP和MySQL的源码之前, 我注意到PHP手册里有两个功能相近的函数:
mysql_query()
mysql_unbuffered_query()
|
两个函数的字面意思和说明证实了我的想法, 前一个函数执行时, 会把所有的结果集从Server端读到Client端的缓冲区中, 而后一个则没有, 这就是”unbuffered(未缓冲)”的意思.
那就是说, 如果用mysql_unbuffered_query()执行了一条返回大量结果集的SQL语句, 在遍历结果之前, PHP的内存是没有被结果集占用的. 而用mysql_query()来执行同样的语句的话, 函数返回时, PHP的内存占用便会急剧增加, 立即耗光内存.
如果阅读PHP的相关代码, 可以看到这两个函数的实现上的异同:
/* {{{ proto resource mysql_query(string query [, int link_identifier])
Sends an SQL query to MySQL */
PHP_FUNCTION(mysql_query)
{
php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_STORE_RESULT);
}
/* }}} */
/* {{{ proto resource mysql_unbuffered_query(string query [, int link_identifier])
Sends an SQL query to MySQL, without fetching and buffering the result rows */
PHP_FUNCTION(mysql_unbuffered_query)
{
php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_USE_RESULT);
}
/*
}}} */
|
两个函数都调用了php_mysql_do_query(), 只差了第2个参数的不同, MYSQL_STORE_RESULT和MYSQL_USE_RESULT. 再看php_mysql_do_query()的实现:
if(use_store == MYSQL_USE_RESULT) {
mysql_result=mysql_use_result(&mysql->conn);
} else {
mysql_result=mysql_store_result(&mysql->conn);
}
|
mysql_use_result()和mysql_store_result()是MySQL的C API函数, 这两个C API函数的区别就是后者把结果集从MySQL Server端全部读取到了Client端, 前者只是读取了结果集的元信息.
回到PHP, 使用mysql_unbuffered_query(), 可以避免内存的立即占用. 如果在遍历的过程不对结果进行”PHP缓存”(如放到某数组中), 则整个执行过程虽然操作了十万条或者百万条或者更多的数据, 但PHP占用的内存始终是非常小的.
分享到:
相关推荐
在探讨PHP查询MySQL大量数据时的内存占用问题时,我们应当了解几个关键的知识点。首先,MySQL作为一个经典的客户端/服务器(C/S)模型,其数据处理方式对于内存消耗有着直接影响。其次,PHP在处理查询结果时的不同...
主要介绍了php查询mysql大量数据造成内存不足的解决方法,实例分析了mysql查询时内存不足的原因与相应的解决方法,并且较为详细的分析了mysql_unbuffered_query函数的使用技巧,需要的朋友可以参考下
在实际开发中,使用非缓冲查询模式可以有效缓解内存耗尽的问题,尤其是在处理大量数据时。但是,这种模式由于涉及到逐条处理数据,可能会对数据库服务器造成较大的性能压力。因此,针对特定的应用场景和服务器配置,...
在PHP编程中,当从数据库查询大量数据时,可能会遇到内存耗尽的问题,这通常由于PHP的默认查询模式——缓冲查询(Buffered queries)导致。缓冲查询会一次性将所有查询结果加载到内存中,以便PHP程序可以自由地处理...
在处理MySQL海量数据查询优化时,我们需要关注的策略包括但不限于以下几点: 1. 优化索引使用:避免全表扫描至关重要。为此,应当在查询条件(WHERE)和排序(ORDER BY)涉及的列上创建索引。索引有助于数据库管理...
当处理大量数据时,一次性导入可能导致内存溢出。为此,可以将数据分批导入,每次处理一部分。 2. 使用事务: 在导入过程中,使用事务可以确保数据的一致性。如果在导入过程中发生错误,可以回滚事务以保持数据的...
一次性处理大量数据可能导致内存溢出,所以可能采用分批读取和导入的方式,比如每次只处理一定数量的行,然后释放内存,再继续下一批。这可以通过循环来实现,每次处理一部分数据后调用`unset()`释放变量,减少内存...
在PHP开发中,有时我们需要处理大量数据,例如从多个文件中读取数据并将其导入到MySQL数据库。这个过程涉及到文件上传、数据处理和数据库交互等多个关键步骤。下面将详细讲解这些知识点。 1. PHP文件上传: PHP...
同时,考虑使用事务来确保数据的一致性,尤其是在处理大量数据时。 总的来说,将PHP与PHPExcel和MySQL结合,可以有效地实现Excel数据的上传和入库,从而提升数据处理的自动化程度。这是一项实用的技能,对于Web...
7. **资源管理**:由于项目涉及到大量数据,资源管理变得重要,包括内存管理、数据库连接池等,以确保系统的稳定性和性能。 8. **日志记录**:为了调试和监控系统的运行状态,可能会有日志记录功能,记录查询请求、...
在PHP和MySQL开发中,数据分页是一种常见的技术,它用于处理大量数据,避免一次性加载过多内容导致页面响应变慢或内存压力增大。本篇将详细介绍如何使用PHP编写一个简单的数据分页函数,并结合MySQL数据库进行操作。...
MySQL优化是提升数据库性能的关键步骤,对于PHP应用来说尤其重要,因为PHP经常与MySQL数据库进行交互,处理大量的数据查询和存储。以下将详细介绍MySQL优化的各个方面,并结合提供的文件名进行推测,尽管没有实际...
5. **高效性**:PHP 对内存的使用非常高效,能够处理大量的数据和并发请求。 #### 四、MySQL简介 MySQL 是一个关系型数据库管理系统,由瑞典MySQL AB公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型...
本文将深入探讨如何使用PHP来与MySQL数据库进行交互,包括如何将数据插入到数据库以及如何读取存储的数据。 首先,PHP是一种开源的服务器端脚本语言,特别适合用于Web开发。它的语法简洁且易于学习,可以轻松地与...
PHP是一种广泛使用的开源脚本语言,尤其适合服务器端的Web开发,而MySQL则是一款流行的关系型数据库管理系统(RDBMS),在处理大量数据时表现优秀,常与PHP搭配使用。 【描述】中的“源代码分享”暗示了这是一个...
- PHP内存限制过小,无法处理大量数据。 - 安全性问题,如硬编码密码。 解决这些问题通常需要检查脚本代码、调整MySQL和Cacti的配置,甚至可能需要优化SQL查询以减少资源消耗。 8. **总结** 使用Cacti和PHP脚本...