`
thunder_yan
  • 浏览: 112473 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

SQLite优化方法

阅读更多

 

1.建表优化

SQLite的数据库本质文件读写操作,频繁操作打开和关闭是很耗时和浪费资源的;

 

优化方法事务机制:

这里要注意一点:事务的开启是要锁定DB的,其他对DB的写入操作都是无法成功的。

db.beginTransaction(); //手动设置开始事务

try {

//这里写你数据操作

db.setTransactionSuccessful();

    //设置事务处理成功,不设置会自动回滚不提交

} catch (Exception e) {

} finaly {

db.endTransaction(); //提交

}

 

项目中不会把项目上万条数据存SQL里的,尽管android有SQLite。

那样处理起来非常慢,而且程序经常出现ANR。

 

打个比方:有200个城市,每个城市500条城市信息,你怎么创建表?

 

A:我创建一张表存10000条数据。

B:200张表,每张存500条数据。

C:我创建两张表,

   一张存city,其实这张表只有1条数据;

   Id(编号),

   Version(这200个城市更新版本用)

   CityDate(200个城市xml格式字符串数据)。

 

   另一张表存城市信息表:200条数据,每个城市一条数据

   id(CityDate解析出城市对象对应的id)

   Version(这500条城市信息更新版本用)

   CityMessage(500条城市信息xml格式字符串数据)。

 

 

 

 首先你给用户展示200城市(你只取了一条数据 200个城市xml格式字符串数据进行解析)

 用户点击一个城市你显示500条记录(通过城市解析ID,取出城市信息表中对应500数据xml格式字符串数据进行解析)

 

 

这样做的好处:

(1)统一数据接口,无论你从网络上直接去数据,还是读本地缓存统一数据接口,xml

(2)数据进行排序,内存操作要快一些;

(3)其实这和自己写文件没什么区别,为什么还要用数据库那,这么做有利于程序版本更新升级数据

    维护!

 

2.其他技巧

 

  1) 相对于封装过的ContentProvider而言,使用原始SQL语句执行效率高,比如使用方法rawQuery、execSQL的执行效率比较高。

 

  2) 对于需要一次性修改多个数据时,可以考虑使用SQLite的事务方式批量处理,我们定义SQLiteDatabase db对象,执行的顺序为

 

  db.beginTransaction();

  //这里处理数据添加,删除或修改的SQL语句

  db.setTransactionSuccessful(); //这里设置处理成功

  db.endTransaction(); //这句很重要,告诉数据库处理完成了,这时SQLite的底层会执行具体的数据操作。

 

  3) 打好SQL语句的基础,对于查询,以及分配表的结构都十分重要

 

3.

  一、影响查询性能的因素:

        1. 对表中行的检索数目,越小越好
        2. 排序与否。
        3. 是否要对一个索引。
        4. 查询语句的形式

        二、几个查询优化的转换

        1. 对于单个表的单个列而言,如果都有形如T.C=expr这样的子句,并且都是用OR操作符连接起来,形如: x = expr1 OR expr2 = x OR x = expr3 此时由于对于OR,在SQLite中不能利用索引来优化,所以可以将它转换成带有IN操作符的子句:x IN(expr1,expr2,expr3)这样就可以用索引进行优化,效果很明显,但是如果在都没有索引的情况下OR语句执行效率会稍优于IN语句的效率。

         2. 如果一个子句的操作符是BETWEEN,在SQLite中同样不能用索引进行优化,所以也要进行相应的等价转换: 如:a BETWEEN b AND c可以转换成:(a BETWEEN b AND c) AND (a>=b) AND (a<=c)。 在上面这个子句中, (a>=b) AND (a<=c)将被设为dynamic且是(a BETWEEN b AND c)的子句,那么如果BETWEEN语句已经编码,那么子句就忽略不计,如果存在可利用的index使得子句已经满足条件,那么父句则被忽略。

         3. 如果一个单元的操作符是LIKE,那么将做下面的转换:x LIKE ‘abc%’,转换成:x>=‘abc’ AND x<‘abd’。因为在SQLite中的LIKE是不能用索引进行优化的,所以如果存在索引的话,则转换后和不转换相差很远,因为对LIKE不起作用,但如果不存在索引,那么LIKE在效率方面也还是比不上转换后的效率的。

         三、 几种查询语句的处理(复合查询)

         1.查询语句为:<SelectA> <operator> <selectB> ORDER BY <orderbylist> ORDER BY 执行方法: is one of UNION ALL, UNION, EXCEPT, or INTERSECT. 这个语句的执行过程是先将selectA和selectB执行并且排序,再对两个结果扫描处理,对上面四种操作是不同的,将执行过程分成七个子过程:

         outA: selectA的结果的一行放到最终结果集中

         outB: 将selectA的结果的一行放到最终结果集中(只有UNION操作和UNION ALL操作,其它操作都不放入最终结果集中)

          AltB: 当selectA的当前记录小于selectB的当前记录
          AeqB: 当selectA的当前记录等于selectB的当前记录
          AgtB: 当selectA的当前记录大于selectB的当前记录
          EofA: 当selectA的结果遍历完
          EofB: 当selectB的结果遍历完

 

四、子查询扁平化 

        例子:SELECT a FROM (SELECT x+y AS a FROM t1 WHERE z<100) WHERE a>5

        对这个SQL语句的执行一般默认的方法就是先执行内查询,把结果放到一个临时表中,再对这个表进行外部查询,这就要对数据处理两次,另外这个临时表没有索引,所以对外部查询就不能进行优化了,如果对上面的SQL进行处理后可以得到如下SQL语句:SELECT x+y AS a FROM t1 WHERE z<100 AND a>5,这个结果显然和上面的一样,但此时只需要对数据进行查询一次就够了,另外如果在表t1上有索引的话就避免了遍历整个表。

        运用flatten方法优化SQL的条件:

        1.子查询和外查询没有都用集函数
        2.子查询没有用集函数或者外查询不是个表的连接
        3.子查询不是一个左外连接的右操作数
        4.子查询没有用DISTINCT或者外查询不是个表的连接
        5.子查询没有用DISTINCT或者外查询没有用集函数
        6.子查询没有用集函数或者外查询没有用关键字DISTINCT
        7.子查询有一个FROM语句
        8.子查询没有用LIMIT或者外查询不是表的连接
        9.子查询没有用LIMIT或者外查询没有用集函数
        10.子查询没有用集函数或者外查询没用LIMIT
        11.子查询和外查询不是同时是ORDER BY子句
        12.子查询和外查询没有都用LIMIT
        13.子查询没有用OFFSET
        14.外查询不是一个复合查询的一部分或者子查询没有同时用关键字ORDER BY和LIMIT
        15.外查询没有用集函数子查询不包含ORDER BY
        16.复合子查询的扁平化:子查询不是一个复合查询,或者他是一个UNION ALL复合查询,但他是都由若干个非集函数的查询构成,他的父查询不是一个复合查询的子查询,也没有用集函数或者是DISTINCT查询,并且在FROM语句中没有其它的表或者子查询,父查询和子查询可能会包含WHERE语句,这些都会受到上面11、12、13条件的限制。

 

 

SELECT a+1 FROM (
SELECT x FROM tab
UNION ALL
SELECT y FROM tab
UNION ALL
SELECT abs(z*2) FROM tab2
) WHERE a!=5 ORDER BY 1
       
转换为:

SELECT x+1 FROM tab WHERE x+1!=5

UNION ALL
SELECT y+1 FROM tab WHERE y+1!=5
UNION ALL
SELECT abs(z*2)+1 FROM tab2 WHERE abs(z*2)+1!=5
ORDER BY 1

 五、连接查询

        在返回查询结果之前,相关表的每行必须都已经连接起来,在SQLite中,这是用嵌套循环实现的,在早期版本中,最左边的是最外层循环,最右边的是最内层循环,连接两个或者更多的表时,如果有索引则放到内层循环中,也就是放到FROM最后面,因为对于前面选中的每行,找后面与之对应的行时,如果有索引则会很快,如果没有则要遍历整个表,这样效率就很低,但在新版本中,这个优化已经实现。

        优化的方法如下:
        对要查询的每个表,统计这个表上的索引信息,首先将代价赋值为SQLITE_BIG_DBL(一个系统已经定义的常量):

        1、如果没有索引,则找有没有在这个表上对rowid的查询条件:

        如果有Rowid=EXPR,如果有的话则返回对这个表代价估计,代价计为零,查询得到的记录数为1,并完成对这个表的代价估计。
        如果没有Rowid=EXPR 但有rowid IN (...),而IN是一个列表,那么记录返回记录数为IN列表中元素的个数,估计代价为NlogN,
        如果IN不是一个列表而是一个子查询结果,那么由于具体这个子查询不能确定,所以只能估计一个值,返回记录数为100,代价为200。

        如果对rowid是范围的查询,那么就估计所有符合条件的记录是总记录的三分之一,总记录估计为1000000,并且估计代价也为记录数。
        如果这个查询还要求排序,则再另外加上排序的代价NlogN
        如果此时得到的代价小于总代价,那么就更新总代价,否则不更新。

       2、如果WHERE子句中存在OR操作符,那么要把这些OR连接的所有子句分开再进行分析。

         如果有子句是由AND连接符构成,那么再把由AND连接的子句再分别分析。
         如果连接的子句的形式是X<op><expr>,那么就再分析这个子句。
         接下来就是把整个对OR操作的总代价计算出来。
         如果这个查询要求排序,则再在上面总代价上再乘上排序代价NlogN
         如果此时得到的代价小于总代价,那么就更新总代价,否则不更新。

         3、如果有索引,则统计每个表的索引信息,对于每个索引:

         先找到这个索引对应的列号,再找到对应的能用到(操作符必须为=或者是IN(…))这个索引的WHERE子句,如果没有找到,则退出对每个索引的循环,如果找到,则判断这个子句的操作符是什么,如果是=,那么没有附加的代价,如果是IN(sub-select),那么估计它附加代价inMultiplier为25,如果是IN(list),那么附加代价就是N(N为list的列数)。

         再计算总的代价和总的查询结果记录数和代价。
         nRow = pProbe->aiRowEst * inMultiplier;/*计算行数*/
         cost = nRow * estLog(inMultiplier);/*统计代价*/
         如果找不到操作符为=或者是IN(…)的子句,而是范围的查询,那么同样只好估计查询结果记录数为nRow/3,估计代价为cost/3。
         同样,如果此查询要求排序的话,再在上面的总代价上加上NlogN
         如果此时得到的代价小于总代价,那么就更新总代价,否则不更新。

         4、通过上面的优化过程,可以得到对一个表查询的总代价

         再对第二个表进行同样的操作,这样如此直到把FROM子句中所有的表都计算出各自的代价,最后取最小的,这将作为嵌套循环的最内层,依次可以得到整个嵌套循环的嵌套顺序,此时正是最优的,达到了优化的目的。

         5、所以循环的嵌套顺序不一定是与FROM子句中的顺序一致,因为在执行过程中会用索引优化来重新排列顺序。

         六、索引

        在SQLite中,有以下几种索引:
        1)    单列索引
        2)    多列索引
        3)    唯一性索引
        4)    对于声明为:INTEGER PRIMARY KEY的主键来说,这列会按默认方式排序,所以虽然在数据字典中没有对它生成索引,但它的功能就像个索引。所以如果在这个主键上在单独建立索引的话,这样既浪费空间也没有任何好处。

        运用索引的注意事项:
        1)  对于一个很小的表来说没必要建立索引
        2)  在一个表上如果经常做的是插入更新操作,那么就要节制使用索引
        3)  也不要在一个表上建立太多的索引,如果建立太多的话那么在查询的时候SQLite可能不会选择最好的来执行查询,一个解决办法就是建立聚蔟索引。

         索引的运用时机:

         1) 操作符:=、>、<、IN等
         2) 操作符BETWEEN、LIKE、OR不能用索引,
         如BETWEEN:SELECT * FROM mytable WHERE myfield BETWEEN 10 and 20;
         这时就应该将其转换成:
         SELECT * FROM mytable WHERE myfield >= 10 AND myfield <= 20;
         此时如果在myfield上有索引的话就可以用了,大大提高速度
         再如LIKE:SELECT * FROM mytable WHERE myfield LIKE 'sql%';
         此时应该将它转换成:
         SELECT * FROM mytable WHERE myfield >= 'sql' AND myfield < 'sqm';
         此时如果在myfield上有索引的话就可以用了,大大提高速度
         再如OR:SELECT * FROM mytable WHERE myfield = 'abc' OR myfield = 'xyz';
         此时应该将它转换成:
         SELECT * FROM mytable WHERE myfield IN ('abc', 'xyz');
         此时如果在myfield上有索引的话就可以用了,大大提高速度
         3) 有些时候索引都是不能用的,这时就应该遍历全表(程序演示)

分享到:
评论

相关推荐

    sqlite优化方法比较

    以上是关于"sqlite优化方法比较"的一些核心知识点。实际应用中,应根据具体项目需求和性能测试结果,选择最适合的优化策略。通过合理的数据库设计和优化,可以显著提升Android应用的运行效率和用户体验。

    SQLite3的性能优化

    SQLite3 的性能优化 SQLite3 是一个轻量级的关系数据库管理系统,常用于嵌入式系统中。在嵌入式系统中,数据库的性能优化尤为重要。本文将主要讲述在嵌入式中使用 SQLite3 时,对相关的数据库的性能如何优化的问题...

    C# SQLite执行效率的优化教程

    C# SQLite执行效率优化教程 本文主要介绍了关于C# SQLite执行效率优化的相关资料,通过示例代码介绍的非常详细,对大家学习或者使用C# SQLite具有一定的参考学习价值。 一、SQLite简介 SQLite是一款轻型的嵌入式...

    SQLite3性能优化

    SQLite3是一款轻量级的数据库引擎,广泛应用于嵌入式设备和移动应用中。..."sqlite-amalgamation-3071300.zip"则包含了SQLite3的源代码和编译脚本,对于深入了解其内部机制和进行定制优化非常有用。

    sqlite 优化资料

    SQLite优化器会分析查询语句,并基于统计信息和成本模型选择最佳执行计划。理解其工作方式有助于编写更高效的SQL语句。 五、Windows下的特殊优化 在Windows环境下,可能需要关注磁盘I/O性能、文件系统缓存设置以及...

    C#实现Excel导入sqlite的方法

    此外,注意在实际项目中,为了提高代码的可维护性和灵活性,可以考虑以下几点优化: - 使用配置文件存储数据库连接字符串,而不是硬编码在代码中。 - 对于大量数据的导入,可以使用批处理或事务来提高性能和保证数据...

    VS2013连接SQLITE3方法

    ### VS2013连接SQLite3方法 在开发过程中,我们常常需要用到各种数据库来存储数据。Visual Studio 2013(简称VS2013)作为一款强大的集成开发环境,支持多种数据库的操作,但默认情况下并不包含SQLite数据库的支持...

    sqlite3性能优化源代码 数据插入 开启事务 执行准备 性能提升 每秒百万条数据写入

    除了上述方法,还可以利用SQLite3的内存数据库模式(:memory:)。在这种模式下,所有数据都存储在内存中,因此读写速度极快。适用于大量快速插入和测试场景。当数据插入完成后,可以使用`ATTACH DATABASE`命令将内存...

    sqlite源码和编译方法

    SQLite是一款开源、轻量级的嵌入式关系型...总之,SQLite源码和编译方法的学习对于理解数据库的工作原理、优化SQL查询以及开发自定义的数据库解决方案非常有帮助。通过实践,你可以更好地掌握这一强大的数据库引擎。

    sqlite优化

    综上,SQLite优化涉及多个方面,包括查询优化、数据库设计、事务管理等。通过深入理解SQLite的工作原理并适当调整,可以显著提升其性能。阅读《Apress.The.Definitive.Guide.to.SQLite.May.2006.pdf》等资料,可以...

    sqlite优化使用与源码分析

    ### SQLite优化使用与源码分析 #### SQLite简介与特点 **SQLite** 是一款轻量级的嵌入式数据库系统,以其高效、便捷的特点被广泛应用于各类应用开发之中,尤其是在资源受限的环境中表现突出。该数据库管理系统由D....

    sqliteodbc驱动sqlite3

    4. **性能优化**:SQLiteODBC利用了SQLite数据库的高性能特性,同时结合ODBC的优势,为用户提供高效的数据交互体验。 #### 三、SQLiteODBC安装与配置 ##### 1. 获取SQLiteODBC安装包 根据提供的信息,SQLiteODBC...

    Inside SQLite(SQLite技术内幕) 原版+个人翻译版

    最后,SQLite的API接口是开发者与数据库交互的主要途径,熟悉这些接口的使用方法和最佳实践,可以避免很多潜在的问题。 总的来说,《Inside SQLite》无论是翻译版还是原版,都是学习和理解SQLite底层机制的宝贵资源...

    Delphi使用ASqlite3 连接SQLite上例子

    ASqlite3控件则是Delphi开发者连接SQLite的工具,它提供了一系列的方法和属性,使得我们可以通过Delphi的可视化界面直接操作数据库。 安装ASqlite3组件库后,打开Delphi IDE,在工具箱中会看到新增的ASqlite3系列...

    sqlite3文件(sqlite3.dll,sqlite3.h,sqlite3.lib)

    4. 性能优化:可以通过使用合适的数据类型、索引、优化SQL语句等方式提升SQLite3数据库的性能。 5. 安全性:尽管SQLite3提供了良好的事务处理,但开发者仍需关注数据安全和备份策略。 总的来说,`sqlite3.dll`、`...

    力控与sqlite数据库交换数据配置.doc

    你可以编写SQL查询语句,例如`SELECT * FROM 表名`,然后使用`OpenRecordSet`方法执行查询,获取的结果集可以绑定到力控的数据显示组件,实时展示数据库中的数据。 需要注意的是,数据交换过程中要确保力控中的数据...

    SQLITE数据库 UPDATE慢

    综上所述,SQLITE数据库UPDATE慢的问题可以通过多个角度来解决,包括索引优化、事务管理、查询重构、硬件升级等。针对具体问题,分析日志,定位慢查询,然后采取针对性的措施,可以显著提升SQLite数据库的更新速度。...

    android sqlite 批量插入数据优化代码

    "android sqlite 批量插入数据优化代码"这个主题正是针对这一需求,探讨如何高效地在SQLite数据库中进行大量数据的插入操作。 首先,我们要理解SQLite的基本插入语句,通常是这样的: ```sql INSERT INTO 表名 (列...

Global site tag (gtag.js) - Google Analytics