`

Oracle 中实现随机抽取数据

阅读更多
一、Oracle取随机数据
1、Oracle访问数据的基本方法:
1)、全表扫描(Full table Scan):执行全表扫描,Oracle读表中的所有记录,考查每一行是否满足WHERE条件。Oracle顺序的读分配给该表的每一个数据块,且每个数据块Oracle只读一次.这样全表扫描能够受益于多块读.

2)、采样表扫描(sample table scan):扫描返回表中随机采样数据,这种访问方式需要在FROM语句中包含SAMPLE选项或者SAMPLE BLOCK选项.

注:从Oracle8i开始Oracle提供采样表扫描特性


2、使用sample获得随机结果集
2.1、语法: SAMPLE [ BLOCK ](sample_percent)[ SEED (seed_value) ]
SAMPLE选项:表示按行采样来执行一个全表扫描,Oracle从表中读取特定百分比的记录,并判断是否满足WHERE子句以返回结果。
BLOCK: 表示使用随机块例举而不是随机行例举。
sample_percent:是随机获取一张表中记录的百分比。比如值为10,那就是表中的随机的百分之10的记录。
               值必须大于等于.000001,小于100。
SEED:表示从哪条记录返回,类似于预先设定例举结果,因而每次返回的结果都是固定的。该值必须介于0和4294967295之间。

2.2、举例说明
   创建测试临时表:
Sql代码 复制代码

    SQL>create table zeeno as select * from dba_objects;     

[sql] view plaincopyprint?

    SQL>create table zeeno as select * from dba_objects;     


1)、sample(sample_percent):
Sql代码 复制代码

    -- 从表zeeno中“全表扫描”随机抽取10%的记录,随机查询5条记录   
    SQL>select object_name from zeeno sample(10) where rownum<6;   
     
    OBJECT_NAME   
    --------------------------------------------------------------------------------   
    UET$   
    VIEW$   
    I_SUPEROBJ2   
    TRIGGERCOL$   
    I_VIEW1      
                                
    SQL&gt; /   
     
    OBJECT_NAME   
    --------------------------------------------------------------------------------   
    I_FILE1   
    IND$   
    CLU$   
    FET$   
    I_COBJ#   
       

[sql] view plaincopyprint?

    -- 从表zeeno中“全表扫描”随机抽取10%的记录,随机查询5条记录  
    SQL>select object_name from zeeno sample(10) where rownum<6;  
     
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    UET$  
    VIEW$  
    I_SUPEROBJ2  
    TRIGGERCOL$  
    I_VIEW1     
                               
    SQL&gt; /  
     
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    I_FILE1  
    IND$  
    CLU$  
    FET$  
    I_COBJ#  
       


2)、sample block(sample_percent)
Sql代码 复制代码

    -- 从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录   
    SQL> select object_name from zeeno sample block(10) where rownum<6;   
     
    OBJECT_NAME   
    --------------------------------------------------------------------------------   
    URIFACTORY   
    DBMS_XMLGEN   
    DBMS_XMLGEN   
    DBMS_XMLSTORE   
    DBMS_XMLSTORE   
       

[sql] view plaincopyprint?

    -- 从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录  
    SQL> select object_name from zeeno sample block(10) where rownum<6;  
     
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    URIFACTORY  
    DBMS_XMLGEN  
    DBMS_XMLGEN  
    DBMS_XMLSTORE  
    DBMS_XMLSTORE  
       



3)、sample block(sample_percent) seed(seed_value)
Sql代码 复制代码

    -- 使用seed,返回固定的结果集。从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录。   
    SQL> select object_name from zeeno sample(10) seed(10) where rownum<6;   
     
    OBJECT_NAME   
    --------------------------------------------------------------------------------   
    UET$   
    I_CON1   
    I_FILE2   
    FET$   
    I_COL1   
     
    SQL&gt; select object_name from zeeno sample(10) seed(10) where rownum&lt;6;   
     
    OBJECT_NAME   
    --------------------------------------------------------------------------------   
    UET$   
    I_CON1   
    I_FILE2   
    FET$   
    I_COL1   
       

[sql] view plaincopyprint?

    -- 使用seed,返回固定的结果集。从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录。  
    SQL> select object_name from zeeno sample(10) seed(10) where rownum<6;  
     
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    UET$  
    I_CON1  
    I_FILE2  
    FET$  
    I_COL1  
     
    SQL&gt; select object_name from zeeno sample(10) seed(10) where rownum&lt;6;  
     
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    UET$  
    I_CON1  
    I_FILE2  
    FET$  
    I_COL1  
       



注意以下几点:

1.sample只对单表生效,不能用于表连接和远程表
2.sample会使SQL自动使用CBO





3、使用DBMS_RANDOM包
  DBMS_RANDOM有两种主要的使用方法分别是:DBMS_RANDOM.VALUE()和DBMS_RANDOM.RANDOM



3.1、取随机数
Sql代码 复制代码

    SQL> select dbms_random.value() from dual;  
       
    DBMS_RANDOM.VALUE()  
    -------------------  
      0.146123095968043  
       
    SQL> select dbms_random.value() from dual;  
       
    DBMS_RANDOM.VALUE()  
    -------------------  
       0.90175764902345 

[sql] view plaincopyprint?

    SQL> select dbms_random.value() from dual; 
      
    DBMS_RANDOM.VALUE() 
    ------------------- 
      0.146123095968043 
      
    SQL> select dbms_random.value() from dual; 
      
    DBMS_RANDOM.VALUE() 
    ------------------- 
       0.90175764902345 


Sql代码 复制代码

    SQL> select dbms_random.value(1,10) from dual;  
       
    DBMS_RANDOM.VALUE(1,10)  
    -----------------------  
           9.86601968210438  
       
    SQL> select dbms_random.value(1,10) from dual;  
       
    DBMS_RANDOM.VALUE(1,10)  
    -----------------------  
           3.43475105499398 

[sql] view plaincopyprint?

    SQL> select dbms_random.value(1,10) from dual; 
      
    DBMS_RANDOM.VALUE(1,10) 
    ----------------------- 
           9.86601968210438 
      
    SQL> select dbms_random.value(1,10) from dual; 
      
    DBMS_RANDOM.VALUE(1,10) 
    ----------------------- 
           3.43475105499398 



3.2、举例说明

 
Sql代码 复制代码

    SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6;  
       
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    /6dd0fe0e_CertificateCertifica  
    /cf5224d7_SunJSSE_a4  
    KU$_PARSED_ITEMS  
    javax/swing/text/IconView  
    oracle/xml/jdwp/XSLJDWPString  
       
    SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6;  
       
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    java/io/ObjectOutputStream$1  
    sun/security/krb5/KrbAsReq  
    /2d52a21c_Last  
    SYS_YOID0000006594$  
    /308fbfa1_BeanContextServices 

[sql] view plaincopyprint?

    SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6; 
      
    OBJECT_NAME 
    -------------------------------------------------------------------------------- 
    /6dd0fe0e_CertificateCertifica 
    /cf5224d7_SunJSSE_a4 
    KU$_PARSED_ITEMS 
    javax/swing/text/IconView 
    oracle/xml/jdwp/XSLJDWPString 
      
    SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6; 
      
    OBJECT_NAME 
    -------------------------------------------------------------------------------- 
    java/io/ObjectOutputStream$1 
    sun/security/krb5/KrbAsReq 
    /2d52a21c_Last 
    SYS_YOID0000006594$ 
    /308fbfa1_BeanContextServices 


Sql代码 复制代码

    SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6;  
       
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    ICOL$  
    C_COBJ#  
    PROXY_ROLE_DATA$  
    I_OBJ#  
    UET$  
       
    SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6;  
       
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    ICOL$  
    UNDO$  
    I_PROXY_ROLE_DATA$_1  
    I_CDEF2  
    UET$ 

[sql] view plaincopyprint?

    SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6; 
      
    OBJECT_NAME 
    -------------------------------------------------------------------------------- 
    ICOL$ 
    C_COBJ# 
    PROXY_ROLE_DATA$ 
    I_OBJ# 
    UET$ 
      
    SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6; 
      
    OBJECT_NAME 
    -------------------------------------------------------------------------------- 
    ICOL$ 
    UNDO$ 
    I_PROXY_ROLE_DATA$_1 
    I_CDEF2 
    UET$ 


Sql代码 复制代码

    SQL> select trunc(dbms_random.value(0, 1000)) randomNum from dual; --(0-1000的整数)  
       
     RANDOMNUM  
    ----------  
           790  
       
    SQL> select dbms_random.value(0, 1000) randomNum from dual; --(0-1000的浮点数)  
       
     RANDOMNUM  
    ----------  
    997.876726 

[sql] view plaincopyprint?

    SQL> select trunc(dbms_random.value(0, 1000)) randomNum from dual; --(0-1000的整数) 
      
     RANDOMNUM 
    ---------- 
           790 
      
    SQL> select dbms_random.value(0, 1000) randomNum from dual; --(0-1000的浮点数) 
      
     RANDOMNUM 
    ---------- 
    997.876726 



4、使用内部函数sys_guid() 
Sql代码 复制代码

    SQL>  select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6;   
       
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    /6bedadd5_KeyManagerFactory1  
    /ffd795c8_AddCRIF  
    TABLE_EXPORT_OBJECTS  
    /278cd3a4_CGParselet  
    KU$_REFCOL_T  
       
    SQL>  select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6;  
       
    OBJECT_NAME  
    --------------------------------------------------------------------------------  
    sun/awt/InputMethodSupport  
    V_$RESTORE_POINT  
    COLORSLIST  
    java/util/WeakHashMap$Entry  
    DBMSOUTPUT_LINESARRAY 

[sql] view plaincopyprint?

    SQL>  select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6;  
      
    OBJECT_NAME 
    -------------------------------------------------------------------------------- 
    /6bedadd5_KeyManagerFactory1 
    /ffd795c8_AddCRIF 
    TABLE_EXPORT_OBJECTS 
    /278cd3a4_CGParselet 
    KU$_REFCOL_T 
      
    SQL>  select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6; 
      
    OBJECT_NAME 
    -------------------------------------------------------------------------------- 
    sun/awt/InputMethodSupport 
    V_$RESTORE_POINT 
    COLORSLIST 
    java/util/WeakHashMap$Entry 
    DBMSOUTPUT_LINESARRAY 



注:

       在使用sys_guid() 这种方法时,有时会获取到相同的记录,即和前一次查询的结果集是一样的,查找相关资料,有些说是和操作系统有关,在windows平台下正常,获取到的数据是随机的,而在linux等平台下始终是相同不变的数据集,有些说是因为sys_guid()函数本身的问题,即sys_guid()会在查询上生成一个16字节的全局唯一标识符,这个标识符在绝大部分平台上由一个宿主标识符和进程或进程的线程标识符组成,这就是说,它很可能是随机的,但是并不表示一定是百分之百的这样。
     
       所以,为确保在不同的平台每次读取的数据都是随机的,我们大多采用使用sample函数或者DBMS_RANDOM包获得随机结果集,其中使用sample函数更常用,因为其查询时缩小了查询范围,在查询大表,且要提取数据不是很不多的情况下,会对查询速度上有明显的提高。




二、其他数据库随机取出n条记录:

1、SqlServer中随机提取数据库记录

select top n * from 表 order by newid()

--------------------------------------------------------------------------------
select top 10 * from tablename order by NEWID() 
select top 10 * from tablename order by NEWID()

2、mysql中随机提取数据库记录

Select * From 表 order By rand() Limit n

-------------------------------------------------------------------------------
select * from tablename order by rand() limit 10
select * from tablename order by rand() limit 10

3、Access中随机提取数据库记录

Select top n * FROM 表 orDER BY Rnd(id)

-------------------------------------------------------------------------------
SELECT top 10 * FROM tablename ORDER BY Rnd(FId) 
SELECT top 10 * FROM tablename ORDER BY Rnd(FId)
FId:为你当前表的ID字段名

/***文章来源:http://blog.csdn.net/songylwq/article/details/6075934***/
分享到:
评论

相关推荐

    利用ORACLE实现数据的抽样

    在Oracle中,可以通过使用`SYS_GUID()`或`DBMS_RANDOM`包来实现随机排序,从而达到随机抽样的目的。例如: ```sql SELECT * FROM (SELECT * FROM TB_PHONE_NO ORDER BY SYS_GUID()) WHERE ROWNUM ; ``` 此语句将从`...

    OGG实现ORACLE数据到大数据平台KFAKF的实时同步到KUDU数据库

    在这个特定的场景中,OGG被用来实现实时地从Oracle RAC(Real Application Clusters)环境中的源数据同步到大数据平台Kafka,最终目的地是Kafka集群中的Kudu数据库。Oracle RAC环境通常用于高可用性和负载均衡,而...

    Oracle数据挖掘入门---Oracle数据库数据挖掘,筛选,数据仓库的入门教程

    数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这些信息或知识可以用来预测趋势和未来模式,帮助决策者做出更...

    SQL随机提取N条记录

    在MySQL中,可以使用RAND()函数结合ORDER BY来实现随机抽取。例如,如果你想要从表`users`中随机抽取5条记录,可以使用以下查询: ```sql SELECT * FROM users ORDER BY RAND() LIMIT 5; ``` 这将返回一个...

    一种基于SQL的元组集随机抽取算法.pdf

    基于SQL的元组集随机抽取算法主要研究如何高效地从数据库中随机获取记录集合,避免了客户端复杂编程的低效性。在某些应用场景中,例如在线考试系统、计算机自动出题、座号安排等,需要从题库数据库中随机选取试题,...

    Oracle相关技术-解决忘记oracle管理员密码,创建只读用户语法等

    至于“随机抽取”,在Oracle中,可以使用内置的函数如`DBMS_RANDONTEGER`或`DBMS_RANDOM.VALUE`来生成随机数,然后结合SQL查询实现数据的随机抽样。例如,如果想从表中随机选取10%的数据,可以创建一个伪列并按该列...

    kettle ETL随机启动mysql-oracle间数据同步教程

    本篇教程将详细介绍如何使用kettle实现MySQL到Oracle数据库之间的数据同步,并实现随机启动调度。 ### 环境准备 在开始之前,我们需要准备合适的环境。教程中明确提到是在Windows环境下进行操作。环境准备包括: ...

    Oracle高级sql学习与练习

    25. 随机值查询处理在数据库中生成随机数据的需求,如随机数或随机抽取记录等。 在学习这些高级SQL技能的过程中,建议通过大量的实践练习,结合具体的应用场景来加深理解,从而有效地掌握这些复杂的数据库操作技术...

    oracle常用问题解答

    **问题**: 如何在Oracle中随机抽取前N条记录? **解答**: 可以使用`RAND`函数配合`RANK`函数来实现。 - **示例**: 抽取前5条记录: ```sql SELECT * FROM ( SELECT t.*, RANK() OVER (ORDER BY DBMS_RANDOM.VALUE...

    如何从数据库中随机取出10条记录的方法

    - **系统测试:** 开发过程中,需要对系统进行压力测试或功能测试,此时可以从数据库中随机抽取数据进行测试。 - **用户界面展示:** 例如新闻推荐系统、商品推荐系统等场景,需要向用户展示多样化的信息,可以采用...

    富士通内部培训ORACLE资料

    9. **随机抽取记录**:要随机抽取前N条记录,可以结合`ROWNUM`和`ORDER BY DBMS_RANDOM.VALUE`实现。 10. **指定范围抽取记录**:从N行到M行的记录可通过子查询配合`ROWNUM`实现,如 `(SELECT * FROM table WHERE ...

    Oracle EBS 开发笔记

    - **随机取前10条不同的记录**:随机抽取数据样本。 - **TRUNC函数**:截断日期或数值。 - **修改表的一些常用语法**:SQL语句用于表结构的修改。 - **舍入函数**:对数值进行四舍五入操作。 - **实现类似BREAK...

    数据仓库与数据挖掘教程

    在数据仓库与数据挖掘的结合应用中,数据仓库为数据挖掘提供稳定且结构化的数据源,而数据挖掘则从这些数据中提炼出有价值的信息。例如,零售商可以使用数据仓库整合销售数据,然后通过数据挖掘找出哪些商品经常一起...

    基于oracle的在线考试系统的设计

    题目表(QUESTION)应包含题目ID、题目内容、答案、分值等,便于随机抽取试题。最后,成绩表(SCORE)用于存储用户考试成绩,包括用户ID、考试ID、得分等字段。 二、创建视图 视图是数据库中的虚拟表,它根据用户...

    基于Oracle 10g Forms Builder 10g开发的多学科考试系统的设计与实现.pdf

    系统能自动生成试卷,并支持随机抽取题目,同时具备自动批改功能(除主观题外)。考试管理员则负责科目管理、题库管理、试卷批改等更多后台工作。 【数据库设计】是系统的关键部分,包括物理设计和逻辑设计。数据库...

    考試管理系統 ORACLE、Sql 版

    3. 随机组卷:根据预设条件,随机抽取试题组成试卷,确保每次考试的公平性。 4. 题目编辑:支持在线编辑试题内容,包括文字、图片、公式等。 四、考试管理与维护 考试管理涵盖了考试的全过程,包括考试设置、考试...

    通用的在线考试系统(jsp+struts+hibernate+oracle)130220.zip

    此外,系统的实现可能还包括用户认证与授权、试题随机抽取、考试时间限制、自动评分等功能。用户认证可能涉及登录验证,确保只有合法用户才能参与考试;试题随机抽取则增加了考试的公正性,避免同一套试题对所有考生...

    随机抽取的sql语句 每班任意抽取3名学生

    在SQL中,随机抽取数据是一项常见的任务,尤其在需要进行抽样调查或模拟随机选取时。在这个场景中,我们需要从一个包含多个班级(一至十班)的学生表中,为每个班级随机选择3名学生参与学校大扫除。这个问题可以通过...

Global site tag (gtag.js) - Google Analytics