如何快速删除100W数据

1 0

如何快速删除100W数据0

大家好我想请问下怎么快速有效的删除百万数据，情况是这样的，表A每天都会以80W左右的数据量增加，但只需要保存7天内的，7天以前的可以直接干掉，就等于说要从这几百万的数据中删除最早哪天的，大家有什么好的解决方案？？？，

我试过只删除一个小时的数据也很慢
数据库Sybase，有索引

问题补充：此表目前做插入的频率很高，后台都在以每小时3-4万的数据量增长，通过BCP命令不断往里面插数据

问题补充：系统访问此表是通过代理表访问的，7天之内的数据都会用到，建分表的话，索引就废了

问题补充：我试过每次删掉一个小时的数据，大概有3-4w左右，也要3-5分钟，感觉还是慢了点，跪求更快的方法

2012年6月06日 15:30

Sev7en_jun
3
0 0 4

22个答案按时间排序按投票排序

3 0

按天分表，然后truncate.
delete速度很慢的！

2012年6月07日 10:17

axeon
19
0 0 1

1条评论

1 0

做一个定时任务，每天运行一次，每次删除时间为7天前的所有数据。

我现在的时间序列数据就是这么干的。

2012年6月07日 03:52

mathgl
3
0 0 2

2条评论

1 0

这种应该分表了,按日期分表

起码做分区表

2012年6月06日 21:45

wendal
33
0 0 0

添加评论

0 0

create procedure delete_me
    @delete_sql varchar(5000),
    @row_count   int
as
begin
declare @rc varchar(19)
select @rc=convert(varchar,@row_count)
    print @delete_sql
    print @rc

set rowcount @row_count
begin tran
exec(@delete_sql)

while ( @@rowcount !=0 )
begin
commit tran
begin tran
exec(@delete_sql)
    end
    commit tran
    set rowcount 0
end

go

--删5000条,commit一次
exec delete_me "delete from A where START_TIME < dateadd(dy,-7,getdate()) ",5000

你可以试一下,我用这个删过800w左右的数据,速度还可以

2012年6月08日 10:54

xmx0632
50
0 0 0

3条评论

0 0

查询七天的你也可以从文件里面查啊

2012年6月08日 09:16

傲世凡尘
2
0 0 1

添加评论

0 0

不要删除，直接用新的数据覆盖老的数据。
这么做有一点需要注意，不要用id列作任何所以和排序之类的功能。

2012年6月08日 07:45

lonelybug
3
0 0 0

添加评论

0 0

按时间分区，直接truncate

可以成个定时任务，定时清理

2012年6月07日 19:33

onlylau
618
1 2 47

添加评论

0 0

做个任务，每次删5万，一会就完了

2012年6月07日 17:18

epsilonlink
30
0 0 1

添加评论

0 0

先清空表就可以了.其实删除慢也对你没影响,只要你上一周的数据有上一周的标识你不删也不会混乱.

2012年6月07日 15:52

foohsinglong
65
0 0 2

添加评论

0 0

建立分区，用truncate，
当数据量很大时，删除了很多，再删除是相当的慢的

2012年6月07日 14:14

禀圣含华
5
0 0 4

添加评论

0 0

建个JOB 凌晨自动跑就好了
按天分表？这么蛋疼的回答都有

2012年6月07日 13:18

丶枫肆
30
0 0 1

添加评论

0 0

增加一个标记, 这个标记用来标识这个数据是否被删除, 然后开一个后台进程, 明白了吧

目前我想到这是最快的

2012年6月07日 10:36

315224416
20
0 0 0

添加评论

0 0

分表分区是不错，不过以你现在这个数据量，不做也无所谓的。
删除的时候分批删，不断地commit，用存储过程有时候比直接sql语句delete要快

2012年6月07日 10:26

whiletrue
100
0 0 2

添加评论

0 0

1.建立定时任务
2.找到第N-7天开始删除，执行delete from tbl where date='N-7'
3.直到删除到库中最小时间点为止（关于最小时间点，非常容易根据定时任务得出，不用去数据库min(date)）

因为date有索引，执行精确的delete语句很快，而且任务是每天定时执行的

2012年6月07日 09:39