3亿数据快速检索实现 -

天机老人

浏览: 151432 次
性别:
来自: 北京

最近访客更多访客>>

露紫枫

daxiongzhe1

jacket233

哒哒哒点

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

3亿数据快速检索实现

博客分类：

Java

全文检索数据结构 Oracle lucene SQL Server

　　上周有个需求，就是要做一个检索库：
　　１　３亿个手机号码，并且每个号码２０个左右的属性例：地区，订阅等信息。
　　２　在最短的时候内select出来（５分钟，１０分钟）[最重要]
　　３　允许更新。对这些号码进行发送信息后，状态改变。[可以让他慢慢更新]

　　和几个同事讨论了一下，具体要注意以下几点：
　　１　如果发送下去状态改变，但是只发送一半，但状态改变了如何办？
　　２　如果多个产品线一起下发，状态会不会混乱。
　　解决以上第二个问题，决定采用，队列等待的方式。第一个问题没想到好的解决办法，回滚也想过了，但感觉不是很现实！

　　解决方案：
　　经过实验500w条的数据在用plsql直接select，只需要０.２秒，所以总体采用分表的方式，每500w条分一个表，然后同时查询！

　　但总感觉不是很好，抛砖引玉（真的很砖

）。不知道大家有没有更好的解决方案！

-----------------------------------------重新描述一下需求-------------------------------
很多人说需求不是很的清楚，这里重新整理了一下！
不过要注意的是数据库里已经有3亿个手机基数了！

一．号码入库。
不定期会有新的号码需要入库，入库需要记录号码的常规属性，如：手机号，省份，城市，入库时间，手机卡类型，是否支持彩信，号码来源情况等。

二．入库手机号源文件管理
入库手机号源文件要以文件形式保存在服务器上。

三．按需要提取号码（最关键部分）
要按照需求提取所需的号码。

例如：
提号要求：
1.此号码非黑名单用户。
2.此号码为的订购和退订用户。
3.此号码2个月内没有活动。
4.省份要求：辽宁，云南，广东
5.号段要求：137和138和139号段
6.数量要求：每个省10w
7.是否支持彩信：是（是，否，忽略三种情况）
……

最后，符合条件的号码，按照固定格式（每个手机号占一行），形成文本文件，将此文件测试号码，是否需要状态报告等信息形成最终可发送文件并提供下载功能，同时记录本次提取信息（发送时间，发送标识等）
注：文件格式如下：
139***85185#09#0
139***71283
139***33190
第1列：手机号
第2列：产品类型（#09）
第3列：是否需要状态报告（#0）

四．统计功能
一．号码情况统计
1.统计当前号码总量。
2.按照2个基本要求，统计现在库中可以使用的号码数量。
注：统计需要显示，全国总量，各省总量，各省省会总量，各省去除省会总量，各省7天未下发总量（省会与其他城市分开显示），各省可以发送总量（省会与其他城市分开显示，所以单独列出来）。

二．发送产品统计
1.按时间段、业务线等统计发送产品的情况，如：发送时间，最终发送文件等

五．黑名单及特殊号码管理
1. 添加黑名单
2. 去除黑名单
3. 过滤黑名单
4. 查询黑名单

以上除黑名单外都是迫切需要的，黑名单功能可以以后完善。

分享到：

电信行业Http接口(通道)设计思路与实现过 ... | Hibernate在oracle上主键生成策略连锁配置 ...

2009-05-23 22:14
浏览 4570
评论(83)
论坛回复 / 浏览 (83 / 46639)
分类:企业架构
查看更多

3 楼天机老人 2009-05-24

按照我们的方案，大批量的查是没啥问题！但是大批量的更新非常成问题！
速度实在是难以想象！每更新一条就要开启关闭一次事物！

所以还是想听听大家的意见！

2 楼抛出异常的爱 2009-05-24

试试数据的hash 分块根据某几位的hash值决定数据所在的DB...3亿对发号地区.对发号时间多次规范之后....

1 楼 fc6029585 2009-05-24

我觉得索引表是个很好的办法!

« 上一页 1 2 3 4 5 下一页 »

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

3亿数据快速检索实现

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

3亿数据快速检索实现

评论

发表评论

相关推荐

电信行业Http接口(通道)设计思路与实现过程

Hibernate在oracle上主键生成策略连锁配置问题（基于注解）

ＳＳH下数据库连接方式

免安装Oracle运行pl/sql developer

Http的客户端与服务端工具

Hibernate主键生成native，identity不可用,increment可以

最近访客更多访客>>