关于分布式系统超高并发写入数据库的架构设计问题(sqlserver2012)

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 10078 次

锁定老帖子主题：关于分布式系统超高并发写入数据库的架构设计问题(sqlserver2012) 精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
liuhu2967 等级: 初级会员性别: 文章: 19 积分: 40 来自: 杭州	发表时间：2014-08-08 相关推荐: 数据库架构设计与优化云原生分布式多模架构：华为云多模数据库 GeminiDB 架构与应用实践【干货】分布式内存数据库新架构，极速OLTP应用新利器分布式秒杀系统构建 MySQL性能管理及架构设计（学习笔记）更多相关推荐数据库请教一些架构上的问题，情况是这样的，是一个分布式的系统，有站点系统和中心系统组成，总共有2000个站点，每天平均每个站点大概有1500条数据要传送到中心系统，并写入数据库，每天要写入大概300万条数据到数据库，这些数据要做查询统计，读取数据的并发很小，可以不考虑，要考虑的写入并发非常高，查询统计的数据量非常大这种情况如何做设计？声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

james_lover 等级: 初级会员文章: 33 积分: 30	发表时间：2014-08-08 一天300万条数据，mysql轻轻松松吧。这300万数据高峰期1s多少条？峰值太高的话先写到一个内存队列里，再慢慢入库。没太大压力吧。
返回顶楼	回帖地址 0 0 请登录后投票

paulwong 等级: 初级会员性别: 文章: 177 积分: 60 来自: 广州	发表时间：2014-08-10 数据库的设计要考虑分区表，ORACLE的概念，不知道SQLSERVER有没有类似的东西。
返回顶楼	回帖地址 0 0 请登录后投票

evanzzy 等级: 初级会员性别: 文章: 165 积分: 70 来自: 北京	发表时间：2014-08-11 一天三百万，高峰期每秒写入估计也就200个并发，这并发量不算大的。最傻的办法：多买几台机器做集群，肯定可以。费点力气的办法：弄一个NoSql数据库，比如MongoDB或者Redis，300万个写入先写进这个NoSql数据库，然后SqlServer慢慢从这个NoSql数据库里面读出来顺序写入。还可以倒过来做：用程序去读取这些站点的数据，然后批量插入SqlServer，批量插入效率比逐条插入高不少，也能够控制系统压力。也可以从根本上解决：做个数据大集中，所有站点都直接用中心站点的数据库，不用同步！搞定。
返回顶楼	回帖地址 0 0 请登录后投票

liuhu2967 等级: 初级会员性别: 文章: 19 积分: 40 来自: 杭州	发表时间：2014-08-11 evanzzy 写道一天三百万，高峰期每秒写入估计也就200个并发，这并发量不算大的。最傻的办法：多买几台机器做集群，肯定可以。费点力气的办法：弄一个NoSql数据库，比如MongoDB或者Redis，300万个写入先写进这个NoSql数据库，然后SqlServer慢慢从这个NoSql数据库里面读出来顺序写入。还可以倒过来做：用程序去读取这些站点的数据，然后批量插入SqlServer，批量插入效率比逐条插入高不少，也能够控制系统压力。也可以从根本上解决：做个数据大集中，所有站点都直接用中心站点的数据库，不用同步！搞定。数据是从每个站点通过集线器采集上来的，不可能直接用中心站点的数据库
返回顶楼	回帖地址 0 0 请登录后投票

liuhu2967 等级: 初级会员性别: 文章: 19 积分: 40 来自: 杭州	发表时间：2014-08-11 最关键的问题是要对所有的数据做查询统计，要怎么样去优化，希望大牛们能给点建议
返回顶楼	回帖地址 0 0 请登录后投票

tracy821 等级: 初级会员性别: 文章: 10 积分: 30 来自: 成都	发表时间：2014-08-11 查询统计优化有两个方面：第一，进行sql优化；第二，对表进行分区分区，可以提交查询效率，如果有条件查询，在查询条件上建立索引（索引不能太多，索引太多影响写入效率）。
返回顶楼	回帖地址 0 0 请登录后投票

james_lover 等级: 初级会员文章: 33 积分: 30	发表时间：2014-08-13 总得先入库吧。入库后想怎么优化都行。
返回顶楼	回帖地址 0 0 请登录后投票

GavinHwa 等级: 初级会员性别: 文章: 27 积分: 60 来自: 北京	发表时间：2014-08-13 300万的数据入库的话，这个数据量不算大，也不算小。原则上来说直接入库来写也不是问题...当然这么说与你的需求是不符的。通用的做法就是使用一个消息队列，比如ActiveMQ、RocketMQ等等。然后你的1500个站点就把数据写入到消息队列里，然后开发一个多线程任务程序从消息队列里获取数据并写入到相应的统计数据库。这样子可以在多线程任务中人为控制每秒的写入量。当然除了通用做法，针对MySQL的话如果只考虑写入操作，HandlerSocket也是个不错的选择。
返回顶楼	回帖地址 0 0 请登录后投票

mathgl 等级: 初级会员性别: 文章: 1102 积分: 50 来自: HK	发表时间：2014-08-14 300万一天没什么问题。我试过　Ｐｏｓｔｇｒｅｓ．单表日产生数据２５０万。查询毫无问题。
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 综合技术版

跳转论坛: