`
hgq0011
  • 浏览: 555265 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

百万级数据能这么干

阅读更多
    今天一上午就和供应商展开了激烈的火拼.
    我作为项目技术把关人,当然会鸡蛋里挑骨头。发现了系统的几个主要的缺陷,我觉得非常之不妥:
    1) 月结一百万甚至两百万的记录,能直接从服务上一次性拿到普通的PC机上面?
这不扯蛋吗?客户端要不程序死掉,要不内存溢出。服务器,广域网还不累个半死。
    2) 假设1)没有问题,下一步还得同时把数据写到类似银行的U盾(类似U盘)中去,如果写成功了,还得更新百万级数据的状态。U盘的速度能有多快呢?该过程会要持续很长。估计数据表都被锁定了。该表其它的用户就不能使用了。这真要命。应该分批分批的写入数据。
    3) U盘如果在系统运行过程中,如果松动或拔出,在重新插入,要把系统重启。这还不让人郁闷死?难道你把U盘拔出,还要重启操作系统?应该提供程序的健壮性。
    4) 6百个客户端直连数据库,保持长链接。这个一值保持怀疑的态度。我也写过测试,似乎没有问题,网上也说没有问题。但通常,较好的做法是在客户端和数据库中间有一个前置,由它统一处理。
    5) 客户端和服务端都通过数据库作为状态的同步。服务端根本不知道客户端处于什么状态,导致他们的数据不一致。通常都会用socket通讯,采用心跳机制。

    靠忽悠是不行的,还是要把系统设计好。价钱也不斐。
分享到:
评论
11 楼 tedeyang 2010-11-19  
我做过的项目里有个与人民银行的数据交换,他们用的是分批次的纯文本(直接用c从数据库里导出来)。
譬如201003-1.txt,201003-2.txt...
每个文本控制在10M左右,ftp传输。
简单可靠。
10 楼 skzr.org 2010-11-19  
百万级数据应该不是很多,也就250MB以内,按照一个U盘5M/s的写入速度不到一分钟;
(一般读取速度都有30M/s 10s以内足够读取了)
如果采用压缩,相信性能还有30%左右的提升!

1)2)做月结的话数据是不是不可能发生变化了,锁定表也无所谓了!因为只有自己修改这些状态,别人只是读取和查询,问题应该不大

后面的3)4)5),第3点要重启就太变态了,真的有点怀疑他们的驱动
4)5)应该问题不大了












以上只是猜想,过于理想化,请大家自动越过
9 楼 qd.zys 2010-11-19  
等着看看楼主最好咋整的、
8 楼 trydofor 2010-11-19  
抓紧写程序,截测试,做评估。
语言没有说服力,能提出该方案的,脑子进水。
与其扯淡,不如面上先拖,底下干实事。

要成功拿下,必须有替代方案,让其认可。
7 楼 oakeye 2010-11-19  
网银互连?
6 楼 joknm 2010-11-19  
不要试想着一次全部读出来写进去,可以试着分N批进行读写,这样耗的内存就不是很大了。
5 楼 抛出异常的爱 2010-11-19  
hgq0011 写道
抛出异常的爱 写道
hgq0011 写道
zhxing 写道
1) 月结一百万甚至两百万的记录,能直接从服务上一次性拿到普通的PC机上面?
不一定都要装内存啦。要不直接提供个excel 文件,自己下载。

4) 6百个客户端直连数据库,保持长链接。
和1差不多,可以先读到文件,然后让他们自己下载。


首先 1),2)要结合起来看。你可能没有理解到具体的需求。
 
一个Excel 工作表(Sheet)的最大行数为:65536。你想想要多少个sheet?,这个方案也不太好。

4) 6百个客户端直连数据库,保持长链接。
连接是指数据库的连接。要把客户端的数据实时的写入数据库。

我老婆公司是作这个的.
如果想换家试试这家
作过中信的项目.

ps:你的需求明明是上一个数据仓库
为何要实时?


谢谢抛哥,:)。由于该项目和Z F行为有关,而那家公司和Z F的关系非常好。该公司是Z F指定的,所以,,,
当然,我们已经给了明确的时间、任务,如果不能完成,我们将采用备用方案。备用方案,基本也是内定的。公司有些项目会招投标,有些也是走过场。 当然,我们会严格把关。感情是一回事,事情还是要做好。

每笔交易是实时的上传到数据库服务器。但在月末的时候要对账,就要从数据库中,把每笔交易从服务器上面,在主服务端上显示,然后写入到Ukey中。如果UKEY能写成功,同时要把状态更新回数据库。这个要事务处理。如果他们这个方案能行,写的时间也是一个非常大的问题。我正想写个例子,测试一下。


ukey根本是个笑话....
事务查出更新数据库更是扯
不如写日志.
一个批次.写二条日志.
日志一条开始写
另一条写结束
只要有开始有结束
就认为数据完整
有开始没结束或结束是error
就认为数据是不完整的.
银行还省这点小钱
拉根专线没几个钱.
4 楼 hgq0011 2010-11-19  
抛出异常的爱 写道
hgq0011 写道
zhxing 写道
1) 月结一百万甚至两百万的记录,能直接从服务上一次性拿到普通的PC机上面?
不一定都要装内存啦。要不直接提供个excel 文件,自己下载。

4) 6百个客户端直连数据库,保持长链接。
和1差不多,可以先读到文件,然后让他们自己下载。


首先 1),2)要结合起来看。你可能没有理解到具体的需求。
 
一个Excel 工作表(Sheet)的最大行数为:65536。你想想要多少个sheet?,这个方案也不太好。

4) 6百个客户端直连数据库,保持长链接。
连接是指数据库的连接。要把客户端的数据实时的写入数据库。

我老婆公司是作这个的.
如果想换家试试这家
作过中信的项目.

ps:你的需求明明是上一个数据仓库
为何要实时?


谢谢抛哥,:)。由于该项目和Z F行为有关,而那家公司和Z F的关系非常好。该公司是Z F指定的,所以,,,
当然,我们已经给了明确的时间、任务,如果不能完成,我们将采用备用方案。备用方案,基本也是内定的。公司有些项目会招投标,有些也是走过场。 当然,我们会严格把关。感情是一回事,事情还是要做好。

每笔交易是实时的上传到数据库服务器。但在月末的时候要对账,就要从数据库中,把每笔交易从服务器上面,在主服务端上显示,然后写入到Ukey中。如果UKEY能写成功,同时要把状态更新回数据库。这个要事务处理。如果他们这个方案能行,写的时间也是一个非常大的问题。我正想写个例子,测试一下。
3 楼 抛出异常的爱 2010-11-19  
hgq0011 写道
zhxing 写道
1) 月结一百万甚至两百万的记录,能直接从服务上一次性拿到普通的PC机上面?
不一定都要装内存啦。要不直接提供个excel 文件,自己下载。

4) 6百个客户端直连数据库,保持长链接。
和1差不多,可以先读到文件,然后让他们自己下载。


首先 1),2)要结合起来看。你可能没有理解到具体的需求。
 
一个Excel 工作表(Sheet)的最大行数为:65536。你想想要多少个sheet?,这个方案也不太好。

4) 6百个客户端直连数据库,保持长链接。
连接是指数据库的连接。要把客户端的数据实时的写入数据库。

我老婆公司是作这个的.
如果想换家试试这家
作过中信的项目.

ps:你的需求明明是上一个数据仓库
为何要实时?
2 楼 hgq0011 2010-11-19  
zhxing 写道
1) 月结一百万甚至两百万的记录,能直接从服务上一次性拿到普通的PC机上面?
不一定都要装内存啦。要不直接提供个excel 文件,自己下载。

4) 6百个客户端直连数据库,保持长链接。
和1差不多,可以先读到文件,然后让他们自己下载。


首先 1),2)要结合起来看。你可能没有理解到具体的需求。
 
一个Excel 工作表(Sheet)的最大行数为:65536。你想想要多少个sheet?,这个方案也不太好。

4) 6百个客户端直连数据库,保持长链接。
连接是指数据库的连接。要把客户端的数据实时的写入数据库。
1 楼 zhxing 2010-11-19  
1) 月结一百万甚至两百万的记录,能直接从服务上一次性拿到普通的PC机上面?
不一定都要装内存啦。要不直接提供个excel 文件,自己下载。

4) 6百个客户端直连数据库,保持长链接。
和1差不多,可以先读到文件,然后让他们自己下载。

相关推荐

    碳卫星资料

    其中,1A级数据包括了衍生的地球物理变量,而2级数据产品仅包括在有利的云和气溶胶条件下获得的光谱的检索、温度、CO2和水蒸气的垂直大气剖面以及气溶胶含量、反照率的标量测量、表面压力和柱平均干燥空气CO2摩尔...

    (干货)大数据:70多个网站让你免费获取大数据存储库.pdf

    :地理和空间数据 :来⾃数Google扫描的百万书籍⽂本 :财务数据,包括股票、期货等 收集许多⽂本和图⽚数据集 :HitCompanies随机取样的1万个英国公司全⾯的数据,采⽤⼈⼯智能/机器学习进⾏⾃动更新。 :包含2008...

    NE80升级IP省干网案例

    NE80支持大容量组播的线速转发,这意味着即使在网络负载极高的情况下,它也能保持高速的数据传输,而不会显著影响性能。 此外,NE80还支持区分服务(Differentiated Services, COS),这是一种QoS策略,可以根据...

    Django框架在海洋平台甲板片建造管理中的应用研究-庞达.pdf

    MySQL是一个强大的关系型数据库管理系统,能够处理百万级别的数据记录,适合在海洋平台甲板片建造这样的大型项目中使用。在Django框架的支持下,可以构建一个数据处理智能化的平台,实现对各个施工阶段数据的实时...

    经历BAT面试后总结的【高级Java后台开发面试指南】,纯净干货无废话,针对高频面试点

    Java基础 JVM原理 集合 多线程 IO ...系统设计-在AWS上扩展到数百万用户的系统 系统设计-从面试者角度设计一个系统设计题 智力题 概率p输出1,概率1-p输出0,等概率输出0和1 判断点是否在多边形内部

    68性能设计篇之-边缘计算1

    如果这些请求能在CDN(内容分发网络)的边缘节点上处理,比如验证用户资格、管理库存等,就可以显著减少数据中心的负担,提高服务响应速度,从而提升用户体验。 随着信息技术的快速发展,我们正处于一个信息化革命...

    Oracle SQL高级编程(资深Oracle专家力作,OakTable团队推荐)--随书源代码

     RIYAJ SHAMSUDEEN 专注于性能/数据恢复/电子商务的咨询公司OraInternals的首席数据库管理员和董事长。有近20年使用Oracle技术产品以及Oracle数据库管理员/Oracle数据库应用管理员的经验,是真正应用集群、性能...

    计算机一级考试试题五选择题.pdf

    3. 对于Windows 98的系统知识考察,例如:“MIPS”,这是计算机性能的一个单位,指的是每秒处理的百万级指令数。 另外,从内容中可以推断出一些与Microsoft Office应用程序相关的问题: 1. 有关Word 97的快捷键和...

    高中计算机基础知识考试题(2).pdf

    6. 计算机指令集:如ALU(算术逻辑单元)和MIPS(每秒百万指令数),ALU是CPU中的一个组件,用于处理算术和逻辑操作,而MIPS是衡量计算机性能的一个单位。 7. 计算机总线:如DMA(直接内存访问),是一种允许计算机...

    2017阿里技术年度精选01

    阿里数据库技术解读 阿里下一代数据库技术:把数据库装入容器不再是神话 接下时序数据存储的挑战书,阿里 HiTSDB 诞生了 运维 49 61 77 96 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光 如何高效排查系统故障?...

    2017阿里技术年度精选(上)

    - **需求分析**:分析了一个支持百万级用户的分布式代码托管平台所面临的挑战,包括数据一致性、版本控制、权限管理等。 - **架构设计**:介绍了该平台的整体架构设计思路,包括使用分布式版本控制系统、高性能...

    海思3518介绍

    - **加密算法**:硬件级实现AES/DES/3DES等加密算法,保护数据安全。 - **数字水印**:为视频添加不可见的数字标识,防止非法篡改。 **9. 接口资源** - **视频接口**:支持多种格式的视频输入,如8/10/12位RGB ...

    计算机系统结构教程

    此题未给出详细解答内容,但从题干可以看出这是一道涉及计算机系统结构基础知识的问题。 ##### 1.2 解析 本题考察了计算机系统中的缓存层次结构。题目给出了不同级别的缓存访问时间,并明确指出“第一级是最低的...

    电力设备和新能源行业周报:特斯拉“电池日”召开,行业格局冲击有限.pdf

    3. 成本下降预期:特斯拉的电池降本技术预计可以实现超过50%的成本下降空间,但未达到市场预期,因为市场期望的某些极具创新性的技术(如百万英里低成本电池)并未公布。 4. 自产电池:特斯拉计划在2022年达到100GWh...

    GPC-PyGC法研究共聚物的组成分布 (1997年)

    GPC的分离效果与凝胶柱填充材料、溶剂的选择有关,本文采用的凝胶柱能够分离分子量在1万至1百万之间的高分子。 分离出的不同级分经过干燥处理后,再通过裂解气相色谱法(PyGC)测定各个级分的组成。PyGC是测定共聚...

    自己动手写操作系统(含源代码).part2

    历史上的 Linux就是这么产生的,Linus Torvalds当时是一名赫尔辛基大学计算机科学系的二年级学生,经常要用自己的电脑去访问大学主机上的新闻组和邮件,为了方便读写和下载文件,他自己编写了磁盘驱动程序和文件...

    自己动手写操作系统(含源代码).part1

    历史上的 Linux就是这么产生的,Linus Torvalds当时是一名赫尔辛基大学计算机科学系的二年级学生,经常要用自己的电脑去访问大学主机上的新闻组和邮件,为了方便读写和下载文件,他自己编写了磁盘驱动程序和文件...

Global site tag (gtag.js) - Google Analytics