大数据量的处理的思路 - aiyan2001 - ITeye博客

`

aiyan2001

浏览: 74703 次
性别:
来自: 上海

最近访客更多访客>>

xx5333

sailensi

sjw850623

cao_jfeng

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

chenchuan：刚刚好我也正为这个事情疑惑了，做了多次试验都没有看到走那条 ...
STRUTS2的源码分析
wubo_789：太有帮助了，多谢！
553 Could not create file
wzglovejava：为什么我把三个链接都试过了，可是我的eclipse总是报错呢。 ...
maven2 eclipse插件在线安装地址
对酒当歌，人生几何：为什么我增加一个后，JBPM4_DEPLOYPROP还是为空呢 ...
jbpm4.2的表说明(抄袭而来)
xindianshang：不知道这些序列号用过没~
window2003 标准版的序列号

大数据量的处理的思路

博客分类：

数据库

DB2 Excel Oracle CVS C

阅读更多

大数据量的处理的思路

one ask and answer------------------

引用 8 楼 william548934 的回复:
引用 1 楼 bao110908 的回复:
这问题问得，这二三十万是什么格式的数据？还是二三十万行的 INSERT 语句？

比如二三十万行有规则的数据存放在excel文件中。。。如下：
a b c d e f
a b c e f
a c d e f
a b c d e
a b c d f
................
请帮忙哦。。。

你的数据库是什么？oracle吗？

先将你的excel的文件保存为.cvs文件

orale 可以通过PLSQL-->tool>text import 导入.cvs文件的

another answer----------------------------------------

批量导入数据库~

强烈建议不要自己写程序实现，应该遵循如下原则：

1. 优先考虑使用数据库提供的批量导入命令实现，速度快，效率高（oracle 就有sqlldr命令）

2. 优先考虑使用命令行，直接导入.例如：insert table ……

3. 最后才是考虑自己写程序进行数据导入~

你就二三十万数据算什么？也不算很大量的，我曾将将200万数据导入至 db2 至花了 5秒不到的时间。

我是用的db2 批量导入的命令：

db2 "export to RPT_DIRECTORY_FILE_new_1.txt of del select * from RPT_DIRECTORY_FILE where rpt_id in('A3015','A3021','A3037','A3047')"

分享到：

BI解决方案中的工具 | jbpm4.2的表说明(抄袭而来)

2009-12-30 08:58
浏览 1024
评论(0)
分类:数据库
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

常用大数据量，海量数据处理方法，算法总结: 这些方法可以用来解决大数据量的问题，例如数据字典、判重、集合求交集等问题。 Bloom Filter Bloom filter 是一种空间效率高、查询效率高的数据结构，可以用来实现数据字典、判重、集合求交集等操作。其原理是...

Java千万级别数据生成文件思路和优化: 由于程序使用的局点数据量巨大，需要生成xml文件的客户资料接近千万级别的程度，而现场对程序的配置大约是100W条数据生成一个xml文件里面去，程序在这样的大数据量下面偶尔会有崩溃。最近几天现场催的比较紧，最近...

常用大数据量、海量数据处理方法__算法总结: 大数据量的问题是很多面试笔试中经常出现的问题，比如百度，谷歌，腾讯这样的一些涉及到海量数据的公司经常会问到。本文的一些问题基本直接来源于公司的面试笔试题目。包括Bloom filter，Hashing，bit-map，双层桶...

大数据量整数排序: 【大数据量整数排序】是计算机科学中一个重要的议题，特别是在处理海量数据的场景下。在上述描述中，我们面临的问题是需要对亿万级别的139号码进行排序，且受到内存大小的限制（300MB以内）。这个问题的挑战在于如何...

基于大数据技术的地震数据处理新思路.pdf: 其中“容量大”指的是数据量级达到TB甚至PB级别，处理的数据量相当于过去美国国家图书馆全部纸质图书的数据量。“种类多”指的是数据类型复杂多变，包括结构化、半结构化和非结构化的数据。“速度快”则强调数据处理...

自动气象站异常数据处理办法及思路.pdf: 文章不仅详述了异常数据处理的具体办法，还提供了处理思路。当自动气象站出现故障影响正点数据时，需要优先使用正点前后10分钟内的数据作为分钟数据，人工观测补测值次之，内插值最后。若异常数据影响到小时内极值和...

频谱使用评估与大数据处理思路初探.pdf: 文中提到的问题包括频谱数据的采集、底噪起伏大、数据量巨大且形式多样，以及不同频段的非连续性，这些因素都对数据处理带来了难度。目前常见的频谱数据处理方法，如固定阈值法、分段平均值法和邻值比较法，都不能很...

java对大数据量文件内容的多线程读取和排序.pdf: 在处理大数据量文件内容时，多线程读取和排序是非常重要的。下面我们将讨论如何使用 Java 对大数据量文件内容进行多线程读取和排序。首先，我们需要生成一个随机的文本文件，其中包含至少 1 亿行，每一行必须包含 ...

基于大数据分析思路的油滴实验数据处理方法.pdf: 这种方法的优势在于，它减少了人为因素对数据处理的影响，同时处理的数据量越大，结果的精确度越高。大数据分析的引入使得从海量数据中挖掘出规律成为可能，有助于提升实验数据的处理效率和结果的可信度。此外，该...

经验大数据量处理及存储代码优化过程 (2).docx: 在大数据量处理和存储的场景中，代码优化是至关重要的，以确保系统性能和响应速度。以下是从给定内容中提取的关键知识点： 1. **原始场景**：客户端上传包含手机号码的文本文件，服务端读取、验证并保存到数据库。...

数据采集和智能数据处理系统的设计思路分析.pdf: 本文将探讨数据采集处理系统的关键设计思路，并分析其在现代信息技术中扮演的角色和应用价值。首先，数据采集系统是智能数据处理的基石。它主要从各种传感器中收集物理量数据，并将这些数据转化为数字信号供后续...

大数据处理技术的总结与分析报告.docx: 1. 事务处理型操作都是细粒度操作，每次事务处理涉及数据量都很小。 2. 计算相对简单，一般只有少数几步操作组成。 3. 事务型处理操作涉及数据的增、删、改、查，对事务完整性和数据一致性要求非常高。 4. 事务性...

处理group by 查询速度太慢的问题数据量大.doc: 在实际项目中，遇到了表数据量大导致查询速度很慢的问题。通过记录和优化过程，总结出一些有价值的经验，希望能够帮助读者解决类似的问题。知识点1：Group By 查询的索引设置在优化 Group By 查询时，仅对 Group...

VC＋＋下对大量实时数据的采集处理: 针对这些问题，采用多线程处理方案可以在很大程度上缓解上述问题，从而提高系统的整体性能。 #### 三、多线程设计方案 ##### 1. 设计思路在 VC++ 中，可以通过多种方式实现串行通信，包括使用 MSComm 控件、...

基于Oracle的大数据量删除操作性能分析.pdf: 其中，大数据量删除操作是数据维护中常见且对性能影响极大的一项任务。本文聚焦于在Oracle数据库环境下，如何有效地执行大数据量删除操作，旨在分析性能问题，并提出相应的解决方案。文章开篇即提出问题：在处理...

大规模数据处理面试题: 在大规模数据处理的面试中，面试官常常会考察候选人在面对海量数据时的设计思路和解决方案。以下是一些基于给定内容的关键知识点： 1. **哈希表（Hash Table）**：哈希表是一种常用的数据结构，用于快速查找和存储...

一种基于数据湖的大数据处理机制研究.pdf: 本文将探讨数据湖的概念内涵、技术特点、体系结构、处理机制及其在大数据处理中的应用思路，期望能为行业大数据的高效共享和利用提供参考和启发。首先，我们需要了解数据湖的基本概念。数据湖是指一个能够存储海量...

SQLServer2005大数据量数据存储设计思路分享: 论坛上总看到有人说某某数据库几百万的数据量怎么提高查询速度等等，最近正好做了一个关于这方面的表结构优化，分享给大家，希望对大家有帮助。本人也不是什么大牛，只希望互相交流学习。仅为分享，不喜勿喷，谢谢。...

Spark on Yarn模式的电信大数据处理平台.pdf: 云计算、电信大数据、映射-规约（MapReduce）、Yarn框架、Spark内存计算等关键词都在文中得到了深入探讨，这些技术的结合为电信行业的大数据处理提供了新的思路和解决方案。文章还强调了大数据在电信行业中的重要...

java处理海量数据的初步解决思路: 这篇文章将探讨如何使用Java来处理大规模数据，主要关注于优化内存管理、分片处理、流式处理以及利用开源工具等方法。首先，理解Java内存管理至关重要。Java使用垃圾回收机制来自动管理内存，但这在处理大量数据时...

Global site tag (gtag.js) - Google Analytics