- 浏览: 80384 次
- 性别:
- 来自: 北京
-
最新评论
-
kimimo:
多谢
数据仓库PDF -
yxyysu:
谢谢分享。
java图形设计卷1AWT卷2swing -
wankunde:
楼主这个密码是什么啊?
JBoss+jBPM+jPDL用户开发手册_3.2.3 -
dk101:
楼主有没有答案啊?
幼升小试题 -
dk101:
说实话,这题我答不出来,不知道是现在的娃娃智商高了,还是考官对 ...
幼升小试题
文章列表
民间十要:
一表人才
两套西装
三杯酒量
四圈麻将
五方广游
六出祁山
七术打马
八口吹牛
九分努力
十分忍耐
中国人际关系以人伦为本,中国五伦:
父子有亲、君臣有义、夫妇有别、长幼有序、朋友有信。
和谐的人伦标准:
彼此关怀、共同协商、一起考虑。
人伦六大原则:
合则共利,相互依存
同时主伴,彼此礼让
发挥潜力,能者我劳
凭着良心,发出爱心
各自成长,彼此影响
分工合作,同心协力
持经达权---依据共识来权宜应变,才能制宜而不乱变
经是共识, ...
自信者总是答案的一部分,自卑者总是问题的一部分。
自信者总有一个计划,自卑者总有一个理由。
自信者说:“让我为你做件事”,自卑者说:“那不关我的事”。
自信者能看到每个问题的答案,自卑者能找出每个答案的问题。
自信者说,“这是困难的,但却是可能的”,自卑者说,“这是可能的,但却太难了”。
当自信者犯错误时,他说,“我错了”,当自卑者犯错误时,他说,“我没错”。
自信者总在做事,自卑者总在许愿。
自信者有理想,自卑者有空想。
自信者说,“我一定要做某事”,自卑者说,“某事我一定要做”。
自信者融入集体,自卑者远离集体。
自信者看到收获的幸福,自卑者看到劳作的痛苦。
自信者看到种种可能,自卑者看到重 ...
确定粒度的级别
确定轻度汇总的粒度级的第一件事是进行有根据的猜测
是将数据拿到最终用户的面前。只有当最终用户实际看到了数据之后,我们才能作出确定的回答
最终用户的态度:“既然我看到了我能够做些什么,我就能告诉你什么是真正有用的。”
一些反馈循环技巧
一些技巧来使反馈循环成为一个和谐的循环:
■ 用很小而很快的步伐建立数据仓库最初的几个部分,仔细聆听最终用户的意见。随时准备做快速的调整。
■ 如果可以使用原型工具的话应用原型法,并使用从原型中收集的观察结果而使反馈循环起作用。
■ 看看别人是怎样确定他们的粒度级别,学习一下他们的经验。
■ 与一个对整个过程了 ...
商业智能的技术体系主要有数据仓库(DW)、在线分析处理(OLAP)以及数据挖掘(DM)三部分组成。数据仓库是商业智能的基础,许多基本报表可以由此生成,但它更大的用处是作为进一步分析的数据源。数据仓库(DW)就是面向主题的、集成的、稳定的、不同时间的数据集合
1996年, Inmon 在他的专著《Building the Data Warehouse》中, 对数据仓库做了如下定义,即“面向主题的、完整的、非易失的、不同时间的、用于支持决策的数据集合”。这和传统的OLTP系统有很大的区别,它属在线分析 (OLAP)系统的范畴。面向主题的,指的是它将依据一定的主题,比如经销商、产品、定单等汇总各个O ...
数据仓库20100513
- 博客分类:
- 数据库
四、数据仓库中的粒度
粗略估算
估计数据仓库环境中的行数/空间大小
1. 对每一个已知的表:
计算一行所占字节数的
-最大估计值
-最小估计值
对一年内:
最大行数可能是多少?
最小行数可能是多少?
对五年内:
最大行数可能是多少?
最小行数可能是多少?
对表的每个键码:
该键码的大小(按字节)是多少?
一年总的最大空间=最大行大小×一年内最大行数
一年总的最小空间=最小行大小×一年内最小行数
累加索引空间
2. 对所有已知的表重复第1步。
双重或单一的粒度 ...
深入搜索引擎--海量信息的压缩、索引和查询
http://download.csdn.net/source/1736549
http://download.csdn.net/source/1736606
http://download.csdn.net/source/1736583
http://download.csdn.net/source/1736600
上面就是那个书的下载地址,有点大,他分四个包
http://www.talend.com/download.php#studio
数据仓库20100511
- 博客分类:
- 读书笔记
数据分割
当数据存放在大的物理单元中时,尤其不能达到:
■ 容易重构。
■ 自由索引。
■ 顺序扫描(若需要)。
■ 容易重组。
■ 容易恢复。
■ 容易监控。
简单地说,数据仓库的本质之一就是灵活地访问数据。如果是大块的数据,就达不到这
一要求。因而,对所有当前细节的数据仓库数据都要进行分割。
有多种数据分割的标准。例如,按:
■ 时间。
■ 商业线。
■ 地理位置。
■ 组织单位。
■ 所有上 ...
一、体系结构设计环境的层次:操作层、原子或数据仓库层、部门层、个体层
部门层常被称为“数据集市层”、O L A P层或“多维D B M S”层。
部门层典型数据是月度顾客文件。在此文件中是一张所有顾客的分类列表。
个体层数据常常是暂时的、小规模的。在个体层要做很多启发式分析。
监控数据仓库环境中的数据能取得一些重要信息,包括:
■ 识别发生了什么增长,增长发生在什么地方,增长以什么速率发生。
■ 识别正在使用什么数据。
■ 估算最终用户得到的响应时间。
■ 确定谁在实际使用数据仓库。
...
什么是CMMI?
软件能力成熟度模型(Capability Maturity Model For Software ,简称SW-CMM/CMMI),是由美国卡内基梅隆大学软件工程研究所(CMU SEI)研究出的一种用于评价软件承包商能力并帮助改善软件质量的方法,其目的是帮助软件企业对软件工程过程进行管理和改进,增强开发与改进能力,从而能按时地、不超预算地开发出高质量的软件。其所依据的想法是:只要集中精力持续努力去建立有效的软件工程过程的基础结构,不断进行管理的实践和过程的改进,就可以克服软件开发中的困难。CMM/CMMI是目前国际上最流行、最实用的一种软件生产过程标准,已经得到了国际软件 ...
《软件架构设计》读书笔记
http://uptodate.iteye.com/blog/346676
领域模型知识不足,理解不深入
鲁棒性分析?