最新文章列表

批量作业调度、数据挖掘,这几款应该是今年 “最值得推荐” 的ETL工具了

工具传送门: Taskctl商业付费版(付费) Taskctl Web商业免费版(永久免费) Kettle(开源免费) Datastage (付费) ETL是数据仓库中的非常重要的一环,是承前启后的必要的一步。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础 ...
taskctl2012 评论(0) 有350人浏览 2020-12-11 16:26

批量kettle作业调度工具 Taskctl 调度任务监控视图

软件安装: 去公众号 "taskctl" 回复内容 "软件" 或 "领取" 即可; TASKCTL 在线应用简介:‍   Taskctl在线应用版V1.2相比C/S应用端功能完整,并精简部分操作逻辑,适合初学者体验 taskctl 产品,也能作为中小项目生产应用。 实时监控 Monitor 监控概况
taskctl2012 评论(0) 有749人浏览 2020-12-07 15:51

大数据处理常用技术有哪些?

大数据技术为决策提供依据,在政府、企业、科研项目等决策中扮演着重要的角色,在社会治理和企业管理中起到了不容忽视的作用,很多国家,如中国、美国以及欧盟等都已将大数据列入国家发展战略,微软、谷歌、百度以及亚马逊等大型企业也将大数据技术列为未来发展的关键筹码,可见,大数据技术在当今乃至未来的重要性! 大数据技术,简而言之,就是提取大数据价值的技术,是根据特定目标,经过数据收集与存储、数据筛选、算法分析 ...
lnh2017 评论(0) 有29人浏览 2018-03-13 16:50

大数据研究常用软件工具与应用场景

如今,大数据日益成为研究行业的重要研究目标。面对其高数据量、多维度与异构化的特点,以及分析方法思路的扩展,传统统计工具已经难以应对。本文针对研究人员(非技术人员)的实际情况,介绍当前大数据研究涉及的一些主要工具软件(因为相关软件众多,只介绍常用的),并进一步阐述其应用特点和适合的场景,以便于研究人员能有的放矢的学习和使用。 1.传统分析/商业统计 Excel、SPSS、SAS 这三者对于研究人员 ...
可乐瓶里的小辣椒 评论(0) 有24人浏览 2017-01-12 17:10

一张图,带你读懂 IBM 云上真实洞察数据那些事

在传统的交易数据库系统中,伴随着客户的交易行为发生,在业务系统中产生了相应的交易数据,并保存在关系型数据库系统,从而形成了业务的交易记录,各类业务应用系统都是围绕着关系型数据库打交道。 当今,大家都已看到的现实状况是: 随着越来越多面向移动(mobile-oriented)的应用被大量企业/机构所使用,很多交易数据以 JSON 文档形式产生,并保存在 NoSQL 数据库系统中。 很多企业 ...
数控小J 评论(0) 有646人浏览 2016-10-20 13:43

医疗大数据解决方案

医疗大数据生命周期 在阿斯克医疗大数据方法论中,把医疗数据的生命周期分成下图的四个象限: 第一象限:数据采集 在数据采集阶段,医院通常 ...
数控小J 评论(0) 有1457人浏览 2016-10-18 14:36

IBM 全新大数据分析平台,助力数据云化

IT架构实现云化已经是企业IT战略的大势所趋。无论是采用私有云技术还是公有云技术,都要求软件具备云环境的适应能力。作为企业最重要的数据资产,依赖于底层的数据管理软件进行有效的管理。为实现从海量数据中得到实用的知识和信息,如何高效组织数据的存储和查找的技术一直在演进。从早期的层次型数据库到关系型数据库,从SQL数据库到NoSQL数据库再到处理非结构化数据的Hadoop、图数据库等平台,一直在发展变 ...
数控小J 评论(0) 有768人浏览 2016-10-17 11:16

InfoSphere Streams——实时大数据分析平台

了解 InfoSphere Streams,它是 IBM 大数据平台的一部分。InfoSphere Streams 解决了针对能够实时处理生成的海量流数据的平台和架构的一种迫切需求。了解该产品的设计目标,它适用于哪些时机,其工作原理,以及它如何为 InfoSphere BigInsights 提供补充来执行高度复杂的分析。 来自多个来源的信息正在以难以置信的速度增长。互联网用户数量在 2015  ...
数控小J 评论(0) 有914人浏览 2016-10-13 14:14

Apache Hadoop 3.0新版本介绍及未来发展方向(内附PDF)

本文PPT来自 Hadoop研发工程师张喆、陈霄讲《Apache Hadoop 十周岁展望前方》在Strata + Hadoop World2016会议上的分享。 过去十年,Apache Hadoop从无到有,从理论概念演变到如今支撑起若干全球最大的生产集群。接下来的十年,Hadoop将继续壮大,并发展支撑新一轮的更大规模、高效和稳定的集群。 我们此次将向大家全面介绍即将到来的Apache Ha ...
数控小J 评论(0) 有747人浏览 2016-10-11 11:04

数据驱动业务——梦想成真,只差一步

长久以来,作为在信息管理领域服务多年的IBM人,就一直有个梦想:当业务人员需要分析公司的经营状况时,当市场部需要在特定时间做精准营销时, ...
数控小J 评论(0) 有856人浏览 2016-09-26 11:16

助力大数据集成,且看DataStage新玩法

一、大数据已成为企业信息供应链中的重要一环 我们对大数据的认知在前几年还仅仅停留在概念和理论中,但转眼间,你会发现身边的大数据项目如雨后春笋般拔地而起,大数据俨然成为当今热得不能再热的话题和焦点。因为Hadoop及其相关开源技术的横空出世和迅猛发展,越来越多的企业发现那些尘封已久的历史数据或每天正在以指数级产生的交易数据、日志数据和客户行为数据其实蕴藏着巨大的价值,犹如一座座尚未开发的金矿, ...
数控小J 评论(0) 有1018人浏览 2016-09-22 10:42

IBM 信息集成解决方案,让大数据处理更简单!

经过一年多来,我们每逢周三发布有关 IBM 信息集成(Information Integration & Governance 简称 IIG)的文章素材,相信大家对 IBM 公司在该领域为用户所提供 ...
数控小J 评论(0) 有1511人浏览 2016-09-14 11:19

速度收藏 | 100+篇大数据、数据分析、数据挖掘电子书免费下载!

全部都是电子书,根据书名点击进去即可进入下载页面,不用谢我,请叫我“雷锋” SQL电子书 SQL必知必会  R语言电子书 《R语言实战》《R语言与统计建模》《统计学与R读书笔记》《R实践运用》《R导论》中文版《R语言与统计分析》《R语言经典入门》《R语言 ggplot2:数据分析与图形艺术》《Learning R》复杂数据统计方法_基于R的应用》《R语言编程艺术》《时间序列分析及应用: ...
数控小J 评论(0) 有3197人浏览 2016-09-07 10:20

干货分享:CDC实时数据复制,大神教你调性能

数据实时复制任务的成与败,取决于多方面的因素,例如:被复制数据本身情况,源系统和目标系统的自身运行状况,网络通讯方面,系统架构设计和实施人员专业技术水平等等。面对复杂而艰巨的任务,IBM 公司专业化实施团队积累了丰富的经验,以下是我们这次分享的 IBM InfoSphere CDC性能调优的重点内容。 1. 明白数据复制的需求和使用场景 改善并提升数据复制作业性能是双向互动的操作,以满足业务需 ...
数控小J 评论(0) 有2738人浏览 2016-09-05 11:05

大数据时代,IBM 带你玩转大数据处理

IBM Big Replication V2.0 在今年中刚发布,是面向 Hadoop 和 Cloud 的大数据复制以及灾难备份解决方案。该产品前身是 WANdisco 公司拳头产品,WANdisco Fusion 是该 ...
数控小J 评论(0) 有642人浏览 2016-08-31 11:00

大数据时代:十大最热门的大数据技术

随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个 ...
数控小J 评论(0) 有852人浏览 2016-08-22 14:20

企业邮箱服务优化软件

我们已经进入了大数据处理时代,需要快速、简单的处理海量数据,企业邮箱服务也面临着大数据处理,海量数据处理的三个主要因素:大容量数据、多格式数据和速度。DMCTextFilter和HTMLFilter是由北京红樱枫软件有限公司研制和开发的纯文本抽出和HTML转换通用程序库产品。本产品可以从各种各样的文档格式的数据中或从插入的OLE对象中,快速抽出纯文本数据信息和转换成HTML文件。便于用户实现 ...
hyfsoft 评论(0) 有638人浏览 2014-05-27 15:51

大数据去除重复--实战(二)

           关于上一篇数据去重复的问题,在结尾的时候提到,另一种思路:在url-->hashCode 根据范围写入文件的时候,不用迭代二分法,采用平均 ...
greemranqq 评论(0) 有2912人浏览 2014-01-28 15:10

如何“打败”CAP定理(转)

CAP定理指出,一个数据库不可能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition-Tolerance)。   一致性(Consistency)是指执 ...
wbj0110 评论(0) 有923人浏览 2014-01-17 10:40

hadoop的mapreduce的一些关键点整理

hadoop的mapreduce的流程图如下:     (1)用户提交一个任务以后,该任务由JobTracker协调,先执行Map阶段(图中M1,M2和M3),然后执行Reduce阶段(图中R1和R2)。Map阶段和Reduce阶段动作都受TaskTracker监控,并运行在独立于TaskTracker的
jimmee 评论(0) 有2101人浏览 2014-01-14 23:14

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics