SIS首先是在1997年的SQL Server 7.0中引入的,当时它的名称为数据转换服务(DTS),SSIS属于ETL产品家族。SSIS提供控制流和数据流。控制流也称为工作流或者任务流,它更像工作流,在工作流中每个组件都是一个任务。这些任务是按预定义的顺序执行的。在任务流中可能有分支。当前任务的执行结果决定沿哪条分支前进。
数据流是新的概念。数据流也称为流水线,主要解决数据转换的问题。数据流由一组预定义的转换操作组成。数据流的起点通常是数据源(源表);数据流的终点通
常是数据的目的地(目标表)。可以将数据流的执行认为是一个流水线的过程,在该过程中,每一行数据都是装配线中需要处理的零件,而每一个转换都是装配线中
的处理单元。
SSIS包
包(package)是SSIS项目中基本的部署和执行单元。SSIS任务执行的所有工作都发生在包的上下文中。SSIS包是SSIS流的容器。SSIS项目可以包含多个包。包只包含一个控制流,而该控制流可以包含一个或者多个数据流。
除了控制流和数据流,包还包含了SSIS连接和包的变量。可以有不同作用域的变量,例如,作用域为整个包的全局变量或者作用域为任务序列的局部变量。
任务流
SSIS包包含一个控制流,该控制流由一组任务组成。这些任务定义了包的工作,例如,加载数据、执行SQL语句、处理脚本或者调用其他过程。在任务流中,包通常包含多个任务。多个任务是按优先权约束的顺序来进行组织的。优先权约束按以下顺序连接两个任务:执行第一个任务的结果决定是否运行第二个任务。可以在工作流中使用优先权约束来创建条件分支。可以将多个优先权约束进行组合,然后将其作为一个约束来求值。
容器
容器(container)是向包提供结构的
SSIS对象。每个包都有一个容器,用来存储包的流。包的容器可以包含其他类型的容器,例如序列容器、Foreach循环容器和For循环容器,这些容器
都可以在控制流工具箱中获得。可以在这些容器中定义子流。容器丰富了控制流的运行时执行模型。例如,并不是所有的任务都是顺序执行的。在Foreach循
环容器内部的子流将会基于容器中定义的迭代器而多次执行。
数据流
数据流也称为流水线。可以将数据流认为是装配线,该装配线包含了顺序执行的多个操作。在数据流中的每个节点都称为转换。数据流通常以源转换开始,以目标转换结束。在这两个转换之间,预定义的数据流转换被依序应用到数据上。
一些转换是同步的,例如,查找、条件性拆分和数据转换。这些同步的转换可以并行执行。一旦已经将转换应用到数据行上,则下一个转换可以开始处理该数据行,而无需等到上一级转换处理完整个数据集。一些转换是异步的,例如聚合和排序。这些转换必须从前面的输出中获得所有的行,从而可以处理和产生输出,用于后续转换。
除了预构建的转换清单,SSIS还提供了一些API,可以使用这些API来构建自己的数据流转换。例如,可以构建Numeric Processing转换来将数学计算和转换应用到流水线数据上。
数据流总是包含于任务流中。有一个特殊的任务,其名称为数据流任务,该任务是用于容纳数据流的容器。在构建数据流之前,必须将数据流任务加入到设计器中。
转换
任务是任务流的基本组件,而转换是数据流的基本组件。转换是预定义的数据操作。可以将转换视为装配线中的机器,用于对输入数据进行操作。
查看器
查看器是为了调试数据流而设计的。可以在执行期间使用查看器来查看流水线中的流。可以将查看器附加在转换之间的连线上。要增加查看器,可以在连线上右击,
然后选择“数据查看器”菜单项。默认的查看器是网格图。也可以增加直方图,散点图和圆柱图作为图形查看器。如果这些预定义的查看器还不能满足您的需求,则
您甚至可以构建自己的查看器。
调试
对SSIS控制流进行调试是在SQL Server 2005中引入的新特性。当在设计器中选择了一个任务时,只要按下F9就可以设置断点。通过调试,可以在执行期间检查包的变量的值以及任务的状态。断点可以基于事件来设置。
简单的事例:
http://www.cnblogs.com/gudujianxiao/archive/2012/02/07/2341820.html
分享到:
相关推荐
SSIS 简要介绍及使用说明 SSIS(SQL Server Integration Services)是一种企业级的 Extract、Transform、Load(ETL)工具,用于将数据从不同的数据源提取、转换、加载到目标数据库中。SSIS 是 Microsoft SQL Server...
SSIS 入门介绍及示例 SSIS(SQL Server Integration Services)是 Microsoft SQL Server 的一部分,用于生成高性能数据集成解决方案的平台。SSIS 具有可视化环境,在熟悉了 SSIS 的可视化操作后,几乎所有的 ETL ...
#### SSIS介绍 SSIS提供了一系列内置的任务、容器、转换和数据适配器,极大地简化了商业应用程序的开发过程。通过SSIS,可以实现异构数据源的合并、数据仓库和数据集市的填充、数据清洗标准化以及将业务智能嵌入到...
SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案的平台。拥有可视化环境,在熟悉了SSIS的可视化操作后,几乎你所能想得到的ETL操作都能通过简单托拽控件来加以实现。还有参数...
1. SSIS 介绍 SSIS 是一种平台,提供了多项功能,包括: * 生成和调试包的图形工具和向导 * 执行工作流函数(如 FTP 操作)、执行 SQL 语句或发送电子邮件的任务 * 提取和加载数据的数据源和目标 * 用于清理、聚合...
本文档详细介绍了如何利用SSIS从MsSql迁移到MySQL的具体步骤,包括前期准备、项目构建、任务配置以及测试与部署等关键环节。通过这些步骤,能够有效地实现两个不同数据库平台之间的数据迁移。需要注意的是,在实际...
总的来说,SSIS专题二详细介绍了如何通过性能调整来充分利用SSIS的能力,提升SQL Server的数据库维护和数据处理效率。这包括理解SSIS的维护功能,正确处理错误,熟练进行包的调试,以及有效地导入不同来源的数据。...
SSIS开发工具介绍 常用控制流控件用法介绍 SSAS控件用法介绍 SSRS开发工具介绍 开发流程 数据库和表创建 ETL设计(SSIS) 建立连接管理器 SSIS包的创建和开发设计 多维数据模型搭建(SSAS) 新建项目Analysis Services ...
本节将详细介绍如何使用SSIS将数据从SQL Server传输到Oracle数据库。 ##### 2.1 准备环境 首先确保以下环境已经准备就绪: - **安装Business Intelligence Development Studio**:这是开发SSIS包的主要工具。 - **...
### ETL工具SSIS的功能介绍 #### ETL概念与应用场景 **ETL**,即**Extract-Transform-Load**(抽取-转换-加载),是一种常用的数据处理流程,主要用于从多种数据源中抽取数据,经过一系列的数据清洗、转换操作后,...
本文将详细介绍如何一步一步部署SSIS包,包括生成安装部署文件、包部署和计划任务的配置。 首先,需要在SQL Server Business Intelligence Development Studio中打开资源管理器,右击IisLog -> [属性],打开[IisLog...
本文档将深入介绍SSIS的基本概念,并探讨如何将旧版的Data Transformation Services(DTS)包迁移到SSIS。 1. SSIS概述 SSIS的设计目标是提供一个灵活且可扩展的数据集成平台,支持多种数据源和目标,包括关系...
本文将详细介绍SSIS中时间戳的应用、VB代码使用方法、脚本使用、包配置以及SSIS的基础知识和控件使用。最后,通过实例深入理解SSIS的实际应用。 首先,我们来探讨时间戳的概念。在数据库中,时间戳是指一个自动生成...
本文档旨在介绍 SSIS 包的部署配置和执行时间的配置过程。SSIS(SQL Server Integration Services)是一种功能强大的数据集成工具,广泛应用于数据仓库、数据挖掘、数据集成等领域。本文档将详细介绍 SSIS 包的部署...
SSIS进阶技巧指南主要针对已有一定SSIS使用经验的开发者,旨在介绍一些高级功能和技巧,以帮助他们更有效地开发和管理SSIS包。例如,在进行数据导入导出操作时,可以使用内置任务和容器来简化开发流程,而无需编写...
下面将详细介绍SSIS-IDE及其主要功能。 在SSIS-IDE中,开发者可以通过拖放操作来创建和配置数据流任务,这些任务可以从各种数据源提取数据,进行清洗、转换,并加载到目标系统中。SSIS-IDE提供了图形化的界面,使得...
本文介绍了如何创建和修改 SSIS 包,如何调试 SSIS 包,以及如何使用 .Net 程序调用 SSIS 包。SSIS 是一个功能强大的数据集成工具,通过本文,读者可以快速上手 SSIS,开始自己的数据集成之旅。
《31 Days of SSIS》是一本详尽介绍了SQL Server Integration Services(SSIS)的技术指南,适用于初学者。本书由Jason Strate编写,他是一位知名的SQL Server MVP(最有价值专家),在SQL Server领域有着丰富的经验...