`

分布式查询资料

    博客分类:
  • Java
阅读更多
1、分布式查询的概念
·链接到外部数据源要做的工作只不过是:配置好链接服务器的名字、以及相应的位置和登录信息,这样 SQL Server 就可以存取链接服务器上的数据了。

·链接是一个单向配置,如果服务器A链接到服务器B,意味着A知道如何登录和访问B。而对于B而言,A只不过是另一个普通用户而已。

·链接服务器可以是 SQL Server 或者任何其他的 OLE DB 和 ODBC 数据源。只要相应的 OLE DB 提供程序或者 ODBC 驱动程序支持,分布式查询可以检索和修改(insert、delete、update)相应数据源中的数据。

·SQL Server 查询可以通过引用预先配置好的链接服务器或直接在查询代码中指定链接的方法来引用外部数据。



2、存取本地 SQL Server 上的数据库
·当你存取同一个服务器上另一个数据库中的数据时,由于处理数据时使用的是同一个 SQL Server 引擎,所以尽管所查询的数据位于本地数据库之外,这样的查询仍然不是真正的分布式查询。

·只要在被引用的表前加上数据库名,就可以存取同一个服务器上的另一个数据库了。

3、链接到外部数据源
·用企业管理器建立链接:服务器 --> 安全性 --> 链接服务器 --> 右键“新建”,链接实际上就是定义如何登录到另一个服务器。

·用 T-SQL 创建链接:

系统存储过程 作用 说明
sp_addlinkedserver 建立链接
创建链接服务器要两部分完成,建立链接和登录信息
sp_dropserver 删除链接服务器  
sp_linkedservers 显示链接服务器  
sp_addlinkedsrvlogin 建立登录信息 安全问题被分解为两部分:映射的登录和没有映射的登录
sp_droplinkedsrvlogin 删除登录信息  
sp_serveroption 链接服务器选项  
示例代码 22-1
--建立连接服务器 ms sql版本
exec sp_addlinkedserver
--要创建的链接服务器名称
'link_mssql',
--产品名称ms sql
'ms',
--ole db 字符
'sqloledb',
--数据源,要链接的服务器
'zhou'
go

--创建链接服务器上远程登录之间的映射
exec sp_addlinkedsrvlogin
'link_mssql',
'false',
null,
--远程服务器的登陆用户名
'sa',
--远程服务器的登陆密码
'sa'
go

--查询数据
select * from link_mssql.测试.dbo.学员

exec sp_linkedservers

示例代码 22-2
--建立连接服务器 access版本
exec sp_addlinkedserver
--要创建的链接服务器名称
'link_access',
--产品名称
'access',
--ole db 字符
'microsoft.jet.oledb.4.0',
--数据源
--格式:
-- 盘符:\路径\文件名
-- \\网络名\共享名\文件名 (网络版本)
'D:\wwwroot\asp\user.mdb'
go

--创建链接服务器上远程登录之间的映射
--链接服务器默认设置为用登陆的上下文进行
--现在我们修改为连接链接服务器不需使用任何登录或密码
exec sp_addlinkedsrvlogin
'link_access',
'false'
go


--查询数据
select * from link_access...admin

exec sp_linkedservers



示例代码 22-3
--建立连接服务器 excel版本
exec sp_addlinkedserver
--要创建的链接服务器名称
'link_excel',
--产品名称
'ex',
--ole db 字符
'microsoft.jet.oledb.4.0',
--数据源
--格式:
-- 盘符:\路径\文件名
-- \\网络名\共享名\文件名 (网络版本)
'D:\wwwroot\Excel\book.xls' ,
null,
--ole db 提供程序特定的连接字符串
'excel 5.0'
go

----创建链接服务器上远程登录之间的映射
--链接服务器默认设置为用登陆的上下文进行
--现在我们修改为连接链接服务器不需使用任何登录或密码
exec sp_addlinkedsrvlogin 'link_excel','false'
go


--查询数据
select * from link_excel...sheet1$


exec sp_linkedservers





4、开发分布式查询
·本地 - 分布式查询:是从外部数据源取回数据,然后在本地 SQL Server 上执行查询。由于是在本地 SQL Server 上执行查询,所以它用的是 T-SQL 语法。

·直接传递 - 分布式查询:它在外部数据源上执行查询,并把结果返回给 SQL Server 。使用传递查询的最主要的理由是为了减少服务器(外部数据源)和客户(SQL Server)之间的通信量。要注意,直接传递需要使用外部数据源上查询语法。

建立链接的方式 本地 SQL Server  外部数据源(直接传递)
链接服务器 由四部分构成的名字
由四部分构成的名字
OpenQuery()
在查询中声明链接 OpenDataSource() OpenRowSet()
示例代码 22-4 
--本地 - 分布式查询(链接服务器)
select * from link_mssql.测试.dbo.学员
select * from link_access...admin
select * from link_excel...sheet1$
--本地 - 分布式查询(在查询中声明链接)
select * from OpenDataSource('sqloledb','Data Source=zhou;User ID=sa;Password=sa').测试.dbo.学员
select * from OpenDataSource('microsoft.jet.oledb.4.0','Data Source=D:\wwwroot\asp\user.mdb;User ID=;Password=')...admin
select * from OpenDataSource('microsoft.jet.oledb.4.0','Data Source=D:\wwwroot\Excel\book.xls;User ID=;Password=')...sheet1$

--直接传递 - 分布式查询(链接服务器)
select * from OpenQuery(link_mssql,'select * from zhou.测试.dbo.学员')
select * from OpenQuery(link_access,'select * from admin')
select * from OpenQuery(link_excel,'select * from [sheet1$]')

--直接传递 - 分布式查询(在查询中声明链接)
select * from OpenRowSet('sqloledb','zhou';'sa';'sa','select * from zhou.测试.dbo.学员')
select * from OpenRowSet('microsoft.jet.oledb.4.0','D:\wwwroot\asp\user.mdb';'admin';'','select * from admin')





5、分布式事务
·事务对数据的完整性非常重要。如果在这种逻辑工作单元中包含了对本地 SQL Server 以外的数据的修改,标准的事务处理机制就无法实现事务的原子性。如果事务的执行过程中发生了错误,必须有一种机制可以回滚已完成的那部分操作,否则整个数据库会处于不一致的状态。

·SQL Server 用分布式事务处理协调器(Distributed Transaction Coordinator,DTC)来处理涉及多个服务器的事务的提交与回滚。

·分布式事务处理协调器是与 SQL Server 相互独立的服务。使用 SQL Server 服务管理器可以启动和停止 DTC。一台服务器上只能运行一个DTC实例,无论有多少 SQL Server 实例安装或者运行在这台服务器上。这个服务的执行程序是 msdtc.exe,必须在启动了DTC之后,才能执行分布式事务,否则事务就会失败。

语法 说明
set xact_abort on
begin distributed transaction
...


commit transaction
用来检查DTC服务是否可用的begin distributed transaction 命令不是必须的。因为,系统将会自动地把用begin tran 开始的事务提升为分布式事务,并在执行分布式查询时自动检查DTC是否可以用。但我们推荐使用begin distributed transaction命令,这样就可以在事务开始时检查DTC是否可用。如果DTC不可用,系统就会自动生成8501号错误。
示例代码 22-5 
set xact_abort on
begin distributed transaction
insert into
OpenRowSet('microsoft.jet.oledb.4.0','D:\wwwroot\asp\user.mdb';'admin';'','select username,password from admin')
(username,password) values ('2','henhen')
if @@error<>0
begin
rollback
raiserror('链接服务器 microsoft.jet.oledb.4.0 出错!%i',15,1,@@error)
end
insert into
OpenRowSet('microsoft.jet.oledb.4.0','D:\wwwroot\asp\user.mdb';'admin';'','select [id] from admin')
(id) values ('2')
if @@error<>0
begin
rollback
raiserror('链接服务器 sqloledb 出错!%i',15,1,@@error)
end
commit transaction

这里是网上找的,感觉他这边的sql的效率不高,但作为了解这方面的需要,就留下了。
分享到:
评论

相关推荐

    分布式数据库查询优化

    共7页,以前做课程作业时通过搜集资料、自己整理的,先介绍了分布式查询的背景和查询方法,然后引出了查询优化的目标,最后用大部分的篇幅分布式查询优化的各种方法。

    SQL专家门诊源代码--分布式查询.rar

    本资源“SQL专家门诊源代码--分布式查询.rar”提供了深入理解和实践分布式查询的宝贵资料,尤其对于SQL开发者和数据库管理员来说,这是一个非常实用的学习资源。 分布式查询是指在一个多节点、分布式数据库系统中...

    [详细完整版]分布式数据库.doc

    《分布式数据库》课程标准 (基本职业素质模块...包括分布式数据库设计、分布式查询处理与优化、分布式查询的存取优化、分 布式事务管理、分布式恢复管理、分布式并发控制、数据复制与一致性、P2P数据管理系 统、Web数

    Hadoop进行分布式计算的入门资料

    - HBase:基于Hadoop的分布式NoSQL数据库,适用于实时查询大数据。 - Hadoop优化:包括数据倾斜问题的解决、内存和磁盘使用策略的调整等。 六、实战应用 通过实际项目来巩固理论知识,例如建立一个日志分析系统,...

    分布式开发讲义 java

    通过JDBC,开发者可以编写SQL语句,执行查询、更新、插入和删除操作,从而确保数据的一致性。 3. **RMI(Remote Method Invocation)**:RMI是Java提供的一种远程对象调用机制,它允许一个Java对象调用位于不同 JVM...

    清华大学 分布式数据库课件

    这一讲将深入讨论分布式查询的优化,包括查询计划的选择、代价估算和查询执行的并行化。还会讲解如何处理分布式查询中的网络延迟和数据局部性问题。 第三讲:分布式事务与并发控制 本讲重点讲述分布式事务的管理和...

    分布式数据库第三版所有课件及相关资料 徐俊刚版

    徐俊刚版的“分布式数据库第三版”课件及相关资料提供了全面而深入的学习资源,帮助我们理解并掌握分布式数据库的核心概念、设计原理以及实际应用。 首先,分布式数据库的核心理念在于数据的分片和复制。分片是指将...

    分布式数据库系统及其应用与答案

    分布式数据库系统的关键特性包括数据分片、复制、并发控制、故障恢复和分布式查询处理等。 首先,数据分片是将数据划分为多个片段,每个片段存储在一个不同的节点上,这有助于平衡负载和优化查询性能。分片策略通常...

    分布式数据库知识资料

    2. 挑战:数据一致性维护复杂、网络延迟、分布式事务处理、跨节点查询优化等。 五、分布式数据库的实际应用 1. 大型电商平台:通过分布式数据库处理海量订单,保证交易快速、稳定。 2. 社交媒体:分散用户数据,...

    postgres分布式数据库学习资料

    【Postgres分布式数据库学习资料详解】 在当今大数据与云计算的时代,分布式数据库系统成为了支撑大规模业务应用的核心技术之一。Postgres,全称为PostgreSQL,作为一款开源的对象关系型数据库管理系统(ORM DBMS)...

    分布式数据库课件资料宝典

    这份“分布式数据库课件资料宝典”无疑是深入理解这一领域的绝佳资源。下面,我们将详细探讨分布式数据库的相关知识点。 一、分布式数据库的基本概念 分布式数据库系统是由两个或多个相互连接的局部数据库组成的,...

    分布式数据库新PPT资料.pptx

    * 分布式查询处理 * 数据复制和冗余 * 事务管理 * 数据加密和安全机制 分布式数据库系统的参考文献 -------------------------------- * TEXTBOOK * 邵佩英《分布式数据库系统及其应用》第二版 科学出版社 * M.T. ...

    分布式数据库系统-复习.doc

    分片设计 非冗余分配 冗余分配 局部模式的重新构造 分布式查询优化的准则是 。 通信费用和响应时间最短 在分布式系统中,查询代价QC= 。 I/O代价+CPU代价+通信代价 在分布式环境下,查询可分为 、 和 三种类型。 ...

    南京大学分布式系统研究生课件

    6. **分布式数据库**:讨论分布式数据库的事务处理、分布式查询优化、数据分区和复制策略。 7. **云计算与大数据**:分析云计算的基础设施,如Amazon AWS、Microsoft Azure,以及大数据处理框架如Spark、Flink。 8...

    大型分布式应用技术资料合集(涵盖Hadoop Cassandra HBase NoSQL)

    这个资料合集对于想要深入理解分布式应用技术的开发者和数据工程师来说是一份宝贵的资源。通过阅读这些书籍,读者可以学习如何设计和管理大规模分布式系统,理解各种技术的核心原理,以及如何根据业务需求选择和优化...

    分布式数据库分布式数据库.ppt

    分布式数据库分布式数据库 分布式数据库是指将数据分布式存储在多个站点上,每个站点都可以独立地处理...分布式数据库系统可以提供快速查询、容错和高可用性的优点,但是也增加了分布式事务处理和并发控制的复杂性。

    东北大学考博资料(分布式数据库)

    本资料集旨在帮助考生全面了解和学习这一主题。 分布式数据库是指数据在物理上分散存储在多个独立的节点上,但对用户来说,它表现为单一的、无差别的数据库系统。这种设计的主要目标是提高系统的可用性、可扩展性和...

    【分布式数据库】特训营学习资料.zip

    优化方面,可能会讨论索引设计、查询优化和分布式查询执行计划。监控则包括性能指标的收集、分析和调优,以确保数据库系统的稳定运行。 整个特训营的目的是让学员通过理论学习和实践操作,理解分布式数据库的设计...

    分布式数据库系统

    "第8章.ppt"虽然标题不完整,但通常会涵盖分布式数据库的其他重要主题,如查询处理和优化、分布式查询计划的生成,以及如何在分布式环境中高效执行SQL语句。 "第10章 分布式数据库系统的发展趋势"展望了分布式...

Global site tag (gtag.js) - Google Analytics