频道栏目
首页 > 数据库 > 其他综合 > 正文
DBA分布式数据库复习总结
2019-07-21 09:21:14         来源:美国清华大学--In The Bei Jing.  
收藏   我要投稿

第一章

1、 分布式数据库的定义(P4)

物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。分布式数据库系统可以看成是计算机网络和数据库系统的有机结合。

2、 分布式数据库的两种分类方法(P7)

l 按局部DBMS的数据模型分

同构型DDBS:各个站点上数据库使用同一数据模型

同构同质型-数据模型相同,且是同一种DBMS(同一厂家)

同构异质型-数据模型相同,不是同一种DBMS

异构型DDBS :各站点上数据库的数据模型类型不同

l 按DDBS的全局控制类型分

全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点

全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。

全局控制可变型DDBS:也称主从型DDBS。分成两组站点,一组包含全局控制机制和全局控制词典,另外一组不包含。

3、分布式数据库的组成成分(两部分)(P9)

l 数据:分布式数据库的主体,包括局部数据和全局数据。

l 数据目录:数据结构的定义、全局数据的分片、分布、授权、事务恢复等描述,包括局部和全局数据目录。

4、 分布式数据库的数据分片的定义和类型(3种)(P10)

数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成。

三种类型:

l 水平分片:按特定条件把全局关系的所有元组划分成若干个互不相交的子集,对全局关系施加选择运算。

l 垂直分片:把全局关系的属性集分成若干个子集,对全局关系施加投影运算。

l 混合分片:以上两种方法的混合。

5、 分布式数据库的分布策略(4条)(P11)

数据分布:根据某种策略把数据分片所得的逻辑片断分散地存储在各个站点上.

l 集中式:所有数据都安排在同一站点上

l 分割式:所有数据只有一份,被分割成若干个逻辑片段,每个片段被放置在特定的站点

l 复制式:所有数据有多个副本,每个站点都有一个完整的数据副本

l 混合式:分割式和复制式的混合

6、 分布式数据库的模式结构(P13)

分四层:

l 全局外层:全局外模式---全局应用的用户视图。

l 全局概念层:全局概念模式---描述全局数据的逻辑结构和数据特性; 分片模式---描述全局数据的逻辑划分; 分配模式---根据数据分布策略,定义各片段的物理存放站点。

l 局部概念层:局部概念模式---各个站点上全部物理映像的集合。

l 局部内层:局部内模式---全局/本站点数据在本站点的存储描述。

7、 分布式数据库的功能模块(P.16-17)

l 查询处理模块:任务是减少查询处理的代价

l 完整性处理模块:负责维护数据库的完整性和一致性

l 调度处理模块:发布局部处理命令,管理数据传输

l 可靠性处理模块:负责监视系统的各个部分是否有故障出现。

8、 分布透明性的层次(三层P.25-26)

分布透明性也叫分布独立性,包括三个层次:

l 分片透明性:用户编写应用程序只对全局关系进行操作,不必考虑数据的逻辑分片。

l 位置透明性:也叫分配透明性。用户编写应用程序需要了解数据分片情况,但不必了解副本和各片段的站点位置情况。

l 局部数据模型透明性:不必了解站点上数据库的数据模型及其数据对象的表示性质。

第二章 DDB设计

1、DDB设计的两个方法 P39-40

l 自顶向下:(对应于DDB创建方法中的重构法)从头开始设计分布式数据库。根据系统的实现环境和用户需求,按照分布式数据库系统的设计思想和方法,采用统一的观点,从总体设计做起,包括各站点上的数据库系统,重新建立一个DDBS。可以有效解决数据一致性、完整性和可靠性问题。通常是同构异质或者同构同质的。

l 自底向上:(对应于DDB创建方法中的组合法)通过聚集现存数据库来设计分布式数据库。利用现有的计算机网络和独立存在于各个站点上的现存数据库系统,通过建立一个分布式协调管理系统,将它们集成为一个统一的DDBS。通常是异构或者同构异质。

2、 DATAID-D方法 P52

这是自顶向下设计分布式数据库的一个典型方法,增加的两个阶段:

l 分布要求分析阶段

输入:用户分布要求、全局数据概念模型、全局数据操作模式;

输出:频率表(各个站点每一应用激活次数)、划分表(各实体的潜在水平分片规则)、极化表(由一个站点发出的一给定应用访问一给定片段的频率)。

l 分布设计阶段

– 分片设计:对实体进行水平分片和垂直分片。

– 非冗余分配:利用最佳适应法,把各片段映射到使用最多的站点上。

– 冗余分配:起初使用非冗余分配,在每次迭代时,计算因增加一副本使其变成本地访问的得益与为维护该副本一致性所需要附加远程修改的损失之差值,如果是个整数,就把该副本存储到该得益站点。

– 局部模式的重新构造:重新构造片段分配站点上的局部模式。

3、数据片断分配法  P50,同时参见PPT相关部分

4、DATAID方法的应用 P55,同时参见PPT相关部分

点击复制链接 与好友分享!回本站首页
相关TAG标签 分布式 数据库
上一篇:在大学时的分布式数据库读书笔记拿出来分享
下一篇:HBaseGC的前生今世-身世篇
相关文章
图文推荐
点击排行

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 全峰安全联盟--致力于做实用的IT技术学习网站