数据库原理笔记

1.jpeg

一、概论

数据库系统的核心任务是数据处理。

数据和信息是数据处理中的两个基本概念。数据是信息的一种表现形式,数据通过能书写的信息编码表示信息。

数据管理发展的三个阶段:1.人工管理阶段。2.文件管理阶段。3.数据库管理阶段.

数据库系统(DataBase Systems, DBS)是为适应数据处理需要而发展起来的一种较为理想数据处理的核心机构。

数据库(DataBase,DB)是指长期存储在计算机内、有组织的、统一管理的相关数据的集合。

数据库中存储数据具有“集成的”和“共享的”的特点。

数据库管理系统(DataBase Management System, DBMS)为用户或应用程序提供访问数据库的方法,包括数据库的建立、查询、更新及各种数据控制。

数据库管理系统的主要功能有以下五个方面:1.数据库的定义功能。2.数据库的操纵功能。3.数据库的保护功能。4.数据库的维护功能。5.数据字典(数据库系统中存放三级结构定义的数据库称为数据字典)。

数据库系统结构

为了有效组织、管理数据,提高数据库的逻辑独立性和物理独立性,美国国家标准协会为数据库设计了一个严密的三级模式体系结构,它包括外模式、概念模式和内模式。
2.jpeg
外模式:外模式又称为子模式或用户模式,是用户与数据库系统的接口,是用户能够看见和使用的局部数据逻辑结构和特征的描述。一个数据库可以有多个外模式。不同需求,外模式描述就不相同。

概念模式:概念模式又称为模式或逻辑模式,是数据库中全部数据逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库只有一个概念模式,通常一某种数据模型为基础,综合考虑所有用户的需求,并将这些需求有机的结合成一个逻辑整体。

内模式:内模式也称为存储模式或物理模式,是对数据物理结构和存储方式的描述,是数据在数据库内部的表示方式,一个数据库只有一个内模式。内模式是数据库最低一级的逻辑描述,它定义所有内部数据类型、索引和文件的组织方式,以及数据控制等方面的细节。

两级映像:为了能够实现数据库三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两级映像。

外模式/概念模式映像:对于每一个外模式,数据库系统都有一个外模式/概念模式映像,它定义了该外模式与概念模式之间的对应关系。当概念模式改变时,只需要数据库管理员对各个外模式/概念模式映像做相应的改变,就可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序可以不必修改,保证了数据与程序的逻辑独立性。

概念模式/内模式映像:该影响是唯一的,它定义了数据库的全局逻辑结构与存储结构之间的对应关系。当数据库的存储结构发生改变时,只需数据库管理员对概念模式/内模式映射做相应的改变,就可以使概念模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性。

外模式/概念模式映像一般在外模式中描述,概念模式/内模式映像一般在内模式中描述。

数据模型

数据模型(data model)包括数据库数据的结构部分、操作部分和约束条件,它是研究数据库技术的核心和基础。

数据处理的三个阶段

1.概念模型:也称信息模型,是对现实世界的认识和抽象描述,按用户的观点对数据和信息进行建模。

E-R模型是现实世界到数据世界的一个中间层,表示实体及实体间的联系。3.jpg
涉及的基本术语有:1.实体。2.实体集。3.属性。4.实体标识符。

二元关系主要有以下三种情况:1.一对一联系。2.一对多联系。3.多对多联系。

在E-R图中用矩形表示现实世界中的实体,用椭圆形表示实体的属性,用菱形表示实体间的联系。

2.逻辑模型:逻辑模型是对应于数据世界的模型,是数据库中实体及其联系的抽象描述。传统的逻辑模型有层次模型、网状模型和关系模型三种,非传统的逻辑模型有面向对象模型。

逻辑模型中的数据描述有1.字段(标记实体属性的命名单位称为字段):字段的命名往往和属性名相同。2.记录,字段的有序集合称为记录。3.文件:同一类记录的集合称为文件。4.关键码:能唯一标识文件中每个记录的字段或字段集,称为记录的关键码(简称为键)。

3.物理模型,用于描述数据在物理存储介质上的组织结构,与具体的数据库管理系统、操作系统和计算机硬件都有关系。

从概念模型到逻辑模型的转换是由数据库设计人员完成的,从逻辑模型到物理模型的转换是由数据库管理系统完成的,一般人员不必考虑物理实现的细节。

常见的数据模型:1.层次模型。2.网状模型。3.关系模型。4.面向对象模型。

二、关系型数据库基本理论

关系数据模型

关系数据结构

1.关系模式:每个关系都有一个模式,称为关系模式,由一个关系名及它的所有属性名构成。如关系模式R(A,B,C),也称关系R或关系模式R。关系中属性个数称为“元数”(arity),元组个数称为“基数”(cardinality).在关系模型中,字段称为属性,字段值称为属性值,记录类型称为关系模式。记录称为元组,元组的集合称为关系或实例。

一般用前面的大写英语字母A、B、C…表示单个属性,用后面的大写字母W、X、Y、Z表示属性集,用小写字母表示属性值。元组为行,属性为列。关系中每一个属性都有一个取值范围,称为属性的域(domain)。属性A的域用DOM(A)表示。

关系具有以下特点:

1.关系(表)可以看成是由元组(行)和属性(列)组成的二维表格。它表示一个实体的集合。

2.2.表中一行称为一个元组,可用来表示实体集中一个具体的实体。

3.表中的列称为属性,给每一列起一个名称即属性名,表中的属性名不能相同。

4.列的取值范围称为域,同列具有相同的域,不同列可以有相同域。

5.表中任意两个元组(行)不能相同。



2.键(key)

在关系型数据库中,键也称为码或关键字,它同常由一个或几个属性组成,能唯一地表示一个元组。

超键:在一个关系中,能唯一标识元组的属性或属性组称为关系的超键。

候选键:如果一个属性组能唯一标识元组,且又不含有多余的属性,那么这个属性组称为关系的候选键。

主键(PK):如果一个关系中有多个候选键,选其中的一个候选键为关系的主键。

外键(FK):若一个关系R中包含有另一个关系S的主键所对应的属性组F,则称F为R的外键。并称关系S为参照关系,关系R为依赖关系。

例如:学生关系和学院关系分别为:

学生(SNO,SNAME,SEX,AGE,SDNO)

学院(SDNO,SDNAME,CHAIR)

学生关系的主键为SNO,学院关系的主键为SDNO,在学生关系中,SDNO是他的外键。更确切的说,SDNO是学院表的主键,将它作为外键放在学生表中,实现两个表之间的联系。我们约定,在主键的属性下面加下划线,在外键的属性下面加波浪线。

3.关系模式、关系子模式和存储模式

关系模型基本上遵循数据库的三级体系结构。在关系模型中,概念模式是关系模式的集合,外模式是关系子模式的集合,内模式是存储模式的集合。

1)关系模式, 是对关系的描述,严格来讲,除了应该包含模式名以及组成该关系的诸属性名以外,还应该包含值域名和模式的主键。一个具体的关系称为一个实例。

2)关系子模式,有时,用户使用的数据不直接来自一个关系模式中的数据,而是通过外键连接从若干关系模式中抽取满足一定条件的数据,这种结构可用关系子模式实现。关系子模式是用户所需数据结构的描述,其中包括这些数据来自哪些模式和应满足哪些条件。

3)存储模式 描述了关系是如何在物理存储设备上存储的。关系存储的基本组织方式是文件。

关系运算

关系运算的特点是集合运算模式,即运算的对象和结果都是集合。

关系模型中常用的关系运算包括查询(query)、插入(insert)、删除(delete)、更新(update)。

查询运算又可以分为选择、投影、连接、除、并、差、交、笛卡儿积等。其中选择、投影、并、差、笛卡儿积是五种基本运算。

关系的完整性约束

1.域完整性约束:关系中属性A的值应该是域DOM(A)中的值,并由语义决定其能否取空值(NULL).

2.实体完整性约束:若属性(指一个或一组属性)A是基本关系R的主属性,则A不能取空值。

3.参照完整性约束:关系的外键必须是另一个关系主键的有效值或者是空值。
需要注意如下两点:1)外键和相应的主键可以不同名,只要定义在相同的域上即可。2)外键的取值是否为空值,应视具体情况而定。如果外键是相应主键的属性,则不允许外键的值为空。

4.用户定义完整性约束

-------------本文结束感谢您的阅读-------------
hao14293 wechat
交流或订阅,请扫描上方微信二维码