GT CO SO DU LIEU 1

----------------------- Page 1-----------------------

UỶ BAN NHÂN DÂN THÀNH PHỐ HÀ NỘI

SỞ BƯU CHÍNH VIỄN THÔNG THÀNH PHỐ

         GIÁO TRÌNH

                CƠ SỞ DỮ LIỆU

               (Mã số giáo trình: 2CD3)

                            HÀ NỘI 2005

----------------------- Page 2-----------------------

Lời mởđầu

     Ngày nay, cơ sở dữ liệu đã có nhiều ứng dụng trong mọi hoạt động của xã

hội. Muốn thiết kế và sử dụng cơ sở dữ liệu chúng ta phải nắm được các kỹ thuật

cơ bản của cơ sở dữ liệu. Giáo trình này nhằm trình bày các kỹ thuật cơ sở của cơ

sở dữ liệu truyền thống, đó là mô hình liên kết thực thể, mô hình cơ sở dữ liệu quan

hệ. Giáo trình cũng trình bày cách thiết kế một cơ sở dữ liệu quan hệ, cách sử dụng

các phép toán đại số quan hệđể tạo, cập nh ật và truy vấn cơ sở dữ liệu và khái

niệm phụ thuộc hàm ứng dụng trong l     í thuyết thiết kế và chuẩn hóa cơ sở dữ liệu

quan hệ.

     Giáo trình cần thiết cho tất cả các đối tượng muốn tìm hiểu và thiết kế các cơ

sở dữ liệu quan hệứng dụng trong công tác quản lý.

                                             1

----------------------- Page 3-----------------------

- Tên môn học: Cơ sở dữ liệu.

- Mã số môn học: 2CD3.

- Thời gian: Lý thuyết + Bài tập 45 tiết.

- Mục tiêu: Trang bị các kiến thức cơ bản về Cơ sở dữ liệu truyền thống.

- Những kiến thức cần phải được trang bị trước khi học: không.

- Nội dung:

        Chương I:     CÁC KHÁI NIỆM CƠ BẢN VỀ CƠ SỞ DỮ LIỆU

        Chương II:    MÔ HÌNH LIÊN KẾT THỰC THỂ

        Chương III:   MÔ   HÌNH   QUAN   HỆ,   CÁC   RÀNG   BUỘC   QUAN

                      HỆ VÀ ĐẠI SỐ QUAN HỆ

        Chương IV:    PHỤ  THUỘC         HÀM     VÀ   CHUẨN      HÓA    CSDL

                      QUAN HỆ, CÁC THUẬT TOÁN THIẾT KẾ CSDL

                      QUAN HỆ

                                      2

----------------------- Page 4-----------------------

                                                  MỤC LỤC

LỜI MỞĐẦU...................................................... ERROR! BOOKMARK NOT DEFINED.

CHƯƠNG I- CÁC KHÁI NIỆM CƠ BẢN VỀ HỆ CƠ SỞDỮ LIỆU .......................... 7

    I-       Cơ sở dữ liệu ........................................................................................................... 7

        I.1-    Định nghĩa cơ sở dữ liệu ..................................................................................... 7

        I.2-     Các tính chất của một cơ sở dữ liệu.................................................................... 8

    II-      Hệ quản trị cơ sở dữ liệu ....................................................................................... 9

        II.1-        Định nghĩa hệ quản trị cơ sở dữ liệu .............................................................. 9

        II.2-        Các chức năng của một hệ quản trị cơ sở dữ liệu .......................................... 9

        II.3-        Các đặc trưng của giải pháp cơ sở dữ liệu................................................... 11

        II.4-        Ví dụ về một cơ sở dữ liệu............................................................................. 13

    III-     Mô hình cơ sở dữ liệu........................................................................................... 15

        III.1-       Các loại mô hình cơ sở dữ liệu..................................................................... 15

        III.2-       Lược đồ và trạng thái cơ sở dữ liệu.............................................................. 17

    IV-      Con người trong hệ cơ sở dữ liệu....................................................................... 18

        IV.1-        Người quản trị hệ cơ sở dữ liệu (Database Administrator – DBA).............. 18

        IV.2-        Người thiết kế cơ sở dữ liệu (Database Designer) ....................................... 18

        IV.3-        Những người sử dụng (End User)................................................................. 18

        IV.4-        Người phân tích hệ thống và lập trình  ứng dụng ......................................... 19

        IV.5-        Người thiết kế và cài đặt hệ quản trị dữ liệu................................................ 19

        IV.6-        Những người phát triển công cụ................................................................... 19

        IV.7-        Các thao tác viên và những người bảo trì .................................................... 19

    V-       Ngôn ngữ cơ sở dữ liệu và giao diện................................................................... 20

         V.1-        Các ngôn ngữ hệ quản trị cơ sở dữ liệu ....................................................... 20

         V.2-        Các loại giao diện hệ quản trị cơ sở dữ liệu ................................................ 21

    VI-      Câu hỏi ôn tập....................................................................................................... 21

CHƯƠNG II-               MÔ HÌNH THỰC THỂ - LIÊN KẾT .................................................. 23

    I-       Sử dụng mô hình quan niệm bậc cao cho việc thiết kế cơ sở dữ liệu.............. 23

    II-      Các thành phần cơ bản của mô hình ER ........................................................... 25

        II.1-        Thực thể và thuộc tính................................................................................... 25

        II.2-        Kiểu thực thể, tập th ực thể, khóa và tập giá tr ị............................................ 27

        II.3-        Kiểu liên kết, tập liên k ết và các thể hiện ..................................................... 30

        II.4-        Cấp liên k ết, tên vai trò và kiểu liên kết đệ quy ............................................ 31

        II.5-        Các ràng buộc trên các kiểu               liên kết ........................................................... 32

                                                                 3

----------------------- Page 5-----------------------

                 II.6-        Thuộc tính của các kiểu liên kết.................................................................... 33

                 II.7-        Các kiểu thực thể yếu.................................................................................... 34

             III-      Ví dụ về thiết kế mô hình ER .............................................................................. 35

                 III.1-       Xác định các kiểu thực thể, các thuộc tính và các kiểu liên kết.................... 35

             IV-       Mô hình thực thể liên kết mở rộng (mô hình EER) .......................................... 39

                 IV.1-        Lớp cha, l ớp con và s ự thừa kế..................................................................... 39

                 IV.2-        Chuyên biệt hóa, tổng quát hóa .................................................................... 40

                      IV.2.1-      Chuyên biệt hóa........................................................................................ 40

                      IV.2.2-      Tổng quát hóa........................................................................................... 42

                      IV.2.3-      Phân cấp chuyên biệt và lưới chuyên biệt................................................ 43

                      IV.2.4-       Các ràng buộc và các đặc trung của chuyên biệt hóa, tổng quát hóa....... 43

                 IV.3-        Sơđồ mô hình EER ....................................................................................... 44

             V-       Tổng kết chương và câu hỏi ôn tập..................................................................... 45

                  V.1-        Tổng kết chương............................................................................................ 45

                  V.2-        Câu hỏi ôn tập............................................................................................... 45

                  V.3-        Bài tập........................................................................................................... 46

         CHƯƠNG III-              MÔ HÌNH QUAN HỆ, CÁC RÀNG BUỘC QUAN HỆ VÀ ĐẠI SỐ

QUAN HỆ                            48

             I-        Các khái niệm của mô hình quan hệ.................................................................. 48

                 I.1-     Miền, thuộc tính, bộ và quan hệ........................................................................ 48

                 I.2-     Các đặc trưng của các quan hệ......................................................................... 50

                      I.2.1-       Thứ tự của các bộ trong một quan hệ....................................................... 50

                      I.2.2-       Thứ tự của các giá trị bên trong một bộ................................................... 51

                      I.2.3-        Các giá trị trong một bộ........................................................................... 51

                      I.2.4-       Thể hiện của một quan hệ........................................................................ 52

             II-       Các ràng buộc quan hệ, lược đồ cơ sở dữ liệu quan hệ.................................... 52

                 II.1-        Các ràng buộc miền...................................................................................... 52

                 II.2-        Ràng buộc khoá và ràng buộc trên các giá trị không xác định (null) .......... 53

                 II.3-        Cơ sở dữ liệu quan hệ và lược đồ cơ sở dữ liệu quan hệ............................. 54

                 II.4-        Toàn vẹn thực thể, toàn vẹn tham chiếu và khoá ngoài................................ 58

             III-      Các phép toán trên mô hình quan hệ................................................................. 60

                 III.1-       Các phép toán cập nh ật ................................................................................ 60

                      III.1.1-      Phép chèn (Insert) .................................................................................... 60

                      III.1.2-      Phép xoá (Delete)..................................................................................... 61

                      III.1.3-     Phép sửa đổi (Update).............................................................................. 62

                 III.2-       Các phép toán đại số quan hệ....................................................................... 62

                      III.2.1-     Phép chọn (SELECT)............................................................................... 63

                                                                            4

----------------------- Page 6-----------------------

                      III.2.2-      Phép chiếu (PROJECT)............................................................................ 65

                      III.2.3-      Phép đặt lại tên (RENAME) .................................................................... 66

                      III.2.4-      Các phép toán lý thuyết tập hợp............................................................... 67

                      III.2.5-      Phép nối (JOIN) ....................................................................................... 70

                      III.2.6-      Tập hợp đầy đủ các phép toán quan hệ.................................................... 72

                      III.2.7-      Phép chia .................................................................................................. 73

                 III.3-       Các phép toán quan hệ bổ sung.................................................................... 74

                      III.3.1-      Các hàm nhóm và các phép nhóm............................................................ 74

                      III.3.2-      Các phép toán khép kín đệ quy ................................................................ 75

                      III.3.3-      Các phép toán nối ngoài (outer join), hợp ngoài (outer union)................ 75

                 III.4-       Một số ví dụ về truy vấn trong đại số quan hệ.............................................. 76

             IV-       Chuyển đổi mô hình ER thành mô hình quan hệ.............................................. 77

                 IV.1-        Các quy tắc chuyển đổi................................................................................. 77

                 IV.2-        Chuyển đổi mô hình cụ thể............................................................................ 81

             V-        Tổng kết chương và câu hỏi ôn tập .................................................................... 81

                  V.1-        Tổng kết chương............................................................................................ 81

                  V.2-        Câu hỏi ôn tập............................................................................................... 82

                  V.3-        Bài tập........................................................................................................... 83

         CHƯƠNG IV-                PHỤ THUỘC HÀM VÀ CHUẨN HÓA CƠ SỞ DỮ LIỆU QUAN

HỆ, CÁC THUẬT TOÁN THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ................................... 86

             I-        Các nguyên tắc thiết kế lược đồ quan hệ........................................................... 86

                 I.1-     Ngữ nghĩa của các thuộc tính quan hệ.............................................................. 86

                 I.2-     Thông tin dư thừa trong các bộ và sự dị thường cập nh ật ................................ 87

                 I.3-     Các giá trị không xác định trong các bộ........................................................... 89

                 I.4-     Sinh ra các bộ giả.............................................................................................. 89

             II-       Các phụ thuộc hàm .............................................................................................. 90

                 II.1-        Định nghĩa phụ thuộc hàm............................................................................ 90

                 II.2-        Các quy tắc suy diễn đối với các phụ thuộc hàm.......................................... 93

                 II.3-        Sự tương đương của các tập ph ụ thuộc hàm ................................................ 97

                 II.4-        Các tập ph ụ thuộc hàm tối thiểu................................................................... 98

             III-      Các dạng chuẩn dựa trên khóa chính................................................................. 99

                 III.1-       Nhập môn v ề chuẩn hoá................................................................................ 99

                 III.2-       Dạng chuẩn 1.............................................................................................. 101

                 III.3-       Dạng chuẩn 2.............................................................................................. 102

                 III.4-       Dạng chuẩn 3.............................................................................................. 104

                 III.5-       Dạng chuẩn Boyce-Codd ............................................................................ 104

             IV-       Các thuật toán thiết kế cơ sở dữ liệu quan hệ và các dạng chuẩn cao hơn... 106

                                                                            5

----------------------- Page 7-----------------------

    IV.1-        Định nghĩa tổng quát các dạng chuẩn........................................................ 107

    IV.2-        Các thuật toán thiết kế lược đồ cơ sở dữ liệu quan hệ............................... 108

        IV.2.1-       Tách quan hệ và tính không đầy đủ của các dạng chuẩn ....................... 108

        IV.2.2-       Phép tách và sự bảo toàn phụ thuộc ....................................................... 109

        IV.2.3-       Phép tách và kết nối không mất mát ...................................................... 111

    IV.3-        Các phụ thuộc hàm đa trị và dạng chuẩn 4................................................ 118

        IV.3.1-      Định nghĩa phụ thuộc đa trị.................................................................... 118

        IV.3.2-       Các quy tắc suy diễn đối với các phụ thuộc hàm và phụ thuộc đa trị.... 120

        IV.3.3-       Dạng chuẩn 4.......................................................................................... 121

        IV.3.4-       Tách có tính chất nối không mất mát thành                     các quan hệ 4NF .............. 121

    IV.4-        Các phụ thuộc nối và dạng chuẩn 5 ........................................................... 122

V-       Tổng kết chương và câu hỏi ôn tập................................................................... 124

     V.1-        Tổng kết chương.......................................................................................... 124

     V.2-        Câu hỏi ôn tập............................................................................................. 125

     V.3-        Bài tập......................................................................................................... 126

                                                             6

----------------------- Page 8-----------------------

   Chương I-             CÁC KHÁI NIỆM CƠ BẢN VỀ HỆ CƠ SỞ

                                                 DỮ LIỆU

      Các cơ sở dữ liệu và các hệ cơ sở dữ liệu đã trở thành một thành phần chủ yếu

trong cuộc sống hàng ngày của xã hội hiện đại. Trong vòng một ngày con người có

thể có nhiều hoạt động cần có sự giao tiếp với cơ sở dữ liệu như: đến ngân hàng để

rút tiền và gửi tiền, đăng ký chỗ trên máy bay hoặc khách sạn, truy cập vào thư viện

đã tin học hoá để tìm sách báo, đặt mua tạp chí ở một nhà xuất bản… Tại các ngân

hàng, các cửa hàng, người ta cũng cập nhật tựđộng việc quản lý tiền bạc, hàng hoá.

      Tất   cả các   giao   tiếp   như trên  được   gọi   là   các  ứng   dụng   của   cơ sở dữ liệu

truyền thống. Trong các cơ sở dữ liệu truyền thống, hầu hết các thông tin được lưu

giữ và truy cập là văn bản hoặc số. Những năm gần đây, những tiến bộ về kỹ thuật

đã đưa đến những ứng dụng mới của cơ sở dữ liệu. Các cơ sở dữ liệu đa phương

tiện bây giờ có thể lưu trữ hình ảnh, phim và tiếng nói. Các hệ thống thông tin địa

lý có thể lưu trữ và phân tích các bản đồ, các dữ liệu về thời tiết và các ảnh vệ tinh.

Kho dữ liệu và các hệ thống phân tích trực tuyến được sử dụng trong nhiều công ty

để lấy ra và phân tích những thông tin có lợi từ các cơ sở dữ liệu rất lớn nhằm đưa

ra các quyết định. Các kỹ thuật cơ sở dữ liệu động và thời gian thực được sử dụng

trong việc kiểm tra các tiến trình công nghiệp và sản xuất. Các kỹ thuật tìm kiếm cơ

sở dữ liệu đang được áp dụng cho World Wide Web để cung cấp việc tìm kiếm các

thông tin cần thiết cho người sử dụng bằng cách duyệt qua Internet.

      Để hiểu được các cơ sở kỹ thuật của cơ sở dữ liệu chúng ta phải bắt đầu từ các

cơ sở kỹ thuật   của   cơ sở dữ liệu   truyền   thống.   Mục  đích   của   giáo   trình   này   là

nghiên cứu các cơ sở kỹ thuật đó. Trong chương này chúng ta sẽđịnh nghĩa cơ sở

dữ liệu, hệ quản trị cơ sở dữ liệu, mô hình cơ sở dữ liệu và các thuật ngữ cơ bản

khác.

I-       Cơ sở dữ liệu

      I.1-   Định nghĩa cơ sở dữ liệu

      Cơ sở dữ liệu và kỹ thuật cơ sở dữ liệu đã có ảnh hưởng rất lớn đến việc sử

dụng máy tính. Có thể nói        rằng cơ sở dữ liệu đóng vai trò quan trọng trong mọi

                                                  7

----------------------- Page 9-----------------------

lĩnh vực có sử dụng máy tính như giáo dục, thương mại, kỹ nghệ, khoa học, thư

viện,…. Thuật ngữ cơ sở dữ liệu trở thành một thuật ngữ phổ dụng.

      Một cơ sở dữ liệu là một tập hợp các dữ liệu có liên quan với nhau, được lưu

trữ trên máy tính, có nhiều người sử dụng và được tổ chức theo một mô hình. Dữ

liệu là những sự kiện có thể ghi lại được và có ý nghĩa.

      Ví dụ, để quản lý việc học tập trong một môi trường đại học, các dữ liệu là các

thông tin về sinh viên, về các môn học, điểm thi….Chúng ta tổ chức các dữ liệu đó

thành các bảng và lưu giữ chúng vào sổ sách hoặc sử dụng một phần mềm máy tính

để lưu giữ chúng trên máy tính. Ta có một tập các dữ liệu có liên quan đến nhau và

mang nhiều ý nghĩa, đó là một cơ sở dữ liệu.

     I.2-    Các tính chất của một cơ sở dữ liệu

      Một cơ sở dữ liệu có các tính chất sau:

      1. Một cơ sở dữ liệu biểu thị một khía cạnh nào đó của thế giới thực như hoạt

động của một công ty, một nhà trường, một ngân hàng… Những thay đổi của thế

giới thực phải được phản ánh một cách trung thực vào trong cơ sở dữ liệu. Những

thông tin được đưa vào trong cơ sở dữ liệu tạo thành một không gian cơ sở dữ liệu

hoặc là một “thế giới nhỏ” (miniworld) .

      2. Một cơ sở dữ liệu là một tập hợp dữ liệu liên kết với nhau một cách logic

và mang một ý nghĩa cố hữu nào đó. Một cơ sở dữ liệu không phải là một tập hợp

tuỳ tiện.

      3. Một cơ sở dữ liệu được thiết kế và được phổ biến cho một mục đích riêng.

Nó có một nhóm người sử dụng có chủđịnh và có một sốứng dụng được xác định

phù hợp với mối quan tâm của người sử dụng. Nói cách khác, một cơ sở dữ liệu có

một nguồn cung cấp dữ liệu, một mức độ tương tác với các sự kiện trong thế giới

thực và một nhóm người quan tâm tích cực đến các nội dung của nó.

      Một cơ sở dữ liệu có thể có cỡ tuỳ ý và có độ phức tạp thay đổi. Có những cơ

sở dữ liệu chỉ gồm vài trăm bản ghi (như cơ sở dữ liệu phục vụ việc quản lý lương

ở một cơ quan nhỏ), và có những cơ sở dữ liệu có dung lượng rất lớn (như các cơ

sở dữ liệu phục vụ cho việc tính cước điện thoại, quản lý nhân sự trên một phạm vi

lớn). Các cơ sở dữ liệu phải được tổ chức quản lý sao cho những người sử dụng có

thể tìm kiếm dữ liệu, cập nhật dữ liệu và     lấy dữ liệu ra khi cần thiết. Một cơ sở dữ

liệu có thểđược tạo ra và duy trì một cách thủ công và cũng có thểđược tin học

                                                8

----------------------- Page 10-----------------------

hoá.   Một   cơ sở dữ liệu   tin   học   hoá được   tạo   ra   và   duy   trì   bằng   bằng   một   nhóm

chương trình ứng dụng hoặc bằng một hệquản trị cơ sở dữ liệu.

II-      Hệ quản trị cơ sở dữ liệu

      II.1-  Định nghĩa hệ quản trị cơ sở dữ liệu

      Một hệ quản trị cơ sở dữ liệu là một tập hợp chương trình giúp cho người sử

dụng tạo ra, duy trì và khai thác một cơ sở dữ liệu. Nó là một hệ thống phần mềm

phổ dụng, làm dễ quá trình định nghĩa, xây dựng và thao tác cơ sở dữ liệu cho các

ứng dụng khác nhau.

      Định nghĩa một cơ sở dữ liệu bao gồm việc đặc tả các kiểu dữ liệu, các cấu

trúc và các ràng buộc cho các dữ liệu sẽđược lưu trữ trong cơ sở.

      Xây dựng một cơ sở dữ liệu là quá trình lưu trữ các dữ liệu trên các phương

tiện lưu trữđược hệ quản trị cơ sở dữ liệu kiểm soát.

      Thao tác một cơ sở dữ liệu bao gồm các chức năng như truy vấn cơ sở dữ liệu

để lấy ra các dữ liệu cụ thể, cập nhật cơ sở dữ liệu để phản ánh các thay đổi trong

thế giới nhỏ và tạo ra các báo cáo từ các dữ liệu.

      Các hệ quản trị cơ sở dữ liệu dùng để thể hiện một cơ sở dữ liệu tin học hoá có

thể là phổ dụng (là một phần mềm đóng gói) hoặc có thể là chuyên dụng (là một

tập các phần mềm được tạo ra với một mục đích riêng).

      Người ta gọi cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu bằng một thuật ngữ

chung là hệ cơ sở dữ liệu. Môi trường của một hệ cơ sở dữ liệu được mô tả bằng

hình vẽ dưới đây (hình I-1).

      II.2-   Các chức năng của một hệ quản trị cơ sở dữ liệu

      Một hệ quản trị cơ sở dữ liệu hiện nay có các chức năng sau :

      1.  Lưu trữ các định nghĩa, các mối liên kết dữ liệu (gọi là siêu dữ liệu) vào

một từđiển dữ liệu. Các chương trình truy cập đến cơ sở dữ liệu làm việc thông

qua hệ quản trị cơ sở dữ liệu. Hệ quản trị cơ sở dữ liệu sử dụng dữ liệu trong từ

điển dữ liệu để tìm kiếm các cấu trúc thành phần dữ liệu và các mối liên kết được

yêu cầu. Mọi sự thay đổi trong các tệp cơ sở dữ liệu sẽđược tựđộng ghi lại vào từ

điển dữ liệu. Như vậy, hệ quản trị cơ sở dữ liệu giải phóng người sử dụng khỏi việc

lập trình cho các mối liên kết phức tạp trong mỗi chương trình, việc sửa đổi các

                                                   9

----------------------- Page 11-----------------------

chương trình truy cập đến tệp cơ sở dữ liệu đã bị sửa đổi. Nói cách khác, hệ quản

trị cơ sở dữ liệu loại bỏ sự phụ thuộc giữa dữ liệu và cấu trúc ra khỏi hệ thống.

                             Người sử dụng / Người lập trình

                            Chương trình ứng dụng / Truy vấn

                                       Phần mềm xử lý

                                  Truy vấn / Chương trình

                                Phần mềm truy cập đến các

                                    dữ liệu được lưu trữ

                  Định nghĩa cơ sở dữ

                                                            Cơ sở dữ liệu

                  liệu (Siêu dữ liệu )

                            ình I-1. Môi trường hệ cơ sở dữ liệu

      2.  Tạo   ra   các   cấu   trúc   phức   tạp   theo   yêu   cầu  để lưu   trữ dữ liệu.   Nó   giúp

người sử dụng làm nhiệm vụ khó khăn là định nghĩa và lập trình cho các đặc trưng

vật lý của dữ liệu.

      3.  Biến đổi các dữ liệu được nhập vào để phù hợp với các cấu trúc dữ liệu ở

điểm 2. Như vậy, hệ quản trị cơ sở dữ liệu giúp người sử dụng phân biệt dạng logic

và dạng vật lý của dữ liệu. Bằng việc duy trì sựđộc lập dữ liệu, hệ quản trị cơ sở dữ

liệu chuyển các yêu cầu logic thành các lệnh định vị một cách vật lý và lấy ra các

dữ liệu yêu cầu. Điều đó cũng có nghĩa là hệ quản trị cơ sở dữ liệu tạo khuôn dạng

                                                   10

----------------------- Page 12-----------------------

cho các dữ liệu được lấy ra để làm cho nó phù hợp với mong muốn logic của người

sử dụng.

      4.  Tạo ra một hệ thống bảo mật và áp đặt tính bảo mật và riêng tư trong cơ sở

dữ liệu.

      5.  Tạo ra các cấu trúc phức tạp cho phép nhiều người sử dụng truy cập đến

dữ liệu

      6.  Cung cấp các thủ tục sao lưu và phục hồi dữ liệu đểđảm bảo sự an toàn và

toàn vẹn dữ liệu.

      7.  Xúc tiến và áp đặt các quy tắc an toàn để loại bỏ vấn đề toàn vẹn dữ liệu.

Điều đó cho phép ta làm tối thiểu sự dư thừa dữ liệu và làm tối đa tính nhất quán

dữ liệu.

      8.  Cung   cấp   việc   truy   cập   dữ liệu   thông   qua   một   ngôn   ngữ truy   vấn.   Một

ngôn ngữ truy vấn là một ngôn ngữ phi thủ tục cho phép người sử dụng chỉ ra cái gì

cần   phải làm mà không cần phải chỉ ra nó được làm như thế nào. Các hệ quản trị

cơ sở dữ liệu cũng cung cấp việc truy cập dữ liệu cho những người lập trình thông

qua các ngôn ngữ thủ tục.

      II.3-   Các đặc trưng của giải pháp cơ sở dữ liệu

      Trước khi khái niệm cơ sở dữ liệu ra đời, hệ thống tệp (file) là một phương

pháp được áp dụng trong việc quản lý. Một tệp có thểđược xem là một cặp hồ sơ

lưu trữ các thông tin liên quan đến từng công việc riêng biệt. Ví dụ, trong một cơ

quan, bộ phận tài vụ sẽ có một cặp hồ sơ liên quan đến lương của các nhân viên, bộ

phận tổ chức có cặp hồ sơ liên quan đến vấn đề nhân sự… Việc xử lý để lấy ra các

thông tin như là các thống kê về lương, về quá trình công tác… lúc đầu được thực

hiện một cách thủ công. Dần dần, khối lượng thông tin ngày càng lớn, việc xử lý

thông tin ngày càng phức tạp, người ta sử dụng máy tính vào việc quản lý. Các cặp

hồ sơđược chuyển thành các tệp trên máy tính và việc xử lý thông tin được thực

hiện bằng cách lập trình (trong một ngôn ngữ lập trình thế hệ 3).

      Việc quản lý theo giải pháp hệ thống tệp có rất nhiều nhược điểm. Thứ nhất,

đó là sự dư thừa thông tin: cùng một thông tin được lưu trữ nhiều lần (chẳng hạn,

danh sách nhân viên có mặt trong tệp lương và cũng có mặt cả trong tệp nhân sự).

Điều đó gây ra việc lãng phí bộ nhớ và dễ gây sai sót trong khi cập nhật dữ liệu, dễ

sinh   ra   các   dữ liệu   không  đúng  đắn.   Thứ hai,  đó   là   việc   phụ thuộc   giữa   chương

                                                   11

----------------------- Page 13-----------------------

trình ứng dụng và dữ liệu. Mỗi khi có sự thay đổi cấu trúc tệp và các dữ liệu trong

tệp, chương trình ứng dụng khai thác thông tin trên tệp đó cũng thay đổi theo. Điều

đó gây ra khó khăn lớn cho việc bảo trì.

     Giải pháp cơ sở dữ liệu ra đời đã giải quyết được những nhược điểm đó. Cụ

thể, giải pháp cơ sở dữ liệu có những đặc trưng sau:

     1. Bản chất tự mô tả của hệ cơ sở dữ liệu.

     Một đặc trưng cơ bản của giải pháp cơ sở dữ liệu là hệ thống cơ sở dữ liệu

không chỉ gồm có bản thân cơ sở dữ liệu mà còn có cảđịnh nghĩa hoặc mô tảđầy

đủ về cấu trúc cơ sở dữ liệu và các ràng buộc. Định nghĩa này được lưu trữ trong từ

điển hệ thống, nó chứa các thông tin như là cấu trúc của mỗi tệp, kiểu và dạng lưu

trữ của từng mục dữ liệu. Các thông tin được lưu giữ trong từđiển gọi là siêu dữ

liệu (meta-data) và chúng mô tả cấu trúc của dữ liệu nguyên thuỷ (hình I-1). Phần

mềm hệ quản trị cơ sở dữ liệu và những người sử dụng cơ sở dữ liệu sử dụng từ

điển để lấy thông tin về cấu trúc của cơ sở dữ liệu.

     2. Sựđộc lập giữa chương trình và dữ liệu.

     Trong hệ thống tệp, cấu trúc của các tệp cơ sở dữ liệu được nhúng vào trong

các chương trình truy cập, vì vậy bất kỳ một thay đổi nào về cấu trúc của một tệp

cũng đòi hỏi phải thay đổi tất cả các chương trình truy cập đến tệp đó. Ngược lại,

các chương trình truy cập của hệ quản trị cơ sở dữ liệu không đòi hỏi việc thay đổi

như thế. Cấu trúc của các tệp dữ liệu được lưu trữ trong từđiển tách rời với các

chương trình truy cập. Tính chất này gọi là sựđộc lập dữ liệu – chương trình.

     3. Hỗ trợ các khung nhìn dữ liệu nhiều thành phần.

     Một cơ sở dữ liệu có nhiều người sử dụng, mỗi một người có thểđòi hỏi một

phối cảnh hoặc một khung nhìn (view) khác nhau. Một khung nhìn có thể là một

tập con của cơ sở dữ liệu hoặc nó có thể chứa các dữ liệu ảo, đó là các dữ liệu được

trích ra từ các tệp cơ sở dữ liệu khác nhau nhưng không được lưu trữ một cách rõ

ràng. Một hệ quản trị cơ sở dữ liệu nhiều người sử dụng phải cung cấp nhiều công

cụđểđịnh nghĩa các khung nhìn nhiều thành phần.

     4. Chia sẻ dữ liệu và nhiều người sử dụng.

     Một hệ quản trị cơ sở dữ liệu nhiều người sử dụng phải cho phép nhiều người

sử dụng truy cập  đồng thời đến cơ sở dữ liệu. Hệ quản trị cơ sở dữ liệu phải có

phần mềm kiểm tra cạnh tranh đểđảm bảo rằng các người sử dụng cập nhật đến

                                             12

----------------------- Page 14-----------------------

cùng một cơ sở dữ liệu phải được thực hiện theo cách được kiểm tra để cho kết quả

của các cập nhật là đúng đắn.

     II.4-  Ví dụ về một cơ sở dữ liệu

     Chúng ta hãy xem xét một cơ sởdữ liệu mà nhiều người đã quen biết: cơ sở

dữ liệu TRƯỜNG. Cơ sở dữ liệu này lưu giữ các thông tin liên quan đến sinh viên,

các môn học, điểm… trong một môi trường đại học. Cơ sở dữ liệu được tổ chức

thành   5  bảng,  mỗi   bảng  lưu  trữ  các  bản  ghi  dữ  liệu  cùng  một  kiểu.  Bảng

SINHVIÊN lưu giữ dữ liệu về các sinh viên, bảng MÔNHỌC lưu giữ các dữ liệu

về các môn học, bảng HỌCPHẦN lưu giữ các dữ liệu về các học phần của các môn

học,   bảng  ĐIỂM   lưu   giữđiểm   của   từng   học   phần   của   các   sinh   viên   và   bảng

BIẾTTRƯỚC lưu giữ thông tin về các môn học cần biết trước của các môn học.

Cấu trúc của cơ sở dữ liệu và một vài mẫu dữ liệu    ví dụđược trình bày ở hình I-2.

  SINHVIÊN          MãsốSV        HọtênSV               Lớp           Chuyênngành

                    17           Nguyễn Nam            K45T          Tinhọc

                   8             Lê Bắc                K45C          CôngnghệTT

 MÔNHỌC             MãsốMH       TênMH                 Sốđvht         Khoa

                    101          Tinhọc cơ sở           8            Công nghệ

                    102          Cấu trúc DL và GT     5             Công nghệ

                    103          Toán rời rạc          5             Công nghệ

                    104          Cơ sở dữ liệu         3             Công nghệ

 HỌCPHẦN         MãsốHP       MãsốMH        Họckỳ       Năm           Têngiáoviên

                1011          101          1             2001        Vân

                1012          101          2             2002        Vân

                1031          103          1             2001        Hoàng

                1032          103          2             2002        Hoàng

                1020          102          3             2002        Lân

                1040          104          4             2002        Huy

                                             13

----------------------- Page 15-----------------------

 ĐIỂM               MãsốSV          MãsốHP        Điểm

                   17              1031            8

                   17              1020           6

                   8               1031           9

                   8               1011            10

                   8               1020           7

                   8               1040           9

 BIẾ  TRƯỚC         Mã sốMH               MãsốMHbiếttrước

     T

                   104                    102

                   104                    103

                   102                    101

                          Hình I-2. Cơ sở dữ liệu TRƯỜNG

     Đểđịnh nghĩa cơ sở dữ liệu này, chúng ta phải chỉ ra cấu trúc của các bản ghi

của mỗi tệp (bảng) bằng cách đặc tả các kiểu khác nhau của các phần tử dữ liệu sẽ

được lưu trữ trong mỗi bản ghi. Theo hình I-2 , mỗi bản ghi SINHVIÊN bao gồm

các dữ liệu  để biểu diễn Mã số sinh viên, Họ tên sinh viên, Lớp, Chuyên ngành.

Mỗi   bản   ghi   MÔNHỌC   bao   gồm   các   dữ liệu  để biểu   diễn   Tên   môn   học,   Mã   số

môn học, Sốđơn vị học trình, Khoa,… Chúng ta phải chỉ ra một kiểu dữ liệu cho

mỗi phần tử dữ liệu bên trong các bản ghi. Ví dụ, ta có thểđặc tả Họ tên sinh viên

là   một   dãy   ký   tự có  độ dài   nhỏ hơn   hoặc   bằng   30,   Mã   số sinh   viên   là   một   số

nguyên,….

     Đểxây dựng cơ sở dữ liệu TRƯỜNG, chúng ta lưu giũ các dữ liệu  để biểu

diễn mỗi sinh viên, mỗi môn học,… vào các tệp thích hợp. Để ý rằng các bản ghi

trong các tệp khác nhau có thể có mối quan hệ với nhau. Ví dụ, bản ghi đối với

Nguyễn Nam trong tệp SINHVIÊN có liên quan đến hai bản ghi trong tệp ĐIỂM.

Các bản ghi này chỉ ra điểm của Nguyễn Nam trong hai học phần. Tương tự như

vậy, các bản ghi trong tệp có mối quan hệ với các bản ghi trong tệp MÔNHỌC…

Thông thường một cơ sở dữ liệu chứa nhiều kiểu bản ghi và chứa nhiều mối quan

hệ giữa các tệp.

                                              14

----------------------- Page 16-----------------------

      Thao tác cơ sở dữ liệu bao gồm việc truy vấn và cập nhật cơ sở dữ liệu. Truy

vấn cơ sở dữ liệu là đưa ra các yêu cầu đối với cơ sở dữ liệu để lấy ra các thông tin

cần thiết. Ví dụ, chúng ta có thể có các truy vấn như: “Liệt kê các môn học và điểm

thi của sinh viên Nguyễn Nam”, “ Đưa ra danh sách các sinh viên thi trượt môn cơ

sở dữ liệu”. Cập nhật cơ sở dữ liệu bao gồm việc thêm vào cơ sở dữ liệu bản ghi,

xoá bỏ các bản ghi hoặc sửa đổi các giá trị trong các bản ghi. Các truy vấn và các

cập   nhật   phải  được đặc   tả trong   ngôn   ngữ hệ cơ sở dữ liệu   một   cách   chính   xác

trước khi chúng được xử lý.

III-     Mô hình cơ sở dữ liệu

      Các loại cấu trúc cơ sở dữ liệu và       mối liên hệ giữa chúng đóng vai trò rất lớn

trong việc xác định tính hiệu quả của hệ quản trị cơ sở dữ liệu. Vì vậy, thiết kế cơ

sở dữ liệu trở thành hoạt động chính trong môi trường cơ sở dữ liệu.

      Việc thiết kế cơ sở dữ liệu được thực hiện đơn giản hơn nhiều khi ta sử dụng

các mô hình. Các mô hình là sự trừu tượng đơn giản của các sự kiện trong thế giới

thực. Các trừu tượng như vậy cho phép ta khảo sát các đặc điểm của các thực thể và

các mối liên hệđược tạo ra giữa các thực thểđó. Việc thiết kế các mô hình tốt sẽ

đưa ra các cơ sở dữ liệu tốt và trên cơ sởđó sẽ có các ứng dụng tốt. Ngược lại, mô

hình không tốt sẽđưa đến thiết kế cơ sở dữ liệu tồi và dẫn đến các ứng dụng không

đúng.

      Một mô hình cơ sở dữ liệu là một tập hợp các khái niệm dùng để biểu diễn

các cấu trúc của cơ sở dữ liệu. Cấu trúc của một cơ sở dữ liệu là các kiểu dữ liệu,

các mối liên kết và các ràng buộc phải tuân theo trên các dữ liệu. Nhiều mô hình

còn có thêm một tập hợp các phép toán cơ bản đểđặc tả các thao tác trên cơ sở dữ

liệu.

      III.1-  Các loại mô hình cơ sở dữ liệu

      Có rất nhiều mô hình dữ liệu đã được đề nghị. Chúng ta có thể phân loại các

mô hình dữ liệu dựa trên các khái niệm mà chúng sử dụng để mô tả các cấu trúc cơ

sở dữ liệu.

      Các mô hình dữ liệu bậc cao hoặc mô hình dữ liệu mức quan niệm cung cấp

các khái niệm gắn liền với cách cảm nhận dữ liệu của nhiều người sử dụng. Các mô

hình này tập trung vào bản chất logic của biểu diễn dữ liệu, nó quan tâm đến cái

được biểu diễn trong cơ sở dữ liệu chứ không phải cách biểu diễn dữ liệu.

                                                  15

----------------------- Page 17-----------------------

      Các mô hình dữ liệu bậc thấp hoặc các mô hình dữ liệu vật lý cung cấp các

khái niệm mô tả chi tiết về việc các dữ liệu được lưu trữ trong máy tính như thế

nào. Các khái niệm do mô hình dữ liệu vật lý cung cấp nói chung có ý nghĩa đối

với   các   chuyên   gia   máy   tính   chứ không   có   ý   nghĩa   mấy  đối   với   người   sử dụng

thông thường. Ở giữa hai loại mô hình này là một lớp các mô hình dữ liệu thể hiện,

chúng cung cấp những khái niệm mà người sử dụng có thể hiểu được và không xa

với cách tổ chức dữ liệu bên trong máy tính. Người ta còn gọi loại mô hình dữ liệu

này là loại mô hình dữ liệu mức logic. Các mô hình dữ liệu thể hiện che giấu một số

chi tiết về việc lưu trữ dữ liệu nhưng có thểđược cài đặt trực tiếp trên hệ thống máy

tính.

      Trong chương II, chúng ta sẽ nghiên cứu một mô hình dữ liệu mức quan niệm,

mô hình thực thể - liên kết, gọi tắt là mô hình ER (Entity – Relationship Model).

Mô hình này sử dụng các khái niệm thực thể, thuộc tính, mối liên kết, để diễn đạt

các đối tượng của thế giới thực. Một thực thể diễn đạt một đối tượng hoặc một khái

niệm của thế giới thực. Ví dụ, một thực thể là một nhân viên hoặc một dự án được

mô tả trong cơ sở dữ liệu. Một thuộc tính diễn đạt một đặc trưng nào đó của thực

thể. Chẳng hạn,     họ tên, lương… là các thuộc tính của thực thể nhân viên. Một mối

liên kết giữa hai hay nhiều thực thể diễn đạt một mối quan hệ qua lại giữa các thực

thể. Ví dụ, giữa thực thể nhân viên và thực thể dự án có mối liên kết            một nhân viên

làm việc trên một dự án. Mô hình dữ liệu hướng đối tượng cũng là một mô hình dữ

liệu bậc cao. Nó sử dụng các khái niệm như lớp, phương thức, thông điệp… Bạn

đọc có thể tìm hiểu về mô hình này trong các tài liệu [1], [2].

      Các mô hình dữ liệu thể hiện là các mô hình được sử dụng thường xuyên nhất

trong các hệ cơ sở dữ liệu thương mại. Ba mô hình nổi tiếng thuộc loại này là mô

hình quan hệ, mô hình mạng và mô hình phân cấp. Các mô hình mạng và phân cấp

ra đời trước và được sử dụng rộng rãi trong quá khứ (trước 1970). Vào đầu những

năm 70, mô hình quan hệ ra đời. Do tính ưu việt của nó, mô hình quan hệ dần dần

thay thế các mô hình mạng và phân cấp. Chúng ta sẽ nghiên cứu về mô hình quan

hệ trong chương III.

      Các mô hình dữ liệu vật lý mô tả cách lưu trữ dữ liệu trong máy tính giới thiệu

các thông tin như khuôn dạng bản ghi, sắp xếp bản ghi, đường truy cập…

                                                   16

----------------------- Page 18-----------------------

      III.2-  Lược đồ và trạng thái cơ sở dữ liệu

      Trong một mô hình dữ liệu cần phải phân biệt rõ giữa mô tả của cơ sở dữ liệu

và bản thân cơ sở dữ liệu. Mô tả của một cơ sở dữ liệu được gọi là lược đồ cơ sở

dữ liệu, nó được xác định rõ trong quá trình thiết kế cơ sở dữ liệu và không bị thay

đổi thường xuyên. Đa số các mô hình dữ liệu có các quy ước hiển thị các lược đồ.

Hiển thị của một lược đồđược gọi là biểu đồ của lược đồđó. Một biểu đồ lược đồ

chỉ thể hiện một vài khía cạnh của lược đồ như là các kiểu bản ghi, các mục dữ liệu

và một số kiểu ràng buộc. Các khía cạnh khác không được thể hiện trong biểu đồ

lược đồ.

      Các dữ liệu trong một cơ sở dữ liệu có thể thay đổi một cách thường xuyên.

Các dữ liệu trong một cơ sở dữ liệu tại một thời điểm cụ thểđược gọi là một trạng

thái cơ sở dữ liệu hoặc là ảnh (snapshot) của cơ sở dữ liệu. Nhiều trạng thái quan

hệ có thểđược xây dựng để làm tương ứng với một lược đồ cơ sở dữ liệu cụ thể.

Mỗi khi chúng ta chèn vào hoặc loại bỏ một bản ghi, sửa đổi giá trị của một mục dữ

liệu trong một bản ghi, chúng ta đã làm thay đổi trạng thái của cơ sở dữ liệu sang

một trạng thái khác.

      Việc phân biệt giữa lược đồ cơ sở dữ liệu và trạng thái cơ sở dữ liệu là rất

quan trọng. Khi chúng ta định nghĩa một cơ sở dữ liệu mới, ta chỉđặc tả lược đồ cơ

sở dữ liệu cho hệ quản trị cơ sở dữ liệu. Tại thời điểm này, trạng thái của cơ sở dữ

liệu là một trạng thái rỗng, không có dữ liệu. Chúng ta nhận được trạng thái ban

đầu của cơ sở dữ liệu khi ta nhập dữ liệu lần đầu tiên. Từđó trởđi, mỗi khi một

phép toán cập nhật được thực hiện đối với cơ sở dữ liệu, chúng ta nhận được một

trạng thái cơ sở dữ liệu khác. Tại mọi thời điểm, cơ sở dữ liệu có một trạng thái

hiện tại. Hệ quản trị cơ sở dữ liệu có trách nhiệm đảm bảo rằng mỗi trạng thái cơ sở

dữ liệu là một trạng thái vững chắc, nghĩa là một trạng thái thoả mãn cấu trúc và

các ràng buộc được đặc tả trong lược đồ. Vì vậy, việc đặc tả một lược đồđúng đắn

cho hệ quản trị cơ sở dữ liệu là một việc làm cực kỳ quan trọng và lược đồ phải

được thiết kế một cách cẩn thận. Hệ quản trị cơ sở dữ liệu lưu trữ các mô tả của các

cấu   trúc   lược đồ và   các   ràng   buộc   –   còn   gọi   là   siêu   dữ liệu   –   vào   trong   từđiển

(catalog) của hệ quản trị sao cho phần mềm hệ quản trị cơ sở dữ liệu có thể tham

khảo  đến   lược  đồ khi   nó   cần.  Đôi   khi   người   ta   còn   gọi   lược  đồ là   mục   tiêu

(intension) và trạng thái cơ sở dữ liệu là mở rộng (extension) của lược đồ.

                                                   17

----------------------- Page 19-----------------------

IV-  Con người trong hệ cơ sở dữ liệu

      Với một cơ sở dữ liệu lớn, rất nhiều người tham gia vào việc thiết kế, sử dụng

và duy trì cơ sở dữ liệu. Những người liên quan đến hệ cơ sở dữ liệu  được chia

thành hai nhóm chính. Nhóm thứ nhất gồm những người mà công việc của họ liên

quan hàng ngày đến cơ sở dữ liệu, đó là những người quản trị cơ sở dữ liệu, thiết kế

cơ sở dữ liệu,   sử dụng   cơ sở dữ liệu,   phân   tích   hệ thống   và   lập   trình  ứng   dụng.

Nhóm thứ hai gồm những người làm việc để duy trì môi trường hệ cơ sở dữ liệu

nhưng không quan tâm đến bản thân cơ sở dữ liệu, đó là những người thiết kế và

cài đặt hệ quản trị cơ sở dữ liệu, phát triển công cụ, thao tác viên và bảo trì.

      IV.1-  Người quản trị hệ cơ sở dữ liệu (Database Administrator – DBA)

      Trong một tổ chức có nhiều người cùng sử dụng các tài nguyên, cần phải có

một người giám sát và quản lý. Trong môi trường hệ cơ sở dữ liệu, các tài nguyên

là cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu và các phần mềm liên quan. Người quản

trị hệ cơ sở dữ liệu là người chịu trách nhiệm quản lý các tài nguyên đó. Người này

chịu trách nhiệm về việc cho phép truy cập cơ sở dữ liệu, tổ chức và hướng dẫn

việc sử dụng cơ sở dữ liệu, cấp các phần mềm và phần cứng theo yêu cầu.

      IV.2-  Người thiết kế cơ sở dữ liệu (Database Designer)

      Người này chịu trách nhiệm xác định các dữ liệu sẽđược lưu giữ trong cơ sở,

chọn các cấu trúc thích hợp để biểu diễn và lưu giữ các dữ liệu đó. Những nhiệm

vụ này được thực hiện trước khi cơ sở dữ liệu được cài đặt và phổ biến. Người thiết

kế có trách nhiệm giao thiệp với những người sử dụng tương lai để hiểu được các

đòi hỏi của họ và  đưa ra một thiết kế thoả mãn các yêu cầu  đó. Anh ta cũng có

nhiệm vụ giao thiệp với các nhóm người sử dụng và có khả năng hỗ trợ các yêu cầu

của các nhóm.

      IV.3-  Những người sử dụng (End User)

      Những người sử dụng là những người mà công việc của họđòi hỏi truy cập

đến cơ sở dữ liệu để truy vấn, cập nhật và sinh ra các thông tin. Có thể chia những

người sử dụng thành hai nhóm chính: những người sử dụng thụđộng (tức là những

người sử dụng không có nhiều kiến thức về hệ cơ sở dữ liệu) và những người sử

dụng chủđộng (là những người có hiểu biết tốt về hệ cơ sở dữ liệu).

                                                  18

----------------------- Page 20-----------------------

      Chức   năng   công   việc   của   những   người   sử dụng   thụđộng   (chiếm   phần   lớn

những người sử dụng) gắn liền với việc truy vấn và cập nhật thường xuyên cơ sở

dữ liệu bằng cách sử dụng các câu hỏi và các cập nhật chuẩn (gọi là các giao tác

định sẵn) đã được lập trình và kiểm tra cẩn thận. Những người này chỉ cần học một

ít về các phương tiện do hệ quản trị cơ sở dữ liệu cung cấp và hiểu các kiểu giao tác

chuẩn đã được thiết kế và cài đặt là đủ.

      Những người sử dụng chủđộng có hiểu biết tốt về hệ cơ sở dữ liệu, họ có thể

tự cài đặt các ứng dụng riêng của mình để làm thoả mãn các yêu cầu phức tạp của

họ.

      IV.4-  Người phân tích hệ thống và lập trình  ứng dụng

      Người phân tích hệ thống xác định các yêu cầu của những người sử dụng (chủ

yếu là những người sử dụng thụđộng) đểđặc tả các chương trình phù hợp với yêu

cầu của họ.

      Người viết chương trình ứng dụng thể hiện các đặc tả của những người phân

tích thành chương trình, sau đó kiểm thử, sửa lỗi làm tài liệu và bảo trì các giao tác

định sẵn.

      IV.5-  Người thiết kế và cài đặt hệ quản trị dữ liệu

      Đó là những người thiết kế, cài đặt các mô đun, giao diện của hệ quản trị cơ

sở dữ liệu thành các phần mềm đóng gói. Một hệ quản trị cơ sở dữ liệu là một hệ

thống phần mềm phức tạp bao gồm nhiều thành phần (mô đun). Đó là các mô đun

cài đặt từđiển dữ liệu, ngôn ngữ truy vấn, bộ xử lý giao diện, truy cập dữ liệu,

kiểm tra cạnh tranh, phục hồi và an toàn. Hệ quản trị cơ sở dữ liệu phải giao tiếp

với các hệ thống phần mềm khác như hệđiều hành và các chương trình dịch cho

nhiều ngôn ngữ khác nhau.

      IV.6-  Những người phát triển công cụ

      Là những người thiết kế và cài  đặt các công cụ (tool),  đó là các phần mềm

đóng gói làm dễ việc thiết kế và sử dụng cơ sở dữ liệu.

      IV.7-  Các thao tác viên và những người bảo trì

      Là những người chịu trách nhiệm về việc chạy và bảo trì phần cứng và phần

mềm của hệ thống.

                                                 19

----------------------- Page 21-----------------------

V-       Ngôn ngữ cơ sở dữ liệu và giao diện

      V.1-    Các ngôn ngữ hệ quản trị cơ sở dữ liệu

      Một khi việc thiết kế cơ sở dữ liệu đã hoàn thành, cần phải chọn một hệ quản

trị cơ sở dữ liệu để cài đặt cơ sở dữ liệu. Trong các hệ quản trị cơ sở dữ liệu hiện

nay thường có các ngôn ngữ: ngôn ngữđịnh nghĩa dữ liệu (data definition language

– DDL) và ngôn ngữ thao tác dữ liệu (data manipulation language – DML).

      Ngôn   ngữđịnh   nghĩa   dữ liệu  được   sử dụng  đểđịnh   nghĩa   các   lược đồ.   Hệ

quản trị cơ sở dữ liệu có một chương trình dịch ngôn ngữ DDL, nhiệm vụ của nó là

xử lý các câu lệnh DDL để xác định mô tả của cấu trúc lược đồ và lưu trữ mô tả

lược đồ vào từđiển của hệ quản trị cơ sở dữ liệu.

      Ngôn ngữ thao tác cơ sở dữ liệu được sử dụng để thao tác cơ sở dữ liệu. Các

thao tác chính gồm có lấy ra, chèn vào, loại bỏ và sửa đổi các dữ liệu. Có hai kiểu

ngôn ngữ thao tác dữ liệu chính: ngôn ngữ thao tác dữ liệu mức cao hoặc ngôn ngữ

phi thủ tục hoặc ngôn ngữ thao tác dữ liệu mức thấp.

      Ngôn ngữ thao tác dữ liệu mức cao có thểđược sử dụng để diễn đạt các phép

toán cơ sở dữ liệu một cách ngắn gọn. Phần lớn các hệ quản trị cơ sở dữ liệu cho

phép nhập các lệnh của ngôn ngữ thao tác dữ liệu mức cao theo cách lặp (nghĩa là

sau khi nhập một lệnh, hệ thống sẽ thực hiện lệnh đó rồi mới nhập lệnh tiếp theo)

hoặc được nhúng vào một ngôn ngữ lập trình vạn năng. Trong trường hợp nhúng

vào ngôn ngữ khác, các lệnh của ngôn ngữ thao tác dữ liệu phải được xác định bên

trong   chương   trình   sao   cho   một   chương   trình   tiền   dịch   có   thể nhận   ra   chúng   và

được hệ quản trị cơ sở dữ liệu xử lý.

      Ngôn ngữ thao tác cơ sở dữ liệu mức thấp hoặc ngôn ngữ thủ tục phải được

nhúng vào trong một ngôn ngữ lập trình vạn năng. Ngôn ngữ thao tác cơ sở dữ liệu

kiểu này thường rút ra các bản ghi hoặc các đối tượng riêng rẽ và xử lý chúng một

cách riêng rẽ. Vì vậy, chúng cần phải sử dụng các cấu trúc ngôn ngữ lập trình như

vòng lặp, điều kiện,… để rút ra từng bản ghi một từ một tập các bản ghi. Ngôn ngữ

thao tác dữ liệu mức thấp được gọi là ngôn ngữ “một lần một bản ghi”. Các ngôn

ngữ thao tác dữ liệu mức cao có thể dùng một lệnh để rút ra một lúc nhiều bản ghi

nên chúng được gọi là ngôn ngữ “một lần một tập hợp”.

                                                  20

----------------------- Page 22-----------------------

     V.2-   Các loại giao diện hệ quản trị cơ sở dữ liệu

     Các hệ quản trị cơ sở dữ liệu cung cấp rất nhiều loại giao diện người dùng

thân thiện. Các loại giao diện chính gồm có:

     Giao diện dựa trên bảng chọn: Các giao diện này cung cấp cho người sử dụng

danh sách các lựa chọn, gọi là bảng chọn (menu) và hướng dẫn người sử dụng diễn

đạt một yêu cầu từđầu đến cuối. Các bảng chọn làm cho người sử dụng không cần

nhớ các lệnh và cú pháp của ngôn ngữ truy vấn. Các bảng chọn thả xuống đã trở

thành kỹ thuật phổ biến trong các giao diện dựa trên cửa sổ. Chúng thường được sử

dụng trong các giao diện quét, cho phép người sử dụng nhìn thấy nội dung của một

cơ sở dữ liệu theo cách không có cấu trúc.

     Giao diện dựa trên mẫu biểu: Các giao diện này hiển thị một mẫu biểu cho

người sử dụng. Những người sử dụng có thểđiền vào tất cả các ô của mẫu biểu để

nhập các dữ liệu mới hoặc họ chỉđiền vào một số ô còn hệ quản trị cơ sở dữ liệu sẽ

đưa ra các dữ liệu phù hợp cho các ô khác. Các mẫu biểu thường được thiết kế và

được lập trình cho các người dùng đơn giản. Một số hệ thống có các tiện ích giúp

người sử dụng từng bước xây dựng một mẫu biểu trên màn hình.

     Giao diện đồ hoạ: Một giao diện đồ hoạ (GUI) thường hiển thị một lược đồ

cho người sử dụng dưới dạng biểu đồ. Người dùng có thể thực hiện một truy vấn

bằng cách thao tác trên biểu đồ. Trong nhiều trường hợp, GUI sử dụng cả các bảng

chọn và các mẫu biểu. Đa số các GUI sử dụng các công cụ trỏ như chuột, phím để

kích các phần của sơđồ.

     Giao diện cho người quản trị hệ thống: Đa số các hệ quản trị cơ sở dữ liệu có

các lệnh ưu tiên, chỉ có những người quản trị hệ thống mới sử dụng các lệnh đó. Đó

là các lệnh tạo ra các tài khoản (account), đặt các tham số cho hệ thống, cấp các tài

khoản, thay đổi lược đồ hoặc tổ chức lại các cấu trúc lưu trữ của cơ sở dữ liệu.

VI-  Câu hỏi ôn tập

     1.  Định nghĩa các thuật ngữ : cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, hệ cơ sở

dữ liệu, từđiển cơ sở dữ liệu, mô hình cơ sở dữ liệu.

     2.  Nêu các tính chất của một cơ sở dữ liệu

     3.  Nêu các chức năng của một hệ quản trị cơ sở dữ liệu

     4.  Giải thích các đặc trưng của giải pháp cơ sở dữ liệu

                                            21

----------------------- Page 23-----------------------

 5.  Định nghĩa mô hình cơ sở dữ liệu và phân loại

 6.  Liệt kê các người có liên quan đến hệ cơ sở dữ liệu.

                                                        22

----------------------- Page 24-----------------------

Chương II-  MÔ HÌNH THỰC THỂ - LIÊN KẾT

     Trong chương này chúng ta sẽ làm quen với mô hình thực thể - liên kết, gọi tắt

là mô hình ER ( Entity-Relationship Model). Đó là một mô hình dữ liệu mức quan

niệm phổ biến, tập trung vào các cấu trúc dữ liệu và các ràng buộc. Mô hình này

thường được sử dụng để thiết kế các ứng dụng cơ sở dữ liệu và nhiều công cụ thiết

kế cơ sở dữ liệu sử dụng các khái niệm của nó.

I-    Sử dụng mô hình quan niệm bậc cao cho việc thiết kếcơ sở dữ

     liệu

     Quá trình thiết kế một cơ sở dữ liệu sử dụng mô hình quan niệm bậc cao được

minh họa bằng hình II.1.

     Bước đầu tiên là  tập h ợp các yêu c ầu và phân tích. Trong bước này, người

thiết kế cơ sở dữ liệu phỏng vấn những người sử dụng cơ sở dữ liệu để hiểu và làm

tài liệu về các yêu cầu về dữ liệu của họ. Kết quả của bước này là một tập hợp ghi

chép súc tích về các yêu cầu của những người sử dụng. Những yêu cầu sẽđược đặc

tả càng đầy đủ và chi tiết càng tốt. Song song với việc đặc tả các yêu cầu dữ liệu,

cần phải đặc tả các yêu cầu về chức năng của ứng dụng: đó là các thao tác do người

sử dụng định nghĩa sẽđược áp dụng đối với cơ sở dữ liệu.

     Mỗi khi tất cả các yêu cầu đã được thu thập và phân tích, bước tiếp theo là tạo

ra lược đồ quan niệm cho cơ sở dữ liệu bằng cách sử dụng mô hình dữ liệu quan

niệm mức cao. Bước này gọi là thiết kế quan niệm. Lược đồ quan niệm là một mô

tả súc tích về các yêu cầu dữ liệu của những người sử dụng. Nó bao gồm các mô tả

chi tiết của các kiểu thực thể, kiểu liên kết và các ràng buộc, chúng được biểu diễn

bằng các khái niệm do các mô hình dữ liệu bậc cao cung cấp. Vì những khái niệm

này không chứa các chi tiết cài đặt, chúng thường dễ hiểu và có thể sử dụng chúng

để giao lưu với những người sử dụng. Lược đồ quan niệm mức cao cũng có thể

được sử dụng như một dẫn chứng đểđảm bảo rằng tất cả các đòi hỏi của người sử

dụng đều thỏa mãn và các đòi hỏi này không chứa các mâu thuẫn. Giải pháp này

cho phép những người thiết kế cơ sở dữ liệu tập trung vào việc đặc tả các tính chất

của dữ liệu mà không cần quan tâm đến các chi tiết lưu trữ. Một thiết kế cơ sở dữ

liệu quan niệm tốt sẽ làm dễ cho công việc của những người thiết kế cơ sở dữ liệu.

                                            23

----------------------- Page 25-----------------------

     Trong quá trình (hoặc sau khi) thiết kế lược đồ quan niệm, chúng ta có thể sử

dụng các phép toán cơ bản của    mô hình dữ liệu đểđặc tả các thao tác của người sử

dụng được xác định trong khi phân tích chức năng. Điều đó cũng giúp khẳng định

rằng lược đồ quan niệm thỏa mãn mọi yêu cầu chức năng được xác định. Nếu có

một số yêu cầu chức năng không thể nêu ra được trong lược đồ ban đầu thì ở bước

này có thể có sự sửa đổi lược đồ quan niệm cho phù hợp.

     Bước tiếp theo trong việc thiết kế cơ sở dữ liệu là việc cài đặt một cơ sở dữ

liệu bằng cách sử dụng một hệ quản trị cơ sở dữ liệu có sẵn. Hầu hết các hệ quản trị

cơ sở dữ liệu sử dụng một mô hình dữ liệu cài đặt (thể hiện), chẳng hạn như mô

hình quan hệ hoặc đối tượng, vì vậy lược đồ quan niệm được chuyển từ mô hình dữ

liệu bậc cao thành mô hình dữ liệu cài đặt. Bước này gọi là thiết kế logic hoặc là

ánh xạ mô hình dữ liệu. Kết quả của bước này là một lược đồ cơ sở dữ liệu dưới

dạng một mô hình dữ liệu cài đặt của hệ quản trị cơ sở dữ liệu.

     Bước cuối cùng trong thiết kế cơ sở dữ liệu là thiết kế vật lý. Trong bước này

ta phải chỉ ra các cấu trúc bên trong, các đường dẫn truy cập, tổ chức tệp cho các

tệp cơ sở dữ liệu. Song song với các hoạt động đó, các chương trình ứng dụng cũng

được thiết kế và cài đặt như là các giao tác (transaction) cơ sở dữ liệu tương ứng

với các đặc tả giao tác mức cao.

                                            24

----------------------- Page 26-----------------------

                                                          Thế giới thực

                                                     TẬP HỢP VÀ PHÂN TÍCH

                                                          CÁC YÊU CẦU

          Các yêu cầu chức năng                      Các yêu cầu cơ sở dữ liệu

                                                       THIẾT KẾ QUAN NIỆM

           PHÂN TÍCH CHỨC NĂNG

           Đặc tả giao tác mức cao                      Lược đồ quan niệm

        (Độc lập với hệ QTCSDL)                          THIẾT KẾ LÔ GIC

          THIẾT KẾ CHƯƠNG TRÌNH                           Lược đồ lô gic

                 ỨNG DỤNG

                                                         THIẾT KẾVẬT LÝ

            CÀI ĐẶT GIAO TÁC

                                                        Lược đồ bên trong

        Các chương trình ứng dụng

               Hình II-1. Sơđồ mô tả các bước chính của việc thiết kế

II-   Các thành phần cơ bản của mô hình ER

     II.1-  Thực thể và thuộc tính

     Đối tượng được trình bày trong mô hình ER là thực thể. Thực thểlà một “vật”

trong thế giới thực, có sự tồn tại độc lập. Một thực thể có thể là cụ thể, tức là chúng

ta có thể cảm nhận được bằng các giác quan, hoặc có thể là trừu tượng, tức là cái

mà chúng ta không cảm nhận được bằng các giác quan nhưng có thể nhận biết được

                                             25

----------------------- Page 27-----------------------

bằng nhận thức. Một cái ô tô, một nhân viên,… là những thực thể cụ thể. Một đơn

vị công tác, một trường học… là những thực thể trừu tượng.

      Mỗi một thực thể có các thuộc tính, đó là các đặc trưng cụ thể mô tả thực thể

đó. Ví dụ, một thực thểNhânviên được mô tả bằng Họtên, Tuổi, Địachỉ, Lương…

của nhân viên đó. Một thực thể cụ thể sẽ có một giá trị cho mỗi thuộc tính của nó.

Ví dụ, nhân viên nv1 có các giá trị cho các thuộc tính Họtên, Tuổi, Địachỉ, Lương

của nó là “ Lê Vân”, 32, “Hà nội”, 500000. Các giá trị thuộc tính mô tả mỗi thực

thể sẽ trở thành một phần chính của các dữ liệu sẽđược lưu giữ trong cơ sở dữ liệu.

Trong mô hình ER có mặt nhiều kiểu thuộc tính: thuộc tính đơn, thuộc tính phức

hợp, thuộc tính đơn trị, thuộc tính đa trị, thuộc tính được lưu trữ, thuộc tính suy

diễn được, thuộc tính có giá trị không xác định, thuộc tính phức tạp.

      Thuộc   tính  đơn   là   thuộc   tính   không   thể phân   chia   ra  được   thành   các   thành

phần   nhỏ hơn.   Ví   dụ,   thuộc   tính   Tuổi  của   một   nhân   viên   là   một   thuộc   tính đơn.

Thuộc tính phức hợp là thuộc tính có thể phân chia được thành các thành phần nhỏ

hơn, biểu diễn các thuộc tính cơ bản hơn với các ý nghĩa độc lập. Ví dụ, thuộc tính

Họtên của thực thể nhân viên có thể phân chia thành các tính Họđệm và Tên. Giá

trị của một thuộc tính là sự kết hợp kết hợp các giá trị của các thuộc tính thành

phần tạo nên nó. Việc phân chia một thuộc tính phức hợp thành các thuộc tính đơn

tùy thuộc vào hoàn cảnh cụ thể.

      Những thuộc tính có giá trị duy nhất cho một thực thể cụ thể gọi là các thuộc

tính đơn trị. Ví dụ, Họtên là một thuộc tính đơn trị của thực thể nhân viên, mỗi

nhân viên có một họ tên duy nhất. Trong một số trường hợp, một thuộc tính có thể

có một tập giá trị cho cùng một thực thể. Những thuộc tính như vậy gọi là thuộc

tính đa trị. Ví dụ, thuộc tính Bằngcấp của một người. Một người có thể không có

bằng   cấp   nào,   người   khác   có   thể có   một   bằng,   người   khác   nữa   có   thể có   nhiều

bằng. Như vậy, các người khác nhau có thể có một số giá trị khác nhau cho thuộc

tính Bằngcấp. Thuộc tính Bằngcấp là một thuộc tính đa trị.

      Thuộc tính được lưu trữ là các thuộc tính mà giá trị của nó được nhập vào khi

cài đặt cơ sở dữ liệu. Trong một số trường hợp, hai hay nhiều thuộc tính có giá trị

liên quan đến nhau. Ví dụ, thuộc tính Tuổi và thuộc tính Ngàysinh của một người.

Với một người cụ thể, ta có thể tính tuổi của anh ta bằng cách lấy năm hiện tại trừ

đi năm của Ngàysinh. Thuộc tính mà giá trị của nó có thể tính được thông qua giá

trị của các thuộc tính khác gọi là thuộc tính suy diễn được.

                                                   26

----------------------- Page 28-----------------------

      Các giá trị không xác định (null values): Trong một số trường hợp, một thực

thể cụ thể có   thể không   có   các   giá   trị áp   dụng  được   cho   một   thuộc   tính.   Ví   dụ,

thuộc tính Sốđiệnthoại của thực thể nhân viên sẽ không có giá trịđối với các nhân

viên không có sốđiện thoại. Trong trường hợp như vậy, ta phải tạo ra một giá trị

đặc biệt gọi là giá trị không xác định (null). Giá trị không xác định được tạo ra khi

một thuộc tính có giá trị không áp dụng được hoặc khi không biết.

      Các thuộc tính phức tạp : Là sự kết hợp của các thuộc tính phức hợp và đa trị.

      II.2-  Kiểu thực thể, tập th ực thể, khóa và tập giá trị

      Các kiểu thực thể và các tập th ực thể: Một cơ sở dữ liệu thường chứa những

nhóm thực thể như nhau. Ví dụ, một công ty thuê hàng trăm nhân viên và lưu giữ

những thông tin tương tự liên quan đến mỗi nhân viên. Các thực thể nhân viên này

chia sẻ các thuộc tính giống nhau nhưng mỗi thực thể có các giá trị riêng cho các

thuộc tính đó. Một kiểu thực thể là một tập hợp các thực thể có các thuộc tính như

nhau. Một kiểu thực thể trong cơ sở dữ liệu được mô tả bằng tên và các thuộc tính.

Vídụ:   NHÂNVIÊN   (Họtên,   Tuổi,   Lương),   CÔNGTY   (Tên,  Địađiểm,   Giámđốc).

Một tập hợp các thực thể của một kiểu thực thể cụ thể trong cơ sở dữ liệu tại một

thời điểm được gọi là một tập thực thể, nó thường được tham chiếu đến bằng cách

sử dụng tên của kiểu thực thể. Ví dụ, NHÂNVIÊN vừa dùng để chỉ một kiểu thực

thể, vừa để chỉ tập hợp hiện tại của tất cả các thực thể nhân viên trong cơ sở dữ

liệu. Hình II-2 minh họa các kiểu thực thể NHÂNVIÊN, CÔNGTY và các tập thực

thể tương ứng.

      Một kiểu thực thểđược biểu diễn trong lược đồ ER như là một hộp hình chữ

nhật có chứa tên kiểu thực thể. Các thuộc tính được đặt trong các hình ô van và

được   nối   với   các   kiểu   thực   thể bằng   các  đường   thẳng.   Các   thuộc   tính   phức   hợp

cũng được nối với các thuộc tính thành phần của nó bằng đường thẳng. Các thuộc

tính đa trịđược hiển thị trong các hình ô van đúp (hình II-3).

      Một kiểu thực thể mô tả một  lược đồ (hoặc một mục đích) cho một tập các

thực thể chia sẻ cùng một cấu trúc. Tập hợp các thực thể của một kiểu thực thể cụ

thểđược nhóm vào một tập thực thể và được gọi là một thể hiện của một kiểu thực

thể.

                                                  27

----------------------- Page 29-----------------------

                     NHÂNVIÊN                                 CÔNGTY

                (Họtên, Tuổi, Lương)                 (Tên, Địadiểm, Giámđốc)

                           Nv1                                     Ct1

             (Lê Lan, 30, 800000)               (CT Phần mềm, Hà nội, Vũ An)

                           Nv2                                     Ct2

             (Trần Bá, 45, 1000000)             (CT Hoa quả, Hải phòng, Lê Hà)

                           Nv3                                     Ct3

             (Hoàng Vân, 25, 600000)            (CT     Máy     tính,   Hà    nội,   Phan

                                                Anh)

                             .

                                                                     .

                             .

                                                                     .

                             .

                                                                     .

                            Hình II-2. Kiểu thực thể và tập th ực thể

       Thuộc   tính   khóa   của   một   kiểu   thực   thể:  Một   ràng   buộc   quan   trọng   trên   các

thực thể của một kiểu thực thể là khóa. Một kiểu thực thể thường có một thuộc tính

mà các giá trị của nó là khác nhau đối với mỗi thực thể tiêng biệt trong một tập

thực thể. Thuộc tính như vậy gọi là  thuộc tính khóa và các giá trị của nó có thể

dung để xác định từng thực thể một cách duy nhất. Ví dụ, thuộc tính Tên của kiểu

thực thể CÔNGTY là khóa của kiểu thực thểđó vì mỗi thực thể công ty có một tên

duy nhất. Đôi khi, nhiều thuộc tính kết hợp với nhau tạo thành một khóa, nghĩa là

tổ hợp các giá trị của các thuộc tính này phải khác nhau đối với mỗi thực thể. Trong

trường hợp như vậy ta có một thuộc tính khóa phức hợp . Chú ý rằng khóa phức hợp

phải tối thiểu, nghĩa là tất cả các thuộc tính thành phần phải có mặt trong thuộc tính

phức hợp để thỏa mãn tính chất duy nhất. Trong biểu đồđồ họa của mô hình ER,

thuộc tính khóa được biểu diễn bằng cách gạch ngang dưới tên của nó (hình II-3).

      Khi chỉ ra rằng một thuộc tính là khóa của một kiểu thực thể nghĩa là tính chất

duy nhất nêu trên phải được thỏa mãn đối với đối với mỗi mở rộng của kiểu thực

thể. Như vậy, ràng buộc khóa cấm hai thực thể bất kỳ có giá trị cho thuộc tính khóa

như nhau tại cùng một thời điểm. Đó là một ràng buộc trên tất cả các thể hiện của

thực thể. Ràng buộc khóa cũng như các ràng buộc sẽđược giới thiệu về sau được

lấy ra từ các ràng buộc của “thế giới nhỏ” của cơ sở dữ liệu.

                                                      28

----------------------- Page 30-----------------------

      Một kiểu thực thể có thể có nhiều hơn một thuộc tính khóa. Ví dụ, nếu một

công ty có một mã số duy nhất và một tên duy nhất thì các thuộc tính Mãsốcông ty

và Têncôngty đều là các thuộc tính khóa. Một kiểu thực thể cũng có thể không có

khóa. Một thực thể không có khóa được gọi là kiểu thực thể yếu.

                      Họđệm               Tên

            MãsốNV             Họtên             Ngàysinh               Bằngcấp

                            NHÂNVIÊN

                  Hình II-3. Biểu diễn kiểu thực thể và các thuộc tính

      Miền   giá   trị của   các   thuộc   tính:   Mỗi   thuộc   tính đơn   của   một   kiểu   thực   thể

được kết hợp với một miền giá trị. Đó là một tập các giá trị có thể gán cho thuộc

tính này đối với mỗi thực thể riêng biệt. Các miền giá trị không hiển thị trong các

sơđồ ER.

      Một cách toán học, một thuộc tính A của kiểu thực thể E có tập giá trị V có

thểđược định nghĩa như là một hàm từ E vào tập hợp lực lượng P(V) của V:

                                         A:   E  →P(V)

      Ta ký hiệu giá trị của thuộc tính A đối với thực thể e là A(e). Định nghĩa ở

trên đúng cho các thuộc tính đơn trị, đa trị và thuộc tính không xác định. Một giá trị

không xác định được biểu diễn bằng một tập rỗng. Với các thuộc tính đơn trị, A(e)

là một giá trịđơn cho thực thể e. Các thuộc tính đa trị không có các hạn chế trên

A(e).   Với   một   thuộc   tính   phức   hợp   A,   tập   giá   trị V   là   tích  Đề các   của   P(V1)x

P(V )x….xP(V ), trong đó V , V , …, V  là tập các giá trị cho các thành phần đơn

     2           n               1   2        n

của A.

                                                29

----------------------- Page 31-----------------------

      II.3-    Kiểu liên kết, tập liên k ết và các thể hiện

       Một kiểu liên kết R giữa n kiểu thực thể E  , E , …,E  xác định một tập liên k ết

                                                             1    2        n

giữa các thực thể của các kiểu đó. Cũng như các kiểu thực thể và tập thực thể, một

kiểu liên kết và tập liên kết tương ứng với nó cũng có tên chung là R. Một cách

toán học, tập liên kết R là một tập hợp các thể hiện liên kết ri , i= 1,2,… trong đó

mỗi r  liên kết n thực thể riêng biệt e ,e ,…,e   và mỗi một thực thể e  trong r  là một

       i                                        1  2      n                              j         i

thành phần của kiểu thực thể Ej  , 1≤ j ≤ n. Như vậy, một kiểu liên kết R là một quan

hệ toán học trên E , E , …, E            hoặc có thểđịnh nghĩa như là một tập con của tích

                         1   2         n

Đề các E      x E  x …x E  . Mỗi kiểu thực thể E  ,E , …, E                 được gọi là tham gia vào

            1     2            n                            1   2         n

kiểu liên kết R, và tương tự, mỗi thực thể riêng biệt e , e , …, e                    được gọi là tham

                                                                       1   2        n

gia vào thể hiện liên kết r  = ( e  ,e ,…,e ).

                                 i       1  2      n

       Một cách không hình thức, mỗi thể hiện liên kết ri trong R là một sự kết hợp

của các thực thể, mỗi thực thể thuộc về một kiểu thực thể tham gia vào liên kết.

Mỗi liên kết r  như vậy diễn đạt một sự kiện rằng các thực thể tham gia trong r  có

mối quan hệ với nhau theo một cách nào đó ở trong thế giới thực. Ví dụ, trong thực

tế, các nhân viên làm việc cho các đơn vị, như vậy, có một kiểu liên kết liên kết

làm việc cho, liên kết giữa kiểu thực thể NHÂNVIÊN và kiểu thực thểĐƠNVỊ.

       Trong sơđồ ER, kiểu liên kết được biểu diễn bằng một hình thoi nối trực tiếp

với các hình chữ nhật biểu diễn các kiểu thực thể tham gia vào liên kết. Hình II-4

minh họa kiểu liên kết và thể hiện liên kết

       a) Kiểu liên kết

               NHÂNVIÊN                           Làm việc                      ĐƠNVỊ

       b) Thể hiện liên kết

                                                        30

----------------------- Page 32-----------------------

                                        làm việc cho

         NHÂNVIÊN                                                      ĐƠNVỊ

              Nv1                              .                          Đv1

              Nv2

              Nv3

              Nv4                                                         Đv2

                                               .

               …

                       Hình II-4. Kiểu liên kết và thể hiện liên kết

     II.4-   Cấp liên k ết, tên vai trò và kiểu liên kết đệ quy

      Cấp c ủa một kiểu liên kết là số các kiểu thực thể tham gia vào kiểu liên kết đó.

Một kiểu liên kết có thể có cấp 1, cấp 2, cấp 3,…. Ví dụ, kiểu liên kết <làm việc

cho> giữa kiểu thực thể NHÂNVIÊN và kiểu thực thểĐƠNVỊ là một kiểu liên kết

cấp 2. Kiểu liên kết <biết trước> giữa kiểu thực thể MÔNHỌC với chính nó là một

kiểu liên kết cấp 1…

      Đôi khi chúng ta có thể coi một kiểu liên kết như một thuộc tính của một kiểu

thực thể. Ví dụ, nếu kiểu thực thể NHÂNVIÊN có thuộc tính Đơnvịđể chỉ ra tên

đơn vị mà nhân viên làm việc cho, thì thuộc tính Đơnvị biểu thị một kiểu liên kết.

Nói cách khác, một thuộc tính của một kiểu thực thể hoặc có chức năng biểu thị

một đặc trưng của kiểu thực thể, hoặc có chức năng biểu thị một kiểu liên kết giữa

kiểu thực thểđó với các kiểu thực thể khác. Các thuộc tính biểu thị một kiểu liên

kết có thểđơn trị hoặc đa trị tuỳ theo bản chất của mối liên kết.

      Các tên vai trò và các kiểu liên kết đệ quy: Mỗi một kiểu thực thể tham gia

vào một kiểu liên kết có một vai trò cụ thể trong liên kết. Tên vai trò dùng để chỉ rõ

vai trò của các thực thể của kiểu thực thể tham gia liên kết, nó giúp đỡ việc giải

thích ý nghĩa của liên kết. Ví dụ, trong kiểu liên kết NHÂNVIÊN <làm việc cho >

ĐƠNVỊ, vai trò của các thực thể của kiểu thực thể NHÂNVIÊN là nhân viên hoặc

công nhân còn vai trò của các thực thể của kiểu thực thểĐƠNVỊ là đơn vị hoặc nơi

thuê công nhân. Nếu các kiểu thực thể tham gia vào kiểu liên kết là khác nhau thì

tên vai trò là hoàn toàn không cần thiết bởi vì có thể sử dụng tên các kiểu thực thể

làm tên vai trò. Tuy nhiên, trong một số trường hợp, một kiểu thực thể có thể tham

gia vào một kiểu liên kết với các vai trò khác nhau. Trong những trường hợp như

                                               31

----------------------- Page 33-----------------------

vậy, tên vai trò trở nên cần thiết để phân biệt ý nghĩa của mỗi sự tham gia. Các kiểu

liên kết như vậy gọi là kiểu liên kết đệ quy. Ví dụ, trong số các nhân viên làm việc

cho một  đơn vị, có các nhân viên được phân công giám sát các nhân viên khác.

Như vậy sẽ có một kiểu liên kết giữa các thực thể của kiểu thực thể NHÂNVIÊN:

NHÂNVIÊN   <giám   sát>   NHÂNVIÊN.   Kiểu   thực   thể NHÂNVIÊN   tham   gia   hai

lần vào kiểu liên kết <giám sát>, một lần với vai trò người giám sát, một lần với vai

trò người bị giám sát.

      II.5-   Các ràng buộc trên các kiểu         liên kết

      Các kiểu liên kết thường có một số ràng buộc để hạn chế số các tổ hợp có thể

của các thực thể có thể tham gia trong tập hợp liên kết tương ứng. Các ràng buộc

này được xác định từ tình trạng của thế giới thực mà kiểu liên kết biểu diễn. Ví dụ,

nếu công ty có quy chế là một nhân viên chỉ làm việc cho một đơn vị thì chúng ta

phải   mô   tả ràng   buộc   này   trong   lược đồ.   Có   hai   loại   ràng   buộc   chính:   tỷ số lực

lượng và sự tham gia.

      Tỷ số lực lượng: Tỷ số lực lượng cho một kiểu liên kết chỉ ra số các thể hiện

liên kết mà một thực thể có thể tham gia. Với các kiểu liên kết cấp 2, có thể có các

tỷ số lực lượng     1:1, 1:N, và M:N. Một kiểu liên kết có tỷ số lực lượng 1:1 giữa hai

kiểu thực thể A và B có nghĩa là        trong kiểu liên kết đó, một thực thể của kiểu A chỉ

liên kết với một thực thể của kiểu B và ngược lại, một thực thể của kiểu B chỉ liên

kết với một thực thể của kiểu A. Tỷ số lực lượng 1:N có nghĩa là một thực thể của

kiểu A có thể liên kết với nhiều thực thể của kiểu B nhưng một thực thể của kiểu B

chỉ liên kết với một thực thể của kiểu A. Trong kiểu liên kết có tỷ số lực lượng

M:N,   mỗi   thực   thể của   kiểu   A   có   thể liên   kết   với   nhiều   thực   thể của   kiểu   B   và

ngược lại, mỗi thực thể của kiểu B có thể liên kết với nhiều thực thể của kiểu A.

Trong biểu diễn của lược đồ ER, các tỷ số lực lượng được biểu diễn bằng cách ghi

1, N, M trên các hình thoi biểu diễn kiểu liên kết (hình II-5) .

                                                    32

----------------------- Page 34-----------------------

            NHÂNVIÊN             1        Quản lý         1          ĐƠNVỊ

                                 N                         1

            NHÂNVIÊN                    Làm việc cho                 ĐƠNVỊ

                               M                           N

            NHÂNVIÊN                    Làm việc trên                DỰÁN

                    Hình II-5. Tỷ số lực lượng của các kiểu liên kết

      Các ràng buộc tham gia và sự phụ thuộc tồn tại: Ràng buộc tham gia chỉ ra

rằng có phải sự tồn tại của một kiểu thực thể phụ thuộc vào một kiểu thực thể khác

thông qua một kiểu liên kết hay không. Có hai kiểu ràng buộc tham gia: ràng buộc

tham gia toàn bộ và ràng buộc tham gia bộ phận. Tham gia toàn bộ nghĩa là tất cả

các thực thể của kiểu thực thể phải tham gia vào kiểu liên kết còn tham gia bộ phận

nghĩa là chỉ một bộ phận các thực thể của kiểu thực thể tham gia vào kiểu liên kết.

Ví dụ, xét kiểu liên kết NHÂNVIÊN <quản lý> ĐƠNVỊ. Trong thực tế, mỗi đơn vị

phải   có   một   người   quản   lý   (là   một   nhân   viên)   nhưng   không   phải   nhân   viên   nào

cũng quản lý một đơn vị. Như vậy, sự tham gia của các thực thểđơn vị vào kiểu

liên kết là toàn bộ còn sự tham gia của các thực thể nhân viên vào kiểu liên kết là

bộ phận. Sự tham gia toàn bộ còn được gọi là sự phụ thuộc tồn tại.

      Trong lược đồ ER, sự tham gia toàn bộđược biểu thị bằng đường nối đôi từ

kiểu thực thểđến kiểu liên kết. Ví dụ :

      II.6-  Thuộc tính của các kiểu liên kết

      Các kiểu liên kết cũng có thể có các thuộc tính, giống như các thuộc tính của

các   kiểu   thực   thể.   Ví   dụ,   kiểu   liên   kết   <làm   việc   trên>   giữa   các   kiểu   thực   thể

NHÂNVIÊN và DỰÁN có thể có thuộc tính Sốgiờđể ghi lại số giờ làm việc của

một nhân viên trên một dự án. Các thuộc tính của kiểu liên kết cũng được biểu diễn

bằng một hình ô van và được nối với kiểu liên kết. Ví dụ:

                                                 33

----------------------- Page 35-----------------------

                                 Sốgiờ

            NHÂNVIÊN            1     Làm việc trên     1         DỰÁN

     II.7-   Các kiểu thực thể yếu

      Các kiểu thực thể không có các thuộc tính khoá cho chính mình được gọi là

các kiểu thực thể yếu. Ngược lại, các kiểu thực thể thông thường (nghĩa là có thuộc

tính khoá) được gọi là kiểu   thực thể mạnh. Các thực thể của một kiểu thực thể yếu

được xác định bằng cách liên kết với các thực thể cụ thể của một kiểu thực thể khác

phối hợp với một số giá trị thuộc tính của nó. Ta gọi kiểu thực thể khác đó là kiểu

thực thể xác định hoặc kiểu thực thể chủ. Ta gọi kiểu liên kết giữa kiểu thực thể yếu

và kiểu thực thể chủ của nó là liên kết xác định của thực thể yếu. Một kiểu thực thể

yếu luôn luôn có một ràng buộc tham gia toàn bộ (tồn tại phụ thuộc) vào liên kết

xác định của nó bởi vì một kiểu thực thể yếu không thểđược xác định mà không có

kiểu thực thể chủ. Ví dụ, trong một công ty, con của nhân viên và nhân viên có thể

hưởng    chế độ  bảo    hiểm   theo  nhân  viên.  Như  vậy,   sẽ  có  một  kiểu  liên  kết

NHÂNVIÊN <có> < CON>. Đây là một kiểu liên kết có tỷ số lực lượng 1:N. Các

thuộc tính của kiểu thực thể CON là Họtên, Ngaysinh, Giớitính. Hai người con của

hai nhân viên khác nhau có thể có cùng giá trị cho các thuộc tính nhưng nó là hai

thực thể khác nhau. Chúng chỉđược xác định như hai thực thể khác nhau sau khi

xác định một thực thể nhân viên cụ thể có liên quan đến từng người phụ thuộc. Mỗi

thực thể của kiểu thực thể NHÂNVIÊN được gọi là chủ của các thực thể của kiểu

thực thể CON liên kết với nó.

      Thông thường, các kiểu thực thể yếu có một khoá bộ phận, đó là một tập hợp

các thuộc tính có thể xác định một cách duy nhất các thực thể yếu liên kết với cùng

một thực thể chủ. Ví dụ, nếu hai người con của một nhân viên không bao giờ có tên

giống nhau thì thuộc tính Họtên của kiểu thực thể CON là một khoá bộ phận. Trong

trường hợp xấu nhất, thuộc tính phức hợp gồm tất cả các thuộc tính của thực thể

yếu sẽ là một khoá bộ phận.

                                              34

----------------------- Page 36-----------------------

      Trong sơđồ ER, kiểu thực thể yếu và kiểu liên kết xác định của nó được biểu

diễn bằng một hình chữ nhật và một hình thoi nét đôi. Ví dụ:

                 NHÂNVIÊN              1        Có         N         CON

III- Ví dụ về thiết kế mô hình ER

      Trong phần này, chúng ta xét ví dụ về việc xây dựng mô hình ER cho cơ sở dữ

liệu công ty. Nhưở trong      phần I đã nói, bước đầu tiên trong việc thiết kế một cơ sở

dữ liệu là tập hợp và phân tích các yêu cầu. Kết quả của bước này là một tập hợp

các ghi chép súc tích về các yêu cầu người sử dụng cũng như tình trạng của nơi ta

cần xây dựng cơ sở dữ liệu.

      Giả sử rằng sau khi tập hợp các yêu cầu và phân tích, hoạt động của công ty

được ghi chép lại như sau:

      1. Công ty được tổ chức thành các đơn vị. Mỗi đơn vị có một tên duy nhất,

một mã số duy nhất, một nhân viên cụ thể quản lý đơn vị. Việc nhân viên quản lý

đơn vịđược ghi lại bằng ngày nhân viên đó bắt đầu quản lý. Một đơn vị có thể có

nhiều địa điểm.

      2. Mỗi đơn vị kiểm soát một số dự án. Một dự án có một tên duy nhất, một mã

số duy nhất và một địa điểm.

      3. Với mỗi nhân viên chúng ta lưu giữ lại Họ tên, Mã số, địa chỉ, lương, giới

tính, ngày sinh. Một nhân viên chỉ làm việc cho một đơn vị nhưng có thể làm việc

trên nhiều dự án do nhiều đơn vị kiểm soát. Chúng ta lưu giữ lại số giờ làm việc

của mỗi nhân viên trên một dự án. Mỗi nhân viên có thể có một người giám sát trực

tiếp, người đó cũng là một nhân viên.

      4.   Mỗi   nhân   viên   có   những   người   con.   Những   người   này  được   hưởng   bảo

hiểm theo nhân viên. Với mỗi người con của nhân viên, chúng ta lưu giữ Họ tên,

giới tính, ngày sinh .

      III.1- Xác định các kiểu thực thể, các thuộc tính và các kiểu liên kết

      Theo các ghi chép ở trên, chúng ta có thể xác định các kiểu thực thể và các

kiểu liên kết như sau:

                                                  35

----------------------- Page 37-----------------------

      1. CÔNGTY không phải là một kiểu thực thể vì ởđây ta có một công ty duy

nhất.

      2. ĐƠNVỊ là một kiểu thực thể với các thuộc tính Tên, Mãsố, Ngườiquảnlý,

Ngàybắtđầu và Địađiểm. Các thuộc tính Tên, Mãsố, Địađiểm là các thuộc tính mô

tảđơn vị, các thuộc tính Ngườiquảnlý, Ngàybắtđầu là các thuộc tính biểu thị một

kiểu liên kết   (với kiểu thực thể NHÂNVIÊN). Các thuộc tính đều là đơn và đơn trị,

trừ thuộc tính Địađiểm, nó là một thuộc tính đa trị (một đơn vị có nhiều địa điểm).

Các thuộc tính Tên, Mãsố là các thuộc tính khóa (vì mỗi đơn vị có một tên và một

mã số duy nhất).

      3.   Kiểu    thực    thể  DỰÁN       có   các   thuộc    tính   Tên,   Mãsố,   Địađiểm,

Đơnvịkiểmsoát.   Các   thuộc   tính   Tên,   Mãsố,  Địa  điểm   là   các   thuộc   tính   mô   tả

DỰÁN, thuộc tính Đơnvịkiểmsoát biểu thị kiểu liên kết với kiểu thực thểĐƠNVỊ

(một đơn vị kiểm soát một số dự án). Các thuộc tính Tên, Mãsố là các thuộc tính

khóa.

      4.   Kiểu   thực   NHÂNVIÊN         với  các   thuộc   tính  Họtên,   Mãsố,    Giới   tính,

Ngàysinh, Lương, Đơnvị, Ngườigiámsát. Thuộc tính Họtên là một thuộc tính phức

hợp (gồm Họđệm, Tên). Các thuộc tính Đơnvị, Ngườigiámsát mô tả các kiểu liên

kết giữa kiểu thực thể NHÂNVIÊN và các kiểu thực thểĐƠNVỊ và NHÂNVIÊN

tương ứng. Thuộc tính Mãsố là thuộc tính khóa.

      5.   Kiểu   thực   thể  CON    với   các  thuộc   tính  Nhânviên,     Họtên,   Giới   tính,

Ngàysinh. Thuộc tính Nhânviên mô tả kiểu liên kết với kiểu thực thể NHÂNVIÊN.

      6.   Kiểu   liên   kết ĐƠNVỊ <kiểm   soát>   DỰÁN   là   kiểu   liên   kết   có   tỷ số lực

lượng 1:N (một đơn vị kiểm soát một số dự án, một dự án do một đơn vị quản lý).

Sự tham gia của DỰÁN vào kiểu liên kết là toàn bộ (bởi vì dự án nào cũng được

một đơn vị kiểm soát). Nếu đơn vị nào cũng có dự án thì việc tham gia của ĐƠNVỊ

vào kiểu liên kết là toàn bộ, ngược lại sự tham gia là bộ phận.

      7. Kiểu liên kết NHÂNVIÊN <làm việc cho> ĐƠNVỊ có tỷ số lực lượng N:1

(mỗi nhân viên làm việc cho một đơn vị nhưng mỗi đơn vị có nhiều nhân viên là

việc). Sự tham gia của hai kiểu thực thể vào liên kết là toàn bộ.

      8. Kiểu liên kết NHÂNVIÊN <quảnlý> ĐƠNVỊ có tỷ số lực lượng 1:1 (một

nhân viên quản lý một đơn vị và một đơn vị có một nhân viên quản lý). Sự tham

gia của kiểu thể NHÂNVIÊN vào kiểu liên kết là bộ phận (bởi vì không phải nhân

                                                  36

----------------------- Page 38-----------------------

viên nào cũng quản lý đơn vị), ngược lại, sự tham gia của kiểu thực thểĐƠNVỊ

vào kiểu liên kết là toàn bộ (bởi vì đơn vị nào cũng phải có người quản lý).

      9. Kiểu liên kết NHÂNVIÊN <giám sát > NHÂNVIÊN                       có tỷ số lực lượng

1:N (một nhân viên có thể giám sát nhiều nhân viên khác). Sự tham gia của của

kiểu thực thể NHÂNVIÊN (ở cả hai phía) là bộ phận (bởi vì không phải nhân viên

nào cũng giám sát nhân viên khác, và không phải nhân viên nào cũng bị giám sát).

Kiểu thực thể NHÂNVIÊN ởđây đóng hai vai trò khác nhau: vai trò người giám

sát và vai trò người bị giám sát.

       10. Kiểu liên kết NHÂNVIÊN <làm việc trên> DỰÁN là có tỷ số lực lượng

là M:N (một nhân viên có thể làm việc trên nhiều dự án khác nhau và mỗi dự án có

nhiều nhân viên làm việc). Sự tham gia của kiểu thực thể NHÂNVIÊN là bộ phận

(bởi vì không phải tất cả nhân viên đều làm việc trên dự án) ngược lại, sự tham gia

của kiểu thực thể DỰÁN là toàn bộ (bởi vì dự án nào cũng phải có nhân viên làm

việc). Kiểu liên kết này có một thuộc tính là Sốgiờ, ghi lại số giờ làm việc của một

nhân viên trên một dự án.

       11. Kiểu liên kết NHÂNVIÊN <có> CON biểu thị mối liên hệ giữa kiểu thực

thể NHÂNVIÊN   và   kiểu   thực   thể CON   (một   nhân   viên   có   thể có   những   người

con).   Kiểu   liên   kết   này   có   tỷ số lực   lượng   1:N   (một   nhân   viên   có   thể có   nhiều

người con nhưng mỗi con là con của chỉ một nhân viên). Sự tham gia của kiểu thực

thể NHÂNVIÊN là bộ phận (không phải nhân viên nào cũng có con), ngược lại, sự

tham gia của kiểu thực thể CON là toàn bộ (người con nào cũng phải là con của

một nhân viên). Ngoài ra, kiểu thực thể CON là một kiểu thực thể yếu.

      Sau khi phân tích như trên, để vẽ lược đồ ER ta loại bỏ các thuộc tính được

xem     như  các   kiểu  liên  kết  ra  khỏi   các  kiểu   thực   thể.  Đó  là  các   thuộc   tính

Ngườiquảnlý và Ngàybắtđầu của kiểu thực thểĐƠNVỊ, thuộc tính Đơnvịkiểmsoát

của kiểu thực thể DỰÁN, thuộc tính Đơnvị và thuộc tính Ngườigiámsát của kiểu

thực thể NHÂNVIÊN, thuộc tính Nhânviên của kiểu thực thể PHỤTHUỘC .

      Kết quả, chúng ta có lược đồ ER như sau:

                                                  37

----------------------- Page 39-----------------------

Họđệm         Tên

               Ngàysinh                                      Ngàybắt

                            Giớitính   Lương     Địachỉ

       Họtên                                                               Mãsố       Tên      Địađiểm

                                                      Quảnlý

 Mã số

                      NHÂNVIÊN                                                    ĐƠNVỊ

                                                       Làmviệccho

        Giám sát

                                                         Sốgiờ                        Kiểm

                                                                                        á

                               Có                      Làmviệc

                                                                                   DỰÁN

                              CON                                 Tên           Mãsố          Địađiểm

                Tên          Ngàysinh         Giớitính

                            Hình II-6. Lược đồ ER “CÔNGTY”

                                                  38

----------------------- Page 40-----------------------

IV-  Mô hình thực thể liên kết mở rộng (mô hình EER)

      Một cách truyền thống, khi xây dựng một cơ sở dữ liệu chúng ta thường bắt

đầu   bằng   việc   xây   dựng   mô   hình   liên   kết   –   thực   thể (mô   hình   ER)   rồi   sau  đó

chuyển đổi nó thành mô hình quan hệ. Các khái niệm về mô hình ER có thểđược

coi là khá đầy đủđể trình bày các lược đồ cơ sở dữ liệu trong các ứng dụng cơ sở

dữ liệu truyền thống, chủ yếu là các ứng dụng xử lý dữ liệu trong kinh doanh và

trong công nghiệp. Ngày nay, các ứng dụng mới hơn cho công nghệ cơ sở dữ liệu

đã trở nên phổ biến. Các cơ sở dữ liệu loại này đòi hỏi những yêu cầu phức tạp hơn

so với các ứng dụng truyền thống.  Để trình bày  được các yêu cầu này một cách

chính xác và rõ ràng, người thiết kế cơ sở dữ liệu phải sử dụng thêm các khái niệm

mới. Việc thêm vào mô hình ER những khái niệm mới làm mở rộng mô hình này

và   tạo   nên   mô   hình   ER   mở rộng   (gọi   tắt   là   mô   hình   EER   –   Enhanced   Entity

Relationship Model).

      Mô hình EER bao gồm tất         cả các khái niệm của mô hình ER, ngoài ra còn có

các khái niệm như lớp, kiểu liên kết lớp cha/ lớp con, tính thừa kế, chuyên biệt,

tổng quát, phạm trù.

      IV.1-  Lớp cha, l ớp con và s ự thừa kế

      Khái niệm đầu tiên trong mô hình EER là lớp con của một kiểu thực thể. Như

ta đã biết, kiểu thực thểđược sử dụng để biểu diễn cả kiểu của thực thể và tập hợp

các thực thể cùng một kiểu trong cơ sở dữ liệu. Trong nhiều trường hợp, một kiểu

thực thể có thể có các nhóm con các thực thể của nó và những nhóm con này cần

được trình bày rõ ràng do ý nghĩa của nó đối với cơ sở dữ liệu.

        Ví dụ, các thực thể thành viên của kiểu thực thể NHÂNVIÊN có thểđược

chia thành các nhóm nhỏ: KỸSƯ, NGƯỜIQUẢNLÝ, KỸTHUẬTVIÊN… Tập các

thực thể trong các nhóm đó là một tập con của các thực thể trong tập thực thể nhân

viên, nghĩa là mỗi thực thể là thành viên của một trong những nhóm này cũng là

một   nhân   viên.   Chúng   ta   gọi   mỗi   nhóm   này   là   một  lớp   con  của   kiểu   thực   thể

NHÂNVIÊN. Kiểu thực thể NHÂNVIÊN được gọi là lớp cha của các lớp con đó.

Ta gọi quan hệ giữa lớp cha và một trong những lớp con của nó là kiểu liên kết lớp

cha/ lớp con . Kiểu liên kết    lớp cha/ lớp con thường được gọi là kiểu liên kết là một

(IS_A). Chúng ta thường nói rằng một kỹ sư là một nhân viên, một kỹ thuật viên là

một nhân viên.

                                                  39

----------------------- Page 41-----------------------

      Chú ý rằng một thực thể thành viên trong lớp con cùng biểu diễn một thực thể

thực tại như một thành viên trong lớp cha, vì vậy, các thực thể thành viên trong lớp

con   và   các   thực   thể thành   viên   trong   lớp   cha   là   giống   nhau,   nhưng   vai   trò   của

chúng hoàn toàn khác nhau. Khi chúng ta tạo một kiểu liên kết lớp cha/ lớp con

trong hệ thống cơ sở dữ liệu, chúng ta có thể trình bày một thành viên của lớp con

như như là một đối tượng riêng biệt, một bản ghi riêng biệt kết hợp với các thực thể

của lớp cha của nó qua thuộc tính khoá. Kiểu liên kết lớp cha/ lớpcon là một kiểu

liên kết có tỷ số lực lượng 1:1.

      Một khái niệm quan trọng gắn với các lớp con là sự thừa kế kiểu. Kiểu của

một thực thểđược xác định bằng các thuộc tính và các kiểu liên kết mà nó tham

gia. Vì mỗi thực thể thành viên trong lớp con cùng biểu diễn một thực thể thực tại

như thực thể trong lớp cha nên các giá trị của thuộc tính của nó trong lớp con cũng

phải giống như là giá trị của các thuộc tính của nó khi nó đóng vai trò là một thành

viên trong lớp cha. Thực thể này cũng được thừa kế các liên kết trong lớp cha. Một

lớp con với các thuộc tính riêng của nó cùng với tất cả các thuộc tính và kiểu liên

kết kế thừa được từ lớp cha có quyền được coi như là một kiểu thực thể.

      IV.2-   Chuyên biệt hoá, tổng quát hoá

            IV.2.1-    Chuyên biệt hoá

      Là quá trình xác định tập hợp các lớp con của một kiểu thực thể. Kiểu thực thể

này được gọi là lớp cha trong chuyên biệt hoá. Tập các lớp con tạo nên một chuyên

biệt hoá được xác định dựa trên cơ sở một đặc trưng phân biệt nào đó của các thực

thể trong lớp cha. Ví dụ, tập các lớp con {THƯKÝ, KỸSƯ, KỸTHUẬTVIÊN} là

một chuyên biệt hoá của lớp cha NHÂNVIÊN  được xác định dựa trên kiểu công

việc của các thực thể. Một kiểu thực thể có thể có một số chuyên biệt hoá dựa trên

các  đặc   trưng   khác   nhau.   Ví   dụ,   một   chuyên   biệt   hoá   khác   của   kiểu   thực   thể

NHÂNVIÊN            sinh     ra     tập    các     lớp     con     {NHÂNVIÊN_BIÊNCHẾ,

NHÂNVIÊN_HỢPĐỒNG}.   Trong   chuyên   biệt   hoá   này,   các   thực   thểđược   phân

biệt dựa trên cơ sởhình thức trả tiền.

      Một chuyên biệt hoá được biểu diễn trong sơđồ EER như sau: Các lớp con

xác định một chuyên biệt hoá được nối bằng các đường đến một vòng tròn, vòng

tròn đó được nối với lớp cha. Ký hiệu tập con          (trên mỗi đường nối một tập con với

vòng tròn chỉ hướng của kiểu liên kết lớp cha / lớp con). Các thuộc tính chỉ áp dụng

                                                  40

----------------------- Page 42-----------------------

cho các thực thể của một lớp con cụ thể - ví dụ như Tốcđộđánhmáy của lớp con

THƯKÝ - được nối với hình chữ nhật biểu diễn lớp con đó. Các thuộc tính như vậy

gọi là các thuộc tính riêng hoặc là các thuộc tính địa phương của lớp con. Tương tự,

một    lớp   con  có   thể  tham   gia   vào   các  kiểu   liên  kết  riêng,  ví  dụ,  lớp   con

NHÂNVIÊN_HỢPĐỒNG tham gia vào kiểu liên kết <thuộc về> (hình II-7).

      Có hai lý do chính đểđặt các kiểu liên kết lớp cha/lớp con và chuyên biệt hoá

vào mô hình dữ liệu. Thứ nhất là có một số thuộc tính có thể áp dụng cho một số

các thực thể chứ không phải cho toàn bộ các thực thể của lớp cha. Khi đó, một lớp

con sẽđược xác định để nhóm các thực thể mà các thuộc tính đó có thể áp dụng

được. Các thành viên của lớp con này có thể vẫn chia sẻ phần lớn các thuộc tính

của chúng với các thành viên khác của lớp cha.Ví dụ, lớp con THƯKÝ có thuộc

tính riêng là Tốcđộđánhmáy, lớp con KỸSƯ có thuộc tính riêng là Kiểukỹsư nhưng

các thuộc tính khác của chúng là chung với kiểu thực thể NHÂNVIÊN. Lý do thứ

hai là chỉ có các thành viên của lớp con có thể tham gia vào một số kiểu liên kết

nào đó. Ví dụ, nếu chỉ có các nhân viên hợp đồng mới tham gia và công đoàn thì

chúng     ta   có  thể  diễn   đạt    sự  kiện   đó    bằng    cách   tạo   ra  một    lớp   con

NHÂNVIÊN_HỢPĐỒNG của NHÂNVIÊN và liên kết lớp con này với kiểu thực

thể CÔNGĐOÀN thông qua kiểu thực thể <thuộc về>.

      Tóm lại, quá trình chuyên biệt hoá cho phép chúng ta làm các việc sau:

  • Xác định một tập hợp các lớp con của một kiểu thực thể.

  • Thiết lập các thuộc tính riêng cho mỗi lớp con.

  • Thiết lập các kiểu liên kết riêng giữa mỗi lớp con và các kiểu thực thể khác

      hoặc các lớp con khác.

                                                 41

----------------------- Page 43-----------------------

                            Họđệm          Tên

                                                        Địachỉ

                         Mãsố      Họtên       Ngày                 Kiểucôngviệc

                                        NHÂN VIÊN

                         d                                                  d

    Tốcđộ

  đánhmáy

                                                              Lương                     LươngHĐ

                                       KiểuKỹ sư

                    Bậc

                                                     NGƯỜI         NHÂNVIÊN         NHÂNVIÊN

     THƯKÝ           KỸTHUẬT         KỸSƯ

                                                    QUẢNLÝ          BIÊNCHẾ         HỢP ĐỒNG

                       VIÊN

                                               Quảnlý                         Thuộc

                                              DỰ ÁN                         CÔNG ĐOÀN

                 Hình II-7. Biểu diễn lược đồ EER của chuyên biệt hoá

           IV.2.2-    Tổng quát hoá

      Là quá trình đảo ngược của chuyên biệt hoá, trong đó ta bỏ qua sự khác nhau

giữa một số kiểu thực thể, xác định các đặc tính chung của chúng và tổng quát hoá

chúng   thành   một   lớp   cha   của   các   kiểu   thực   thểđó.   Ví   dụ,   ta   có   kiểu   thực   thể

XECON   với   các   thuộc   tính   (Mãsố,   Sốgiấyphép,   Giá,   Tốcđộtốiđa,   Sốchỗngồi)   và

kiểu    thực  thể  XETẢI      với  các  thuộc   tính  (Mãsố,    Sốgiấyphép,     Giá,  Trọngtải,

Sốcáctrục), các kiểu thực thể này có một số thuộc tính chung, chúng có thểđược

tổng quát hoá thành kiểu thực thể XEÔTÔ với các thuộc tính (Mãsố, Sốgiấyphép,

Giá).   Các   kiểu   thực   thể XECON   và   XETẢI   trở thành   các   lớp   con   của   lớp   cha

XEÔTÔ. Như vậy, tổng quát hoá là quá trình tổng quát một kiểu thực thể từ các

kiểu thực thể cho trước.

                                                 42

----------------------- Page 44-----------------------

      Một tổng quát hoá được biểu diễn trong sơđồ EER giống như là một chuyên

biệt hoá. Tổng quát là lớp cha còn chuyên biệt là các lớp con được sử dụng để tạo

nên lớp cha (hình II-8).

                                             Sốgiấyphép

                             Mãsố

                                                                      Giá

                                               Xeôtô

                                                 d

                         Sốchỗ                                        Sốtrục

            Tốcđộ

                                                                                Trọngtải

                            Xe con                             Xe tải

                 Hình II-8. Xeôtô được tổng quát hoá từ Xecon và Xetải

            IV.2.3-    Phân cấp chuyên bi ệt và lưới chuyên biệt

      Bản thân các lớp con cũng có các lớp con của nó. Như vậy sẽ tạo ra một phân

cấp chuyên biệt hoá hoặc một lưới chuyên biệt hoá. Một phân c ấp chuyên bi ệt hoá

có ràng buộc là một lớp con chỉ tham gia vào một kiểu liên kết lớp cha/lớp con như

là một lớp con. Một lưới chuyên biệt có điều kiện là một lớp con có thể tham gia

vào nhiều kiểu liên kết lớpcha/lớpcon như là một lớp con. Nói cách khác, một lớp

con trong phân cấp chuyên biệt chỉ thừa kế một lớp cha, ngược lại, một lớp con

trong lưới chuyên biệt có thể thừa kế nhiều lớp cha. Một lớp con thừa kế nhiều lớp

cha thuộc các kiểu khác nhau được gọi là một kiểu hợp (union type) hoặc một ph ạm

trù (category).

            IV.2.4-    Các   ràng   buộc   và   các  đặc   trung   của   chuyên   biệt   hoá,   tổng

                       quát hoá

      Trong một số chuyên biệt hoá, chúng ta có thể xác định một cách chính xác

các thực thể sẽ là thành viên của một lớp con bằng cách đặt một điều kiện trên một

thuộc tính nào đấy của lớp cha. Các lớp con như vậy được gọi là các lớp con  được

xác  định bằng điều kiện. Nếu các lớp con của một chuyên biệt hoá có  điều kiện

thành viên trên cùng một thuộc tính của lớp cha thì chuyên biệt hoá đó cũng được

gọi là chuyên biệt hoá được xác định bằng thuộc tính. Nếu việc xác định một lớp

                                                   43

----------------------- Page 45-----------------------

con không theo một điều kiện nào thì lớp con đó được gọi là được người sử dụng

xác định.

     Có hai ràng buộc áp dụng cho một chuyên biệt hoá. Ràng buộc rời rạc chỉ ra

rằng các lớp con của một chuyên biệt phải rời rạc. Điều này có nghĩa là một thực

thể có thể là một thành viên của nhiều nhất là một trong số các lớp con của chuyên

biệt hoá. Một chuyên biệt hoá được xác định bằng thuộc tính thoả mãn ràng buộc

rời rạc nếu thuộc tính được sử dụng để xác định thành viên là đơn trị. Nếu các lớp

con không thoả mãn ràng buộc rời rạc, các tập thực thể của chúng có thể chồng

chéo nhau, nghĩa là một thực thể có thể là một thành viên của nhiều lớp con trong

chuyên biệt hoá. Ràng buộc thứ hai trong chuyên biệt hoá gọi là ràng buộc đầy đủ,

nó có thể là toàn bộ hoặc từng phần. Một ràng buộc chuyên biệt toàn bộ chỉ ra rằng

mỗi thực thể trong lớp cha phải là một thành viên của một lớp con nào  đó trong

chuyên biệt. Một ràng buộc chuyên biệt từng phần cho phép một thực thể của lớp

cha không thuộc về bất kỳ lớp con nào. Ví dụ, nếu một nhân viên phải hoặc là một

nhân viên biên chế hoặc là một nhân viên hợp đồng thì (NHÂNVIÊN_BIÊNCHẾ,

NHÂNVIÊN_HỢPĐỒNG) là một chuyên biệt toàn bộ của NHÂNVIÊN. Nếu một

nhân viên có thể không phải là một thư ký, một kỹ sư hoặc một kỹ thuật viên thì

chuyên   biệt   (THƯKÝ,   KỸSƯ,   KỸTHUẬTVIÊN)   là   một   chuyên   biệt   từng   phần

của NHÂNVIÊN.

     Trong sơđồ của mô hình EER, nếu một chuyên biệt hoá là rời rạc thì ở giữa

hình tròn nối với các lớp con có ghi chữ d (disjoin), còn một chuyên biệt là chồng

chéo thì ở giữa hình tròn nối các lớp con có ghi chữ o (overlap).

     IV.3-  Sơđồ mô hình EER

     Mô hình EER có biểu diễn đồ hoạ giống         như mô hình ER, nghĩa là các kiểu

thực thể (các lớp)  được biểu diễn bằng các hình chữ nhật có ghi tên  ở giữa, các

thuộc tính của chúng được biểu diễn bằng các hình ô van nối với hình chữ nhật.

Các kiểu liên kết được biểu diễn bằng các hình thoi và được nối với các kiểu thực

thể tham gia liên kết. Tại các hình thoi có ghi rõ các tỷ số lực lượng tham gia của

các kiểu thực thể tham gia vào kiểu liên kết. Ngoài ra, kiểu liên kết lớpcha/lớpcon

được biểu diễn bằng một đường nối có thêm một ký hiệu tập con “⊂“ ở giữa đường

nối. Các lớp con trong một chuyên biệt được nối với một vòng tròn và vòng tròn

được nối với lớp cha. Nếu chuyên biệt là rời rạc, giữa vòng tròn sẽ ghi chữ d, nếu

chuyên biệt là chồng chéo, giữa vòng tròn có ghi chữ o.

                                             44

----------------------- Page 46-----------------------

V-     Tổng kết chương và câu hỏi ôn tập

      V.1-    Tổng kết chương

      Trong chương này chúng ta đã thảo luận về vai trò của mô hình dữ liệu bậc

cao trong quá trình thiết kế cơ sở dữ liệu. Ta đã làm quen với các khái niệm cơ bản

của mô hình liên kết - thực thể: kiểu thực thể, kiểu liên kết, và các thuộc tính của

chúng. Các kiểu thuộc tính khác nhau cũng đã được xem xét: thuộc tính đơn, thuộc

tính phức hợp, thuộc tính đơn trị, thuộc tính đa trị, thuộc tính lưu trữ, thuộc tính suy

diễn được và các thuộc tính có giá trị null. Thông qua một ví dụ cụ thể, ta đã tiến

hành xây dựng mô hình ER           “CÔNGTY”. Ngoài ra, chúng ta cũng đã nói đến mô

hình EER, mở rộng của mô hình ER. Các khái niệm “mở rộng” như lớp, lớp con,

kiểu   liên   kết   lớp   cha/lớp   con,   chuyên   biệt   hoá,   tổng   quát   hoá   cũng  đã được   giới

thiệu và phân tích. Chúng ta cũng  đã nói đến cách biểu diễn  đồ hoạ của các mô

hình ER và EER.

      V.2-    Câu hỏi ôn tập

       1- Hãy nói về vai trò của mô hình dữ liệu bậc cao trong quá trình thiết kế cơ

sở dữ liệu.

      2- Liệt kê các trường hợp cần phải sử dụng giá trị null.

      3- Định nghĩa các thuật ngữ sau: thực thể, thuộc tính, giá trị thuộc tính, thể

hiện liên kết, thuộc tính phức hợp, thuộc tính đa trị, thuộc tính suy diễn được, thuộc

tính phức tạp, thuộc tính khoá, miền giá trị.

      4- Kiểu thực thể là gì? Tập thực thể là gì? Giải thích sự khác nhau giữa một

thực thể, một kiểu thực thể và một tập thực thể.

      5- Giải thích sự khác nhau giữa một thuộc tính và một tập giá trị.

      6 - Kiểu liên kết là gì? Giải thích sự khác nhau giữa một thể hiện liên kết, một

tập liên kết và một kiểu liên kết.

      7- Vai trò tham gia là gì? Khi nào cần phải sử dụng các tên vai trò trong mô tả

các kiểu liên kết.

      8- Mô tả cách chỉ ra các ràng buộc cấu trúc trên các kiểu liên kết.

      9- Với điều kiện nào một thuộc tính của một kiểu liên kết cấp 2 có thể chuyển

thành một thuộc tính của một trong các kiểu thực thể tham gia vào kiểu liên kết.

                                                  45

----------------------- Page 47-----------------------

      10- Khi chúng ta nghĩđến các liên kết như là các thuộc tính, các tập giá trị của

các thuộc tính đó là gì?

      11- Kiểu liên kết đệ quy là gì? Cho một số ví dụ về các kiểu liên kết đệ quy.

      12- Khi nào khái niệm kiểu thực thể yếu được dùng trong mô hìn hoá cơ sở dữ

liệu? Định nghĩa các thuật ngữ: kiểu thực thể chủ, kiểu thực thể yếu, khoá bộ phận,

kiểu liên kết xác định.

      13-   Trình   bày   các   khái   niệm   lớp,   lớp   con,   chuyên   biệt   hoá,   tổng   quát   hoá.

Trong hoàn cảnh nào ta cần tách một lớp thành các lớp con.

      14- Trình bày cách biểu diễn đồ hoạ của các mô hình ER và EER.

      V.3-   Bài tập

      Bài 1: Xây dựng mô hình ER cho cơ sở dữ liệu TRƯỜNG

      Hãy xây dựng lược đồ ER cho CSDL “TRƯỜNG”, dựa trên các ghi chép sau:

1)   Trường    được    chia  thành   các  trường   con:   Trường    KHTN,     Trường    KHXH,

     Trường   Công   nghệ,….   Mỗi   trường   có   một   hiệu   trưởng   quản   lý.   Mỗi   hiệu

     trưởng quản lý một trường.

2)   Mỗi trường có nhiều khoa. Chẳng hạn, trường KHTN có các khoa Toán, Lý,

     Hoá,… Mỗi một khoa chỉ thuộc về một trường. Thông tin về Khoa gồm Mã

     khoa, tên khoa, địa chỉ, sốđiện thoại, tên trường.

3)   Mỗi Khoa cung cấp nhiều môn học. Mỗi môn học gồm có Tên môn học, mã số,

     sốđơn vị học trình, trình độ, tên Khoa.

4)   Mỗi môn học có thể có nhiều học phần.Mỗi học phần được lưu giữ bằng các

     thông tin: Mã học phần, Tên môn học, Tên giáo viên dạy, học kỳ.

5)   Mỗi khoa có nhiều giáo viên làm việc, nhưng mỗi giáo viên chỉ làm việc cho

     một khoa. Mỗi một khoa có một chủ nhiệm khoa, đó là một giáo viên.

6)   Mỗi giáo viên có thể dạy nhiều nhất là 4 học phần và cũng có thể không dạy

     học phần nào.

7)   Mỗi sinh viên phải học nhiều học phần.

8)   Mỗi một khoa có nhiều sinh viên, mỗi sinh viên chỉ thuộc về một khoa. Thông

     tin về mỗi sinh viên gồm: Mã sinh viên, Họ tên, địa chỉ, ngày sinh, giới tính,

     Lớp, Tên Khoa và chếđộđào tạo.

                                                 46

----------------------- Page 48-----------------------

9)   Mỗi sinh viên có một người giám sát (giáo viên chủ nhiệm), người đó là một

     giáo viên.

10) Sau mỗi học kỳ sẽ có một danh sách điểm để phân loại. Nó gồm các thông tin:

     Mã sinh viên, mã học phần, điểm bằng chữ, điểm bằng số.

      Bài 2: Xây dựng mô hình ER cho cơ sở dữ liệu THƯ VIỆN.

      Hãy xây dựng lược đồ ER cho CSDL “THƯ VIỆN”, dựa trên các ghi chép

sau:

1)   Thư viện được chia ra thành các nhánh. Thông tin về mỗi nhánh gồm có Mã

     nhánh, Tên nhánh và Địa chỉ.

2)   Mỗi cuốn sách trong thư viện có các thông tin về Mã sách, Tên sách Nhà xuất

     bản và Tác giả…

3)   Một tác giả có thể viết nhiều cuốn sách. Một cuốn sách có thể có nhiều tác giả

     viết.

4)   Một nhà xuất bản xuất bản nhiều cuốn sách. Một cuốn sách do một nhà xuất

     bản xuất bản. Thông tin về Nhà xuất bản gồm có Tên, Địachỉ và Sốđiệnthoại.

5)   Một cuốn sách có thể có nhiều bản sao được lưu trữ tại các nhánh. Thông tin về

     bản sao sách gồm Mã sách, số các bản sao.

6)   Thư viện có những người mượn sách. Thông tin về những người mượn sách

     gồm có Số thẻ, Họ tên, Địa chỉvà Sốđiện thoại.

7)   Sách được   cho   các   người   mượn   mượn   tại   các   nhánh.   Thông   tin   về một   lần

     mượn gồm có Ngày mượn và ngày trả.

                                                47

----------------------- Page 49-----------------------

Chương III-  MÔ              HÌNH        QUAN        HỆ,      CÁC      RÀNG         BUỘC

                    QUAN HỆ VÀ ĐẠI SỐ QUAN HỆ

      Mô hình quan hệđược Ted Codd đưa ra đầu tiên vào năm 1970 và gây được

chú ý ngay tức khắc vì tính đơn giản và các cơ sở toán học của nó. Mô hình quan

hệ sử dụng khái niệm quan hệ toán học như là khối xây dựng cơ sở và có cơ sở lý

thuyết của nó trong lý thuyết tập hợp và logic vị từ bậc nhất. Trong chương này

chúng ta sẽ nói về các đặc trưng cơ bản của mô hình, các ràng buộc của chúng và

tập hợp các phép toán của mô hình quan hệ.

I-    Các khái niệm của mô hình quan hệ

      Mô hình quan hệ biểu thị cơ sở dữ liệu như một tập các quan hệ. Mỗi quan hệ

có thểđược biểu diễn như một bảng giá trị, mỗi một dòng trong bảng biểu thị một

tấp hợp các giá trị dữ liệu liên quan với nhau. Trong chương trước, chúng ta đã đưa

ra các khái niệm về kiểu thực thể và kiểu liên kết như là các khái niệm để mô hình

hoá dữ liệu của thế giới thực. Trong mô hình quan hệ, mỗi một dòng trong bảng

biểu   thị một   sự kiện   tương  ứng   với   một   thực   thể hoặc   một   liên   kết   của   thế giới

thực. Tên bảng và tên các cột dùng để giúp giải thích ý nghĩa của các giá trị trong

mỗi hàng. Mọi giá trị trong một cột đều cùng một kiểu dữ liệu

      Theo thuật ngữ mô hình quan hệ hình thức, mỗi hàng được gọi là một bộ, mỗi

đầu cột được gọi là một thuộc tính, và bảng được gọi là một quan hệ. Kiểu dữ liệu

mô tả các kiểu của dữ liệu xuất hiện trong mỗi cột gọi là một miền

      I.1-   Miền, thuộc tính, bộ và quan hệ

      Một miền D là một tập hợp các giá trị nguyên tử, điều đó có nghĩa là mỗi giá

trị trong miền là không thể phân chia được trong phạm vi mô hình quan hệ. Đểđặc

tả một miền, người ta chỉ ra một tên,      một kiểu dữ liệu và khuôn dạng dữ liệu. Một

số ví dụ vềđịnh nghĩa miền:

      . Họ tên: Tập hợp các dãy chữ cái có độ dài <= 30.

      . Tuổi: Tập các số nguyên nằm trong khoảng từ 1 đến 80.

      . Giới tính: Tập hợp gồm hai giá trị “Nam”, “Nữ”.

                                                48

----------------------- Page 50-----------------------

      Ngoài ra, trong cơ sở dữ liệu người ta còn chỉ ra các thông tin phụđể thể hiện

các giá trị của miền, chẳng hạn các đơn vị tính như tiền, trọng lượng,…

      Một lược đồ quan hệ R, ký hiệu là R(A  ,A ,..., A ), được tạo nên từ một tên

                                                          1   2       n

quan hệ R một danh sách các thuộc tính A ,A ,…, A . Mỗi một thuộc tính A  là tên

                                                      1   2       n                              i

vai trò của một miền D nào đó trong lược đồ quan hệ R. D được gọi là miền giá trị

của A  và được ký hiệu là Dom(A ). Một lược đồ quan hệđược sử dụng để mô tả

một quan hệ, R được gọi là tên của quan hệđó. Cấp của   một quan hệ là số các

thuộc tính của lược đồ quan hệ của nó. Ví dụ, ta có lược đồ cho quan hệ cấp 5:

SINHVIÊN (Mãsố, Họtên, Ngàysinh, Giớitính, Địachỉ). Với lược đồ quan hệ này,

SINHVIÊN là tên của quan hệ.

      Một quan hệ (hoặc trạng thái quan hệ) r của lược đồ quan hệ R(A ,A ,…, A )

                                                                                          1   2        n

được ký hiệu là r(R), là tập hợp các n-bộr =              {t  , t , ..., t  }. Mỗi n-bộ t là một danh

                                                            1   2      n

sách có thứ tự của n giá trị, t = <v , v , …, v >, trong đó mỗi v  ,1<= i <= n , là một

                                           1   2        n                      i

phần tử của Dom(Ai) hoặc là một giá trị không xác định (null value). Giá trị thứ i

của bộ t, tương ứng với thuộc tính A  được ký hiệu là                 t[A ] . Hình III-1 chỉ ra một

ví dụ của quan hệ SINHVIÊN tương ứng với lược đồ quan hệ SINHVIÊN ở trên.

Mỗi bộ trong quan hệ biểu diễn một thực thể sinh viên cụ thể. Quan hệđược biểu

diễn như một bảng, trong đó mỗi bộđược hiển thị như một hàng và mỗi thuộc tính

tương ứng với một đầu cột chỉ ra vai trò của các giá trị trong cột đó. Các giá trị

không   xác  định   biểu   thị các   thuộc   tính   mà   giá   trị của   nó   không   biết  được   hoặc

không tồn tại đối với từng bộ SINHVIÊN cụ thể.

 SINHVIÊN          Họtên              Mã số            Ngàysinh          Giớitính        Địachỉ

                   Lê Vân             4515202          12/09/84          Nữ              Hà nội

                   Hoàng Tùng         4516802          21/03/84          Nam             Bắc ninh

                   Trương Định        4620503          15/05/85          Nam             Hà nam

                   Phạm An            4612203          16/04/85          Nam             Nam định

                   Đỗ Cung            4521402          20/01/84          Nam             Nghệ an

                                 Hình III-1. Quan hệ SINHVIÊN

                                                      49

----------------------- Page 51-----------------------

      Định nghĩa quan hệở trên có thể phát biểu lại như sau: Một quan hệ r(R) là

một quan hệ toán học cấp n trên các miền giá trị dom(A ), dom(A ), …, dom(A ),

                                                                   1           2               n

đó là tập con của tích Đề các của các miền giá trị xác định R:

                          r( R) ⊆(dom(A ) x dom(A ) x … dom(A ))

                                             1            2                n

      Tích Đềcác chỉ ra mọi tổ hợp có thể có của các giá trị từ các miền đã cho. Như

vậy, nếu ta ký hiệu lực lượng của một miền D là             ⏐D ⏐ và giả thiết rằng mọi miền

đều hữu hạn thì tổng số các bộ trong tích Đề cac là:

                           ⏐dom(A1) ⏐* ⏐dom(A2) ⏐*….* ⏐dom(An) ⏐

      Ngoài tất cả các tổ hợp có thể có này, một trạng thái quan hệ ở một thời điểm

cho trước - gọi là trạng thái quan hệ hiện tại - chỉ phản ánh các bộ giá trị biểu diễn

một trạng thái cụ thể của thế giới thực. Nói chung, do trạng thái của thế giới thực

thay đổi, quan hệ cũng bị thay đổi thành trạng thái quan hệ khác. Tuy nhiên, lược

đồ R là ổn định, không thay đổi, trừ phi phải thêm vào một số thuộc tính để biểu

diễn một thông tin mới chưa được lưu trữ trong quan hệ.

      Có thể xảy ra trường hợp nhiều thuộc tính có cùng một miền giá trị. Các thuộc

tính chỉ ra các vai trò khác nhau đối với miền. Ví dụ, hai thuộc tính ĐịachỉNV và

ĐịachỉĐV có cùng miền giá trị nhưng thuộc tính thứ nhất tham chiếu đến địa chỉ

của nhân viên còn địa chỉ thứ hai tham chiếu đến địa chỉ của đơn vị.

      I.2-    Các đặc trưng của các quan hệ

            I.2.1-   Thứ tự của các bộ trong một quan hệ

      Một quan hệđược định nghĩa như một tập hợp các bộ. Các phần tử trong một

tập hợp không có thứ tự, vì vậy các bộ trong một quan hệ không có một thứ tự cụ

thể. Tuy nhiên, trong một tệp, các bản ghi được lưu trữ một cách vật lý trên đĩa vì

vậy luôn có một thứ tự giữa các bản ghi. Thứ tự này chỉ rõ bản ghi thứ nhất, bản

ghi thứ hai, …, bản ghi thứ n. Một cách tương tự, khi ta biểu diễn một quan hệ như

là một bảng, các hàng được hiển thị theo một thứ tự nhất định.

      Thứ tự các bộ không phải là một phần của định nghĩa quan hệ bởi vì một quan

hệ cố gắng biểu diễn các sự vật ở mức trừu tượng hoặc lôgic. Có thể có nhiều thứ

tự lôgic trên một quan hệ. Ví dụ, các bộ giá trị trong quan hệ SINHVIÊN  ở hình

III-1 có thể sắp xếp theo nhiều cách khác nhau: theo thứ tự logic của Họtên, theo

thứ tự logic của Mãsố,… Định nghĩa quan hệ không chỉ ra thứ tự lôgic nào cả, vì

                                                   50

----------------------- Page 52-----------------------

vậy không có thứ tự lôgic nào hơn thứ tự lôgic khác. Các quan hệ chứa cùng một số

hàng như nhau nhưng các hàng được sắp xếp khác nhau được xem nhưđồng nhất

với nhau. Khi một quan hệđược cài đặt như một tệp, một thứ tự vật lý có thểđược

chỉ ra trên các bản ghi của tệp.

             I.2.2-   Thứ tự của các giá trị bên trong một bộ

      Theo định nghĩa quan hệở trên, một n-bộ là một danh sách có thứ tự của n giá

trị. Như vậy thứ tự của các giá trị trong một bộ là quan trọng, từđó suy ra thứ tự

của các thuộc tính trong một lược đồ quan hệ cũng quan trọng. Tuy nhiên, ở mức

lôgic, thứ tự của các thuộc tính và các giá trị của nó là không thực sự quan trọng

khi giữđược sự tương ứng giữa các thuộc tính và các giá trị.

      Có thểđưa ra một định nghĩa khác về quan hệ, định nghĩa này sẽ làm cho thứ

tự của các giá trị trong một bộ là không cần thiết. Theo định nghĩa này, một lược

đồ quan hệ R = {A1, A2,…,An} là một tập hợp các thuộc tính và một quan hệr(R)

là một tập hợp hữu hạn các ánh xạ r = {t  , t , …., t               }, trong đó mỗi t      là một ánh

                                                     1   2        m                      i

xạ từ R vào D, trong đó D = dom(A )∪dom(A ) ∪…∪dom(A ). Trong định nghĩa

                                              1            2                   n

này, t[A ] phải ở trong dom(A ) với 1<= i <= n với mỗi ánh xạ t  trong r. Mỗi ánh xạ

ti  được gọi là một bộ.

      Theo định   nghĩa   này,   một   bộ có   thể xem   như một   tập   hợp   các   cặp   (<thuộc

tính>, <giá trị>), trong đó mỗi cặp cho một giá trị của ánh xạ từ một thuộc tính Ai

đến một giá trị v  của dom(A ) . Vì           tên thuộc tính xuất hiện cùng với giá trị của nó

nên thứ tự của các thuộc tính là không quan trọng. Điều này làm nên ý nghĩa ở mức

trừu tượng hoặc lôgic vì chẳng có lý do gì để thích có một giá trị thuộc tính xuất

hiện trước một giá trị thuộc tính khác trong một bộ.

      Khi một quan hệđược cài đặt như một tệp, các thuộc tính được sắp xếp một

cách vật lý như là các trường trong một bản ghi. Trong trường hợp đó chúng ta sẽ

sử dụng định nghĩa thứ nhất của quan hệ, trong đó các giá trị của các thuộc tính

trong một bộ là có thứ tự vì nó làm đơn giản rất nhiều khái niệm. Tuy nhiên, định

nghĩa thứ hai là tổng quát hơn.

             I.2.3-   Các giá trị trong một bộ

      Mỗi giá trị trong một bộ là một giá trị nguyên tử, điều đó có nghĩa là nó không

phân chia được thành các thành phần trong phạm vi của mô hình quan hệ. Như vậy,

trong mô hình quan hệ không cho phép có các thuộc tính phức hợp và các thuộc

                                                      51

----------------------- Page 53-----------------------

tính  đa   trị.   Các   thuộc   tính  đa   trị phải  được   biểu   diễn   bằng   các   quan   hệ còn   các

thuộc tính phức hợp chỉđược biểu diễn bằng các thuộc tính thành phần đơn của nó.

      Các giá trị của một vài thuộc tính trong một bộ cụ thể có thể không biết được

hoặc không thích ứng cho nó. Trường hợp đó, người ta sử dụng một giá trịđặc biệt

gọi là giá trị null.Ví dụ, giả sử quan hệ SINHVIÊN có thuộc tính Sốđiệnthoạiởnhà.

Trong một tập thể sinh viên, có người có điện thoại ở nhà, có người không có và

cũng có người có nhưng không biết chắc. Với những trường hợp không có hoặc

không biết chắc, thuộc tính Sốđiệnthoạiởnhà có giá trị null.

            I.2.4-   Thể hiện của một quan hệ

      Một   lược  đồ quan   hệ có   thểđược   thể hiện   như là   một   tuyên   bố hoặc   một

khẳng định. Ví dụ lược đồ quan hệ SINHVIÊN ở trên khẳng định rằng, nói chung,

một thực thể sinh viên có một        mã số, họ tên, ngày sinh, giới tính, địa chỉ. Mỗi bộ

trong quan hệđược thể hiện như là một sự kiện hoặc như một thể hiện cụ thể của

một khẳng định. Ngoài các quan hệ biểu diễn các sự kiện về các thực thể, một số

quan   hệ có   thể biểu   diễn   các   sự kiện   về mối   liên   kết.   Ví   dụ,   lược  đồ quan   hệ

NHÂNVIÊN_DỰÁN(MãsốNV,   MãsốDA,   Sốgiờ)   khẳng  định   các   nhân   viên   làm

việc với các dự án. Mỗi bộ trong quan hệ này liên kết một nhân viên với một dự án

mà anh ta làm việc cho nó.

      Như vậy, mô hình quan hệ biểu diễn các sự kiện về thực thể và các sự kiện về

liên kết dưới dạng duy nhất là các quan hệ.

II-   Các ràng buộc quan hệ, lược đồ cơ sở dữ liệu quan hệ

      Trong phần này chúng ta thảo luận về các hạn chế trên các dữ liệu trong một

lược đồ cơ sở dữ liệu quan hệ. Các hạn chếđó được gọi là các ràng buộc. Có các

loại ràng buộc: ràng buộc miền, ràng buộc khoá, ràng buộc toàn vẹn thực thể và

ràng buộc toàn vẹn tham chiếu.

      II.1-   Các ràng buộc miền

      Các ràng buộc miền chỉ ra rằng giá trị của mỗi thuộc tính A phải là một giá trị

nguyên tử thuộc miền giá trị dom(A). Các kiểu dữ liệu liên kết với các miền bao

gồm:   các   kiểu   dữ liệu   số chuẩn   cho   các   số nguyên   (short   integer,   integer,   long

integer), các số thực (float, double precision float). Ngoài ra còn các kiểu dữ liệu ký

tự (dãy ký tự với độ dài cốđịnh, dãy ký tự với độ dài thay đổi), ngày, thời gian và

                                                   52

----------------------- Page 54-----------------------

tiền tệ. Các loại miền khác có thể là các miền con của một kiểu dữ liệu hoặc một

kiểu dữ liệu đếm được trong đó mọi giá trị có thểđược liệt kê rõ ràng

      II.2-   Ràng buộc khoá và ràng buộc trên các giá trị không xác định (null)

      Một quan hệđược định nghĩa như một tập hợp các bộ. Theo định nghĩa, các

phần   tử của   một   tập   hợp   là   khác   nhau,   vì   vậy,   mọi   bộ trong   quan   hệ phải   khác

nhau. Điều đó có nghĩa là không có hai bộ có cùng một tổ hợp giá trị cho tất cả các

thuộc tính của chúng. Thông thường, có tồn tại các tập con của các thuộc tính của

một lược đồ quan hệ có tính chất là không có hai bộ nào  ở trong mọi trạng thái

quan hệ r của R có cùng một tổ hợp giá trị cho các thuộc tính của nó. Giả sử chúng

ta ký hiệu một tập con như vậy là SK, khi đó với hai bộ khác nhau bất kỳ t1 và t2

trong một trạng thái quan hệ r của R chúng ta có ràng buộc là  t [SK] ≠ t  [SK].

                                                                           1         2

      Tập hợp thuộc tính SK như vậy được gọi là một siêu khoá của lược đồ quan

hệ R. Một siêu khoá SK xác định rõ một ràng buộc về tính duy nhất, phát biểu rằng

không có hai bộ khác nhau trong một trạng thái r của R có cùng một giá trị cho SK.

Mỗi quan hệ có ít nhất là một siêu khoá mặc định, đó là tập hợp tất cả các thuộc

tính của nó. Một khoá K của một lược đồ quan hệ R là một siêu khoá của R với tính

chất là nếu bỏđi bất kỳ thuộc tính A nào ra khỏi K thì sẽ còn lại một tập K không

phải là siêu khoá của R. Như vậy, một khoá là một siêu khoá tối thiểu, nghĩa là đó

là một siêu khoá mà ta không thể vứt bỏ thuộc tính nào ra khỏi nó mà vẫn giữđược

ràng buộc về tính duy nhất.

      Ví   dụ,   xét   quan   hệ SINHVIÊN   với   các   thuộc   tính   Mãsố,   Họtên,   Ngàysinh,

Giớitính, Địachỉ. Thuộc tính {Mãsố} là một khoá của SINHVIÊN bởi vì không có

hai   bộ sinh   viên   có   cùng   một   giá   trị cho   Mãsố.   Mọi   tập   hợp   thuộc   tính   có   chứa

Mãsố, vídụ {Mãsố, Họtên, Ngàysinh}, đều là một siêu khoá. Tuy nhiên, siêu khoá

{Mãsố, Họtên, Ngàysinh} không phải là khoá bởi vì nếu bỏđi thuộc tính Họtên

hoặc Ngàysinh hoặc cả hai thì nó vẫn còn là một siêu khoá.

      Giá trị của một thuộc tính khoá có thểđược sử dụng để xác định một cách duy

nhất mỗi bộ trong một quan hệ. Ví dụ, giá trị 4515202 của Mãsố xác định một cách

duy nhất bộ giá trị tương ứng với sinh viên Lê Vân trong quan hệ SINHVIÊN. Chú

ý rằng một tập hợp thuộc tính tạo nên một khoá là một tính chất của lược đồ quan

hệ. Điều ràng buộc là tính chất đó phải thỏa mãn trên mọi trạng thái của lược đồ.

Một khoá được xác định từ ý nghĩa của các thuộc tính và tính chất là bất biến, tính

chất đó phải thỏa mãn khi chúng ta chèn thêm các bộ mới vào quan hệ. Ví dụ, ta

                                                   53

----------------------- Page 55-----------------------

không   thể và   không  được   chỉđịnh   thuôc   tính   Họtên   của   quan   hệ SINHVIÊN   là

khoá bởi vì không có gì đảm bảo rằng không tồn tại hai sinh viên có cùng họ tên.

      Nói chung, một lược đồ quan hệ có thể có nhiều hơn một khoá. Trong trường

hợp  đó, mỗi một khoá được gọi là một khoá dự tuyển. Thông thường ta phải chỉ

định một trong các khoá dự tuyển làm khoá chính của quan hệ. Khoá chính là một

khoá dự tuyển mà các giá trị của chúng được dùng để xác định các bộ trong quan

hệ. Ta quy ước rằng, các thuộc tính tạo nên khoá chính của một lược đồ quan hệ

được gạch dưới. Ví dụ:

                   SINHVIÊN( Mãsố, Họtên, Ngàysinh, Giớitính, Địachỉ ).

      Chú ý rằng khi một lược đồ quan hệ có nhiều khoá dự tuyển, việc lựa chọn

một   khoá   dự tuyển  để làm   khoá   chính   là   tuỳ ý,   tuy   nhiên   tốt   nhất   là   chọn   khoá

chính gồm một thuộc tính hoặc có số các thuộc tính ít nhất.

      Một ràng buộc khác trên các thuộc tính chỉ rõ khi nào thì cho phép các giá trị

null. Những thuộc tính luôn luôn phải có một giá trị xác định và hợp lệ thì bị ràng

buộc là NOT NULL.

      II.3-   Cơ sở dữ liệu quan hệ và lược đồ cơ sở dữ liệu quan hệ

      Ở trên, chúng ta đã nói đến các lược đồ quan hệđơn lẻ và các quan hệđơn lẻ.

Một cơ sở dữ liệu quan hệ thường gồm nhiều quan hệ với các bộ giá trị trong các

quan hệđược liên kết với nhau theo nhiều cách. Trong phần này chúng ta sẽđịnh

nghĩa một cơ sở dữ liệu quan hệ và một lược đồ cơ sở dữ liệu quan hệ. Một lược đồ

cơ sở dữ liệu quan hệ S là một tập hợp các lược đồ quan hệ

                    S = {R , R ,…, R }       và một tập các ràng buộc toàn vẹn.

                            1    2       n

      Một trạng thái cơ sở dữ liệu quan hệ (hoặc một cơ sở dữ liệu quan hệ) DB của

S là một tập hợp các trạng thái quan hệ:

                                         DB = {r , r , …, r }

                                                   1  2       n

      sao cho mỗi r  là một trạng thái của R  và sao cho các trạng thái quan hệ r  thoả

mãn các ràng buộc toàn vẹn chỉ ra trong tập các ràng buộc toàn vẹn.

      Ví dụ, Hình III-2 trình bày một lược đồ cơ sở dữ liệu CÔNGTY và hình III-3

trình bày một cơ sở dữ liệu công ty.

NHÂNVIÊN(Họđệm, Tên, MãsốNV, Ngàysinh, Địachỉ, Giớitính, Lương,

                 MãsốNGS, MãsốĐV)

                                                    54

----------------------- Page 56-----------------------

 ĐƠNVỊ(TênĐV, MãsốĐV, MãsốNQL, Ngàybắtđầu)

 ĐƠNVỊ_ĐỊAĐIỂM(MãsốĐV, ĐịađiểmĐV)

 DỰÁN(TênDA, MãsốDA, ĐịađiểmDA, Mã sốĐV)

 NHÂNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ)

 CON(MãsốNV, TênPT, Giớitính, Ngàysinh)

                   Hình III-2. Lược đồ cơ sở dữ liệu “CÔNG TY”

NHÂNVIÊN   MãsốNV   Họđệm    Tên    Ngày sinh Địachỉ Giớitính  Lương MãsốNGS    MãsốĐV

           NV001    Lê       Vân     12/02/79 Hà nội  Nam      3000  NV002      5

           NV002    Trần     Nam     14/02/66 Hà nội  Nam      4000  NV061      5

                    Đức

           NV010    Hoàng    Thanh  05/08/79  Nghệ Nữ          2500  NV014      4

                                              an

           NV014    Phạm     Bằng   26/06/52  Bắc     Nam      4300  NV061      4

                                              ninh

           NV016    Nguyễn   Sơn     14/08/73 Hànam   Nam      3800  NV002      5

           NV018    Vũ       Giang  26/03/83  Nam     Nữ       2500  NV002      5

                    Hương                     định

           NV025    Trần Lê  Hoa     15/03/80 Phú     Nữ       2500  NV014      4

                                              thọ

           NV061    Hoàng    Giáp   02/05/47  Hà tĩnh Nam      5500  Null       1

 ĐƠNVỊ  MãsốĐV       TênĐV          Mã sốNQL    Ngàybắtdầu

           5         Nghiên cứu     NV002       15/09/2000

           4         Hànhchính      NV014       24/06/1997

           1         Lãnhđạo        NV061       25/01/1992

                                             55

----------------------- Page 57-----------------------

ĐƠNVỊ_ĐỊAĐIỂM                Mã sốĐV           ĐịađiểmĐV

                              1                Hà nội

                              4                Hà nội

                              5                Nam đinh

                              5                Hà nội

                              5                Bắc ninh

DỰÁN           TênDA         Mã sốDA          ĐịađiểmDA          Mã sốĐV

               DA01           1               Hà nội              5

               DA02           2               Nam định            5

               DA03           3               Bắc Ninh            5

               DA04           10              Hà nội              4

               DA05          20               Hà nội              1

               DA06           30              Hà nội              4

NHÂNVIÊN_DỰÁN                    Mã sốNV         Mã sốDA         Sốgiờ

                                 NV001            1              32

                                 NV001            2               7

                                 NV016            3              40

                                 NV018            1              20

                                 NV018            2              20

                                 NV002            2               10

                                 NV002            3               10

                                 NV002           10               10

                                 NV002           20               10

                                                                  56

----------------------- Page 58-----------------------

                     NV010      30         30

                     NV010      10         10

                     NV025      10         35

                     NV025      30         5

                     NV014      30         20

                     NV014      20         15

                     NVO61      20         null

CON      MãsốNV    Têncon     Giớitính Ngày sinh

        NV002      Giang      Nữ        04/05/1997

        NV002      Bình       Nam       25/10/1994

        NV002      Hoa        Nữ        03/05/1969

        NV014      Lan        Nữ        29/02/1953

        NV001      Bình       Nam       04/01/1999

        NV001      Hòa        Nũ        04/01/1999

        NV001      Hương      Nữ        05/05/1981

                       Hình III-3. Cơ sở dữ liệu “CÔNGTY”

     Trong một lược đồ cơ sở dữ liệu quan hệ, các thuộc tính biểu diễn cùng một

khái niệm thế giới thực có thể (hoặc không) có cùng tên như nhau trong các quan

hệ khác nhau. Ngược lại, các thuộc tính biểu diễn các khái niệm khác nhau có thể

có tên như nhau trong các quan hệ khác nhau. Ví dụ, trong cơ sở dữ liệu CÔNGTY

ở trên, các thuộc tính MãsốNV, MãsôNGS, MãsốNQL có tên khác nhau nhưng đều

biểu diễn một khái niệm đó là mã số nhân viên (bởi vì người giám sát hoặc người

quản lý cũng là nhân viên). Trong lúc đó, thuộc tính Giớitính có mặt trong hai quan

hệ NHÂNVIÊN và CON, tuy nhiên Giớitính trong quan hệ NHÂNVIÊN là biểu thị

giới tính của nhân viên còn Giớitính trong CON là biểu thị giới tính của người con.

     Trong một số phiên bản trước của mô hình quan hệ, người ta yêu cầu rằng các

thuộc tính biểu diễn cùng một khái niệm của thế giới thực thì phải có tên như nhau

                                           57

----------------------- Page 59-----------------------

trong mọi quan hệ. Điều  đó sẽ gây ra khó khăn khi cùng một khái niệm thế giới

thực được sử dụng trong các vai trò khác nhau.

      Một   hệ quản   trị cơ sở dữ liệu   phải   có   ngôn   ngữđịnh   nghĩa   dữ liệu   (Data

definition   language   DDL)  đểđịnh   nghĩa   lược  đồ cơ sở dữ liệu   quan   hệ.   Các   hệ

quản trị cơ sở dữ liệu hiện nay hầu như sử dụng SQL cho mục đích này.

      Các ràng buộc toàn vẹn được chỉ ra trên một lược đồ cơ sở dữ liệu và được tôn

trọng làm thoả mãn trên mỗi trạng thái cơ sở dữ liệu của lược đồ này. Ngoài các

ràng buộc miền và ràng buộc khoá còn có thêm các ràng buộc được xem như một

phần của mô hình quan hệ, đó là ràng buộc toàn vẹn thực thể và ràng buộc toàn vẹn

tham chiếu.

      II.4-   Toàn vẹn thực thể, toàn vẹn tham chiếu và khoá ngoài

      Ràng buộc toàn vẹn thực thểđược phát biểu là: khoá chính phải luôn luôn có

giá trị xác định, nghĩa là không được phép có giá trị null. Sở dĩ có điều đó là do giá

trị của   khoá   chính được   sử dụng  để xác  định   các   bộ giá   trị riêng   biệt   trong   một

quan hệ. Việc có giá trị null cho khoá chính kéo theo việc chúng ta không thể xác

định được một số bộ giá trị. Ví dụ, nếu có hai hay nhiều hơn các bộ giá trị có giá trị

null cho khoá chính thì chúng ta không có khả năng phân biệt chúng.

      Các ràng buộc khoá và ràng buộc toàn vẹn thực thểđược chỉ ra trên các quan

hệ riêng rẽ. Ràng buộc toàn vẹn tham chiếu được chỉ ra giữa hai quan hệđể duy trì

sự tương ứng giữa các bộ của hai quan hệ. Một cách không hình thức, ràng buộc

toàn vẹn tham chiếu được phát biểu là: một bộ giá trị trong một quan hệ có liên kết

đến một quan hệ khác phải liên kết đến một bộ giá trị tồn tại trong quan hệđó.

      Đểđịnh nghĩa toàn vẹn tham chiếu một cách hình thức hơn, trước tiên chúng

ta đưa ra khái niệm khoá ngoài: Một tập hợp các thuộc tính FK trong một lược đồ

quan hệ R  là một khoá ngoài của R  tham chiếu đến quan hệ R  nếu nó thoả mãn

             1                              1                                 2

hai quy tắc sau:

      qt1. Các thuộc tính trong FK có cùng miền giá trị như các thuộc tính của khoá

chính PK của R2. Các thuộc tính FK được gọi là tham chiếu đến (hoặc là liên hệ

đến) quan hệ R2.

      qt2. Một giá trị của FK trong một bộ t  của trạng thái hiện tại r (R ) hoặc có

                                                     1                              1   1

mặt như một giá trị của khoá chính của một bộ t2 nào đấy trong trạng thái hiện tại

r (R ), hoặc là null. Trong trường hợp này ta có t  [FK] = t [PK] và ta nói rằng bộ t

 2   2                                                     1         2                             1

                                                    58

----------------------- Page 60-----------------------

liên hệ (tham chiếu) đến bộ t  . R      được gọi là quan hệ tham chiếu và R          được gọi là

                                  2   1                                            2

quan hệ bị tham chiếu.

      Trong một cơ sở dữ liệu có nhiều quan hệ thường có nhiều ràng buộc toàn vẹn

tham chiếu. Để chỉ ra các ràng buộc này, trước tiên ta phải có một hiểu biết rõ ràng

về ý nghĩa hoặc vai trò của mỗi tập thuộc tính ở trong các lược đồ quan hệ khác

nhau của cơ sở dữ liệu. Các ràng buộc toàn vẹn quy chiếu thường nảy sinh từ các

mối liên kết giữa các thực thểđược biểu diễn bằng các lược đồ quan hệ.

      Chú   ý   rằng   một   khoá   ngoài   có   thể tham   chiếu  đến   quan   hệ của   chính   nó.

Trong trường hợp đó, khoá ngoài biểu thị một liên kết đệ quy.

      Chúng ta có thể biểu diễn các ràng buộc tham chiếu bằng sơđồ. Để làm điều

đó ta vẽ một cạnh có hướng từ mỗi khoá ngoài đến quan hệ mà nó tham chiếu đến.

Hình III-4 biểu diễn lược đồở hình 3.2 với các ràng buộc quy chiếu được biểu diễn

theo cách này.

      NHÂNVIÊN( Họđệm,Tên, MãsốNV, Ngàysinh, Địachỉ, Giớitính,Lương, MãsốNGS, MãsốĐV)

                       ĐƠNVỊ ( TênĐV, MãsốĐV, MãsốNQL, Ngàybắtđầu)

                       ĐƠNVỊ_ĐỊAĐIỂM( MãsốĐV, ĐịađiểmĐV)

                       DỰÁN( TênDA, MãsốDA, ĐịađiểmDA, Mã sốĐV)

                      NHÂNVIÊN_DỰÁN( MãsốNV, MãsốDA, Sốgiờ)

                      PHỤTHUỘC( MãsốNV, TênCon, Giớitính, Ngàysinh)

                         Hình III-4. Lược đồ và sơđồ tham chiếu

      Ngoài các ràng buộc toàn vẹn ở trên, cơ sở dữ liệu còn phải thoả mãn một số

ràng buộc khác, như ràng buộc trạng thái, ràng buộc chuyển tiếp… Các ràng buộc

trạng thái xác định các ràng buộc mà một trạng thái vững chắc của cơ sở dữ liệu

phải thoả mãn. Ví dụ về các ràng buộc đó là: “lương của một nhân viên không được

                                                   59

----------------------- Page 61-----------------------

vượt quá lương của người giám sát nhân viên đó” hoặc “số giờ nhiều nhất mà một

nhân viên có thể làm việc trong một tuần trên tất cả các dự án là 56 giờ”. Các ràng

buộc như vậy có thểđược đặc tả và bắt tuân theo bằng cách sử dụng một ngôn ngữ

đặc tả ràng buộc. Người ta có thể sử dụng các cơ cấu như là trigger hoặc assertion.

Các ràng buộc chuyển tiếp có thểđược định nghĩa để làm việc với những thay đổi

trạng thái trong cơ sở dữ liệu. Ví dụ về ràng buộc này là: “ lương của một nhân

viên chỉ có thể tăng”. Các ràng buộc như vậy thường được định nghĩa bằng cách sử

dụng các quy tắc hoặc bằng các trigger.

III-  Các phép toán trên mô hình quan hệ

     Trong phần này chúng ta thảo luận về các phép toán của mô hình quan hệ. Các

phép toán của mô hình quan hệ có thể phân thành hai loại: các phép toán cập nhật

và các phép toán đại số quan hệ. Các phép toán cập nhật được sử dụng để tạo ra

một quan hệđúng đắn. Các phép toán đại số quan hệđược sử dụng đểđặc tả các

phép lấy thông tin ra.

     III.1-  Các phép toán cập nh ật

     Các phép toán cập nhật gồm ba phép toán cơ bản là chèn, xoá và sửa đổi. Phép

chèn được dùng để chèn một bộ giá trị hoặc nhiều bộ giá trị vào một quan hệ. Phép

xoá dùng để loại bỏ các bộ giá trị và phép sửa đổi dùng để sửa đổi các giá trị của

một số thuộc tính trong các bộ giá trịđã có. Mỗi khi các phép toán cập nhật được

áp dụng, các ràng buộc trên lược đồ cơ sở dữ liệu có thể bị vi phạm. Trong phần

này chúng ta sẽ nói đến khả năng vi phạm các ràng buộc của từng phép toán và các

kiểu hành động có thể thực hiện khi một ràng buộc bị vi phạm.

          III.1.1-  Phép chèn (Insert)

     Phép chèn cung cấp một danh sách các giá trị cho một bộ mới t được chèn vào

trong một quan hệ R. Phép chèn có thể vi phạm các kiểu ràng buộc được mô tảở

trên. Các ràng buộc miền có thể bị vi phạm nếu một giá trị thuộc tính được cho

không thuộc vào miền tương ứng. Các ràng buộc khoá có thể bị vi phạm nếu một

giá trị khoá trong bộ mới t đã tồn tại trong một bộ khác ở trong quan hệ r(R). Sự

toàn vẹn thực thể có thể bị vi phạm nếu khoá chính của bộ mới t là null. Sự toàn

vẹn tham chiếu có thể bị vi phạm nếu một giá trị của một khoá ngoài trong t tham

chiếu đến một bộ không tồn tại trong một quan hệđược tham chiếu. Ví dụ (với các

bảng trong cơ sở dữ liệu CÔNGTY) :

                                            60

----------------------- Page 62-----------------------

  • Chèn bộ giá trị <null, ‘Vũ’, ‘Hải’, ‘15/07/81’, ‘Hànội’, ‘Nam’, 3200, null, 4>

      vào quan hệ NHÂNVIÊN. Phép chèn này vi phạm ràng buộc toàn vẹn thực thể

      (giá trị null cho khoá chính). Phép chèn bị loại bỏ.

  • Chèn   bộ giá   trị <‘NV002’,‘Trương’,‘Phi’,‘15/07/81’,   ‘Hànội’,   ‘Nam’,   3200,

      ‘NV067’,   4>   vào   quan   hệ NHÂNVIÊN.   Phép   chèn   này   vi   phạm   ràng   buộc

      khoá, bới vì giá trị ‘NV002’ đã có ở trong bảng. Phép chèn bị loại bỏ.

  • Chèn   bộ giá   trị <‘NV072’,   ‘Vũ’,   ‘Hải’,   ‘15/07/81’,   ‘Hànội’,   ‘Nam’,   3200,

      ‘NV002’ , 7> vào quan hệ NHÂNVIÊN. Phép chèn này vi phạm ràng buộc

      toàn vẹn tham chiếu, trong quan hệĐƠNVỊ không có đơn vị có mã số = 7.

      Phép chèn bị loại bỏ.

  • Chèn   bộ giá   trị <‘NV045’l,   ‘Vũ’,   ‘Hải’,   ‘15/07/81’,   ‘Hànội’,   ‘Nam’,   3200,

      ‘NV002’, 4> vào quan hệ NHÂNVIÊN. Phép chèn thoả mãn tất cả các ràng

      buộc, vì thế nó được chấp nhận.

      Nếu một phép chèn vi phạm một hoặc nhiều ràng buộc, tuỳ chọn mặc định là

loại bỏ phép chèn. Trong trường hợp này, thường là các hệ quản trị cơ sở dữ liệu có

thể thông báo cho người sử dụng nguyên nhân của việc loại bỏ phép chèn.

           III.1.2-  Phép xoá (Delete)

      Phép xoá được sử dụng  để xoá một hoặc nhiều bộ giá trị của một quan hệ.

Phép xoá chỉ có thể vi phạm ràng buộc tham chiếu trong trường hợp bộ bị xoá được

tham chiếu bởi một khoá ngoài từ các bộ khác trong cơ sở dữ liệu. Để chỉ rõ một

phép xoá, cần phải đưa ra một điều kiện trên các thuộc tính của quan hệđể chọn

các bộ sẽ bị xoá. Ví dụ:

  • Xoá một bộ giá trị của quan hệ NHÂNVIÊN_DỰÁN có MãsốNV = ‘NV010’

      và MãsốDA = 10. Phép xoá này được chấp nhận.

  • Xoá bộ giá trị của NHÂNVIÊN có MãsốNV = ‘ NV010’. Phép xoá này không

      chấp nhận được bởi vì có các bộ trong NHÂNVIÊN_DỰÁN tham chiếu đến

      bộ này, như vậy là vi phạm ràng buộc toàn vẹn tham chiếu.

  • Xoá bộ giá trị của NHÂNVIÊN có MãsốNV = ‘ NV002’. Phép xoá này cũng

      vi phạm ràng buộc toàn vẹn tham chiếu .

      Ba tuỳ chọn được sẵn sàng được sử dụng nếu một phép xoá gây ra sự vi phạm.

Tuỳ chọn thứ nhất là loại bỏ phép xoá. Tuỳ chọn thứ hai là cố gắng lan truyền phép

                                               61

----------------------- Page 63-----------------------

xoá (cascade the deletion) bằng cách xoá đồng thời các bộ tham chiếu  đến bộ bị

xoá. Tuỳ chọn thứ ba là sửa đổi các giá trị của các thuộc tính tham chiếu gây ra sự

vi phạm. Mỗi giá trị như vậy hoặc là làm cho bằng null hoặc được thay đổi thành

bộ có hiệu lực tham chiếu khác. Chú ý rằng, nếu một thuộc tính tham chiếu gây ra

sự vi phạm là một phần của khoá chính thì không thể làm cho thành null, bởi vì nếu

làm vậy thì sẽ vi phạm ràng buộc toàn vẹn thực thể. Có thể kết hợp cả ba tuỳ chọn

ở trên.

           III.1.3-  Phép sửa đổi (Update)

      Phép toán sửa đổi được dùng để thay đổi các giá trị của một hoặc nhiều thuộc

tính trong một (hoặc nhiều) bộ của một quan hệ R nào đấy. Để lựa chọn các bộ cần

được thay đổi, người sử dụng phải chỉ ra một điều kiện trên các thuộc tính. Ví dụ:

  • Sửa đổi Lương của bộ NHÂNVIÊN có MãsốNV = ‘NV018’ thành 2800. Phép

      sửa đổi này được chấp nhận.

  • Sửa đổi MãsốĐV của bộ NHÂNVIÊN có MãsốNV = ‘NV018’ thành 7. Phép

      sửa đổi này vi phạm ràng buộc toàn vẹn tham chiếu.

  • Sửa     đổi   MãsốNV      của  bộ  NHÂNVIÊN         có  MãsốNV      =  ‘NV018’     thành

      ‘NV014’. Phép sửa đổi này vi phạm ràng buộc toàn vẹn thực thể và toàn vẹn

      tham chiếu.

      Việc sửa đổi một thuộc tính không phải là một khoá chính hoặcc   một khoá

ngoài thường không gây ra các vi phạm ràng buộc, hệ quản trị cơ sở dữ liệu chỉ cần

kiểm tra để khẳng định rằng giá trị mới là thuộc miền và kiểu giá trịđúng đắn. Việc

sửa đổi giá trị một khoá chính tương tự như việc xoá một bộ và chèn bộ khác vào

chỗ của nó. Như vậy chúng ta trở về trường hợp  đã thảo luận với phép chèn và

phép xoá. Nếu một thuộc tính khoá ngoài bị sửa đổi thì hệ quản trị cơ sở dữ liệu

phải đảm bảo rằng giá trị mới tham chiếu đến một bộ có tồn tại trong quan hệđược

tham chiếu (hoặc là null).

     III.2-  Các phép toán đại số quan hệ

      Ngoài việc định nghĩa cấu trúc cơ sở dữ liệu và các ràng buộc, một mô hình

dữ liệu phải chứa một tập hợp phép toán  để thao tác dữ liệu. Tập hợp cơ sở các

phép toán mô hình quan hệ tạo nên đại số quan hệ. Các phép toán này giúp cho

người sử dụng xác định rõ các yêu cầu lấy tin cơ bản. Kết quả của một phép lấy tin

                                               62

----------------------- Page 64-----------------------

là một quan hệ mới, có thểđược tạo ra từ một hoặc nhiều quan hệ. Các quan hệđó

có thểđược thao tác tiếp theo bằng cách sử dụng các phép toán của cùng đại số.

Một dãy các phép toán quan hệ tạo nên một biểu thức đại số quan hệ mà kết quả

của nó cũng là một quan hệ.

      Các phép toán đại số quan hệđược chia thành hai nhóm. Một nhóm bao gồm

các phép toán tập hợp lấy từ lý thuyết tập hợp toán học. Các phép toán đó là phép

hợp, phép giao, phép trừ tập hợp và phép tích Đề các. Nhóm kia bao gồm các phép

toán được xây dựng đặc biệt cho các cơ sở dữ liệu quan hệ. Các phép toán đó là

phép chọn, phép chiếu, phép nối và một số các phép toán khác.

           III.2.1-   Phép chọn (SELECT)

      Phép   chọn  đưllợc   sử dụng  để chọn   một   tập   hợp   các   bộ thoả mãn  điều   kiện

chọn từ một quan hệ. Ta có thể xem phép chọn như một bộ lọc, nó chỉ giữ lại các

bộ thoả mãn điều kiện đặt ra.

      Phép chọn được ký hiệu là

                                         σ< điều kiện chọn>( R)

      trong đó ký hiệu  σđược dùng để ký hiêu phép chọn, còn điều kiện chọn là

một biểu thức lôgic được chỉ ra trên các thuộc tính của R. Chú ý rằng R nói chung

là một biểu thức đại số quan hệ. Kết quả của một biểu thức đại số quan hệ là một

quan hệ. Biểu thức đơn giản nhất chính là tên của một quan hệ của một cơ sở dữ

liệu. Quan hệ kết quả của phép chọn có cùng thuộc tính như R. Ví dụ, để chọn các

bộ NHÂNVIÊN thuộc vềđơn vị có mã số là 4 hoặc các bộ NHÂNVIÊN có lương

lớn hơn 3000 ta có thể viết một cách riêng rẽ như sau:

                                    σ< Mãsố = 4>( NHÂNVIÊN)

                                   σ< Lương > 3000>( NHÂNVIÊN)

      Biểu thức logic chỉ ra trong <điều kiện chọn> được tạo nên từ một số hạng

mục có dạng :

              <tên thuộc tính> <phép so sánh> <giá trị hằng>

      hoặc     <tên thuộc tính> <phép so sánh> <tên thuộc tính>

      trong đó <tên thuộc tính> là tên của một thuộc tính trong R, <phép so sánh> là

một trong các phép toán so sánh {<, <=, =, >=, >, ≠} còn <giá trị hằng> là một giá

                                                 63

----------------------- Page 65-----------------------

trị hằng từ miền giá trị của thuộc tính. Các hạng mục có thểđược nối với nhau bằng

các phép toán lô gic AND, OR, NOT để tạo ra một điều kiện chọn chung. Ví dụ, để

chọn ra các nhân viên làm việc ởđơn vị có mã số là 4 và có lương lớn hơn 3000

hoặc các nhân viên làm việc ởđơn vị có mã số là 5 và có lương lớn hơn                 4000 ta có

thể viết phép chọn như sau:

             σ< MãsốĐV = 4>AND <lương>3000>OR< MãsốĐV = 5>AND <lương>3500>( NHÂNVIÊN)

      Kết quả chỉ ra ở hình III-5.

 MãsốNV      Họđệm      Tên    Ngàysinh    Địachỉ  Giớitính     Lương     MãsốNGS      MãsốĐV

 NV002       Trần Đức   Nam     14/02/66   Hà nội     Nam       4000      NV061        5

 NV014       Phạm       Bằng   26/06/52    Bắc ninh   Nam       4300      NV061        4

 NV016      Nguyễn      Sơn     14/08/73   Hà nam     Nam       3800      NV002        5

                                Hình III-5. Kết quả phép chọn

      Chú ý rằng các phép toán so sánh trong tập hợp {<, <=, =, >=, >, ≠} áp dụng

cho các thuộc tính có miền giá trị là các giá trị có thứ tự như là miền giá trị số.

Miền giá trị các dãy ký tựđược xem như có thứ tự dựa trên việc so sánh các dãy ký

tự. Nếu miền giá trị của một thuộc tính là một tập hợp các giá trị không có thứ tự

thì chỉ có các phép so sánh trong tập hợp { =, ≠ } là có thể áp dụng được. Ngoài ra,

có thể còn các phép so sánh bổ sung, chẳng hạn như “ là một dãy con của…” hoặc

“trong khoảng từ… đến…”.

      Kết quả một phép chọn  được xác định như sau: <Điều kiện chọn>  được   áp

dụng cho mỗi bộ t trong R một cách độc lập.  Điều  đó được thực hiện bằng cách

thay thế mỗi thuộc tính A  trong điều kiện chon bằng giá trị t[A ] của nó trong bộ.

Nếu điều kiện chọn cho giá trịđúng thì bộ t sẽđược chọn. Tất cả các bộđược chọn

xuất hiện trong kết quả của phép chọn. Các phép toán logic AND, OR, NOT được

thực hiện theo quy tắc bình thường của chúng.

      Phép chọn là phép toán một ngôi, nghĩa là nó được áp dụng cho một quan hệ.

Hơn nữa, phép chọn được áp dụng cho từng bộ một cách độc lập, vì vậy, các điều

kiện chọn không thể liên quan đến nhiều bộ. Quan hệ kết quả của phép chọn có cấp

giống như cấp của R. Số các bộ trong quan hệ kết quả luôn luôn nhỏ hơn hoặc bằng

số các bộ trong R.

                                                   64

----------------------- Page 66-----------------------

      Phép chọn là một phép toán có tính chất giao hoán, nghĩa là

               σ< Điều kiện 1> (σ< Điều kiện 2>( R)) = σ< Điều kiện 2> (σ< Điều kiện 1>( R))

      Hơn nữa ta có thể kết hợp một loạt các phép chọn thành một phép chọn đơn

giản bằng cách sử dụng phép toán AND. Ví dụ:

                σ< Điều kiện 1> (σ< Điều kiện 2>( R))  = σ< Điều kiện 2>AND< Điều kiện 1>( R)

            III.2.2-  Phép chiếu (PROJECT)

      Nếu ta coi một quan hệ như một bảng thì phép chọn chọn một số hàng của

bảng thoả mãn điều kiện chọn và bỏ qua các hàng không thoả mãn điều kiện chọn.

Phép chiếu là phép toán chọn một số cột của bảng. Nếu chúng ta chỉ quan tâm đến

một số thuộc tính của quan hệ, chúng ta dùng phép chiếu  để chiếu lên các thuộc

tính đó. Phép chiếu được ký hiệu là:

                                       π<danh sách các thuộc tính>( R)

      trong đó π là ký hiệu dùng để biểu diễn phép chiếu và <danh sách các thuộc

tính> là một danh sách con các thuộc tính của quan hệ R. Nói chung R là một biểu

thức đại số quan hệ. Trường hợp đơn giản nhất nó là tên của một quan hệ của cơ sở

dữ liệu. Kết quả của phép chiếu là một quan hệ chỉ có các thuộc tính nằm trong

<danh sách các thuộc tính> và có cùng thứ tự như thứ tự của chúng có trong danh

sách. Như vậy, cấp của quan hệ kết quả là số các thuộc tính có trong <danh sách

các thuộc tính>.

      Nếu <danh sách các thuộc tính> chỉ bao gồm các thuộc tính không phải thuộc

tính khoá của R thì quan hệ kết quả có thể có những bộ trùng nhau. Phép chiếu loại

bỏ mọi bộ trùng lặp, và như vậy, kết quả của phép chiếu là một tập hợp các bộ và là

một quan hệđúng đắn.

      Ví dụ, phép chiếu:

                             π< MãsốNV, Họđệm,Tên, Lương>(NHÂNVIÊN)

      cho kết quả là một quan hệ có các thuộc tính MãsốNV, Họđệm, Tên, Lương

(hình III-6).

                    MãsốNV      Họđệm          Tên      Địachỉ        Lương

                    NV001       Lê             Vân      Hà nội        3000

                                                   65

----------------------- Page 67-----------------------

                   NV002       Trần Đức      Nam      Hà nội        4000

                   NV010       Hoàng         Thanh    Nghệ an       2500

                   NV014       Phạm          Bằng     Bắc ninh      4300

                   NV016       Nguyễn        Sơn      Hànam         3800

                   NV018       Vũ Hương      Giang    Nam định      2500

                   NV025       Trần Lê       Hoa      Phúthọ        2500

                   NV061       Hoàng         Giáp     Hà tĩnh       5500

                              Hình III-6. Kết quả phép chiếu

      Số các bộ trong quan hệ kết quả từ một phép chiếu luôn luôn nhỏ hơn hoặc

bằng số các bộ trong R. Nếu danh sách chiếu là một siêu khoá của R (nghĩa là nó

chứa một khoá nào đó của R) thì quan hệ kết quả có cùng một số bộ như R. Ngoài

ra, nếu <danh sách 2> chứa tất cả các thuộc tính có trong <danh sách 1> thì

                        π< danh sách1>(π< danh sách2> ( R)) = π< danh sách 1> ( R)

      Phép chiếu không có tính giao hoán.

           III.2.3-  Phép đặt lại tên (RENAME)

      Chúng ta có thể áp dụng nhiều phép toán quan hệ liên tiếp nhau. Trong trường

hợp đó hoặc chúng ta có thể viết các phép toán như là một biểu thức đại số quan hệ

đơn bằng cách xếp lồng các phép toán lại với nhau, hoặc chúng ta có thể áp dụng

mỗi phép toán tại một thời điểm và tạo ra các quan hệ kết quả trung gian. Trong

trường hợp tạo các quan hệ trung gian, ta phải đặt tên cho quan hệđó. Ví dụ: Để

đưa ra Họtên và Lương của các Nhânviên làm việc ởđơn vị có Mãsố là 4 chúng ta

phải áp dụng một phép chọn và một phép chiếu. Chúng ta có thể viết một biểu thức

đại số quan hệđơn như sau :

                           π< Họtên, Lương >(σ <Mãsố = 4> (NHÂNVIÊN))

      Một cách khác, chúng ta có thể tạo ra kết quả trung gian và viết biểu thức trên

thành dãy các phép toán như sau:

              KQTG      ← σ<Mãsố = 4>(NHÂNVIÊN)

              Ketqua    ←π < Họtên, Lương >(KQTG)

                                                 66

----------------------- Page 68-----------------------

      Thông thường việc phân tích một dãy phức tạp các phép toán bằng cách chỉ ra

các quan hệ kết quả trung gian là dễ hơn việc viết một biểu thức đại số quan hệ

đơn. Chúng ta có thể dùng kỹ thuật này đểđặt lại tên (rename) cho các thuộc tính

trong các quan hệ trung gian và kết quả. Đểđặt lại tên cho các thuộc tính của một

quan hệ, chúng ta liệt kê các tên mới của các thuộc tính trong cặp dấu ngoặc. Ví dụ:

                          R(Họvà tên, Lương) ←π< Họtên , Lương >( KQTG)

      Cho kết quả là quan hệ R, trong đó thuộc tính Họtên được đặt lại tên thành

Họvàtên.

      Nếu không có việc đặt lại tên thì tên của các thuộc tính trong quan hệ kết quả

của một phép chọn là giống như các tên trong quan hệ ban đầu và có cùng một thứ

tự như thứ tự của các thuộc tính đó. Đối với phép chiếu, nếu không có việc đặt lại

tên thì quan hệ kết quả có các tên thuộc tính giống như các tên trong danh sách

chiếu và có cùng thứ tự như chúng xuất hiện trong danh sách.

      Chúng ta có thểđịnh nghĩa một phép toán đặt lại tên , nó có thểđặt lại tên cho

một tên quan hệ hoặc các tên thuộc tính hoặc cả hai. Phép đặt lại tên được ký hiệu

là:

                      ρ             (R)    hoặc   ρ(R)        hoặc    ρ            (R)

                        S(B1,B2,…Bn)                S                  (B1,B2,…Bn)

      trong đó ký hiệu ρđược dùng để ký hiệu phép toán đặt lại tên, S là tên quan

hệ mới, B ,B ,…B  là các tên thuộc tính mới. Biểu thức thứ nhất đặt lại tên quan hệ

            1   2      n

và các thuộc tính của nó. Nếu các thuộc tính của R là A ,A , ...A  thì sau khi đặt lại

                                                                    1   2      n

tên, quan hệ có tên mới là S còn các thuộc tính có tên mới là B , B , …, B . Biểu

                                                                               1    2        n

thức thứ hai chỉđặt lại tên quan hệ, nghĩa là sau phép đặt lại tên, quan hệ có tên

mới là S, còn các thuộc tính vẫn mang tên cũ. Biểu thức thứ ba chỉđặt lại tên các

thuộc tính, nếu các thuộc tính của R là A ,A , ...A  thì sau khi đặt lại tên chúng có

                                                   1   2      n

tên là B , B , ...B .

          1   2      n

            III.2.4-    Các phép toán lý thuyết tập h ợp

      Nhóm tiếp theo của các phép toán đại số quan hệ là các phép toán toán học

thông thường trên các tập hợp. Đó là các phép toán hợp, giao và trừ tập hợp. Các

phép toán này là các phép toán hai ngôi, nghĩa là mỗi phép toán được áp dụng cho

hai tập hợp. Khi áp dụng các phép toán này cho cơ sở dữ liệu quan hệ, hai quan hệ

tham gia vào một trong các phép toán trên phải có kiểu của các bộ như nhau, hay

nói cách khác, chúng phải có cùng một cấu trúc. Điều kiện này được gọi là tương

                                                     67

----------------------- Page 69-----------------------

thích  đồng   nhất.   Hai   quan   hệ R(A  ,A ,…,   A )   và S(B ,   B ,   …,BB )  được   gọi   là

                                        1  2       n            1   2       n

tương thích đồng nhất nếu chúng có cùng cấp n và dom(Ai) = dom(Bi) với                1<= i

<= n. Điều đó có nghĩa là hai quan hệ có cùng số các thuộc tính và mỗi cặp thuộc

tính tương ứng có cùng miền giá trị.

      Các phép toán được định nghĩa như sau:

      . Phép hợp: Hợp của hai quan hệ R và S, được ký hiệu là R ∪ S, cho kết quả là

một quan hệ chứa tất cả các bộ có trong R hoặc ở trong S hoặc ở trong cả hai. Các

bộ trùng lặp bị loại bỏ.

      . Phép giao: Giao của hai quan hệ R và S , được ký hiệu là R ∩ S , cho kết quả

là một quan hệ chứa tất các các bộ có trong cả hai quan hệ R và S.

      . Phép trừ quan hệ: Phép trừ quan hệ R và S , được ký hiệu là R - S, cho kết

quả là một quan hệ chứa tất cả các bộ có trong R nhưng không có trong S.

       Ví dụ, xét hai quan hệ:

   R        Họtên      Tuổi       Giớitính         S       Họtên       Tuổi      Giớitính

            AA         20         Nam                      BB          18        Nữ

            BB         18         Nữ                       EE          20        Nam

            CC         21         Nam                      DD          25        Nữ

            DD         25         Nữ                       FF          21        Nam

   R∪S     Họtên       Tuổi       Giớitính         R∩S     Họtên       Tuổi      Giớitính

           AA          20         Nam                      BB          18        Nữ

           BB           18        Nữ                       DD          25        Nữ

           CC          21         Nam

           DD          25         Nữ               R - S   Họtên       Tuổi      Giớitính

           EE          20         Nam                      AA          20        Nam

           FF          21         Nam                      CC          21        Nam

                    Hình III-7. Kết quảcủa các phép toán tập h ợp

                                               68

----------------------- Page 70-----------------------

      Chú ý rằng các phép toán hợp và giao là các phép toán giao hoán, nghĩa là:

                            R ∪ S   =  S ∪ R    và    R ∩ S    =  S ∩ R

      Các phép toán trên cũng có tính chất kết hợp, nghĩa là

                R ∪ (S    ∪ T) = (R ∪ S) ∪ T       và  R ∩ (S ∩T)     = (R∩S) ∩T

      Phép toán trừ tập hợp không có tính chất giao hoán.

                                           R - S  ≠ S - R

      Ngoài các phép toán trên, còn có một phép toán gọi là tích Đề các. Tích Đề

các còn gọi là tích hỗn hợp (cross product) hoặc là nối hỗn hợp (cross join), được

ký hiệu là  ×. Đó cùng là một phép toán hai ngôi nhưng những quan hệ mà nó áp

dụng trên đó không phải là tương thích đồng nhất. Phép toán này được sử dụng để

nối các bộ của hai quan hệ vào một kiểu kết hợp. Kết quả của

                              R(A , A , .. , A )× S(B  , B , …,B  )

                                   1    2      n        1   2       m

      là một quan hệ Q với n+m thuộc tính Q(A , A ,…, A , B , B ,…,B  ). Quan hệ

                                                      1   2       n   1    2      m

kết quả Q có các bộđược tạo thành do sự kết hợp một bộ của R và một bộ của S.

Ví dụ, xét hai quan hệ R và S như sau:

       R      A1      A2     A3                       S         B1       B2       B3

              aa      bb     cc                                 dd       da       db

              ab      ba     ac                                 cd       cb       ac

                    R × S     A1      A2      A3     B1       B2      B3

                              aa      bb      cc     dd       da      db

                              aa      bb      cc     cd       cb      ac

                              ab      ba      ac     dd       da      db

                              ab      ba      ac     cd       cb      ac

                    Hình III-8. Tích Đề các của hai quan hệ R và S.

                                                 69

----------------------- Page 71-----------------------

       Như vậy, nếu R có n   bộ và S có n  bộ thì R× S               có n   *n  bộ. Phép toán này

                                 R                 S                       R   S

nếu áp dụng một mình thì không có ý nghĩa mấy. Nó chỉ có lợi khi tiếp theo bằng

một phép chọn các giá trị tương thích của các thuộc tính xuất phát từ các quan hệ

thành phần. Tích Đềcác kết hợp với một phép chọn cho ta một phép nối.

             III.2.5-   Phép nối (JOIN)

       Phép nối được ký hiệu là              và được dùng để kết hợp các bộ có liên hệ với

nhau từ hai quan hệ thành một bộ. Phép toán này rất quan trọng đối với cơ sở dữ

liệu quan hệ có nhiều bảng bởi vì nó cho phép ta xử lý các mối liên kết giữa các

quan     hệ.  Dạng     tổng   quát   của   phép   nối   trên  hai  quan    hệ R(A  ,    A ,…,A )      và

                                                                                    1    2       n

 S(B ,B ,…, B  ) là

     1   2       m

                                               R             S

                                                < Điều kiện nối>

       Kết   quả của   phép   nối   là   một   quan   hệ Q(A  ,A ,…,A ,B ,B ,…,B  )   có   n+m

                                                               1   2       n   1  2       m

thuộc tính. Mỗi bộ của Q là một sự kết nối giữa một bộ của R và một bộ của S khi

chúng thoả mãn điều kiện nối. Sự khác nhau giữa tích Đề các và phép nối là ở chỗ

trong phép nối, chỉ có các bộ thoả mãn điều kiện nối mới xuất hiện trong kết quả,

trong khi đó trong tích Đề các mọi tổ hợp của các bộđều có trong kết quả. Điều

kiện nối được chỉ ra trên các thuộc tính của hai quan hệ R và S và được tính toán

cho mỗi tổ hợp các bộ. Mọi tổ hợp bộ mà điều kiện nối là đúng được chứa trong

quan hệ kết quả Q như là một bộđơn. Một điều kiện nối tổng quát có dạng

                   <điều kiện> AND <điều kiện> AND … AND <điều kiện>

       trong đó mỗi điều kiện có dạng A            θ B , A  là một thuộc tính của R, B  là một

                                                 i     j    i                                 j

thuộc tính của S, A  và B  có cùng miền và θ là một trong các dấu phép toán so sánh

                        i      j

 {<, <=, =, >=, >, ≠}. Một phép toán nối với điều kiện tổng quát như vậy gọi là một

phép n ối tê-ta. Các bộ có các thuộc tính nối là null không xuất hiện trong kết quả.

Theo nghĩa đó, phép toán không nhất thiết phải xử lý mọi thông tin trong các quan

hệ tham gia. Ví dụ :

       Giả sử ta có hai quan hệ R và S như sau:

    R         A1         A2        A3                     S          B1         B2         B3

              Aa         Ca        Ba                                Ba         Aaa        Bbb

              Ab         Cb        Bb                                Bb         Ccc        Ddd

                                                      70

----------------------- Page 72-----------------------

            Ac        Ca        Ba

            Ad        Cc       Null

            Ae        Cd        Bb

      Khi đó kết quả của phép nối tê-ta R và S với điều kiện A3 = B1 sẽ cho kết quả

là:

    R      S      A1       A2        A3        B1        B2        B3

    <A3 = B1>     Aa       Ca        Ba        Ba        Aaa       Bbb

                  Ab       Cb        Bb        Bb        Ccc       Ddd

                  Ac       Ca        Ba        Ba       Aaa        Bbb

                  Ae       Cd        Bb        Bb        Ccc       Ddd

                         Hình III-9. Phép nối tê-ta hai quan hệ

      Phần lớn các phép nối chỉ cho phép các điều kiện nối với các so sánh bằng.

Những phép nối chỉ sử dụng phép so sánh bằng được gọi là nối bằng (equi join). Ví

dụ trong hình III-8 là một phép nối bằng. Chú ý rằng trong kết quả của phép nối

bằng chúng ta thấy luôn luôn có một hoặc nhiều cặp thuộc tính có các giá trị như

nhau trong mỗi bộ. Việc có các cặp thuộc tính có giá trị như nhau là thừa, vì vậy

người ta đề nghị một phép nối mới gọi là nối tự nhiên, ký hiệu là *. Phép nối tự

nhiên nhằm loại bỏ thuộc tính thứ hai (thuộc tính thừa) trong điều kiện nối bằng.

Định nghĩa chuẩn của nối tự nhiên đòi hỏi hai thuộc tính nối (hoặc mỗi cặp thuộc

tính nối) phải có tên như nhau trong cả hai quan hệ. Nếu các thuộc tính đó không

cùng tên thì trước khi nối phải áp dụng phép toán đặt lại tên. Ví dụ, ta cần nối tự

nhiên hai quan hệ R(A1,A2,A3) và S(B1,B2,B3) như trong ví dụ trên. Để có thể

thực hiện được phép nối tự nhiên với điều kiện so sánh bằng, ta phải đổi tên thuộc

tính B1 thành A3, nghĩa là ta phải viết:

                                        R * ρ(A3, B2,B3)(S)

      Phép nối sẽ có kết quả như sau:

                  R * S   A1        A2       A3        B2        B3

                          Aa        Ca       Ba        Aaa       Bbb

                                                71

----------------------- Page 73-----------------------

                           Ab         Cb        Bb        Ccc        Ddd

                           Ac         Ca        Ba        Aaa        Bbb

                           Ae         Cd        Bb        Ccc        Ddd

                        Hình III-10. Phép nối tự nhiên hai quan hệ

      Nếu các thuộc tính mà trên đó nối tự nhiên được chỉ ra có tên như nhau thì

việc đặt lại tên là không cần thiết.

      Chú ý rằng nếu không có một tổ hợp các bộ nào thoả mãn điều kiện nối thì kết

quả của một phép nối là một quan hệ rỗng không chứa bộ nào. Nói chung, nếu R có

n   bộ và S có n  bộ thì kết quả của phép nối R với S sẽ có số các bộ lớn hơn 0 và

 R                S

nhỏ hơn n  .n . Cỡ của một kết quả nối chia cho cỡ cực đại n  .n  tạo nên một tỷ lệ

            R   S                                                       R   S

gọi là chọn lựa nối, đó là một tính chất của mỗi điều kiện nối. Nếu không có điều

kiện nối, mọi tổ hợp các bộ sẽđược chọn và phép nối trở thành một tích Đề các.

      Phép nối được sử dụng để kết hợp các dữ liệu từ nhiều quan hệ sao cho các

thông tin có liên hệ với nhau có thểđược biểu diễn trong một bảng. Đôi khi phép

nối được áp dụng nối một bảng với chính nó. Chúng ta có thể áp dụng phép nối tự

nhiên và nối bằng để nối nhiều bảng với nhau. Nếu ta nối n bảng với nhau thì phải

chỉ ra n-1 điều kiện nối.

            III.2.6-   Tập h ợp  đầy đủ các phép toán quan hệ

      Người ta đã chỉ rằng tập hợp các phép toán đại số quan hệ {σ, π, ∪, −, ×} là

một tập đầy đủ, nghĩa là mọi phép toán đại số quan hệ khác có thểđược biểu diễn

thông qua các phép toán của tập hợp này. Ví dụ, phép giao có thểđược biểu diễn

bằng cách sử dụng các phép hợp và trừ tập hợp như sau:

                              R ∩ S      (R ∪ S) − ((R- S) ∪ (S − R))

      Như vậy, nói một cách chính xác là không cần phải có phép giao. Mỗi khi cần

thực hiện một phép giao, ta chỉ cần đưa ra biểu thức phức tạp này là đủ.

      Một ví dụ khác, một phép nối có thểđược chỉ ra như một tích Đề các và sau

đó là một phép chọn:

                             R          S  =   σ < Đièu kiện chọn> (R × S)

                             < Điều kiện nối>

                                                  72

----------------------- Page 74-----------------------

      Một cách tương tự, ta có thể thay thế phép nối tự nhiên bằng một tích Đề các

đi sau một phép đặt lại tên và sau đó là các phép toán chọn và chiếu. Như vậy các

phép toán nối cũng không cần thiết. Tuy nhiên các phép toán đó rất quan trọng bởi

vì chúng tiện dùng và rất thường xuyên được áp dụng trong các cơ sở dữ liệu. Các

phép toán đó được đưa vào trong đại số quan hệ là do tiện dụng hơn là do cần thiết.

Một phép toán khác cũng được đưa vào, đó là phép chia.

           III.2.7-  Phép chia

      Phép chia có lợi cho một loại truy vấn đặc biệt đôi khi có các ứng dụng trong

cơ sở dữ liệu. Phép chia được áp dụng cho hai quan hệ R(Z) và S(X) và được ký

hiệu là  R(Z) ÷ S(X), trong đó X ⊂ Z . Giả sử Y = Z - X (như vậy Z = X ∪ Y). Kết

quả của phép chia là quan hệ T(Y) chứa một bộ t nếu các bộ tR xuất hiện trong R

với t  [Y] = t và với t  [X] = t  với mọi bộ t  trong S. Điều đó có nghĩa là để một bộ t

     R                R        S              S

xuất hiện trong kết quả T của phép chia, các giá trị trong t phải xuất hiện trong R

trong sự kết nối với mọi bộ của S.

      Ví dụ: Xét phép chia quan hệ R(A,B) cho quan hệ S(A) như hình vẽ dưới đây.

Ta thấy chỉ có các thuộc tính B1 và B4      là kết nối với tất cả các bộ của S ở trong R.

Vì vậy kết quả nhận được là một quan hệ T(B) với hai giá trị của B là B1 và B4.

      Phép chia có thếđược biểu diễn thông qua các phép toán        π, ×, −như sau:

                   T ←π( R ) ;      T  ←π((S × T ) − R ) ; T ←T         − T

                     1    Y          2      Y        1                 1    2

      R        A           B                        S           B

               A1          B1                                   A1

               A2          B1                                   A2

               A3          B1                                   A3

               A4          B1

               A1          B2

               A3          B2

               A2          B3                       T           A

               A3          B3                                   B1

               A4          B3                                   B4

                                               73

----------------------- Page 75-----------------------

                A1          B4

                A2          B4

                A3          B4

                    Hình III-11. Phép chia T(B)      =   R(A,B) ÷ S(B).

      III.3-  Các phép toán quan hệ bổ sung

      Có nhiểu truy vấn cơ sở dữ liêu không thể thực hiện được bằng các phép toán

đại số cơ bản trình bày ở trên. Trong phần này chúng ta sẽ trình bày các phép toán

bổ sung để biểu diễn các truy vấn đó. Các phép toán này làm tăng cường sức mạnh

của đại số quan hệ.

           III.3.1-   Các hàm nhóm và các phép nhóm

      Kiểu câu hỏi đầu tiên không thể biểu diễn được trong đại số quan hệ cơ sở là

chỉ ra các hàm nhóm toán học trên các tập hợp giá trị của các cơ sở dữ liệu. Các ví

dụ về các hàm như vậy có thể là đưa ra lương trung bình hoặc tổng lương của tất cả

nhân viên, hoặc cho biết số các bộ của bảng nhân viên. Các hàm hay áp dụng để

thu thập các giá trị số là hàm Tổng (SUM), Trungbình (AVERAGE), Tính giá trị

lớn nhất (MAX), Giá trị bé nhất (MIN). Hàm Đếm (COUNT) được sử dụng đểđếm

các bộ giá trị.

      Một kiểu câu hỏi hay dùng khác là đòi hỏi nhóm các bộ trong một quan hệ

theo một giá trị của một số các thuộc tính của chúng và sau đó áp dụng các hàm

nhóm     một   cách  độc   lập  cho   từng  nhóm.    Ví  dụ,  nhóm    các   bộ  của  quan   hệ

NHÂNVIÊN theo MãsốĐV. Như vậy, mỗi nhóm bao gồm các nhân viên cùng làm

việc trong một đơn vị. Sau đó chúng ta có thểđưa ra mỗi giá trị của MãsốĐV cùng

với lương trung bình của các nhân viên ở trong đơn vị.

      Chúng ta có thểđịnh nghĩa một phép toán nhóm như sau:

                              < các thuộc tính nhóm>  ℑ< danh sách các hàm>(R)

      trong  đó ℑ là ký hiệu phép toán hàm nhóm, <các thuộc tính nhóm> là một

danh   sách   các   thuộc   tính   của   quan   hệđược   chỉ ra   trong   R,   <danh   sách   hàm>   là

danh sách các cặp (<hàm><thuộc tính)>). Trong các cặp như vậy, <hàm> là một

trong các hàm cho phép như SUM, AVERAGE, MAX, MIN, COUNT, và <thuộc

tính> là một thuộc tính của quan hệđược chỉ ra trong R. Quan hệ kết quả có các

                                                74

----------------------- Page 76-----------------------

thuộc tính nhóm cộng với một thuộc tính cho mỗi phần tử trong danh sách hàm. Ví

dụ, để lấy ra theo MãsốĐV các nhân viên và lương trung bình của các nhân viên

theo từng đơn vị, ta có thể viết:

                       MãsốDVℑ COUNT ( ), AVERAGE(Lương)( NHÂNVIÊN)

     Kết quảđược minh hoạở hình III-10.

                         MãsốĐV    COUNT()       AVERAGE(Lương)

                         1         1             5500

                         4         3             3100

                         5         4             3325

                           Hình 3.10 Minh hoạ phép toán nhóm

     Nếu không chỉ ra thuộc tính nhóm thì các hàm được áp dụng cho các giá trị

thuộc tính của tất cả các bộ trong quan hệ, vì vậy quan hệ kết quả chỉ có một bộ.

Cần chú ý rằng, nói chung, các trùng lặp không được loại bỏ khi hàm nhóm được

áp dụng. Kết quả của việc áp dụng một hàm nhóm là một quan hệ chứ không phải

là một đại lượng vô hướng, thậm chí nếu nó chỉ có một giá trị.

           III.3.2- Các phép toán khép kín đệ quy

     Một kiểu phép toán khác, nói chung, không chỉ ra được trong các phép toán

đại số quan hệ cơ sở là phép toán khép kín đệ quy. Phép toán này được áp dụng

cho mối liên kết đệ quy giữa các bộ cùng kiểu.Với các phép toán này chúng ta phải

sử dụng kỹ thuật lặp.

           III.3.3- Các phép toán nối ngoài (outer join), hợp ngoài (outer union)

     Trong phần này chúng ta thảo luận một vài mở rộng của phép toán nối và hợp.

Các phép toán nối mô tảở trên liên kết các bộ thoả mãn điều kiện nối. Như vậy, các

bộ không có bộ liên kết sẽ bị loại khỏi kết quả nối. Các bộ với giá trị null trong các

thuộc tính nối cũng bị loại. Một tập hợp các phép toán gọi là nối ngoài có thểđược

sử dụng khi chúng ta muốn giữ các bộ trong R hoặc S hoặc trong cả hai quan hệ

trong kết quả của phép nối dù chúng có những bộ liên kết trong quan hệ kia hay

không. Có ba phép nối ngoài gọi là nối ngoài trái (left outer join), nối ngoài phải

(right outer join) và nối ngoài đầy đủ (full outer join), được ký hiệu tương ứng là:

                                             75

----------------------- Page 77-----------------------

                 Nối ngoài trái       Nối ngoài phải        Nối ngoài đầy đủ

      Phép nối ngoài trái giữ lại mọi bộ trong quan hệ bên trái R trong phép nối.

Nếu không có bộ liên kết nào được tìm thấy trong S thì các thuộc tính của S trong

kết quả phép nối được “làm đầy” bằng các giá trị null.

      Tương tự như vậy đối với các phép nối ngoài phải và các phép nối ngoài đầy

đủ.

      Phép toán hợp ngoài được mở rộng để lấy hợp của các bộ từ các quan hệ nếu

các bộ không tương thích đồng nhất. Phép toán này chỉ lấy hợp của các quan hệ mà

chúng chỉ tương thích bộ phận, nghĩa là chỉ một vài thuộc tính của chúng là tương

thích phép hợp. Điều phải tôn trọng là danh sách các thuộc tính tương thích phải

chứa một khoá cho cả hai quan hệ. Các bộ từ các quan hệ thành phần với cùng một

khoá chỉđược biểu diễn một lần trong kết quả và có giá trị cho tất cả các thuộc tính

trong kết quả. Các thuộc tính không tương thích phép hợp từ bất kỳ quan hệ nào

cũng được giữ trong kết quả và các bộ không có giá trị cho các thuộc tính này cũng

được lấp đầy bằng những giá trị null.

      III.4-  Một số ví dụ về truy vấn trong đại số quan hệ

      Trong phần này, chúng ta xét một số ví dụ minh họa việc sử dụng các phép

toán đại số quan hệ. Các ví dụởđây thực hiện trên cơ sở dữ liệu “CÔNG TY” ở

mục II.3 chương III. Nói chung, một truy vấn có thểđược thực hiện bằng nhiều

cách, sử dụng các phép toán khác nhau. Trong các ví dụ sau, chúng ta xét một cách

thực hiện, các bạn đọc có thể tựđưa ra các cách thực hiện khác.

      Truy vấn 1: Đưa ra Họđệm, Tên và địa chỉ của tất cả các nhân viên làm việc

cho đơn vị có tên là “Nghiên cứu”: (Các quan hệ TG1, TG2 là các kết quả trung

gian)

      TG1 ←σTênĐV = “Nghiêncứu” (ĐƠNVỊ)

      TG2 ←(TG1 ∗ NHÂNVIÊN)

      KETQUA       ←πHọđệm, Tên, Địachỉ (TG2)

      Theo   cách   thực   hiện   này,   quan   hệ TG1   chứa   thông   tin   vềđơn   vị có   tên

“Nghiên cứu”, quan hệ TG2 chứa thông tin về các nhân viên làm việc cho đơn vị

“Nghiên cứu” và quan hệ KẾTQUẢ chứa các thông tin theo yêu cầu của truy vấn.

                                                76

----------------------- Page 78-----------------------

Trong các bảng của chúng ta, các thuộc tính nối có tên như nhau nên có thể dùng

phép nối tự nhiên.

      Truy vấn 2: Với mỗi dự án đặt tại Hà nội, hãy liệt kê MãsốDA, TênĐV, Tên,

Địachỉ, Ngàysinh của người quản lý đơn vị.

      TG1 ← σDiadiemDA=”Hanoi”(DỰÁN)

      TG2 ←(TG1 ∗ĐƠNVỊ)

      TG3 ←(TG2 * NHÂNVIÊN)

      KẾTQUẢ ←πMãsốDA, MãsốĐV, Họđệm,Địachỉ, Ngàysinh (TG3)

      Truyvấn 3: Hãy tìm tên của các nhân viên làm việc trên tất cả các dự án do

đơn vị có mã số = 5 kiểm soát.

      TG1 ←πMãsốDA (σMã sốDV = 5 (DỰÁN))

      TG2 ←πMãsốNV, MãsốDA (NHÂNVIÊN_DỰÁN)

      TG3 ←TG2 ÷ TG1

      KETQUA      ←πHọđệm, Tên (TG3 * NHÂNVIÊN)

IV-  Chuyển đổi mô hình ER thành mô hình quan hệ

     Nhưđã     thảo luận ở chương II, bước tiếp theo sau việc xây dựng mô hình dữ

liệu   mức   khái   niệm,   ta   phải   chuyển  đổi   mô   hình  đó   thành   một   mô   hình   dữ liệu

lôgic. Trong phần này chúng ta sẽ thảo luận về thuật toán chuyển đổi một mô hình

ER thành ra mô hình quan hệ.

     IV.1-   Các quy tắc chuyển đổi

      Thuật   toán   chuyển  đổi  được   thực   hiện   theo   các   bước   sau   (dựa   trên   CSDL

“CÔNG TY”):

      Bước 1 : Với mỗi kiểu thực thể thông thường E trong lược đồ ER, hãy tạo một

quan hệ R chứa mọi thuộc tính đơn của E. Với các thuộc tính phức hợp, chỉ lấy các

thuộc tính thành phần đơn của nó. Chọn một trong các thuộc tính khoá của E làm

khoá chính cho R. Nếu khoá được chọn của E là phức hợp (gồm nhiều thuộc tính)

thì tập các thuộc tính đơn đó sẽ cùng nhau tạo nên khoá chính của R.

                                               77

----------------------- Page 79-----------------------

      Ví   dụ:   Giả sử ta   có   kiểu   thực   thểĐƠNVỊ với   các   thuộc   tính   là   MãsốĐV,

TênĐV,  ĐịađiểmĐV   trong  đó   các   thuộc   tính   khoá   là   MãsốĐV,   TênĐV   (do   mỗi

đơn vị có một tên duy nhất), và ĐịađiểmĐV là một thuộc tính đa trị (do mỗi đơn vị

có   nhiều  địa  điểm).   Khi  đó   kiểu   thực   thểĐƠNVỊđược   chuyển   thành   quan   hệ

ĐƠNVI với các thuộc tính         MãsốĐV, TênĐV. Khoá chính của quan hệ là MãsốĐV

(chọn một trong hai thuộc tính khoá của kiểu thực thể).

      Bước 2: Với mỗi kiểu thứ thể yếu W trong lược đồ ER cùng với kiểu thực thể

chủ E, hãy tạo một quan hệ R chứa tất các các thành phần đơn (hoặc các thành phần

đơn   của   các   thuộc   tính   phức   hợp)   của   W   như là   các   thuộc   tính   của   R. Đưa   các

thuộc tính khoá chính của các quan hệ tương ứng với kiểu thực thể chủ làm khoá

ngoài của R. Các thuộc tính này sẽ xác định kiểu liên kết của W. Khoá chính của R

là một tổ hợp của khoá chính của các quan hệ tương ứng với kiểu thực thể chủ và

khoá bộ phận của kiểu thực thể yếu W nếu có.

      Ví    dụ:   Giả  sử  ta   có  kiểu   liên  kết   NHÂNVIÊN         <có>    CON     trong  đó

NHÂNVIÊN          là  kiểu  thực   thể chủ  với    các  thuộc   tính  MãsốNV,      Họđệm,     Tên,

Ngàysinh, Giớitính. Thuộc tính khoá của NHÂNVIÊN là MãsốNV. CON là kiểu

thực   thể phụ thuộc   (vào   thực   thể NHÂNVIÊN)   với   các   thuộc   tính   là   Họtêncon,

Ngàysinh, Giớitính. Kiểu thực thể này không có thuộc tính khoá. Khi đó kiểu thực

thể NHÂNVIÊN được chuyển thành quan hệ NHÂNVIÊN với các thuộc tính như

trên.   Kiểu   thực   thể CON  được   chuyển   thành   quan   hệ CON   với   các   thuộc   tính

MãsốNV, Họtêncon, Ngàysinh, Giớitính. Quan hệ này có khoá ngoài là MãsốNV,

khoá chính là Mã sốNV, Họtêncon.

      Bước 3: Với mỗi kiểu liên kết 1:1        R trong lược đồ ER, hãy xác định các quan

hệ S và T tương ứng với các kiểu thực thể tham gia trong R. Hãy chọn một trong

các quan hệ, chẳng hạn S, và đưa khoá chính của T vào làm khoá ngoài trong S.

Tốt nhất là chọn S là một kiểu thực thể tham gia toàn bộ vào R. Đưa tất các các

thuộc tính đơn (hoặc các thành phần đơn của các thuộc tính phức hợp) của kiểu liên

kết 1:1 R vào làm các thuộc tính của S.

      Chú ý: Có một cách chuyển đổi mối liên kết 1:1 nữa là nhập hai kiểu thực thể

và mối liên kết thành một quan hệ. Cách này thường được áp dụng khi cả hai kiểu

thực thểđều tham gia toàn bộ vào liên kết.

      Ví   dụ:   Giả sử ta   có   kiểu   liên   kết   NHÂNVIÊN   <quản   lý>  ĐƠNVỊ,   với   các

thuộc tính của các kiểu thực thể giống nhưở trên. Kiểu liên kết <quản lý> là một

                                                   78

----------------------- Page 80-----------------------

kiểu liên kết 1:1, đồng thời sự tham gia của NHÂNVIÊN vào kiểu liên kết là bộ

phận (không phải nhân viên nào cũng quản lý đơn vị), sự tham gia của ĐƠNVỊ là

đầy đủ (một đơn vị luôn luôn phải có một người quản lý). Khi đó, kiểu thực thể

NHÂNVIÊN sẽđược chuyển thành quan hệ NHÂNVIÊN với các thuộc tính của

nó, còn kiểu thực thểĐƠNVỊ sẽđược chuyển thành quan hệĐƠNVỊ với các thuộc

tính của kiểu thực thểĐƠNVỊ cộng thêm với thuộc tính MãsốNV và thuộc tính của

kiểu liên kết <quản lý>, nếu có. Thuộc tính MãsốNV sẽ là khoá ngoài cho quan hệ

ĐƠNVỊ. Để làm rõ vai trò người quản lý, khi chuyển sang quan hệĐƠNVỊ, người

ta đổi tên thuộc tính MãsốNV thành MãsốNQL (Mã số người quản lý). Ngoài ra,

kiểu liên kết <quản lý> có một thuộc tính là Ngàybắtđầu, thuộc tính này cũng được

đưa vào quan hệĐƠNVỊ.

      Bước 4: Với mỗi kiểu liên kết hai ngôi R kiểu 1:N, hãy xác định quan hệ S

biểu diễn kiểu thực thể tham gia  ở phía N của kiểu liên kết. Đưa khoá chính của

quan hệ T biểu diễn kiểu thực thể tham   gia   vào   R  ở phía 1 vào làm khoá ngoài

trong S. Làm như vậy là vì mỗi thực thể cụ thể của phía N được liên kết với nhiều

nhất là một thực thể cụ thể của phía 1 của kiểu liên kết. Đưa các thuộc tính đơn

(hoặc các thành phần đơn của các thuộc tính phức hợp) của kiểu liên kết 1:N vào

làm các thuộc tính của S.

      Ví dụ: Giả sử ta có kiểu liên kết NHÂNVIÊN <làm việc cho> ĐƠNVỊ, trong

đó các kiểu thực thể NHÂNVIÊN, ĐƠNVỊ là các kiểu thực thểở trên. Kiểu liên

kết <làm việc cho> là kiểu liên kết N:1 (một nhân viên chỉ làm việc cho một đơn vị

và mỗi đơn vị có nhiều nhân viên làm việc cho). Khi đó, Kiểu thực thểĐƠNVỊ sẽ

được chuyển thành quan hệĐƠNVỊ với các thuộc tính của kiểu thực thểĐƠNVỊ

còn kiểu thực thể NHÂNVIÊN sẽđược chuyển thành quan hệ NHÂNVIÊN với các

thuộc tính của kiểu thực thể NHÂNVIÊN cộng thêm với thuộc tính                 MãsốĐV (là

khoá chính của quan hệĐƠNVỊ). Thuộc tính MãsốĐV sẽ là thuộc tính khoá ngoài

của quan hệ NHÂNVIÊN.

      Bước 5: Với mỗi kiểu liên kết N:M hai ngôi R, hãy tạo ra một quan hệ mới S

để biểu diễn R. Đưa các khoá chính của các quan hệ biểu diễn các kiểu thực thể

tham   gia   vào   làm   khoá   ngoài   của   S.   Tổ hợp   các   khoá   chính  đó   sẽ tạo   nên   khoá

chính của S. Đưa tất cả các thuộc tính đơn (hoặc các thành phần đơn của các thuộc

tính phức hợp) của kiểu liên kết N:M vào làm các thuộc tính của S. Chú ý rằng ta

không thể biểu diễn một kiểu liên kết N:M bằng một thuộc tính khoá ngoài đơn

                                                79

----------------------- Page 81-----------------------

giản trong một trong các quan hệ tham gia (nhưđã làm với các kiểu liên kết 1:1 và

1:N) vì tỷ số lực lượng N:M.

      Ví dụ: Giả sử ta có kiểu liên kết NHÂNVIÊN <làm việc với> DỰÁN. Kiểu

thực thể NHÂNVIÊN có các thuộc tính như trên với thuộc tính khoá là MãsốNV.

Kiểu thực thể DỰÁN có các thuộc tính là MãsốDA, TênDA, ĐịađiểmDA trong đó

thuộc tính khoá là MãsốDA. Kiểu liên kết < làm việc với> là một kiểu liên kết N:M

(một nhân viên có thể làm việc với nhiều dự án và mỗi dự án có nhiều nhân viên

làm việc với). Kiểu liên kết này có một thuộc tính là Sốgiờđể lưu số giờ mà mỗi

nhân viên làm việc cho một dự án. Khi  đó kiểu liên kết <làm việc với> sẽđược

chuyển   thành   một   quan   hệ có   tên   là   NHÂNVIÊN_DỰ ÁN   với   các   thuộc   tính

MãsốNV,   MãsốDA,   Sốgiờ trong  đó   hai   thuộc   tính   MãsốNV,   MãsốDA   tạo   thành

khoá chính (phức hợp) cho quan hệ.

      Bước 6: Với mỗi thuộc tính đa trị A, hãy tạo ra một quan hệ mới R. Quan hệ R

này sẽ chứa một thuộc tính tương ứng với A cộng với thuộc tính khoá K của quan

hệ biểu diễn kiểu thực thể hoặc kiểu liên kết có thuộc tính là A làm khoá ngoài của

R. Khoá chính của R là một tổ hợp của A và K. Nếu thuộc tính đa trị là phức hợp

thì chúng ta chỉđưa vào R các thành phần đơn của nó.

      Ví dụ: Xét kiểu thực thểĐƠNVỊở trên. Thuộc tính ĐịađiểmĐV là một thuộc

tính đa trị. Khi chuyển thành mô hình quan hệ nó sẽđược chuyển thành một quan

hệ có khoá chính là MãsốĐV, Địa điểm và có thể có thêm một số thuộc tính khác

lưu thông tin vềđịa điểm.

      Bước 7: Với mỗi kiểu liên kết n ngôi R, trong đó n > 2, hãy tạo ra một quan hệ

S để biểu diễn R. Đưa các khoá chính của các quan hệ biểu diễn các kiểu thực thể

tham gia vào làm khoá ngoài của S. Đưa tất cả các thuộc tính đơn (hoặc các thành

phần đơn của các thuộc tính phức hợp) của kiểu liên kết n-ngôi vào làm thuộc tính

của S. Khoá chính của S thường là một tổ hợp các khoá chính của các quan hệ biểu

diễn các kiểu thực thể tham gia. Tuy nhiên, nếu ràng buộc lực lượng trên một kiểu

thực thể E nào đó tham gia vào R là 1 thì khoá chính của S không được chứa thuộc

tính khoá ngoài tham chiếu đến quan hệ E tương ứng với kiểu thực thể E.

      Ví dụ: Giả sử chúng ta có kiểu liên kết ĐẠILÝ <cung cấp> VẬTTƯ <cho>

DỰÁN. Đây là một kiểu liên kết cấp ba. Giả sử rằng kiểu thực thểĐẠILÝ có thuộc

tính khoá là MãsốĐL, kiểu thực thể VẬTTƯ có thuộc tính khoá là MãsốVT, kiểu

thực thể DỰÁN có thuộc tính khoá là MãsốDA còn kiểu liên kết <cung cấp> có

                                               80

----------------------- Page 82-----------------------

thuộc tính là Sốlượng để lưu số lượng vật tư mà một đai lý cung cấp cho môt dự án.

Khi  đó   kiểu   liên   kết   <cung   cấp>   sẽđược   chuyển   thành   một   quan   hệ có   tên   là

CUNGCẤP   với   các   thuộc   tính   MãsốĐL,   MãsốVT   ,   MãsốDA,   Sốlượng   và   khoá

chính gồm ba thuộc tính MãsốĐL, MãsốVT , MãsốDA.

     IV.2-   Chuyển đổi mô hình cụ thể

      Trong chương 2 chúng ta đã phân tích và thiết kế mô hình ER cho bài toán

CÔNGTY. Áp dụng các bước của thuật toán ở trên, chúng ta có mô hình quan hệ

cho bài toán CÔNGTY như sau:

     NHÂNVIÊN(Họđệm,Tên, MãsốNV, Ngàysinh, Địachỉ, Giớitính, Lương,

                     MãsôNGS, MãsốĐV)

      ĐƠNVỊ(TênĐV, MãsốĐV, MãsốNQL, Ngàybắtđầu)

      ĐƠNVỊ_ĐỊAĐIỂM(MãsốĐV, ĐịađiểmĐV)

      DỰÁN(TênDA, MãsốDA, ĐịađiểmDA, MãsốĐV)

     NHÂNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ)

      PHỤTHUỘC(MãsốNV, Têncon, Giớitính, Ngàysinh)

                    Hình III-12. Lược đồ cơ sở dữ liệu “CÔNGTY”

V-    Tổng kết chương và câu hỏi ôn tập

      V.1-   Tổng kết chương

      Trong chương này chúng ta đã trình bày các khái niệm cơ bản của         mô hình dữ

liệu quan hệ. Chúng ta cũng đã thảo luận vềđại số quan hệ và các phép toán bổ

sung được sử dụng  để thao tác các quan hệ. Chương này bắt dầu bằng việc giới

thiệu   các   khái   niệm   miền,   thuộc   tính   và   bộ giá   trị.   Lược  đồ quan   hệđược  định

nghĩa như một danh sách các thuộc tính mô tả cấu trúc của một quan hệ. Một quan

hệ (hoặc trạng thái quan hệ) là một tập hợp các bộ giá trị phù hợp với lược đồ.

      Có nhiều đặc trưng làm phân biệt các quan hệ vớị các bảng hoặc các tệp thông

thường. Trước tiên, các bộ trong một quan hệ là không có thứ tự. Đặc trưng thứ hai

liên quan đến thứ tự của của các thuộc tính trong một lược đồ quan hệ và thứ tự

tương ứng của các giá trị bên trong một bộ. Mặc dù ta đã đưa ra một định nghĩa

quan hệ khác để chứng minh rằng hai thứ tự này là không cần thiết, tuy nhiên, để

thuận tiện ta vẫn đòi hỏi các thuộc tính và các giá trị trong bộ là có thứ tự. Chúng ta

                                               81

----------------------- Page 83-----------------------

cũng đã thảo luận về các giá trị trong các bộ và giới thiệu các giá trị null để biểu

diễn thông tin bị thiếu hoặc không biết.

      Tiếp theo, chúng ta đã thảo luận về các ràng buộc mô hình quan hệ. Đó là các

ràng buộc miền, ràng buộc khóa, các khái niệm về siêu khóa, khóa dự tuyển, khóa

chính và ràng buộc NOT NULL trên các thuộc tính. Sau đó, chúng ta đã định nghĩa

cơ sở dữ liệu và lược đồ cơ sở dữ liệu quan hệ. Các ràng buộc toàn vện thực thể và

toàn vẹn tham chiếu cũng đã được định nghĩa và phân tích. Toàn vẹn thực thể ngăn

cấm việc khóa chính có giá trị null. Toàn vẹn tham chiếu được sử dụng để duy trì

sự nhất quán của việc tham chiếu trong các bộ từ các quan hệ khác nhau.

      Các phép cập nhật trên mô hình quan hệ gồm Insert, Delete, Update. Mỗi một

phép   toán   có   thể vi   phạm   các   kiểu   ràng   buộc   nhất  định.   Mỗi   khi   một   phép   toán

đuợc áp dụng, trạng thái cơ sở dữ liệu sau khi phép toán được thực hiện phải được

kiểm tra đểđảm bảo rằng không có một ràng buộc nào bị vi phạm.

      Tiếp theo chúng ta đã mô tảđại số quan hệ cơ sở, đó là một tập hợp các phép

toán thao tác quan hệ và có thểđược sử dụng đểđưa ra các truy vấn. Chúng ta đã

định nghĩa và phân tích cách sử dụng các phép toán như chiếu, chọn, tích Đềcác,

nối,   phép  đặt   lại   tên.   Các   phép   toán   tập   hợp   như giao,   hợp,   trừ cũng  được  định

nghĩa và phân tích.

      Tiếp theo, chúng ta thảo luận về các kiểu truy vấn quan trọng không thể sử

dụng được các phép toán đại số quan hệ cơ sở. Chúng ta đã giới thiệu phép toán

hàm nhóm để làm việc với các kiểu yêu cầu nhóm. Các kiểu truy vấn đệ quy cũng

được thảo luận và      giới thiệu cách chỉ ra một số kiểu truy vấn đệ quy. Các phép nối

ngoài, hợp ngoài, mở rộng của phép nối và phép hợp cũng được thảo luận ở cuối

chương.

      Cuối cùng, chúng ta làm quen với thuật toán chuyển đổi từ mô hình ER sang

mô   hình   quan   hệ.   Mô   hình   ER   cho   “CÔNGTY” được   xây   dựng  ở chương   II  đã

được chuyển đổi thành lược đồ cơ sở dữ liệu quan hệ.

      V.2-    Câu hỏi ôn tập

1)   Định nghĩa các thuật ngữ sau: miền, thuộc tính, n-bộ, lược đồ quan hệ, trạng

     thái quan hệ, cấp của quan hệ, lược đồ cơ sở dữ liệu, trạng thái cơ sở dữ liệu.

2)   Vì sao các bộ trong một quan hệ là không có thứ tự.

                                                   82

----------------------- Page 84-----------------------

3)   Vì sao không cho phép các bộ trùng lặp trong một quan hệ.

4)   Siêu khóa và khóa khác nhau ở chỗ nào.

5)   Vì sao phải chỉđịnh một trong các khóa dự tuyển làm khóa chính.

6)   Nêu   những  đặc   trưng   làm   cho   các   quan   hệ khác   với   các   bảng   hoặc   các   tệp

     thông thường.

7)   Nêu các lý do về việc tồn tại các giá trị không xác định trong các quan hệ.

8)   Hãy   giải   thích   về ràng   buộc   toàn   vẹn   thực   thể và   ràng   buộc   toàn   vẹn   tham

     chiếu. Vì sao các ràng buộc này là quan trọng?

9)   Định nghĩa khóa ngoài. Khái niệm này dùng để làm gì? Các khóa ngoài đóng

     vai trò như thế nào trong phép nối?

10) Hãy giải thích các phép toán cập nhật trên các quan hệ và các kiểu ràng buộc

     toàn vẹn phải được kiểm tra đối với mỗi phép toán cập nhật.

11) Liệt kê các phép toán đại số quan hệ và mục đích của từng phép toán.

12) Tương thích hợp là gì? Vì sao các phép toán hợp, giao, trừđòi hỏi các quan hệ

     tham gia vào phép toán phải tương thích hợp?

13) Hãy giải thích các kiểu truy vấn cần có việc đặt lại tên các thuộc tính để chỉ ra

     truy vấn một cách rõ ràng.

14) Hãy nêu các kiểu phép toán nối khác nhau.

15) Phép toán hàm là gì? Nó được dùng vì mục đích nào?

16) Các phép nối ngoài khác với các phép nối trong như thế nào? Phép hợp ngoài

     khác với phép hợp như thế nào?

      V.3-   Bài tập

1)   Chuyển đổi các lược đồ ER của các bài tập 1, 2 ở chương II thành lược đồ cơ

     sở dữ liệu quan hệ.

2)   Cho lược đồ cơ sở dữ liệu Thưviện:

      SACH(Mãsách, Tênsách, TênNXB)

      SACH_TACGIA(Masach, TênTG)

                                                  83

----------------------- Page 85-----------------------

     NHAXUATBAN(TênNXB, Địachỉ, Điệnthoại)

     SACH_BANSAO(Mãsách, Mãnhánh, Sốlượngbảnsao)

     NHANH_THUVIEN(Mãnhanh, Tênnhánh, Địachỉ)

     SACH_MUON(Mãsách, Mãnhánh, Sốthẻ, Ngàymượn, Ngàytrả)

     NGUOIMUON(Sốthẻ, Tên, Địachỉ, Điệnthoại)

     Hãy viết các biểu thức quan hệ cho các truy vấn sau đây trên cơ sở dữ liệu

Thưviện:

      1.  Có bao nhiêu bản sao của cuốn sách “The Lost Tribe” có trong nhánh thư

         viện có tên là “Shapstown”.

      2. Có bao nhiêu bản sao của cuốn sách “The Lost Tribe” có trong mỗi nhánh

         thư viện.

      3. Đưa ra tên của tất cả người muợn chưa mượn cuốn sách nào.

      4. Với mỗi cuốn sách được mượn ra từ nhánh thư viện “Shapstown” có ngày

         trả là   ngày   hôm   nay,   hãy  đưa   ra   Tên   sách,   Tên   người   mượn   và  địa   chỉ

         người mượn.

      5.  Với mỗi thư viện nhánh, hãy  đưa ra tên nhánh thư viện và tổng số sách

         được mượn ra từ nhánh này.

      6. Đưa ra tên, địa chỉ và số các sách do người này mượn với những người

         mượn nhiều hơn 5 cuốn sách.

      7. Với mỗi cuốn sách có tác giả (hoặc đồng tác giả) là “Stephen King”, hãy

         đưa ra tên sách và số lượng các bản sao có tại nhánh thư viện có tên là

         “Central”.

3)   Cho cơ sở dữ liệu CÔNGTY gồm các lược đồ:

     NHÂNVIÊN(Mã sốNV, Họđệm, Tên, Ngàysinh, Giớitính, Địachỉ, Lương,

                    MãsốNGS, Mã sốĐV)

     ĐƠNVỊ(MãsốĐV, TênĐV, MãsốNQL, Ngàybắtđầu)

     DỰÁN(MãsốDA, TênDA, ĐịađiểmDA, MãsốĐV)

     PHỤTHUỘC(MãsốNV, TênPT, Ngày sinh, Giớitính, Quanhệ)

                                             84

----------------------- Page 86-----------------------

     NHÂNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ)

     ĐƠNVỊ_ĐỊAĐIỂM(MãsốĐV, Địađiểm)

Hãy viết các biểu thức quan hệ thực hiện các truy vấn sau:

     a)  Đưa ra tên và địa chỉ của tất cả các nhân viên làm việc cho đơn vị nghiên

         cứu.

     b)  Với mỗi dự án có địa điểm tại Hà nội, hãy liệt kê mã số dự án, mã số của

         đơn vị kiểm soát, Tên, địa chỉ và ngày sinh của người quản lý đơn vị

     c)  Tìm tên của các nhân viên làm việc trên tất cả các dự án do đơn vị có mã

         số 5 kiểm soát.

     d)  Tạo ra một danh sách các mã số dự án đối với các dự án có một nhân viên

         hoặc một người quản lý đơn vị kiểm soát dự án có tên là ‘Nam’.

     e)  Đưa ra tên của tất cả các nhân viên có nhiều hơn hoặc bằng 2 người phụ

         thuộc.

     f)  Đưa ra các nhân viên không có người phụ thuộc.

     g)  Đưa ra tên của những người quản lý có ít nhất là một người phụ thuộc.

                                           85

----------------------- Page 87-----------------------

Chương IV-  PHỤ THUỘC HÀM VÀ CHUẨN HÓA CƠ SỞ

                  DỮ  LIỆU          QUAN       HỆ,     CÁC     THUẬT         TOÁN

                   THIẾT KẾ CƠ SỞ DỮ LIỆU QUAN HỆ

     Trong chương này chúng ta sẽ thảo luận về một số vấn đề lý thuyết đã được

phát triển nhằm mục đích chọn được lược đồ quan hệ “tốt”, nghĩa là đo đạc một

cách hình thức vì sao tập hợp các thuộc tính này nhóm vào trong các lược đồ quan

hệ thì tốt hơn nhóm kia. Chúng ta có thể nói đến “tính tốt” của các lược đồ quan hệ

ở hai mức: mức thứ nhất là mức lôgic, mức thứ hai là mức cài đặt. Mức thứ nhất

liên quan đến việc các người sử dụng thể hiện các lược đồ quan hệ và ý nghĩa của

các thuộc tính của chúng như thế nào. Mức thứ hai liên quan đến việc các bộ trong

một quan hệ cơ sởđược lưu trữ và cập nhật như thế nào.

     Việc thiết kế cơ sở dữ liệu có thểđược thực hiện bằng cách sử dụng hai giải

pháp: dưới lên (bottom-up) hoặc trên xuống (top-down). Phương pháp thiết kế dưới

lên xem các mối liên kết cơ bản giữa các thuộc tính riêng rẽ như là điểm xuất phát

và sử dụng chúng để xây dựng nên các quan hệ. Giải pháp này còn có tên gọi là

thiết kế bằng tổng hợp  (design by synthesis). Ngược lại, phương pháp thiết kế trên

xuống, còn gọi là thiết kế bằng phân tích (design by analyse) bắt đầu từ một số các

nhóm thuộc tính trong các quan hệ nhận  được từ thiết kế quan niệm và các hoạt

động chuyển  đổi. Sau đó việc  thiết kế bằng phân tích được  áp  dụng  đối với các

quan hệ một cách riêng rẽ và tập thể dẫn đến việc tách các quan hệ cho đến khi đạt

được tính chất mong muốn.

I-    Các nguyên tắc thiết kế lược đồ quan hệ

     I.1-   Ngữ nghĩa của các thuộc tính quan hệ

     Khi chúng ta nhóm các thuộc tính để tạo nên một lược đồ quan hệ, ta giả thiết

rằng có một ý nghĩa nào đó gắn với các thuộc tính. Ý nghĩa này, còn gọi là ngữ

nghĩa, chỉ ra việc hiểu các giá trị thuộc tính lưu giữ trong các bộ của một quan hệ

như thế nào. Nói cách khác, các giá trị thuộc tính trong một bộ liên hệ với nhau như

thế nào. Nếu việc thiết kế khái niệm được làm một cách cẩn thận, sau đó là một

chuyển đổi sang các quan hệ thì hầu hết ngữ nghĩa đã được giải thích và thiết kế kết

quả có một ý nghĩa rõ ràng. Nói chung, việc giải thích ngữ nghĩa của quan hệ càng

                                            86

----------------------- Page 88-----------------------

dễ dàng thì việc thiết kế lược đồ quan hệ càng tốt. Một ví dụ về thiết kế lược đồ

quan hệ tốt là lược đồ cơ sở dữ liệu “CÔNG TY”. Trong lược đồđó, các thuộc tính

đều có ý nghĩa rõ ràng, không có tính mập mờ. Nguyên tắc sau sẽ hỗ trợ cho việc

thiết kế lược đồ quan hệ.

      Nguyên tắc 1: Thiết kế một lược đồ quan hệ sao cho dễ giải thích ý nghĩa của

nó. Đừng tổ hợp các thuộc tính từ nhiều kiểu thực thể và kiểu liên kết vào một quan

hệđơn. Một cách trực quan, nếu một lược đồ quan hệ tương ứng với một kiểu thực

thể hoặc   một   kiểu   liên   kết   thì   ý   nghĩa   trở nên   rõ   ràng.   Ngược   lại,   một   quan   hệ

tương ứng với một hỗn hợp các thực thể và liên kết thì ý nghĩa trở nên không rõ

ràng.

      I.2-   Thông tin dư thừa trong các bộ và sự dị thường cập nh ật

      Một mục tiêu của thiết kế lược đồ là làm tối thiểu không gian lưu trữ các quan

hệ cơ sở.   Các   thuộc tính được nhóm vào trong các lược đồ quan hệ có   một  ảnh

hưởng đáng kểđến không gian lưu trữ. Nếu cùng một thông tin được lưu giữ nhiều

lần trong cơ sở dữ liệu thì ta gọi đó là dư thừa thông tin và điều đó sẽ làm lãng phí

không gian nhớ. Ví dụ, giả sử ta có bảng cơ sở sau đây:

                                     NHÂNVIÊN_ĐƠNVỊ

 MãsốNV     Họđệm        Tên     Ngày sinh   Địachỉ      MãsốĐV     TênĐV        MãsốNQL

 NV001      Lê           Vân      12/02/79   Hà nội       5         Nghiêncứu    NV002

 NV002      Trần Đức     Nam      14/02/66   Hà nội       5         Nghiêncứu    NV002

 NV010      Hoàng        Thanh    05/08/79   Nghệ an      4         Hànhchính    NV014

 NV014      Phạm         Bằng    26/06/52    Bắc ninh     4         Hànhchính    NV014

 NV016      Nguyễn       Sơn      14/08/73   Hà nam       5         Nghiêncứu    NV002

 NV018      Vũ Hương     Giang   26/03/83    Nam định     5         Nghiêncứu    NV002

 NV025      Trần Lê      Hoa      15/03/80   Phú thọ  4             Hànhchính    NV014

 NV061      Hoàng        Giáp     02/05/47   Hà tĩnh      1         Lãnhđạo      NV061

      Ởđây có sự dư thừa thông tin. Nếu một đơn vị có nhiều nhân viên làm việc thì

thông tin vềđơn vị (Mã số, Tên đơn vị, Mã số người quản lý) được lưu giữ nhiều

                                                 87

----------------------- Page 89-----------------------

lần trong bảng. So với việc dùng hai bảng NHÂNVIÊN và ĐƠNVỊ riêng rẽ như

trong lược đồ “CÔNG TY”, việc sử dụng bảng này làm lãng phí không gian nhớ.

      Ngoài việc lãng phí không gian nhớ nó còn dẫn đến một vấn đề nghiêm trọng

là sự dị thường cập nhật. Dị thường cập nhật bao gồm: Dị thường Chèn, dị thường

Xoá, dị thường Sửa đổi. Những dị thường cập nhật này sẽđưa vào cơ sở dữ liệu

những thông tin “lạ” và làm cho cơ sở dữ liệu mất tính đúng đắn.

      Dị thường Chèn: Gây ra khó khăn khi chèn các bộ giá trị vào bảng hoặc dẫn

đến vi phạm ràng buộc. Ví dụ:

      Để  chèn       một     bộ  giá     trị  cho    một     nhân    viên    mới    vào    bảng

NHÂNVIÊN_ĐƠNVỊ ngoài các thông tin về nhân viên, ta phải đưa vào các thông

tin vềđơn vị mà anh ta làm việc hoặc các giá trị null (nếu nhân viên không làm

việc cho đơn vị nào cả). Các thông tin vềđơn vị phải được đưa vào một cách đúng

đắn, phù hợp với các thông tin của đơn vịđó trong các bộ khác. Trong lúc đó, với

lược đồ cơ sở dữ liệu “CÔNGTY” chúng ta không phải lo lắng gì, vì các thông tin

về một đơn vị chỉđược lưu trữ một lần.

      Rất khó chèn một đơn vị mới vào quan hệ NHÂNVIÊN_ĐƠNVỊ nếu đơn vị

đó không có nhân viên nào làm việc. Cách giải quyết duy nhất là điền các giá trị

null vào các thuộc tính của nhân viên. Điều đó làm nảy sinh vấn đề về ràng buộc

bởi vì MãsốNV là khóa chính của quan hệ.

      Dị thường Xóa: Gây ra việc mất thông tin khi xóa. Ví dụ khi ta xóa một bộ giá

trị trong bảng NHÂNVIÊN_ĐƠNVỊ. Nếu nhân viên tương ứng với bộ giá trịđó là

người cuối cùng làm việc cho đơn vị thì phép xóa sẽ kéo theo việc làm mất thông

tin vềđơn vị.

      Dị thường Sửa đổi: Gây ra việc sửa đổi hàng loạt khi ta muốn sửa đổi một giá

trị trong một bộ nào đó. Ví dụ, ta muốn sửa giá trị của thuộc tính MãsốNQL của

đơn vị 5. Điều đó kéo theo ta phải sửa giá trị của thuộc tính này trong tất cả các bộ

ứng với đơn vị 5. Dựa trên các dị thường ở trên, chúng ta có thể phát biểu nguyên

tắc sau:

      Nguyên   tắc   2:   Thiết   kế các   lược  đồ quan   hệ cơ sở sao   cho   không   sinh   ra

những dị thường cập nhật trong các quan hệ. Nếu có xuất hiện những dị thường cập

nhật thì phải ghi chép lại một cách rõ ràng và phải đảm bảo rằng các chương trình

cập nhật dữ liệu sẽ thực hiện một cách đúng đắn.

                                                  88

----------------------- Page 90-----------------------

      I.3-   Các giá trị không xác định trong các bộ

      Trong một số thiết kế lược đồ, chúng ta có thể nhóm nhiều thuộc tính với nhau

vào một quan hệ “béo”. Nếu nhiều thuộc tính không thích hợp cho mọi bộ trong

một quan hệ, chúng ta sẽ kết thúc với nhiều giá trị null trong các bộđó. Điều đó có

thể làm tăng không gian ở mức lưu trữ và có thể dẫn đến vấn đề về hiểu ý nghĩa

của các thuộc tính. Việc chỉ ra các phép nối ở mức lôgic cũng sẽ gặp khó khăn. Một

vấn  đề nữa với các giá trị null là các hàm nhóm như COUNT, SUM không  đếm

được đối với chúng. Hơn nữa, các giá trị null có thể nhiều cách giải thích, chẳng

hạn như thuộc tính không áp dụng được cho bộ này, giá trị của thuộc tính cho bộ

này là không có hoặc giá trị cho thuộc tính là có nhưng vắng mặt. Tóm lại, các giá

trị null có nhiều ý nghĩa khác nhau .

      Nguyên tắc 3: Tránh càng xa càng tốt việc đặt vào trong các quan hệ cơ sở

những thuộc tính mà các giá trị của chúng thường xuyên là null. Nếu không thể

tránh  được   các   giá   trị null   thì   phải  đảm   bảo   rằng   chúng   chỉ áp   dụng   trong   các

trường hợp đặc biệt và không áp dụng cho một số lớn các bộ trong quan hệ.

      I.4-   Sinh ra các bộ giả

      Nhiều khi chúng ta đưa vào cơ sở dữ liệu những quan hệ không đúng, việc áp

dụng các phép toán (nhất là các phép nối) sẽ sinh ra các bộ giá trị không đúng, gọi

là các bộ “giả”. Ví dụ, xét hai lược đồ quan hệ:

      NV_ĐĐ (Tên, ĐịađiểmDA)

      NV_DA1(Mã sốNV, Mã sốDA, Sốgiờ, TênDA, ĐịađiểmDA)

                             NV_ĐĐ         Tên        ĐịađiểmDA

                                           Vân        Hànội

                                           Vân        Namđịnh

                                           Sơn        Bắcninh

                                           Giang      Hànội

     NV_DA1        MãsốNV        MãsốDA       Sốgiờ         TênDA       ĐịađiểmDA

                   NV001         1            32            DA01        Hànội

                                                89

----------------------- Page 91-----------------------

                   NV001         2           7             DA02        Namđịnh

                   NV016         3           40            DA03        Bắcninh

                   NV018         1           20            DA01        Hànội

      Bây giờ ta nối tự nhiên hai quan hệ trên với nhau, ta có quan hệ

               MãsốNV        MãsốDA       Sốgiờ       TênDA        Địađiểm      Tên

               NV001         1            32          DA01         Hànội        Vân

               NV001         1            32          DA01         Hànội        Giang

     *

               NV001         2            7           DA02         Namđịnh      Vân

               NV016         3            40          DA03         Bắcninh      Sơn

               NV018         1            20          DA01         Hànội        Vân

     *

               NV018         1            20          DA01         Hànội        Giang

      Ta thấy các dòng đánh dấu * là các bộ “giả”. Đấy là các bộ giá trị không có

trên thực tế.

      Nguyên tắc 4: Thiết kế các lược đồ quan hệ sao cho chúng có thểđược nối với

điều kiện bằng trên các thuộc tính là khoá chính hoặc khoá ngoài theo cách đảm

bảo không sinh ra các bộ “giả”. Đừng có các quan hệ chứa các thuộc tính nối khác

với các tổ hợp khoá chính-khoá ngoài. Nếu không tránh được những quan hệ như

vậy thì đừng nối chúng trên các thuộc tính đó, bởi vì các phép nối có thể sinh ra các

bộ “giả”.

II-   Các phụ thuộc hàm

      Khái niệm cơ bản nhất trong thiết kế lược đồ quan hệ là khái niệm phụ thuộc

hàm. Trong phần này chúng ta sẽđịnh nghĩa hình thức khái niệm này và cách sử

dụng nó đểđịnh nghĩa các dạng chuẩn cho các lược đồ quan hệ.

     II.1-   Định nghĩa phụ thuộc hàm

      Một phụ thuộc hàm là một ràng buộc giữa hai nhóm thuộc tính của một cơ sở

dữ liệu. Giả sử rằng lược đồ cơ sở dữ liệu của ta có n thuộc tính A ,A ,…,A  và ta

                                                                           1  2      n

                                               90

----------------------- Page 92-----------------------

hãy nghĩ rằng toàn bộ cơ sở dữ liệu được mô tả bằng một lược đồ quan hệ chung

R={A , A ,…., A }. Đừng nên nghĩ rằng cơ sở dữ liệu của chúng ta sẽđược lưu trữ

       1    2        n

trong một bảng chung, chúng ta chỉ sử dụng khái niệm này để phát triển lý thuyết

hình thức về sự phụ thuộc dữ liệu. Giả sử X và Y là hai tập con của R.

      Một phụ thuộc hàm, ký hiệu là          X→ Y, giữa hai tập thuộc tính X và Y chỉ ra

một ràng buộc trên các bộ có thể có tạo nên một trạng thái quan hệ r của R. Ràng

buộc đó là: với hai bộ bất kỳ t  và t  trong r , nếu có          t  [X] = t [X] thì cũng phải có

                                     1     2                      1        2

t  [Y] = t [Y]. Điều đó có nghĩa là các giá trị của thành phần Y của một bộ trong R

 1        2

phụ thuộc   vào,   hoặc  được   xác  định   bởi,   các   giá   trị của   thành   phần   X.   Nói   cách

khác, các giá trị của thành phần X của một bộ xác định một cách duy nhất các giá

trị của thành phần Y. Chúng ta cũng nói rằng có một phụ thuộc hàm từ X vào Y

hoặc   Y   phụ thuộc   hàm   vào   X.   Phụ thuộc   hàm  được   viết   tắt   là   FD   (functional

dependency). Tập thuộc tính X được gọi là vế trái của FD, tập thuộc tính Y được

gọi là vế phải của FD.

      Như vậy, X xác định hàm Y trong lược đồ quan hệ R khi và chỉ khi nếu hai bộ

của r(R) bằng nhau trên các giá trị của X thì chúng nhất thiết phải bằng nhau trên

các giá trị của Y. Ta có các nhận xét sau:

  • Nếu có một ràng buộc trên các trạng thái của R là chỉ có một bộ giá trị duy

      nhất của X trong mọi thể hiện quan hệ r(R) thì điều đó kéo theo X → Y với

      mọi tập con các thuộc tính Y của R.

  • Nếu X → Y thì không thể nói gì về Y → X.

      Một   phụ thuộc   hàm   là   một   tính   chất   ngữ nghĩa   của   các   thuộc   tính.   Những

người thiết kế cơ sở dữ liệu sẽ dùng hiểu biết của họ về ý nghĩa của các thuộc tính

của R để chỉ ra các phụ thuộc hàm có thể có trên mọi trạng thái quan hệ của r(R)

của R. Khi ngữ nghĩa của hai tập thuộc tính trong R chỉ ra rằng có thể có một phụ

thuộc hàm, chúng ta sẽđặc tả phụ thuộc hàm như một ràng buộc. Các trạng thái

quan hệ r(R) thoả mãn các ràng buộc phụ thuộc hàm được gọi là các trạng thái hợp

pháp của R, bởi vì chúng tuân theo các ràng buộc phụ thuộc hàm. Như vậy, việc sử

dụng chủ yếu của các phụ thuộc hàm là dùng để mô tả một lược đồ quan hệ R bằng

việc chỉ ra các ràng buộc trên các thuộc tính phải thoả mãn ở mọi thời điểm.

      Một phụ thuộc hàm là một tính chất của lược đồ quan hệ R chứ không phải là

tính chất của một trạng thái hợp pháp r của R. Vì vậy, một phụ thuộc hàm không

                                                    91

----------------------- Page 93-----------------------

thểđược phát hiện một cách tựđộng từ một trạng thái r         mà phải do một người hiểu

biết ngữ nghĩa của các thuộc tính xác định một cách rõ ràng. Ví dụ, ta có quan hệ

sau

          DẠY            Giáoviên          Mônhọc         Tàiliệu

                         AA                Mônhọc1        XX

                         AA                Mônhọc2        YY

                         BB                Mônhọc3        ZZ

                         CC                Mônhọc4        TT

        Mới nhìn qua, chúng ta có thể nói có một phụ thuộc hàm Tàiliệu → Mônhọc,

tuy nhiên chúng ta không thể khẳng định được vì điều đó chỉđúng với trạng thái

quan hệ này, biết  đâu trong trạng thái quan hệ khác có thể có hai môn học khác

nhau sử dụng cùng một tài liệu tham khảo. Với một trạng thái cụ thể, chúng ta chỉ

có thể khẳng  định là không có một phụ thuộc hàm giữa nhóm thuộc tính này và

nhóm  thuộc   tính   khác. Để làm  điều  đó   chúng   ta   chỉ cần  đưa   ra   một   phản   ví   dụ.

Chẳng hạn,  ở trong quan hệ trên chúng ta có thể khẳng  định rằng không có phụ

thuộc hàm giữa Giáoviên và Mônhọc bằng cách chỉ ra ví dụ là AA dạy hai môn học

“ Mônhọc1” và “Mônhọc2” vậy Giáo viên không thể xác định duy nhất Môn học.

      Để biểu diễn các phụ thuộc hàm trong một lược đồ quan hệ, chúng ta sử dụng

khái   niệm   sơđồ phụ thuộc   hàm.   Mỗi   FD  được   biểu   diễn   bằng   một  đường   nằm

ngang. Các thuộc tính ở vế trái của FD được nối với đường biểu diễn FD bằng các

đường thẳng đứng, các thuộc tính ở vế phải của FD được nối với đường biểu diễn

FD bằng mũi tên chỉđến các thuộc tính.

      Ví dụ: Ta có lược đồ quan hệ

              MƯỢN(Sốthẻ, Mãsốsách, Tênngườimượn, Tênsách, Ngàymượn)

      Với các phụ thuộc hàm:

              Sốthẻ→ Tênngườimượn

              Mãsốsách  → Tênsách

              Sốthẻ, Mãsốsách  → Ngàymượn

      Có sơđồ phụ thuộc hàm như sau:

                                               92

----------------------- Page 94-----------------------

                                        MƯỢN

               Sốthẻ      Mã số      Tên người    Tên sách   Ngàymượn

                           sách        mượn

     II.2-  Các quy tắc suy diễn đối với các phụ thuộc hàm

     Chúng ta ký hiệu F là tập các phụ thuộc hàm được xác định trên một lược đồ

quan hệ R. Một phụ thuộc hàm X → Y được gọi là suy diễn được từ một tập các

phụ thuộc hàm F được xác định trên R nếu X → Y đúng trong mỗi trạng thái quan

hệ r là mở rộng hợp pháp của R, nghĩa là mỗi khi r làm thoả mãn mọi phụ thuộc

hàm trong F, X→ Y cũng đúng trong r. Tập hợp tất cả các phụ thuộc hàm suy diễn

được từ F được gọi là bao đóng của F và được ký hiệu là F+. Để xác định một cách

suy diễn các phụ thuộc hàm có hệ thống, chúng ta phải phát hiện một tập hợp các

quy tắc suy diễn. Tập quy tắc này sẽđược sử dụng để suy diễn các phụ thuộc hàm

mới từ một tập các phụ thuộc hàm cho trước. Ta sử dụng ký hiệu F |=   X→ Y để ký

hiệu phụ thuộc hàm X→ Y được suy diễn từ tập các phụ thuộc hàm F. Để cho tiện,

ta viết tắt phụ thuộc hàm có dạng {X,Y}→ Z     thành XY → Z ( nghĩa là ta nối các

biến và bỏ dấu ngoặc nhọn đi). Có 6 quy tắc suy diễn đối với các phụ thuộc hàm:

     QT1 (quy tắc phản xạ)       : Nếu X ⊃ Y thì  X → Y

     QT2 (quy tắc tăng)           : { X→ Y } |= XZ →YZ

     QT3 (quy tắc bắc cầu)        : { X→ Y, Y→ Z }   |= X→ Y

     QT4 (quy tắc chiếu)          : { X→ YZ }   |=  X→ Y và X→ Z

     QT5 (quy tắc hợp)            : { X→ Y , X→ Z }   |= X→ YZ

     QT6 (quy tắc tựa bắc cầu)    : { X→ Y, WY→ Z } |=    WX→ Z

     Quy tắc phản xạ phát biểu rằng một tập hợp các thuộc tính luôn luôn xác định

chính nó hoặc một tập con bất kỳ của nó. Vì QT1 tạo ra các phụ thuộc luôn luôn

đúng, những phụ thuộc như vậy được gọi là tầm thường. Một cách hình thức, một

phụ thuộc hàm X → Y là tầm thường nếu X ⊃Y, ngược lại, nó được gọi là không

tầm thường. Quy tắc tăng nói rằng việc thêm cùng một tập thuộc tính vào cả hai vế

                                           93

----------------------- Page 95-----------------------

của một phụ thuộc hàm sẽ tạo ra một phụ thuộc hàm đúng đắn. Theo quy tắc 3, các

phụ thuộc hàm là bắc cầu. Quy tắc chiếu (QT4) nói rằng chúng ta có thể bỏ bớt các

thuộc tính ra khỏi vế phải của phụ thuộc hàm. Việc áp dụng nhiều lần quy tắc này

có thể tách phụ thuộc hàm         X → {A  , A ,…, A } thành một tập hợp phụ thuộc hàm

                                             1    2        n

{ X→ A  , X→ A , ..., X→ A  }. Quy tắc hợp cho phép chúng ta làm ngược lại, ta

           1          2              n

có thể gộp các phụ thuộc hàm { X→ A  , X→A , ..., X→ A  } thành một phụ thuộc

                                                  1         2              n

hàm đơn X→ {A  , A , ..., A }.

                      1   2        n

      Có thể chứng minh các quy tắc suy diễn ở trên một cách trực tiếp hoặc bằng

phản chứng dựa trên định nghĩa của phụ thuộc hàm. Để chúng minh phản chứng, ta

giả thiết một quy tắc là không đúng và chỉ ra rằng điều đó là không thể. Sau đây là

chứng minh các quy tắc.

      Quy tắc 1:

      Giả sử rằng X ⊃ Y và hai bộ t  và t  trong một thể hiện quan hệ r của R sao

                                              1     2

cho t [X] = t [X]. Khi đó t [Y] = t [Y] bởi vì X ⊃ Y, như vậy X→ Y phải xẩy ra

       1        2                 1         2

trong r.

      Quy tắc 2: (chứng minh phản chứng)

      Giả sử rằng X→Y đúng trong một thể hiện quan hệ r của R nhưng XZ→ YZ

không đúng. Khi đó phải có hai bộ t  và t  trong r sao cho:

                                             1     2

(1)  t  [X] = t [X],

      1         2

(2)  t  [Y] = t [Y],

      1         2

(3)  t  [XZ] = t [XZ] và

      1           2

(4)  t  [YZ] ≠ t  [YZ]. Điều đó là không thể bởi vì từ (1) và (3) chúng ta suy ra

      1          2

(5)  t  [Z] = t [Z], và từ (2) và (5) ta suy ra t  [YZ] = t [YZ], mâu thuẫn với (4).

      1        2                                     1           2

      Quy tắc 3: Giả sử rằng

      (1) X→ Y và (2) Y→ Z cả hai đúng trong một quan hệ r. Khi đó với mọi bộ t1

và t  trong r sao cho t  [X] = t [X] ta phải có (3) t [Y] = t [Y] theo giả thiết (1). Như

     2                     1        2                        1        2

vậy chúng ta cũng phải có (4) t  [Z] = t [Z] theo (3) và giả thiết (2). Vậy X→ Z phải

                                       1        2

đúng trong  r.

                                                      94

----------------------- Page 96-----------------------

      Chúng   ta   có   thể chứng   minh   các   quy   tắc   từ quy   tắc   4  đến   quy   tắc   6   theo

phương pháp trên. Tuy nhiên ta có thể lợi dụng các quy tắc đã được chứng minh là

đúng để chứng minh chúng. Sau đây ta chứng minh theo cách đó.

      Quy tắc 4:

1. X→ YZ (cho trước)

2. YZ → Y (sử dụng QT1 và YZ ⊃ Y)

3. X→ Y (sử dụng QT3  trên 1. và 2.)

      Quy tắc 5:

1. X→ Y     (cho trước)

2. X→ Z    (cho trước)

3. X→ YX (sử dụng QT2 trên 1. bằng cách thêm vào cả hai vế X, và XX=X)

4. YX→ YZ      (sử dụng QT2 trên 2. bằng cách thêm vào cả hai vế Y)

5. X→YZ (sử dụng QT3 trên 3. và 4.)

      Quy tắc 6:

 1. X→Y     (cho trước )

 2. WY→Z (cho trước)

 3. WX→WY (sử dụng QT2 trên 1. bằng cách thêm vào cả hai vế W)

 4. WX→ Y (sử dụng QT3 trên 3. và 2.)

      Amstrong đã chứng minh rằng các quy tắc suy diễn từ QT1 đến QT3 là đúng

và đầy đủ. Đúng có nghĩa là cho trước một tập các phụ thuộc hàm F trên một lược

đồ quan hệ R , bất kỳ một phụ thuộc hàm nào suy diễn được bằng cách áp dụng các

quy tắc từ QT1 đến QT3 cũng đúng trong mỗi trạng thái quan hệ r của R thoả mãn

các phụ thuộc hàm trong F. Đầy đủ có nghĩa là việc sử dụng các quy tắc từ QT1

đến QT3 lặp lại nhiều lần để suy diễn các phụ thuộc hàm cho đến khi không còn

suy diễn được nữa     sẽ cho kết quả là một tập hợp đầy đủ các phụ thuộc hàm có thể

được suy diễn từ F. Nói cách khác, tập hợp các phụ thuộc hàm F+           (bao đóng của F)

có thể xác định được từ F bằng cách áp dụng các quy tắc suy diễn từ QT1 đến QT3.

Các quy tắc từ QT1 đến QT3 được gọi là các quy tắc suy diễn Amstrong.

                                                95

----------------------- Page 97-----------------------

      Thông thường, những người thiết kế cơ sở dữ liệu đầu tiên chỉ ra một tập các

phụ thuộc hàm dễ xác định được nhờ ngữ nghĩa của các thuộc tính của R. Sau đó,

sử dụng các quy tắc Amstrong để suy diễn các phụ thuộc hàm bổ sung. Một cách

có hệ thống, để xác định tất cả các phụ thuộc hàm bổ sung là đầu tiên hãy xác định

mỗi tập thuộc tính X xuất hiện ở vế trái của một phụ thuộc hàm nào đấy trong F và

sau đó xác định tập hợp tất cả các thuộc tính phụ thuộc vào X. Như vậy, với mỗi

tập thuộc tính X, chúng ta xác định tập X+ các thuộc tính phụ thuộc hàm vào X dựa

          +                                                                  +

trên F. X   được gọi là bao đóng của X dưới F. Thuật toán xác định X  như sau:

                                      +

      Thuật toán 4.1: ( xác định X  , bao đóng của X dưới F)

             +

           X   = X;

           Repeat

                        +     +

                 Old X  = X  ;

                 với mỗi phụ thuộc hàm Y → Z trong F thực hiện

                 nếu X+  ⊃ Y thì   X+ = X+ ∪ Z;

           until ( X+          +

                      = Old X  );

      Ví dụ: Xét lược đồ quan hệ

R = {MãsốNV, HọtênNV, MãsốDA, TênDA, ĐịađiểmDA, Sốgiờ}

và tập phụ thuộc hàm  F = {MãsốNV → HọtênNV,

                                MãsốDA → TênDA, ĐịađiểmDA,

                                {MãsốNV, MãsốDA} → Số giờ}

      Áp dụng thuật toán 4.1 ta có:

      {MãsốNV}+ = { MãsốNV, HọtênNV}

      {MãsốDA }+ =  { MãsốDA, TênDA, ĐịađiểmDA}

      {MãsốNV, MãsốDA}+ = {MãsốNV, HọtênNV, MãsốDA, TênDA, Sốgiờ}

      Bao đóng và khóa: Để ý rằng nếu X+  là là tập tất cả các thuộc tính của quan

hệ thì có nghĩa là X xác định hàm các thuộc tính còn lại, hay nói cách khác X là

một siêu khóa. Chúng ta có thể kiểm tra xem một tập thuộc tính X có phải là khóa

của   một   quan   hệ bằng   cách   trước   tiên   xem  X+  có   chứa   tất   cả các   thuộc   tính   của

quan hệ hay không sau đó kiểm tra không có một tập con S nào được lập từ X bằng

                                                96

----------------------- Page 98-----------------------

                                                     +

cách loại bỏ một thuộc tính của X thỏa mãn S chứa tất cả các thuộc tính của quan

hệ (nghĩa là X là siêu khóa tối thiểu). Ví dụ:

      Xét lược đồ quan hệ R( A,B,C,D,E,F) và tập phụ thuộc hàm

                            F ={ A,B → F  ; A→C,D; B → E }

      Ta có {A,B}+  = {A,B,C,D,E,F},        A+  = {A,C,D}, B+ = {B,E} , vậy AB là khóa

của quan hệ.

      II.3-  Sự tương đương của các tập ph ụ thuộc hàm

      Trong phần này chúng ta thảo luận về sự tương đương của hai tập phụ thuộc

hàm. Một tập hợp các phụ thuộc hàm E được phủ bởi một tập các phụ thuộc hàm F

- hoặc F phủ E - nếu mỗi một phụ thuộc hàm trong E đều ở trong F+ ,điều đó có

nghĩa là mỗi phụ thuộc hàm trong E có thể suy diễn được từ F. Hai tập phụ thuộc

                                         +     +

hàm E và F là tương đương         nếu E  = F  . Như vậy tương đương có nghĩa là mỗi

phụ thuộc hàm trong E có thể suy diễn được từ F và mỗi phụ thuộc hàm trong F có

thể suy diễn được từ E.

      Chúng ta có thể xác định xem F có phủ E hay không bằng cách tính X+  đối với

F  đối   với   mỗi   thuộc   hàm   X→Y   trong   E   và   sau  đó   kiểm   tra   xem   X+  này   có   các

thuộc tính trong Y hay không (nghĩa là X+  ⊃ Y). Nếu điều đó xẩy ra với mỗi phụ

thuộc hàm trong E, thì F phủ E. Chúng ta xác định xem E và F có tương đương hay

không bằng cách kiểm tra E phủ F và F phủ E.

      Ví dụ : Xét hai tập phụ thuộc hàm

              F = {A →C, AC → D, E→AD, E →H }

              E = { A →CD,       E → AH }

      Ta chứng minh  F phủ E:

      Tìm bao đóng của các vế trái của các phụ thuộc hàm trong E theo F. Áp dụng

thuật toán 4.1 ở trên, ta có:

          + = { A, C, D };

      {A}

          + = {E, A,D, H}

      {E}

ta thấy các bao đóng này chứa các vế phải tương ứng. Từđó suy ra F phủ E.

      Ta chứng minh E phủ F:

      Tìm bao đóng của các vế trái của các phụ thuộc hàm trong F theo E. Ta có

                                                97

----------------------- Page 99-----------------------

                    +

               {A}  ={A,C,D},

               {AC}+ = { A,C,D},

               {E}+   =   {E,A,H},   ta   thấy   các   bao  đóng   này   chứa   các   vế phải   tương

ứng. Từđó suy ra E phủ F.

       Tóm lại E tương đương với F.

      II.4-   Các tập ph ụ thuộc hàm tối thiểu

      Một tập phụ thuộc hàm là tối thiểu nếu nó thoả mãn các điều kiện sau đây:

      1. Vế phải của các phụ thuộc hàm trong F chỉ có một thuộc tính.

      2. Chúng ta không thể thay thế bất kỳ một phụ thuộc hàm X →A trong F bằng

phụ thuộc hàm Y→A, trong đó Y là tập con đúng của X mà vẫn còn là một tập phụ

thuộc hàm tương đương với F.

      3. Chúng ta không thể bỏđi bất kỳ phụ thuộc hàm nào ra khỏi F mà vẫn có

một tập phụ thuộc hàm tương đương với F.

      Chúng ta có thể nghĩ về tập tối thiểu các phụ thuộc hàm như là một tập hợp ở

dạng chuẩn không có sự dư thừa. Điều kiện 1 đảm bảo rằng mỗi phụ thuộc hàm là

ở dạng   chính   tắc   với   một   thuộc   tính  ở vế phải.  Điều   kiện   2   và   3  đảm   bảo   rằng

không có sự dư thừa trong các phụ thuộc hoặc do có các thuộc tính dư thừa ở vế

trái của phụ thuộc, hoặc do có một phụ thuộc có thểđược suy diễn từ các phụ thuộc

khác ở trong F.

      Một ph ủ tối thiểu của một tập phụ thuộc hàm F là một tập tối thiểu các phụ

thuộc hàm Fmin tương đương với F. Thường có rất nhiều các phủ tối thiểu cho một

tập các phụ thuộc hàm. Chúng ta luôn luôn có thể tìm được ít nhất là một phủ tối

thiểu G cho một tập các phụ thuộc hàm F bất kỳ theo thuật toán 4.2 sau đây:

      Thuật toán 4.2: ( Tìm phủ tối thiểu G cho F)

      1. Đặt G := F;

      2.   Thay   thế mỗi   phụ thuộc   hàm   X  → {A ,   A ,   ...,   A }   trong   G   bằng   n   phụ

                                                         1    2        n

thuộc hàm X → A  , X → A  , … , X → A  .

                      1          2               n

      3. Với mỗi phụ thuộc hàm X → A trong G,

                với mỗi thuộc tính B là một phần tử của X

                                                   98

----------------------- Page 100-----------------------

               nếu ((G – (X → A) ∪ ((X − {B}) → A) là tương đương với G

               thì thay thếX→A bằng (X – {B})→A ở trong G

      4. Với mỗi phụ thuộc hàm  X→A còn lại trong G

               nếu (G − {X → A}) là tương đương với G

               thì loại bỏX → A ra khỏi G

      Ví dụ áp dụng : Tìm phủ tối thiểu cho tập phụ thuộc hàm:

          {A → B, A → C, B → A, B → C, C → A, C → B}

      Áp dụng thuật toán trên, chúng ta có thể tìm được các phủ tối thiểu sau:

1)   Do A→B và B→C nên A→C là thừa. Do C→B và B→A nên C→A là thừa.

     Bỏ những phụ thuộc hàm thừa đi, ta có {A→B, B→A, B→C, C→B} là một

     phủ tối thiểu.

2)   Do A→B và B→C nên A→C là thừa. Do có B→C và C→A nên B→A là thừa.

     Do có C→A và A→B nên C→B là thừa. Bỏ những phụ thuộc hàm thừa đi, ta

     nhận được một phủ tối thiểu khác là  {A→B, B→C, C→A}

III-  Các dạng chuẩn dựa trên khóa chính

      Sau khi đã nghiên cứu các phụ thuộc hàm và một số tính chất của chúng, bây

giờ chúng ta sẽ sử dụng chúng như thông tin về ngữ nghĩa của các lược đồ quan hệ.

Ta giả sử rằng mỗi một quan hệđược cho trước          một tập các phụ thuộc hàm và mỗi

quan hệ có một khoá chính. Trong phần này chúng ta sẽ nghiên cứu các dạng chuẩn

và quá trình chuẩn hoá các lược đồ quan hệ.

     III.1-  Nhập môn v ề chuẩn hoá

      Quá trình chuẩn hoá (do Codd đề nghị 1972)        lấy một lược đồ quan hệ và thực

hiện một loạt các kiểm tra để xác nhận nó có thoả mãn một dạng chuẩn nào đó hay

không. Quá trình này được thực hiện theo phương pháp trên xuống bằng việc đánh

giá mỗi quan hệ với tiêu chuẩn của các dạng chuẩn và tách các quan hệ nếu cần.

Quá trình này có thể xem như là việc thiết kế quan hệ bằng phân tích. Lúc  đầu,

Codd đề nghị ba dạng chuẩn gọi là dạng chuẩn 1, dạng chuẩn 2 và dạng chuẩn 3.

Một  định   nghĩa   mạnh   hơn   cho   dạng   chuẩn   3   gọi   là   dạng   chuẩn   Boyce-Codd   do

Boyce   và   Codd  đề nghị muộn hơn. Tất cả các dạng chuẩn này dựa trên các phụ

                                               99

----------------------- Page 101-----------------------

thuộc hàm giữa các thuộc tính của một quan hệ. Sau đó, dạng chuẩn 4 (4NF) và

dạng chuẩn 5 (5NF) được đề nghị dựa trên các phụ thuộc hàm đa trị và các phụ

thuộc hàm nối.

      Chuẩn hoá dữ liệu có thểđược xem như một quá trính phân tích các lược đồ

quan hệ cho trước dựa trên các phụ thuộc hàm và các khoá chính của chúng đểđạt

đến các tính chất mong muốn:

      (1) Cực tiểu sự dư thừa và

      (2) Cực tiểu các phép cập nhật bất thường.

      Các lược đồ quan hệ không thoả mãn các kiểm tra dạng chuẩn sẽđược tách ra

thành các lược đồ quan hệ nhỏ hơn thoả mãn các kiểm tra và có các tính chất mong

muốn. Như vậy, thủ tục chuẩn hoá cung cấp cho những người thiết kế cơ sở dữ

liệu:

  • Một cơ cấu hình thức để phân tích các lược đồ quan hệ dựa trên các khoá của

      nó và các phụ thuộc hàm giữa các thuộc tính của nó.

  • Một loạt các kiểm tra dạng chuẩn có thể thực hiện trên các lược đồ quan hệ

      riêng rẽ sao cho cơ sở dữ liệu quan hệ có thểđược chuẩn hoá đến một mức

      cần thiết.

      Dạng chuẩn của một quan hệ liên quan đến điều kiện dạng chuẩn cao nhất mà

nó thoả mãn. Các dạng chuẩn khi được xem xét độc lập với các sự kiện khác không

đảm bảo một thiết kế cơ sở dữ liệu tốt. Nói chung, việc xác minh riêng biệt từng

lược đồ quan hệở dạng chuẩn này dạng chuẩn nọ là chưa đủ. Tốt hơn là quá trình

chuẩn hoá thông qua phép tách phải khẳng định một vài tính chất hỗ trợ mà tất cả

các lược đồ quan hệ phải có. Chúng gồm hai tính chất sau:

  • Tính chất nối không mất mát (hoặc nối không phụ thêm), nó đảm bảo rằng vấn

      đề tạo ra các bộ giả không xuất hiện đối với các lược đồ quan hệđược tạo ra

      sau khi tách.

  • Tính   chất   bảo   toàn   sự phụ thuộc,   nó  đảm   bảo   rằng   từng   phụ thuộc   hàm   sẽ

      được biểu hiện trong các quan hệ riêng rẽ nhận được sau khi tách.

      Tính chất nối không mất mát là rất quan trọng, phải đạt được bằng mọi giá,

còn tính chất bảo toàn phụ thuộc thì cũng rất mong muốn nhưng đôi khi có thể hy

sinh.

                                                 100

----------------------- Page 102-----------------------

      Trước khi định nghĩa các dạng chuẩn chúng ta xem lại định nghĩa các khóa

của một quan hệ. Một siêu khóa (superkey) của một lược đồ quan hệ R = {A  , A ,

                                                                                          1   2

.., An } là một tập con S các thuộc tính của R, S ⊆ R, có tính chất là không có hai bộ

t , t  trong một trạng thái quan hệ hợp pháp r nào của R mà t [S] = t [S]. Một khóa

 1  2                                                                  1       2

K là một siêu khóa có tính chất là nếu bỏđi bất kỳ thuộc tính nào ra khỏi K thì K

không còn là siêu khóa nữa. Điều đó có nghĩa là khóa là một siêu khóa tối thiểu.

Nếu một lược đồ quan hệ có nhiều hơn một khóa thì các khóa đó được gọi là các

khóa dự tuyển. Một trong những khóa dự tuyển sẽđược chỉđịnh làm khóa chính và

các khóa còn lại được gọi là các khóa phụ (secondary key). Một lược đồ quan hệ

phải có một khóa chính. Một thuộc tính của một lược đồ quan hệ R được gọi là một

thuộc tính khóa của R nếu nó là một thành phần của khóa chính của R. Một thuộc

tính được gọi là thuộc tính không khóa nếu nó không phải là một thuộc tính khóa.

      III.2-  Dạng chuẩn 1

      Một quan hệđược gọi là ởdạng chuẩn 1 (1NF) nếu miền giá trị của một thuộc

tính chỉ chứa các giá trị nguyên tử (đơn, không phân chia được) và giá trị của mỗi

thuộc tính trong một bộ phải là một giá trịđơn lấy từ miền giá trị của thuộc tính đó.

Như vậy, 1NF không cho phép quan hệ có các thuộc tính đa trị hoặc có các nhóm

thuộc tính lặp (quan hệ trong quan hệ). Nó chỉ cho phép các giá trị của các thuộc

tính là nguyên tử.

      Ví   dụ,   xét   các   quan   hệĐƠNVỊ và   NHÂNVIÊN_DỰÁN   như hình   vẽ dưới

đây. Các quan hệ này không thỏa mãn điều kiện 1NF. Quan hệĐƠNVỊ chứa thuộc

tính đa trịĐịađiểm, quan hệ NHÂNVIÊN_DỰÁN chứa nhóm các thuộc tính lặp

(Tênnhânviên, Sốgiờ).

     ĐƠNVỊ           MãsốĐV      TênĐV            Mã sốNQL       Địađiểm

                         5       Nghiêncứu        NV002          Namđịnh, Hànội,Bắcninh

                         4       Hànhchính        NV014          Hànôi

                         1       Lãnhđạo          NV061          Hànội

     NHÂNVIÊN_DỰÁN          MãsốDA      TênDA     Tênnhânviên    Sốgiờ

                             1          DA01      Vân             15

                                                 101

----------------------- Page 103-----------------------

                                              Nam           20

                          2         DA02      Nam           10

                                              Thanh         12

                                              Bằng          28

                          3         DA03      Thanh         20

     Đểđạt đến dạng chuẩn 1  đối với các quan hệở trên chúng ta dùng phương

pháp sau:

     Loại bỏ các thuộc tính vi phạm dạng chuẩn 1 và đặt chúng vào một bảng riêng

cùng với khoá chính của quan hệ ban đầu. Khoá chính của bảng này là một tổ hợp

của khoá chính của quan hệ ban  đầu và thuộc tính đa trị hoặc khoá bộ phận của

nhóm lặp.

     Các thuộc tính còn lại lập thành một quan hệ với khóa chính là khóa chính ban

đầu.

     Áp dụng : Lược đồ quan hệĐƠNVỊở trên sẽđược tách thành hai:

              ĐƠNVỊ (Mã sốĐV, TênĐV, Mã sốNQL)

              ĐƠNVỊ_ĐỊAĐIỂM ( MãsốĐV, Địađiểm)

     Lược đồ quan hệ NHÂNVIÊN_DỰÁN cũng được tách thành hai:

             DỰÁN (MãsốDA, TênDA)

             NHÂNVIÊN_DỰÁN(MãsốDA, Tênnhânviên, Sốgiờ)

     III.3-  Dạng chuẩn 2

     Dạng   chuẩn   2   (2NF)   dựa   trên   khái   niệm   phụ thuộc   hàm  đầy  đủ.   Một   phụ

thuộc hàm X → Y là một phụ thuộc hàm đầy đủ nếu loại bỏ bất kỳ thuộc tính A

nào ra khỏi X thì phụ thuộc hàm không còn đúng nữa. Điều  đó có nghĩa là, với

thuộc tính A bất kỳ, A  ∈ X, (X – {A}) không xác định Y. Một phụ thuộc hàm            X

→ Y là phụ thuộc bộ phận nếu có thể bỏ một thuộc tính A∈ X, ra khỏi X phụ thuộc

hàm vẫn đúng, điều đó có nghĩa là với     A∈ X,  (X – {A}) → Y.

     Ví dụ, xét lược đồ quan hệ

NHÂNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ, HọtênNV, TênDA, ĐịađiểmDA)

                                             102

----------------------- Page 104-----------------------

     MãsốNV, MãsốDA → Sốgiờ là phụ thuộc hàm đầy đủ

     MãsốNV,   MãsốDA  → HọtênNV   là   phụ thuộc   hàm   bộ phận,   bởi   vì   có   phụ

thuộc hàm

     MãsốNV →HọtênNV

     Việc kiểm tra đối với 2NF bao gồm việc kiểm tra đối với các phụ thuộc hàm

có các thuộc tính ở vế trái của nó là một bộ phận của khoá chính. Nếu khoá chính

chứa một thuộc tính đơn thì không cần phải kiểm tra. Một lược đồ quan hệ R là ở

dạng   chuẩn   2  nếu nó   thỏa   mãn   dạng   chuẩn   1   và   mỗi   thuộc   tính   không   khoá   A

trong R là phụ thuộc hàm đầy đủ vào khoá chính của R.

     Nếu một quan hệ không thoả mãn điều kiện 2NF ta có thể chuẩn hoá nó để có

các quan hệ 2NF như sau: Loại bỏ các thuộc tính không khoá phụ thuộc vào một bộ

phận khoá chính và tách thành ra một bảng riêng, khoá chính của bảng là bộ phận

khoá mà chúng phụ thuộc vào. Các thuộc tính còn lại lập thành một quan hệ, khóa

chính của nó là khóa chính ban đầu.

     Ví dụ, xét lược đồ quan hệ:

NHÂNVIÊN_DỰÁN(MãsốNV, MãsốDA, Sốgiờ, HọtênNV, TênDA, ĐịađiểmDA)

     với các phụ thuộc hàm:

     MãsốNV, MãsốDA        → Sốgiờ

     MãsốNV →HọtênNV

     MãsốDA→TênDA, ĐịađiểmDA

     Ta thấy ởđây có những thuộc tính không khoá phụ thuộc vào một bộ phận của

khoá chính, như vậy nó không thoả mãn điều kiên 2NF.

     Áp dụng phương pháp chuẩn hoá trên, lược đồđược tách thành các lược đồ

như sau:

     N_D1(MãsốDA, TênDA, ĐịađiểmDA)

     N_D2(MãsốNV , HọtênNV)

     N_D3(MãsốNV, MãsốDA, Sốgiờ)

                                             103

----------------------- Page 105-----------------------

     III.4-  Dạng chuẩn 3

     Dạng chuẩn 3 (3NF) dựa trên khái niệm phụ thuộc bắc cầu. Một phụ thuộc

hàm X  → Y trong một lược đồ quan hệ R là một phụ thuộc hàm bắc cầu nếu có

một tập hợp thuộc tính Z không phải là một khoá dự tuyển cũng không phải là một

tập con của một khoá nào và cả hai X → Z và Z →Y đều đúng. Theo định nghĩa

nguyên thuỷ của Codd, một lược đồ quan hệ R là ở 3NF nếu nó thoả mãn 2NF và

không có thuộc tính không khoá nào của R là phụ thuộc bắc cầu vào khoá chính.

     Nếu một lược đồ quan hệ không thoả mãn điều kiện 3NF, ta có thể chuẩn hoá

nó để có được các lược đồ 3NF như sau: Loại bỏ các thuộc tính phụ thuộc bắc cầu

ra khỏi quan hệ và tách chúng thành một quan hệ riêng có khoá chính là thuộc tính

bắc cầu. Các thuộc tính còn lại lập thành một quan hệ có khóa chính là quan hệ ban

đầu.

     Ví dụ: Xét lược đồ quan hệ

NHÂNVIÊN_ĐƠNVỊ(HọtênNV, MãsốNV, Ngàysinh, Địachỉ, MãsốĐV, TênĐV,

                         MãsốNQL)

     Với các phụ thuộc hàm:

      MãsốNV→ HọtênNV, Ngày sinh, Địachỉ, MãsốĐV, TênĐV, MãsốNQL

      MãsốDV→ TênĐV, Mã sốNQL

      Các thuộc tính TênĐV, MãsốNQL phụ thuộc bắc cầu vào khoá chính, lược đồ

quan hệ không thoả mãn điều kiện 3NF.

     Áp dụng phương pháp chuẩn hoá ở trên, lược đồđược tách ra như sau:

     NV_DV1(HọtênNV, MãsốNV, Ngàysinh, Địachỉ, MãsốĐV)

     NV_DV2(MãsốĐV, TênĐV, MãsốNQL)

     III.5-   Dạng chuẩn Boyce-Codd

      Một lược đồ quan hệ R được gọi là ở dạng chuẩn Boyce-Codd (BCNF) nếu nó

là ở dạng chuẩn 3NF và không có các thuộc tính khóa phụ thuộc hàm và thuộc tính

không khóa.

     Ví dụ: Lược đồ

R (A ,A ,A ,A ,A )

     1   2  3   4  5

                                              104

----------------------- Page 106-----------------------

      Với các phụ thuộc hàm:

      A1,A    → A  ,A ,A

            2       3  4   5

      A4  → A2

      Quan hệ này vi phạm dạng chuẩn BCNF bởi vì có thuộc tính khóa (A2) phụ

thuộc hàm vào thuộc tính không khóa (A4).

      Nếu một lược đồ quan hệ không thoả mãn điều kiện BCNF, ta có thể chuẩn

hoá nó để có được các lược đồ BCNF như: Loại bỏ các thuộc tính khóa phụ thuộc

hàm vào thuộc tính không khóa ra khỏi quan hệ và tách chúng thành một quan hệ

riêng có khoá chính là thuộc tính không khóa gây ra phụ thuộc.

      Áp dụng phương pháp chuẩn hóa ở trên, lược đồđược tách ra như sau:

      R1( A , A )

             4   2

      R2(A , A , A , A )

            1    4   3    5

      Ví dụ áp dụng:

      Cho lược đồ quan hệ R = {A,B,C,D,E,F,G,H,I,J} có khóa chính là A,B

      Với tập các phụ thuộc hàm       :

      A,B → C,D,E,F,G,H,I,J

      A→ E,F,G,H,I,J

      F → I, J

      D →B

      Do có có phụ thuộc hàm A→ E,F,G,H,I,J mà A là một bộ phận của khóa chính

nên quan hệ R là vi phạm 2NF. Ta tách R thành R (A,E,F,G,H,I,J) và R (A,B,C,D).

                                                          1                        2

Trong R1, do có phụ thuộc hàm F→ I, J, nên ta có I,J phụ thuộc bắc cầu vào khóa

chính, R  là quan hệ vi phạm 3NF. Trong R  ta có phụ thuộc hàm D → B trong đó

          1                                        2

B là một thuộc tính khóa, R  vi phạm BCNF. Tách R  và R  ta có:

                                2                            1      2

      R11( F,I,J) , R12( A,E,F,G,H), R21(D,B), R22( A,D,C)

                                                  105

----------------------- Page 107-----------------------

IV-  Các thuật toán thiết kế cơ sở dữ liệu quan hệ và các dạng chuẩn

      cao hơn

      Như chúng ta đã thảo luận trong đầu chương IV, có hai cách chính để thiết kế

cơ sở dữ liệu quan hệ. Cách thứ nhất là thiết kế trên-xuống (top-down design). Đây

là cách hay được sử dụng nhất trong thiết kếứng dụng cơ sở dữ liệu thương mại.

Nó bao gồm việc thiết kế một lược đồ quan niệm trong một mô hình dữ liệu bậc

cao, chẳng hạn như mô hình EER, sau đó ánh xạ lược đồ quan niệm vào một tập

quan hệ sử dụng các thủ tục ánh xạ nhưđã nói đến trong chương III. Sau đó, mỗi

một quan hệđược phân tích dựa trên các phụ thuộc hàm và các khóa chính được

chỉđịnh bằng cách áp dụng các thủ tục chuẩn hóa nhưđã nói đến trong phần III

chương này để loại bỏ các phụ thuộc hàm bộ phận và các phụ thuộc hàm bắc cầu.

Việc phân tích các phụ thuộc không mong muốn cũng có thểđược thực hiện trong

quá trình thiết kế quan niệm bằng cách phân tích các phụ thuộc hàm giữa các thuộc

tính bên trong các kiểu thực thể và các kiểu liên kết để ngăn ngừa sự cần thiết có sự

chuẩn hóa phụ thêm sau khi việc ánh xạđược thực hiện.

      Cách thứ hai là thiết kế dưới-lên (bottom-up design), một kỹ thuật tiếp cận và

nhìn nhận việc thiết kế lược đồ cơ sở dữ liệu quan hệ một cách chặt chẽ trên cơ sở

các phụ thuộc hàm được chỉ ra trên các thuộc tính của cơ sở dữ liệu. Sau khi người

thiết kế chỉ ra các phụ thuộc, người ta áp dụng một thuật toán chuẩn hóa để tổng

hợp các lược đồ quan hệ. Mỗi một lược đồ quan hệ riêng rẽở dạng chuẩn 3NF hoặc

BCNF hoặc ở dạng chuẩn cao hơn.

      Trong phần này chúng ta chủ yếu trình bày cách tiếp cận thứ hai. Trước tiên

chúng ta sẽđịnh nghĩa lại các dạng chuẩn một cách tổng quát, sau đó trình bày các

thuật toán chuẩn hóa và các kiểu phụ thuộc khác. Chúng ta cũng sẽ trình bày chi

tiết hơn về hai tính chất cần có là nối không phụ thêm (mất mát) và bảo toàn phụ

thuộc. Các thuật toán chuẩn hóa thường bắt đầu bằng việc tổng hợp một lược đồ

quan hệ rất lớn, gọi là quan hệ phổ quát (universal relation), chứa tất cả các thuộc

tính   của  cơ  sở  dữ  liệu.  Sau  đó    chúng   ta  thực  hiện  lặp đi   lặp  lại  việc  tách

(decomposition) dựa trên các phụ thuộc hàm và các phụ thuộc khác do người thiết

kế cơ sở dữ liệu chỉ ra cho đến khi không còn tách được nữa hoặc không muốn tách

nữa.

                                                106

----------------------- Page 108-----------------------

      IV.1-  Định nghĩa tổng quát các dạng chuẩn

      Nói chung, chúng ta muốn thiết kế các lược đồ của chúng ta sao cho chúng

không còn các phụ thuộc bộ phận và các phụ thuộc bắc cầu bởi vì các kiểu phụ

thuộc này gây ra các sửa đổi bất thường. Các bước chuẩn hóa thành 3NF, BCNF

đã được trình bày trong phần trước loại bỏ các phụ thuộc bộ phận và bắc cầu dựa

trên khóa chính. Các định nghĩa này không tính đến các khóa dự tuyển của quan hệ.

Trong phần này chúng ta sẽđưa ra các định nghĩa về các dạng chuẩn tổng quát hơn,

có tính đến tất cả các khóa dự tuyển. Cụ thể, thuộc tính khóa được định nghĩa lại là

một bộ phận của một khóa dự tuyển. Các phụ thuộc hàm bộ phận, đầy đủ, bắc cầu

bây giờ sẽđược định nghĩa đối với tất cả các khóa dự tuyển của quan hệ.

      Định nghĩa dạng chuẩn 1: Một lược đồ quan hệ R là  ở dạng chuẩn 1 (1NF)

nếu   miền   giá   trị của   các   thuộc   tính   của   nó   chỉ chứa   các giá   trị nguyên   tử (đơn,

không phân chia được) và giá trị của một thuộc tính bất kỳ trong một bộ giá trị phải

là một giá trịđơn thuộc miền giá trị của thuộc tính đó.

      Định nghĩa dạng chuẩn 2: Một lược đồ quan hệ R là  ở dạng chuẩn 2 (2NF)

nếu mỗi thuộc tính không khóa A trong R không phụ thuộc bộ phận vào một khóa

bất kỳ của R.

      Ví dụ: Xét lược đồ quan hệ

              R={A,B,C,D,E,F}

      Với các phụ thuộc hàm A → B,C,D,E,F;          B,C → A,D,E,F; B → F;  D →E.

      Lược đồ trên có hai khóa dự tuyển là A và {B,C}. Ta chọn A làm khóa chính.

Do có phụ thuộc hàm B → F        nên   F phụ thuộc bộ phận vào khóa {B,C}, lược đồ vi

phạm chuẩn 2NF (chú ý rằng, trong định nghĩa dạng chuẩn dựa trên khóa chính,

lược đồ này không vi phạm 2NF).

      Định nghĩa dạng chuẩn 3: Một lược đồ quan hệ R là  ở dạng chuẩn 3 (3NF)

nếu khi một phụ thuộc hàm X → A thỏa mãn trong R, thì:

      1) Hoặc X là một siêu khóa của R.

      2) Hoặc A là một thuộc tính khóa của R.

      Ví dụ: Xét lược đồ quan hệ R ở ví dụ trên. Giả sử nó được tách thành hai lược

đồ:

      R1 = {A,B,C,D,E}

                                               107

----------------------- Page 109-----------------------

      R2 = {B, F}.

      Do có phụ thuộc hàm D → E         trong đó D không phải thuộc tính khóa, E cũng

không phải là thuộc tính khóa, nên R1 vi phạm chuẩn 3NF

      Định nghĩa dạng chuẩn Boyce- Codd: Một lược đồ quan hệ là ở dạng chuẩn

Boyce-Codd (BCNF) nếu khi một phụ thuộc hàm X → A thỏa mãn trong R thì X là

một siêu khóa của R.

      Ví dụ: Xét lược đồ R = {A, B, C, D} có A là khóa chính và {B,C} là khóa dự

tuyển. Nếu có tồn tại một phụ thuộc hàm D → B thì lược đồ này vi phạm BCNF vì

B là một thuộc tính khóa (chú ý rằng trong trường hợp định nghĩa dạng chuẩn dựa

trên khóa chính, lược đồ này không vi phạm BCNF).

      IV.2-  Các thuật toán thiết kế lược đồ cơ sở dữ liệu quan hệ

           IV.2.1-    Tách quan hệ và tính không đầy đủ của các dạng chuẩn

      Tách quan hệ: Các thuật toán thiết kế cơ sở dữ liệu quan hệđược trình bày

trong phần này bắt đầu từ một lược đồ quan hệ vũ trụđơn R = {A , A , …, A }

                                                                              1   2         n

chứa tất cả các thuộc tính của cơ sở dữ liệu. Với giả thiết quan hệ vũ trụ, tên của

mỗi thuộc tính là duy nhất. Tập hợp F các phụ thuộc hàm thỏa mãn trên các thuộc

tính của R do những người thiết kế cơ sở dữ liệu chỉ ra          sẽđược các thuật toán sử

dụng. Sử dụng các phụ thuộc hàm, các thuật toán sẽ tách lược đồ quan hệ vũ trụ R

thành một tập hợp các lược đồ quan hệ D = {R , R , …, R            }, tập hợp đó sẽ là lược

                                                     1   2        m

đồ cơ sở dữ liệu   quan   hệ.   D được   gọi   là   một   phép   tách   (decomposition)   của   R.

Chúng ta phải đảm bảo rằng mỗi thuộc tính trong R sẽ xuất hiện trong ít nhất là

một lược đồ quan hệ Ri trong phép tách để nó khỏi bị “mất ”. Một cách hình thức,

ta có điều kiện bảo toàn thuộc tính sau đây:

                                           ∪Ri    = R

      Tính không đầy đủ của các dạng chuẩn: Mục đích của chúng ta là mỗi quan hệ

riêng rẽ Ri trong phép tách D là ở dạng chuẩn BCNF hoặc 3NF. Tuy nhiên, điều đó

không đủđểđảm bảo một thiết kế cơ sở dữ liệu tốt. Bên cạnh việc xem xét từng

quan hệ riêng rẽ, chúng ta cần xem xét toàn bộ phép tách. Ví dụ, xét hai quan hệ:

      NV_ĐĐ(Tên, ĐịađiểmDA)

      NV_DA1(Mã sốNV, Mã sốDA, Sốgiờ, TênDA, ĐịađiểmDA)

                                                108

----------------------- Page 110-----------------------

  Ở phần I.4 chương này, ta thấy rằng dù quan hệ NV_ĐĐ là một quan hệở dạng

BCNF   nhưng   khi   chúng   ta  đem  nối   tự nhiên   với  quan   hệ NV_DA1   thì   chúng   ta

nhận được một quan hệ có chứa các bộ giả. Điều đó xảy ra là do ngữ nghĩa không

rõ ràng của quan hệ NV_ĐĐ. Đó là một lược đồ quan hệđược thiết kế tồi. Chúng

ta cần phải có tiêu chuẩn khác để cùng với các điều kiện 3NF và BCNF ngăn ngừa

các thiết kế tồi như vậy. Trong các phần tiếp theo chúng ta sẽ nối đến các điều kiện

phụ thêm phải thỏa mãn trên phép tách D.

            IV.2.2-    Phép tách và sự bảo toàn phụ thuộc

      Việc mỗi phụ thuộc hàm X → Y trong F hoặc được xuất hiện trực tiếp trong

một trong các lược đồ quan hệ Ri  trong phép tách D hoặc có thểđược suy diễn từ

các phụ thuộc hàm có trong Ri  là rất có lợi. Ta gọi đó là điều kiện bảo toàn phụ

thuộc. Chúng ta muốn bảo toàn phụ thuộc bởi vì mỗi phụ thuộc trong F biểu thị

một ràng buộc trong cơ sở dữ liệu. Nếu như một trong các phụ thuộc không được

thể hiện trong một quan hệ riêng rẽ Ri nào đó của phép tách, chúng ta không thể ép

buộc ràng buộc này đối với quan hệ riêng rẽ, thay vào đó, chúng ta nối hai hoặc

nhiều quan hệ trong phép tách và sau  đó kiểm tra rằng phụ thuộc hàm thỏa mãn

trong kết quả của phép nối. Rõ ràng đó là một thủ tục không hiệu quả và không

thực tiễn.

      Việc các phụ thuộc chính xác được chỉ ra ở trong F xuất hiện trong các quan

hệ riêng rẽ của phép tách D là không cần thiết. Chỉ cần hợp của các phụ thuộc thỏa

mãn trên các quan hệ riêng rẽ trong D là tương đương với F là đủ. Bây giờ chúng ta

định nghĩa các khái niệm này một cách hình thức.

      Cho trước một tập hợp các phụ thuộc F trên R, phép chi ếu của F trên Ri, ký

hiệu là π (F) trong đó R  là một tập con của R, là một tập hợp các phụ thuộc hàm

           Ri                  i

                 +

X→Y trong F  sao cho các thuộc tính trong X ∪ Y đều được chứa trong R . Như

vậy, phép chiếu của F trên mỗi lược đồ quan hệ Ri trong phép tách D là tập hợp các

phụ thuộc hàm trong F+, bao đóng của F, sao cho các thuộc tính ở vế trái và vế phải

của chúng đều ở trong Ri. Ta nói rằng phép tách D = {R1, R2, …, Rm} của R bảo

toàn phụ thuộc đối với F nếu hợp của các phép chiếu của F trên mỗi Ri trong D là

tương đương với F. Điều đó có nghĩa là:

                          ( (π (F)) ∪ (π (F)) ∪ … ∪ (π (F)))+               =  F+

                               R1           R2                   Rm

                                                    109

----------------------- Page 111-----------------------

      Nếu một phép tách là không bảo toàn phụ thuộc, một vài phụ thuộc sẽ bị mất

trong phép tách.  Để kiểm tra xem một phụ thuộc hàm X→ B, trong  đó X là tập

thuộc   tính   thuộc   về Ri,   B   là   một   thuộc   tính   thuộc   Ri  có   thỏa   mãn   trong   Ri  hay

không ta làm như sau: Trước hết tính X+ , sau đó với mỗi thuộc tính B sao cho

      1. B là một thuộc tính của Ri

      2. B là ở trong X+

      3. B không ở trong X

      Khi đó phụ thuộc hàm X → B thỏa mãn trong Ri.

      Một ví dụ về phép tách không bảo toàn phụ thuộc. Xét lược đồ quan hệ:

R = { A,B,C,D}      với các phụ thuộc hàm:

      A → BCD;      BC → DA;  D →B

      Lược đồ này có hai khóa dự tuyển là A và BC. Lược đồ này vi phạm BCNF.

Nó được tách thành:

      R1 = {D,B}, lược đồ này chứa phụ thuộc hàm D → B

      R2 = {A,C,D}, lược đồ này chứa phụ thuộc hàm A → CD

      Rõ ràng sau khi tách, phụ thuộc hàm  BC → DA bị mất.

      Định lý: Luôn luôn tìm được một phép tách bảo toàn phụ thuộc D đối với F

sao cho mỗi quan hệ Ri trong D là ở 3NF. Phép tách D đựơc thực hiện theo thuật

toán sau đây:

      Thuật toán 5.1: Tạo một phép tách bảo toàn phụ thuộc D = {R ,R , …,R                     }

                                                                                  1  2       m

của một quan hệ vũ trụ R dựa trên một tập phụ thuộc hàm F sao cho mỗi Ri trong D

là ở 3NF. Thuật toán này chỉđảm bảo tính chất bảo toàn phụ thuộc, không đảm bảo

tính chất nối không mất mát.

      Input: Một quan hệ vũ trụ R và một tập phụ thuộc hàm F trên các thuộc tính

của R.

      1)   Tìm phủ tối thiểu G của F.

      2)   Với mỗi vế trái X của một phụ thuộc hàm xuất hiện trong G, hãy tạo một

           lược đồ trong D với các thuộc tính {X ∪ {A  } ∪ {A  } ∪… ∪{A }} trong

                                                              1        2             k

                                                 110

----------------------- Page 112-----------------------

           đó X→A , X→A ,…, X→A  chỉ là các phụ thuộc hàm trong G với X là

                      1        2            k

           vế trái (X là khóa của quan hệ này).

      3)   Đặt các thuộc tính còn lại (những thuộc tính chưa được đặt vào quan hệ

           nào) vào một quan hệđơn đểđảm bảo tính chất bảo toàn thuộc tính.

      Ví dụ áp dụng:

      Xét lược đồ: R = { A,B,C,D} , với các phụ thuộc hàm:

      F = {A → BCD;       BC → DA;       D →B}

      Lược đồ này có hai khóa dự tuyển là A và BC.

      Ta thực hiện thuật toán như sau: Trước tiên ta tìm G là phủ tối thiểu của F.

Theo thuật toán tìm phủ tối thiểu, đầu tiên ta làm cho các vế phải trong G chỉ chứa

một thuộc tính, ta có:

      G = {A → B; A → C; A→ D; BC → D; BC → A; D → B}

      Sau đó ta bỏđi các phụ thuộc hàm thừa (là các phụ thuộc hàm có thể suy diễn

được từ các phụ thuộc hàm khác). Ta thấy A →B là thừa vì có A →D, D →B. Vậy

G còn lại là:

      G = {A → C; A→ D; BC → D; BC → A; D → B}. Lược đồ R sẽđược tách

thành:

      R1( A,C,D); R2(B,C,D,A); R3(D,B) với các khóa chính được gạch dưới.

      Rõ ràng rằng tất cả các phụ thuộc hàm trong G đều được thuật toán bảo toàn

bởi vì mỗi phụ thuộc xuất hiện trong một trong các quan hệ của phép tách D. Bởi vì

G tương đương với F, tất cả các phụ thuộc của F cũng được bảo toàn hoặc trực tiếp

bằng thuật toán hoặc được suy diễn từ những phụ thuộc hàm trong các quan hệ kết

quả, như vậy tính chất bảo toàn phụ thuộc được đảm bảo.

           IV.2.3-    Phép tách và kết nối không mất mát

      Phép tách D phải có một tính chất nữa là nối không mất mát (hoặc tính chất

nối không phụ thêm), nó đảm bảo rằng không có các bộ giảđược tạo ra khi áp dụng

một phép nối tự nhiên vào các quan hệ trong phép tách. Chúng ta đã đưa ra ví dụ về

phép   tách   không   có   tính   chất   nối   không   mất   thông   tin  ở phần   I.4   chương   này.

Trong phép tách đó, khi ta thực hiện phép nối tự nhiên trên các quan hệ của phép

tách, rất nhiều các bộ giảđã sinh ra.

                                                 111

----------------------- Page 113-----------------------

      Một cách hình thức, ta nói rằng một phép tách D = { R , R ,…,R                       } của R có

                                                                             1    2      m

tính chất nối không mất mát (không phụ thêm) đối với một tập hợp phụ thuộc hàm

F trên R nếu với mỗi trạng thái quan hệ r của R thỏa mãn F thì

                                   *  ( π (r) , π (r)     …, π (r) ) = r

                                          R1       R1           R1

trong đó * là phép nối tự nhiên của các quan hệ trong D.

      Nếu một phép tách không có tính chất nối không mất mát thông tin thì chúng

ta có thể nhận được các bộ phụ thêm (các bộ giả) sau khi áp dụng các phép chiếu và

nối tự nhiên. Nghĩa của từ mất mát ởđây là mất mát thông tin chưa không phải mất

các bộ giá trị. Vì vậy, với tính chất này ta nên gọi chính xác hơn là tính chất nối

không phụ thêm.

      Chúng ta có thuật toán để kiểm tra một phép tách có tính chất nối không mất

mát thông tin hay không như sau:

       Thuật toán 5.2: Kiểm tra tính chất nối không mất mát

      Input: Một quan hệ vũ trụ R(A  ,A ,…A ), một phép tách D = {R , R , …, R                          }

                                             1   2      n                               1   2         m

của R và một tập F các phụ thuộc hàm.

       1)  Tạo một ma trận S có m            hàng, n cột. Mỗi cột của ma trận ứng với một

           thuộc tính, mỗi hàng ứng với mỗi quan hệ Ri

      2)   Đặt S(i,j) = 1 nếu thuộc tính A  thuộc về quan hệ R  và  bằng 0 trong trường

                                                 j                        i

           hợp ngược lại.

      3)   Lặp lại vòng lặp sau đây cho đến khi nào việc thực hiện vòng lặp không

           làm   thay  đổi   S:   Với   mỗi   phụ thuộc   hàm   X  → Y   trong   F,   xác  định   các

           hàng trong S có các ký hiệu 1 như nhau trong các cột ứng với các thuộc

           tính trong X. Nếu có một hàng trong sốđó chứa 1 trong các cột ứng với

           thuộc tính Y thì hãy làm cho các làm cho các cột tương ứng của các hàng

           khác cũng chứa 1.

      4)   Nếu   có   một   hàng   chứa   toàn   ký   hiệu   “1”   thì   phép   tách   có   tính   chất   nối

           không mất mát, ngược lại, phép tách không có tính chất đó.

      Cho trước một quan hệ R được tách thành một số quan hệ R , R , ..,R   . Thuật

                                                                                  1    2     m

toán 5.2 bắt đầu bằng việc tạo ra một            trạng thái quan hệ r trong ma trận S. Hàng i

trong S biểu diễn một bộ t  (tương ứng với quan hệ R ). Hàng này có các ký hiệu

“1” trong các cột tương ứng với các thuộc tính của                Ri và các ký hiệu “0” trong các

                                                      112

----------------------- Page 114-----------------------

cột còn lại. Sau đó thuật toán biến đổi các hàng của ma trận này (trong vòng lặp của

bước 3) sao cho chúng biểu diễn các bộ thỏa mãn tất cả các phụ thuộc hàm trong F.

Ở cuối vòng lặp áp dụng các phụ thuộc hàm, hai hàng bất kỳ trong S – chúng biểu

diễn hai bộ trong r – có các giá trị giống nhau đối với các thuộc tính của X ở vế trái

của phụ thuộc hàm X→ Y trong F sẽ cũng có các giá trị giống nhau đối với các

thuộc tính của vế phải Y. Có thể chỉ ra rằng sau khi áp dụng vòng lặp của bước 3,

nếu một hàng bất kỳ trong S kết thúc với toàn ký hiệu “1” thì D có tính chất nối

không mất mát đối với F. Mặt khác, nếu không có hàng nào kết thúc bằng tất cả ký

hiệu “1” thì D không thỏa mãn tính chất nối không mất mát. Trong trường hợp sau,

trạng thái quan hệ r được biểu diễn bằng S ở cuối thuật toán sẽ là một ví dụ về một

trạng thái quan hệ r của R thỏa mãn các phụ thuộc trong F nhưng không thỏa mãn

điều kiện nối không mất mát . Như vậy, quan hệ này được dùng như một phản ví

dụ chứng minh rằng D không có tính chất nối không mất mát đối với F. Chú ý rằng

các ký hiệu “1” và “0” không có ý nghĩa đặc biệt gì ở cuối thuật toán.

     Ví dụ áp dụng 1:

R = ( MãsốNV, TênNV, MãsốDA, TênDA, ĐịađiểmDA, Sốgiờ)

     R1= ( TênNV, ĐịađiểmDA)

     R2 = ( MãsốNV, MãsốDA, Sốgiờ, TênDA, ĐịađiểmDA )

     F= { Mã sốNV→TênNV,          MãsốDA →{TênDA, ĐịađiểmDA}, {MãsốNV,

           Mã sốDA}→Sốgiờ}

          MãsốNV        TênNV       Mã sốDA        TênDA      ĐịađiểmDA        Sốgiờ

 R1           0            1            0             0             1            0

 R2           1            0             1            1             1            1

     Xét   lần  lượt  phụ  thuộc  hàm  MãsốNV    → TênNV,       MãsốDA   → {TênDA,

ĐịađiểmDA}, {MãsốNV, Mã sốDA} → Sốgiờ. Ta thấy không có trường hợp nào

các thuộc tính tương ứng với các vế trái đều có giá trị bằng 1, vì vậy ta không thể

làm gì để biến đối ma trận. Ma trận không chứa một hàng gồm toàn ký hiệu “1”.

Phép tách là mất mát.

     Ví dụ áp dụng 2:

R = (MãsốNV, TênNV, MãsốDA, TênDA, ĐịađiểmDA, Sốgiờ)

                                            113

----------------------- Page 115-----------------------

      R1= (MãsốNV, TênNV)

      R2 = (MãsốDA, TênDA, ĐịađiểmDA)

      R3 = (MãsốNV, MãsốDA, Sốgiờ)

      F=   {Mã   sốNV→ TênNV,   MãsốDA  → {TênDA,  ĐịađiểmDA},   {MãsốNV,

            MãsốDA} →Sốgiờ}

          MãsốNV         TênNV        Mã sốDA        TênDA       ĐịađiểmDA        Sốgiờ

 R1            1             1            0             0              0             0

 R2           0             0              1            1              1             0

 R3            1            0              1            1              1             0

                             (Giá trị ban đầu của ma trận S)

          MãsốNV         TênNV        Mã sốDA        TênDA       ĐịađiểmDA        Sốgiờ

 R1            1             1            0             0              0             0

 R2           0             0              1            1              1             0

 R3            1            0  1           1            0  1           0  1          1

   (Ma trận S sau khi áp dụng hai phụ thuộc hàm đầu tiên dòng cuối cùng ko chứa

   toàn ký hiệu “a”). Ma trận chứa một hàng gồm toàn ký hiệu 1. Phép tách này là

                                     không mất mát.

                  Hình IV-1. Thuật toán kiểm tra nối không mất mát

      Thuật toán 5.2 cho phép chúng ta kiểm tra xem một phép tách D cụ thể có

tuân theo tính chất nối không mất mát hay không. Câu hỏi tiếp theo là liệu có một

thuật toán tách một lược đồ quan hệ vũ trụ R = {A  , A , …, A } thành một phép

                                                          1   2        n

tách D = {R , R , …,R     } sao cho mỗi R  là ở BCNF và phép tách D có tính chất nối

             1   2       m                  i

không mất mát đối với F hay không? Câu trả lời là có. Trước khi trình bày thuật

toán, ta xem một số tính chất của các phép tách nối không mất mát nói chung.

      Tính chất 1: Một phép tách D = {R ,R } của R có tính chất nối không mất mát

                                            1  2

đối với một tập phụ thuộc hàm F trên R khi và chỉ khi

                                                                      +

      -  Hoặc phụ thuộc hàm  ((R ∩ R  ) → (R − R )) ở trong F  .

                                     1    2         1   2

                                              114

----------------------- Page 116-----------------------

                                                                              +

       -   Hoặc phụ thuộc hàm ((R ∩ R ) → (R              − R )) ở trong F  .

                                         1     2         2     1

      Với tính chất này, chúng ta có thể kiểm tra lại các phép tách chuẩn hóa trong

4.3 và sẽ thấy rằng các phép tách đó là thỏa mãn tính chất nối không mất mát.

      Tính chất 2: Nếu một phép tách D = {R , R , …, R                   } của R có tính chất nối

                                                         1   2         m

không mất mát đối với một tập phụ thuộc hàm F trên R và nếu một phép tách D1 =

{Q , Q , …,Q } của R  có tính chất nối không mất mát đối với phép chiếu của F

    1    2        k          i

trên R  thì phép tách D2 = { R , R ,…, R            , Q , Q ,…,Q , R        ,…, R    } của R có tính

        i                            1   2        i-1   1   2       k    i+1       m

chất nối không mất mát đối với F.

      Tính chất này nói rằng nếu một phép tách D đã có tính chất nối không mất mát

đối với một tập F và chúng ta tiếp tục tách một trong các quan hệ Ri trong D thành

phép tách khác D  (l = 1,2,..k) có tính chất nối không mất mát đối với π (F) thì

                       1                                                                     Ri

việc thay R  trong D bằng D  (l = 1,2,..k) cũng tạo ra một phép tách có tính chất nối

              i                    1

không mất mát đối với F.

      Thuật toán 5.3 sau đây sử dụng hai tính chất trên để tạo ra một phép tách D =

{R , R , …, R       } của một quan hệ vũ trụ R dựa trên một tập các phụ thuộc hàm F

    1   2         m

sao cho mỗi Ri là BCNF.

      Thuật   toán   5.3:   Tách   quan   hệ thành   các   quan   hệ BCNF   với   tính   chất   nối

không mất mát.

      Input:   Một   quan   hệ vũ trụ R   và   một   tập   hợp   các   phụ thuộc   hàm   F   trên   các

thuộc tính của R.

   1.  Đặt   D := {R} ;

   2.  Khi có một lược đồ quan hệ Q trong D không phải ở BCNF, thực hiện vòng

       lặp: Với mỗi một lược đồ quan hệ Q trong D không ở BCNF hãy tìm một phụ

       thuộc   hàm   X→ Y   trong   Q   vi  phạm   BCNF   và   thay   thế Q   trong   D   bằng   hai

       lược đồ quan hệ (Q-Y) và (X∪Y). Quá trình lặp dừng khi không còn quan hệ

       nào trong D vi phạm BCNF.

      Mỗi lần  đi vào vòng lặp trong thuật toán 5.3, chúng ta tách một quan hệ Q

không phải BCNF thành hai lược đồ quan hệ. Theo các tính chất 1 và 2, phép tách

D có tính chất nối không mất mát. Kết thúc thuật toán, tất cả các quan hệ trong D sẽ

ở BCNF.

                                                     115

----------------------- Page 117-----------------------

      Trong bước 2 của thuật toán 5.3, cần xác định xem một lược đồ quan hệ Q có

ở BCNF hay không. Một phương pháp  để làm  điều  đó là kiểm tra. Với mỗi phụ

                                          +         +

thuộc hàm X → Y trong Q, ta tính X  . Nếu X  không chứa tất cả các thuộc tính

trong Q thì X → Y vi phạm BCNF bởi vì X không phải là một siêu khóa.

      Một kỹ thuật nữa dựa trên quan sát rằng khi một lược đồ quan hệ Q vi phạm

BCNF thì có tồn tại một cặp thuộc tính A,B trong Q sao cho {Q – {A,B}} → A.

Bằng việc tính bao đóng {Q – {A,B}}+ cho mỗi cặp thuộc tính {A,B} của Q và

kiểm tra xem bao đóng có chứa A (hoặc B) hay không, chúng ta có thể xác định

được Q có ở BCNF hay không.

     Ví dụ áp dụng: Xét lược đồ quan hệ

R = { A, B, C, D, E, F)

     Với các phụ thuộc hàm:

     A → BCDEF,        BC → ADEF, B→ F,  D→ E,           D→B

      Lược đồ quan hệ này có hai khóa dự tuyển là A và BC.

      Ta có B → F vi phạm BCNF vì B không phải là siêu khóa, R được tách thành:

R1(B,F)  với phụ thuộc hàm B→ F

R2(A,B,C,D,E) với các phụ thuộc hàm A→SCDE, BC→ADF, D→E, D→B

      Do  D→ E vi phạm BCNF ( D là một thuộc tính không khóa ), R2 được tách

thành:

R21(D,E) với phụ thuộc hàm D → E

R22(ABCD) với các phụ thuộc hàm          A → BCD, BC→ AD, D→ B

      Do   D   B   vi   phạm   BCNF (Dkhông   phải   là   thuộc   tính   khóa),   R22 được   tách

thành:

R221(D,B)

R222(A,B,D) với phụ thuộc hàm A → BD (phụ thuộc hàm              BC → AD bị mất)

      Tóm lại, ta có phép tách D = {R1, R21, R221, R222}. Phép tách này có tính

chất nối không mất thông tin nhưng không bảo toàn phụ thuộc.

                                              116

----------------------- Page 118-----------------------

      Nếu chúng ta muốn có một phép tách có tính chất nối không mất mát và bảo

toàn phụ thuộc thì ta phải hài lòng với các lược đồ quan hệở dạng 3NF. Thuật toán

sau đây là cải tiến của thuật toán 5.1, tạo ra một phép tách thỏa mãn :

      -  Bảo toàn phụ thuộc.

      -  Có tính chất nối không mất mát.

      -  Mỗi lược đồ quan hệ kết quả là ở dạng 3NF.

      Thuật toán 5.4: Thuật toán tổng hợp quan hệ với tính chất bảo toàn phụ thuộc

và nối không mất mát.

      Input: Một quan hệ vũ trụ R và một tập các phụ thuộc hàm F trên các thuộc

tính của R.

   1) Tìm phủ tối thiểu G cho F.

   2)  Với mỗi vế trái X của một phụ thuộc hàm xuất hiện trong G hãy tạo ra một

      lược  đồ quan   hệ trong   D   với   các   thuộc   tính   {X∪{A }∪{A }∪…∪ {A  }},

                                                                      1       2             k

      trong đó X →A , X→A ,…, X→ A  chỉ là các phụ thuộc hàm ở trong G với

                         1        2             k

      X là vế trái (X là khóa của quan hệ này).

   3)  Nếu không có lược đồ quan hệ nào trong D chứa một khóa của R thì hãy tạo

      ra thêm một lược đồ quan hệ trong D chứa các thuộc tính tạo nên một khóa

      của R.

      Bước 3 của thuật toán 5.4 đòi hỏi phải xác định một khóa K của R. Để xác

định một khóa K của R, ta sử dụng thuật toán sau

      Thuật toán xác  định khóa:   Tìm  một khóa K của  R  dựa trên tập F các phụ

thuộc hàm.

  1)  Đặt K := R;

  2)  Với mỗi thuộc tính A trong K

                   +  đối với F;

      {tính (K-A)

       Nếu (K-A)+ chứa tất cả các thuộc tính trong R thì đặt K := K-{A}};

       *Chú ý: Chúng ta có nhận xét sau: Nếu quan hệ có khóa thì các thuộc tính

khóa của quan hệ phải là các tập con của         tập hợp các thuộc tính ở vế phải các phụ

thuộc hàm trong F. Vì vậy, để tìm được các khóa nhanh hơn, trước tiên chúng ta

tính RF là hợp của các thuộc tính ở các vế trái của các phụ thuộc hàm trong F, sau

                                                 117

----------------------- Page 119-----------------------

đó đi tính bao đóng của tất cả các tập con của R  . Nếu bao đóng của tập con nào

                                                             F

chứa tất cả các thuộc tính của R thì tập đó là một siêu khóa. Để kiểm tra nó là một

khóa ta thực hiện như bước 2) của thuật toán trên.

      Không phải lúc nào cũng có khả năng tìm được một phép tách thành các lược

đồ quan hệ bảo toàn phụ thuộc và mỗi lược đồ trong phép tách là  ở BCNF. Các

lược đồ quan hệ trong phép tách theo thuật toán ở trên thường là 3NF. Để có các

lược đồ BCNF, chúng ta có thể kiểm tra các lược đồ quan hệ 3NF trong phép tách

một cách riêng rẽđể xem nó có thỏa mãn BCNF không. Nếu có lược đồ quan hệ Ri

không ở BCNF thì ta có thể tách tiếp hoặc để nguyên nó là 3NF.

      IV.3-   Các phụ thuộc hàm đa trị và dạng chuẩn 4

      Trong phần này chúng ta thảo luận khái niệm phụ thuộc hàm đa trị và  định

nghĩa dạng chuẩn 4. Các phụ thuộc đa trị hệ quả của dạng chuẩn 1 không cho phép

một thuộc tính của một bộ có một tập giá trị (nghĩa là các thuộc tính đa trị). Nếu

chúng ta có hai hoặc nhiều hơn các thuộc tính độc lập và đa trị trong cùng một lược

đồ quan hệ thì chúng ta phải lặp lại mỗi một giá trị của một trong các thuộc tính với

mỗi giá trị của thuộc tính khác để giữ cho trạng thái quan hệ nhất quán và duy trì

tính độc lập giữa các thuộc tính. Ràng buộc đó được chỉ ra bằng một phụ thuộc đa

trị.

            IV.3.1-     Định nghĩa phụ thuộc đa trị

      Giả thiết có một lược đồ quan hệ R, X và Y là hai tập con của R. Một phụ

thuộc đa trị (MVD), ký hiệu là         X →→Y , chỉ ra ràng buộc sau đây trên một trạng

thái quan hệ bất kỳ của R: Nếu hai bộ t  và t  tồn tại trong R sao cho t  [X] = t [X]

                                                 1      2                               1         2

thì hai bộ t  và t  cũng tồn tại trong R với các tính chất sau:

             3     4

      . t [X] = t [X] = t [X] = t [X]

         3        4        1         2

      . t [Y] = t [Y]  và  t [Y] = t [Y]

         3        1           4        2

      . t [Z] = t [Z]    và  t [Z] = t [Z]    với Z = (R- (X ∪ Y))

         3        2           4        1

      Khi   X→→Y   thỏa   mãn,   ta   nói   rằng   X  đa   xác định   Y.   Bởi   vì   tính  đối   xứng

trong định nghĩa, khi X →→ Y thỏa mãn trong R, X→→Z cũng thỏa mãn trong R.

Như vậy X→→Y kéo theo X→→Z và vì thếđôi khi nó được viết là X→→Y|Z

      Định nghĩa hình thức chỉ ra rằng, cho trước một giá trị cụ thể của X, tập hợp

các giá trị của Y được xác định bởi giá trị này của X là được xác định hoàn toàn bởi

                                                     118

----------------------- Page 120-----------------------

một mình X và không phụ thuộc vào các giá trị của các thuộc tính còn lại Z của R.

Như vậy, mỗi khi hai bộ tồn tại có các giá trị khác nhau của Y nhưng cùng một giá

trị X thì các giá trị này của Y phải được lặp lại trong các bộ riêng rẽ với mỗi giá trị

khác nhau của Z có mặt với cùng giá trị của X. Điều đó tương ứng một cách không

hình thức với Y là một thuộc tính đa trị của các thực thểđược biểu diễn bằng các

bộ trong R.

      Ví dụ về phụ thuộc đa trị:

          NHÂNVIÊN          TênNV        TênDA        TênconNV

                             Nam          DA01            Lan

                             Nam          DA02            Hoa

                             Nam          DA01            Hoa

                             Nam          DA02            Lan

       Trong bảng trên có hai phụ thuộc đa trị là:

              TênNV→→TênDA,  TênNV→→TênconNV

       Một MVD X→→Y được gọi phụ thuộc đa trị tầm thường nếu:

      a) Y là một tập con của X

      b) hoặc X ∪ Y = R

      Một   MVD   không   thỏa   mãn   a)   hoặc   b)  được   gọi   là   một   MVD   không   tầm

thường. Nếu chúng ta có một phụ thuộc đa trị không tầm thường trong một quan

hệ, chúng ta có thể phải lặp các giá trị một cách dư thừa trong các bộ. Trong quan

hệ NHÂNVIÊN ở ví dụ trên, các giá trị ‘DA01’, ‘DA02’ của TênDA được lặp lại

với mỗi giá trị của TênconNV (một cách đối xứng, các giá trị ‘Lan’, ‘Hoa’ được lặp

lại với mỗi giá trị của TênDA). Rõ ràng ta không mong muốn có sự dư thừa đó.

Tuy nhiên, lược đồ quan hệ trên là  ở BCNF bởi vì không có phụ thuộc hàm nào

thỏa mãn trong quan hệđó. Vì vậy, chúng ta phải định nghĩa một dạng chuẩn thứ tư

mạnh hơn BCNF và ngăn cấm các lược đồ quan hệ như quan hệ NHÂNVIÊN.

                                              119

----------------------- Page 121-----------------------

           IV.3.2-    Các quy tắc suy diễn đối với các phụ thuộc hàm và phụ thuộc

                      đa trị

      Các quy tắc từ Qt1 đến Qt8 sau đây tạo nên một tập hợp đúng đắn và đầy đủ

cho việc suy diễn các phụ thuộc hàm và phụ thuộc đa trị từ một tập các phụ thuộc

cho trước. Giả thiết rằng tất cả các thuộc tính được chứa trong một lược đồ quan hệ

“vũ trụ”   R = {A , A , …,A } và X, Y, Z, W là các tập con của R.

                   1   2       n

      Qt1) (quy tắc phản xạ cho FD):  Nếu X ⊇ Y thì X → Y

      Qt2) (quy tắc tăng cho FD): {X →Y} |=          XZ → YZ

      Qt3) (quy tắc bắc cầu cho FD): { X → Y, Y→ Z } |=           X→ Z

      Qt4) (quy tắc bù cho MVD): {X →→Y } |= {X→→ (R-(X∪ Y))}

      Qt5) (quy tắc tăng cho MVD): Nếu X →→Y và W ⊇Z thì WX →→ YZ

      Qt6) (quy tắc bắc cầu cho MVD): {X→→ Y, Y→→ Z } |= X→→ (Z – Y)

      Qt7) (quy tắc tái tạo cho FD và MVD): {X →Y} |= X→→ Y

      Qt8) (quy tắc liên hợp cho FD và MVD): Nếu X →→ Y và có tồn tại W với

các tính chất a) W ∩Y = ∅, b) W →Z và c) Y ⊇ Z             thì X → Z.

      Qt1 đến Qt3 là các quy tắc suy diễn Amstrong đối với các phụ thuộc hàm. Qt4

đến Qt6 là các quy tắc suy diễn chỉ liên quan đến các phụ thuộc đa trị. Qt7 và Qt8

liên kết các phụ thuộc hàm và các phụ thuộc đa trị. Đặc biệt, Qt7 nói rằng một phụ

thuộc hàm là một trường hợp đặc biệt của một phụ thuộc đa trị. Điều đó có nghĩa là

mỗi phụ thuộc hàm cũng là một phụ thuộc đa trị bởi vì nó thỏa mãn định nghĩa hình

thức của phụ thuộc đa trị. Về cơ bản, một phụ thuộc hàm X →Y là một phụ thuộc

đa trị X →→ Y với một hạn chế phụ rằng có nhiều nhất là một giá trị của Y được

kết hợp với mỗi giá trị của X. Cho trước một tập hợp các phụ thuộc hàm và phụ

thuộc đa trị chỉ ra trên R = {A1, A2,  …, An}, chúng ta có thể sử dụng các quy tắc

từ Qt1  đến Qt8 để suy ra tập hợp  đầy  đủ các phụ thuộc (hàm và đa trị) F+             đúng

trong mọi trạng thái quan hệ r của R thỏa mãn F. Chúng ta lại gọi F+ là bao đóng

của F.

                                                120

----------------------- Page 122-----------------------

           IV.3.3-   Dạng chuẩn 4

      Định nghĩa: Một lược đồ quan hệ R là ở dạng chuẩn 4 (4NF) đối với một tập

hợp các phụ thuộc F (gồm các phụ thuộc hàm và phụ thuộc đa trị) nếu với mỗi phụ

thuộc đa trị không tầm thường X→→Y trong F+ , X là một siêu khóa của R.

      Như vậy, một lược đồ quan hệ vi phạm 4NF nếu nó chứa các phụ thuộc hàm

đa trị không mong muốn. Ví dụ, lược đồ quan hệ NHÂNVIÊN  ở ví dụ trên là vi

phạm     4NF    bởi  vì  trong   các   phụ  thuộc    hàm  đa    trị  TênNV→→TênDA           và

TênNV→→ Têncon, TênNV không phải là một siêu khóa .

      Giả sử chúng ta tách bảng NHÂNVIÊN thành hai bảng như sau:

   NV_DA          TênNV        TênDA           NV_CON          TênNV         TênconNV

                  Nam          DA01                            Nam           Lan

                  Nam          DA02                            Nam           Hoa

       Hai   bảng   này   là  ở 4NF   bởi   vì   các   phụ thuộc  đa   trị TênNV→→TênDA   và

TênNV→→TênconNV   là   các   phụ thuộc  đa   trị tầm   thường.   Trong   hai   bảng   này

không có các phụ thuộc đa trị không tầm thường cũng như không có các phụ thuộc

hàm.

           IV.3.4-    Tách có tính chất nối không mất mát thành          các quan hệ 4NF

      Khi chúng ta tách một lược đồ quan hệ R thành R  = (X∪Y) và R  = (R-Y)

                                                                1                  2

dựa trên phụ thuộc hàm đa trị X→→Y đúng trong R, phép tách có tính chất nối

không mất mát. Đó cũng là  điều kiện cần và  đủ cho một phép tách một lược đồ

thành hai lược đồ có tính chất nối không mất mát. Ta có tính chất sau:

      Tính chất 1’: Các lược đồ quan hệ R  và R  tạo thành một phép tách có tính

                                                1      2

chất nối không mất mát của R khi và chỉ khi (R ∩ R )→→ (R  –R ) (hoặc (R ∩R )

                                                      1    2          1    2           1    2

→→(R  –R )).

         1   2

      Áp dụng tính chất trên chúng ta có thuật toán tạo một phép tách có tính chất

nối không mất mát thành các lược đồ quan hệở dạng 4NF.

      Thuật toán 5.5: Tách quan hệ thành các quan hệ 4NF với tính chất nối không

mất mát.

      Input: Một quan hệ vũ trụ R và một tập phụ thuộc hàm và phụ thuộc đa trị F.

                                                121

----------------------- Page 123-----------------------

   1.  Đặt D := {R};

   2. Khi có một lược đồ quan hệ Q trong D không ở 4NF, thực hiện:

      {Chọn một lược đồ quan hệ Q trong D không ở 4NF;

       Tìm một phụ thuộc đa trị không tầm thường X→→Y trong Q vi phạm 4NF;

       Thay thế Q trong D bằng hai lược đồ quan hệ (Q – Y) và (X ∪ Y)};

      Ví dụ áp dụng:

      Xét lược đồ NHÂNVIÊN(TênNV, TênDA, TênconNV). Ta có phụ thuộc hàm

đa trị TênNV→→TênDA trong đó TênNV không phải là một siêu khóa, vậy nó vi

phạm      4NF.     Ta   tách    thành    NV_DA(TênNV,           TênDA),      NV_CON(TênNV,

TênconNV).

      IV.4-   Các phụ thuộc nối và dạng chuẩn 5

      Như chúng ta  đã thấy, các tính chất 1 và tính chất 1’ cho  điều kiện  để một

lược đồ quan hệ R được tách         thành hai lược đồ quan hệ R1 và R2 và phép tách có

tính chất nối không mất mát. Tuy nhiên, trong một số trường hợp, có thể không có

phép tách có tính chất nối không mất mát của R thành hai lược đồ quan hệ nhưng

có thể có phép tách có tính chất nối không mất mát thành nhiều hơn hai quan hệ.

Hơn nữa, có thể không có phụ thuộc hàm nào trong R các chuẩn cho đến BCNF và

có thể không có phụ thuộc đa trị nào có trong R vi phạm 4NF. Khi đó chúng ta phải

sử dụng đến một phụ thuộc khác gọi là phụ thuộc nối và nếu có phụ thuộc nối thì

thực hiện một phép tách đa chiều thành dạng chuẩn 5 (5NF).

      Một ph ụ thuộc nối (JD), ký hiệu là JD(R , R , …, R )            trên lược đồ quan hệ R

                                                      1   2        n

chỉ ra một ràng buộc trên các trạng thái r của R. Ràng buộc đó tuyên bố rằng mỗi

trạng   thái   hợp   pháp   r   của   R   phải   có   phép   tách có   tính   chất   nối   không   mất   mát

thành R1, R2, …, Rn. Điều đó nghĩa là:

                                  *( π (r), π (r), …, π (r))  = r

                                      R1       R2          Rn

      Một phụ thuộc nối JD(R , R , …, R ) là một phụ thuộc nối tầm thường nếu

                                    1   2         n

một trong các lược đồ quan hệ R  ở trong JD(R  , R , …, R ) là bằng R.

                                      i                1   2        n

      Một lược đồ quan hệ R là ở dạng chuẩn 5 (5NF) (hoặc dạng chuẩn nối chiếu

PJNF – Project-Join normal form) đối với một tấp F các phụ thuộc hàm, phụ thuộc

                                                  122

----------------------- Page 124-----------------------

đa trị và phụ thuộc nối nếu với mỗi phụ thuộc nối không tầm thường JD(R , R , …,

                                                                                        1   2

              +

R )  trong F  , mỗi R  là một siêu khóa của R.

      Ví dụ: Xét quan hệ CUNGCẤP gồm toàn các thuộc tính khóa

       CUNGCẤP            Tênnhàcungcấp        Tênhàng             TênDựán

                         Ncc1                  Bulong              Dựán1

                         Ncc1                  Đaiốc               Dựán2

                         Ncc2                  Bulong              Dựán2

                         Ncc3                  Đaiốc               Dựán3

                         Ncc2                  Đinh                Dựán1

                         Ncc2                  Bulong              Dựán1

                         Ncc1                  Bulong              Dựán2

      Giả thiết rằng ràng buộc phụ thêm sau đây luôn đúng: Khi một nhà cung cấp S

cung cấp hàng P VÀ một dự án J sử dụng hàng P VÀ nhà cung cấp S cung cấp ít

nhất là một hàng cho dự án J THÌ nhà cung cấp S cũng sẽ cung cấp hàng P cho dự

án   J.   Ràng   buộc   này   chỉ ra   một   phụ thuộc   nối   JD(R ,R ,R )   giữa   ba   phép   chiếu

                                                                1   2   3

R (Tênnhàcungcấp,Tênhàng),   R (Tênnhàcungcấp,Têndựán),R (Tênhàng,TênDựán)

  1                                   2                                  3

của quan hệ CUNGCẤP. Quan hệ CUNGCẤP được tách thành ba quan hệ R , R ,

                                                                                            1   2

R3  ở dạng chuẩn 5. Chú ý rằng nếu ta áp dụng phép nối tự nhiên cho từng đôi quan

hệ một thì sẽ sinh ra các bộ giả, nhưng nếu áp dụng phép nối tự nhiên cho cả ba

quan hệ thì không sinh ra các bộ giả.

                R1                                  R2                               R3

   Tênnhàcungcấp     Tênhàng           Tênnhàcungcấp     Têndựán            Tênhàng      Têndựán

   Ncc1              Bulong            Ncc1              Dựán1              Bulong       Dựán1

   Ncc1              Đaiốc             Ncc1              Dựán2              Đaiốc        Dựán2

   Ncc2              Bulong            Ncc2              Dựán2              Bulong       Dựán2

   Ncc3              Đaiốc             Ncc3              Dựán3              Đaiốc        Dựán3

   Ncc2              Đinh              Ncc2              Dựán1              Đinh         Dựán1

                                                  123

----------------------- Page 125-----------------------

      Việc phát hiện các phụ thuộc nối trong các cơ sở dữ liệu thực tế với hàng trăm

thuộc tính là một điều rất khó khăn. Vì vậy, thực tiễn thiết kế cơ sở dữ liệu hiện nay

thường không chú ý đến nó.

      Nói chung, trong thực tế thiết kế cơ sở dữ liệu, người ta chỉ chuẩn hóa các

bảng đến 3NF, BCNF là đủ

V-    Tổng kết chương và câu hỏi ôn tập

      V.1-    Tổng kết chương

      Trong chương này chúng ta đã nói đến các nguy hiểm có thể xảy ra trong việc

thiết kế cơ sở dữ liệu, xác định một cách không hình thức một số chuẩn mực để chỉ

ra một lược đồ quan hệ là “tốt” hay “tồi” và đưa ra một số nguyên tắc không hình

thức cho một thiết kế tốt. Sau đó chúng ta đã trình bày một vài khái niệm cho phép

ta thiết kế quan hệ theo cách trên-xuống bằng cách phân tích các quan hệ một cách

riêng rẽ. Chúng ta đã định nghĩa quá trình thiết kế này bằng phân tích và tách bằng

cách giới thiệu quá trình chuẩn hóa.

      Những   vấn  đề về các   bất   thường   cập   nhật   xảy   ra   khi   có   sự dư thừa   xảy   ra

trong các quan hệ cũng đã được đề cập đến. Các chuẩn mực không hình thức của

các lược đồ quan hệ tốt bao       gồm    ngữ nghĩa của thuộc tính rõ ràng và đơn giản, ít

giá trị null trong các mở rộng của quan hệ. Một phép tách tốt phải tránh được việc

sinh ra các bộ giả khi thực hiện phép nối.

      Chúng ta đã định nghĩa khái niệm phụ thuộc hàm và thảo luận một số tính chất

của nó. Các phụ thuộc hàm là các nguồn thông tin ngữ nghĩa cơ bản về các thuộc

tính của lược đồ quan hệ. Chúng ta đã chỉ ra cách suy diễn các phụ thuộc phụ thêm

dựa   trên   một tập   các   phụ thuộc hàm cho trước  và  một tập các quy tắc suy diễn.

Chúng ta đã định nghĩa các khái niệm bao đóng và phủ tối thiểu của một tập phụ

thuộc hàm và cung cấp thuật toán tính phủ tối thiểu. Ta cũng đã chỉ ra làm thế nào

để kiểm tra xem hai tập phụ thuộc hàm có tương đương nhau hay không.

      Tiếp theo, chúng ta đã mô tả quá trình chuẩn hóa đểđạt đến các thiết kế tốt

bằng cách kiểm tra các quan hệđối với các kiểu phụ thuộc hàm không mong muốn.

Chúng ta đã cung cấp cách chuẩn hóa liên tiếp dựa trên khóa chính được định nghĩa

trước trong mỗi quan hệ và sau đó giảm nhẹđòi hỏi này và đưa ra các định nghĩa

tổng quát của các dạng chuẩn có tính đến tất cả các khóa dự tuyển của một quan hệ.

                                                  124

----------------------- Page 126-----------------------

      Trong phần IV chúng ta đã trình bày nhiều thuật toán chuẩn hóa. Đó là thuật

toán tổng hợp quan hệ tạo ra các quan hệ 3NF từ một lược đồ quan hệ vũ trụ dựa

trên một tập các phụ thuộc hàm do người thiết kế cơ sở dữ liệu xác định. Các thuật

toán tạo ra các quan hệ BCNF (hoặc 4NF) bằng cách tách không mất mát liên tiếp

các   quan   hệ không   chuẩn   hóa   thành   hai   quan   hệ thành   phần   tại   một   thời  điểm.

Chúng   ta  đã   thảo   luận   về hai   tính   chất   quan   trọng   của   phép   tách:   tính   chất   nối

không mất mát (hoặc không phụ thêm) và tính chất bảo toàn phụ thuộc. Một thuật

toán kiểm tra phép tách không mất mát và một thuật toán kiểm tra tính không mất

mát của một phép tách thành hai quan hệ cúng đã được trình bày. Chúng ta cũng đã

thấy rằng việc tổng hợp các quan hệở dạng 3NF đảm bảo cả hai tính chất trên là có

khả năng   còn   việc   tổng   hợp   các   quan   hệ BCNF   chỉ có   khả năng  đảm   bảo   tính

không mất mát, không thểđảm bảo tính bảo toàn phụ thuộc.

      Cuối cùng, chúng ta đã nghiên cứu các loại phụ thuộc khác: phụ thuộc đa trị

và phụ thuộc nối, đưa ra định nghĩa các dạng chuẩn 4, dạng chuẩn 5 và thuật toán

tách các quan hệ vi phạm thành quan hệ 4NF, 5NF. Việc phát hiện các phụ thuộc

nối rất khó khăn nên trong thiết kế thực tiễn người ta thường bỏ qua nó.

      V.2-    Câu hỏi ôn tập

1)   Hãy giải thích ngữ nghĩa của thuộc tính như là một độđo không hình thức về

     tính tốt đối với một lược đồ quan hệ.

2)   Hãy thảo luận về các bất thường chèn, xóa và sửa đổi. Vì sao chúng được xem

     là không tốt? Hãy minh họa bằng ví dụ.

3)   Hãy trình bày vấn đề các bộ giả và làm thế nào để ngăn ngừa chúng?

4)   Trình bày các nguyên tắc đối với việc thiết kế lược đồ quan hệ. Hãy minh họa

     việc vi phạm các nguyên tắc đó sẽ có hại như thế nào?

5)   Phụ thuộc hàm là gì? Ai là người chỉ ra các phụ thuộc hàm giữa các thuộc tính

     của một lược đồ quan hệ?

6)   Vì sao chúng ta không thể suy ra một phụ thuộc hàm từ một trạng thái quan hệ

     cụ thể?

7)   Vì sao các quy tắc suy diễn của Amstrong (Qt1 đến Qt3) là quan trọng?

8)   Tính đầy đủ và tính đúng đắn của các quy tắc suy diễn Amstrong là gì?

9)   Bao đóng của một tập phụ thuộc hàm là gì?

                                                  125

----------------------- Page 127-----------------------

10) Khi nào thì hai tập phụ thuộc hàm là tương đương? Làm thế nào để kiểm tra

    tính tương đương của chúng?

11) Tập tối thiểu các phụ thuộc hàm là gì? Có phải mỗi tập tối thiểu phụ thuộc hàm

    có một tập tối thiểu tương đương hay không?

12) Thuật ngữ quan hệ không chuẩn hóa ám chỉ cái gì?

13) Định nghĩa các dạng chuẩn 1NF, 2NF, 3NF, BCNF dựa trên khóa chính và các

    dạng chuẩn dưới dạng tổng quát. Sự khác nhau của hai định nghĩa là gì?

14) Phụthuộc hàm nào cần tránh khi một quan hệ là ở 3NF?

15) Định nghĩa dạng chuẩn Boyce-Codd. Nó khác gì với 3NF? Vì sao nó được xem

    là mạnh hơn 3NF?

16) Điều kiện bảo toàn thuộc tính trên một phép tách là gì?

17) Vì sao các dạng chuẩn tự nó là chưa đủ như là một điều kiện cho một thiết kế

    lược đồ tốt?

18) Tính chất bảo toàn phụ thuộc đối với một phép tách là gì? Vì sao nó là quan

    trọng?

19) Vì sao chúng ta không thểđảm bảo rằng một phép tách các lược đồ quan hệ

    không BCNF thành BCNF là bảo toàn phụ thuộc? Hãy cho một phản ví dụ.

20)  Tính chất nối không mất mát (không phụ thêm) của một phép tách là gì? Vì sao

    nó là quan trọng?

21)  Giữa các tính chất bảo toàn phụ thuộc và nối không mất mát cái nào là nhất

    thiết phải thỏa mãn? Vì sao? Phụ thuộc hàm đa trị là gì? Nó chỉ ra ràng buộc

    gì? Khi nào nó sinh ra?

22)  Hãy minh họa quá trình tạo ra các quan hệở dạng chuẩn 1? Làm thế nào để có

    dạng chuẩn 1 một cách đúng đắn, tránh được phụ thuộc đa trị?

23)  Định nghĩa dạng chuẩn 4. Nó có lợi gì?

24)  Định nghĩa phụ thuộc nối và dạng chuẩn 5.

      V.3-  Bài tập

1)  Hãy kiểm tra các quy tắc suy diễn đối với các phụ thuộc hàm sau đây là đúng

    hay sai:

                                            126

----------------------- Page 128-----------------------

     a)  {W →Y, X →Z} |=     {WX →Y}

     b)  {X →Y} và Y ⊇Z |= {X →Z}

     c)  {X →Y , X →W, WY →Z} |= {X →Z}

     d)  {XY →Z, Y →W} |= {XW →Z}

     e)  {X →Z, Y →Z} |= {X →Y}

     f)  {X →Y, Z →W} |= {XZ →YW}

     g)  {XY →Z , Z →X} |= {Z →Y}

     h)  {X →Y, Y →Z} |= {X →YZ}

     i)  {XY →Z, Z →W} |= {X →W}

2)  Cho lược đồ quan hệ R(A,B,C,D,E,F,G,H,I,J) và tập phụ thuộc hàm sau đây:

     F1 = {AB → C, A → DE, B →F,        F → GH, D→ IJ}

     a)  Khóa của quan hệ là gì? Hãy tách quan hệ thành 2NF, sau đó thành 3NF.

     b)  Làm lại câu a) với tập phụ thuộc hàm sau:

     G1= { AB → C, BD → EF, AD→GH, A → I            , H →J }

3)  Xét quan hệ R(A,B,C,D,E) và các phụ thuộc hàm sau:

     AB →C, CD →E, DE → B.

AB có phải là khóa dự tuyển của quan hệ không? Vì sao? Hãy tìm một khóa của

nó.

4)  Cho quan hệ sau:

             A       B         C        BộID

             10      b1        c1       #1

             10      b2        c2       #2

             11      b4        c1       #3

             12      b3        c4       #4

             13      b1        c1       #5

             14      b3        c4       #6

                                          127

----------------------- Page 129-----------------------

     Những phụ thuộc hàm nào sau đây là đúng: A → B , B → C, C → B, B → A,

C → A. Nếu có những phụ thuộc hàm sai, hãy giải thích vì sao.

                                         128

Bạn đang đọc truyện trên: AzTruyen.Top

Tags: