De cuong mon CSDL1
I.Tổng quan về cơ sở dữ liệu:
1.Một số khái niệm cơ bản:
vCSDL: Là một tập các dữ liệu về một đối tượng cần được quản lý, lưu trữ trên các thiết bị máy tính, Việc lưu trữ và quản lý một cách có tổ chức để phục vụ các hệ thống ứng dụng
·Các đặc điểm của CSDL:
-Tập hợp các dữ liệu được lưu ở bộ nhớ ngoài.
-Có 1 tập các chương trình ứng dụng được chạy với các dữ liệu này để thực hiện 1 số thao tác thông thường như (chèn, xóa, sửa, tìm kiếm…) và thậm chí là có thể truyền chúng đi xa.
-Tập hợp nhiều loại dữ liệu với nhiều kiểu khác nhau và cho nhiều người dùng với các mục đích khác nhau.
vHệ quản trị CSDL: là một hệ thống phần mềm điều khiển toàn bộ các chiến lược truy nhập và cấu trúc lưu trữ CSDL
·Các chức năng chủ yêu của Hệ QTCSDL:
-Mô tả dl tạo lập và duy trì sự tồn tại của CSDL
-Cho phép truy xuất vào CSDL theo thẩm quyền đã được cung cấp
-Cập nhật, Chèn thêm, loại bỏ hay sửa đổi dữ liệu mức tệp.
-Đảm bảo an toàn, bảo mật dữ liệu và tính toàn vẹn dữ liệu
-Tạo cấu trúc dữ liệu tương ứng với mô hình dữ liệu
-Đảm bảo tính độc lập dữ liệu. tức là cấu trúc lưu trữ dữ liệu độc lập với các trình ứng dụng dữ liệu.
-Tạo mối liên kết giữa các thực thể.
-Cung cấp các phương tiện sao lưu, phục hồi (backup, tecovery).
-Điều khiển tương tranh.
vNgười quản trịCSDL: Là một người hay một nhóm người có khả năng chuyên môn cao về công nghệ thông tin, có trách nhiệm quản lý và điều khiển toàn bộ hoạt động của các hệ CSDL vì vậy người quản trị CSDL cần phải đặt ra các hình thức, quy định cho người sử dụng nhằm ngăn chặn việc truy nhập trái phép vào các hệ CSDL. Người quản trị CSDL có thể cho phép người sử dụng những quyền truy nhập như chỉ được phép đọc, đọc một phần, có thể sửa, bổ sung một phần….
·Người quản trị CSDL có một số nhiệm vụ chính:
-Xác định thực thể và nội dung thông tin cần lưu trữ, xác định sơ đồ quan niệm đáp ứng yêu cầu truy nhập của người sử dụng
-Quyết định cấu trúc dữ liệu & chiến lược truy nhập: Người quản trị CSDL phải xác định cách thức biểu diễn dữ liệu như mô tả cấu trúc lưu trữ trong, mô tả cấu trúc lưu trữ vật lý, Xác định mô hình dữ liệu, định nghĩa ánh xạ giữa cấu trúc lưu trữ và sơ đồ ngoài… Thực hiện các chiến lược lưu trữ, quản lý hệ thống.
-Người quản trị CSDL phải tạo môi trường giao tiếp giữa người sử dụng với các hệ CSDL, vì sơ đồ ngoài cho người sử dụng là cách nhìn dữ liệu tương ứng với ngôn ngữ con thích hợp, nên người quản trị CSDL phải cung cấp sơ đồ quan niệm, các ánh xạ, và cấu trúc lưu trữ, kiểm soát thẩm quyền truy cấp của người sử dụng và bảo đảm quyền truy nhập của họ.
-Duy trì các tiêu chuẩn thống nhất về các thủ tục và cấu trúc lưu trữ, biểu diễn thông tin và các chiến lược truy nhập. kiểm soạt và kiểm tra tính đúng đắn của dữ liệu, áp dụng các biện pháp an toàn, an ninh dữ liệu
-Xác định chiến lược lưu trữ, sao chép, phục hồi… trong các trường hợp hư hỏng do sai sót, hoặc trục trặc kỹ thuật.
vHệ CSDL: gồm 4 thành phần:
-CSDL hợp nhất:
+ không dư thừa
+ Chia sẻ
-Người sử dụng:
+ Người sử dụng cuối
+ Người viết chương trình ứng dụng
+ Người quản trị CSDL
-Phần mềm DBMS ( Hệ quản trị CSDL)
-Phần cứng
vTại sao phải cần tới các hệ CSDL:
-Giảm tối đa sự dư thừa thông tin cần lưu trữ
-Có thể tránh được những xung đột về thông tin đang lưu trữ
-Có thể dùng chung dữ liệu
-Có thể chuẩn hóa dữ liệu giúp cho sự bảo hành và trao đổi dữ liệu giữa các hệ thống.
-Trong CSDL có thể áp dụng các phương pháp bảo mật(mật khẩu, mã hóa dữ liệu).
-Có thể giải quyết được các đòi hỏi xung đột nhau.
-Dữ liệu là độc lập
vKiến trúc một hệ CSDL:
Về mặt kiến trúc một hệ CSDL gồm có 3 mức:
1.Mức trong
2.Mức mô hình dữ liệu(mức quan niệm)
3. Mức ngoài
Giữa các mức tồn tại các ánh xạ quan niệm trong và ánh xạ quan niệm ngoài. Trung tâm của hệ thống là mức quan niệm, tức là mô hình dữ liệu
-Mô hình ngoài: là nội dung thông tin của CSDL dưới cách nhìn của người sử dụng. là nội dung thông tin của một phần dữ liệu tác nghiệp được một người hoặc một nhóm người sử dụng quan tâm. Nói cahcs khác, mô hìnhngoài mô tả cách nhìn dữ liệu của người sử dụng và mỗi người sử dụng cso cách nhìn dữ liệu khác nhau.
-Mô hình dữ liệu (Mô hình quan niệm – mức logic)
+ Mô hình dữ liệu (Mô hình quan niệm ): là cách nhìn dữ liệu một cách tổng quát của người sử dụng. Nghĩa là có rất nhiều cách nhìn dữ liệu ở mô hình ngoài, nhưng chỉ có duy nhất một cách nhìn dữ liệu ở mức quan niệm. Biểu diễn toàn bộ thông tin trong CSDL là duy nhất.
+Mô hình dữ liệu gồm nhiều xuất hiện của nhiều kiểu bản ghi dữ liệu. VD kiểu xuất hiện bản ghi về nhân sự, kiểu xuất hiện bản ghi về doanh thu – sản lượng, kiểu xuất hiện bản ghi về cước đàm thoại.
+ Mô hình dữ liệu được xác định bởi một sơ đồ dữ liệu mô tả của nhiều kiểu thực thể chẳng hạn như mô tả thực thể tuyến cáp, các loại cáp, thầy giáo , học sinh…., Sơ đồ dữ liệu bao gồm các định nghĩa về các kiểu bản ghi, đó là các ràng buộc cho quyền và tính toàn vẹn thích hợp
+ Sơ đồ quan niệm luôn luôn ổn định, nghĩa là nếu mô tả thêm một kiểu thực thể đặc biệt sát nhập vào sơ đồ dữ liệu, không được làm thay đổi sơ đồ dữ liệu cũ. Nếu sơ đồ dữ liệu không ổn định thì các ứng dụng và mô hình ngoài cũng không ổn định
+ Thiết kế mô hình dữ liệu là giai đoạn quan trọng và quyết định trong việc thiết kế và cài đặt các hệ CSDL. Quá trình thiết kế không phụ thuộc quá nhiều vào cấu trúc lưu trữ vật lý và chiến lược truy nhập của dữ liệu. Như vậy việc thiết kế sơ đồ dữ liệu phải được tiến hành độc lập với việc thiết kế sơ đồ trong và các sơ đồ ngoài liên kết, vì nếu không việc thiết kế sẽ không ổn định và thường xuyên phải xem xét lại tác động thường xuyên đến nhiều thành phần khác của hệ thống.
+ Ngoài các định nghĩa về xuất hiện nhiều kiểu bản ghi quan niệm. sơ đồ dữ liệu còn chuwacs các định nghĩa về quyền truy nhập của người sử dụng, các thủ tục kiểm tra tính đúng đắn của dữ liệu nhằm bảo đảm tính toàn vẹ của CSDL. Các luồng lưu chuyển thông tin, quy định cách thức sử dụng thông tin…
-Mô hình trong (Mức vật lý): Mô hình trong là mô hình lưu trữ vật lý dữ liệu. Chỉ có duy nhất một và chỉ một cách biểu diễn CSDL dưới dạng lưu trữ vật lý. Mô hình trong là cách biểu diễn csdl trừu tượng ở mức thấp nhất
vRàng buộc dữ liệu: Giữa các thực thể dữ liệu tồn tại các mỗi quan hệ, ràng buộc lẫn nhau, các ràng buộc này chính là tập các quy tắc, quy định yêu cầu dữ liệu trong CSDL nhằm thỏa mãn. Mục đích yêu cầu dữ liệu trong cơ sở dữ liệu phải thỏa mãn. Mục đích xấy dựng các ràng buộc dữ liệu nhằm bảo đảm tính độc lập và tính toàn vẹn dữ liệu.
·Ràng buộc kiểu: loại ràng buộc thấp nhất, mô tả tính chất của các thuộc tính khi tạo lập CSDL ngoài tên của thuộc tính, thuộc tính đó kiểu gì, chuỗi ký tự, kiểu số, kiểu ngày, kiểu logic… Và độ dài là bao nhiêu. VD thuộc tính “số điện thoại” là kiểu chuỗi ký tự đúng bằng 7 ký tự trong xâu. Hệ thống dữ liệu sẽ không chấp nhận, nếu nhập vào CSDL một số điện thoại kiểu số hoặc kiểu xâu nhưng chưa đủ hoặc vượt quá 7 ký tự. Phản ứng của hệ thống hoặc là đưa ra thông báo “ dữ liệu không hợp lệ” hoặc cắt đi những ký tự thùa.
·Ràng buộc giải tích: Là những ràng buộc giữa các thuộc tính được biểu diễn bằng các biểu thức toán học. VD khi nhập “số lượng” và “đơn giá” của một mặt hàng, hệ thống sẽ tự động tính giá trị của thuộc tính “thành tiền” theo công thức
“số lượng” x “đơn giá” = “Thành tiền”. hoặc tự động đánh giá em có năng lực học tập là “kém”, “ trung bình”, “khá hay giỏi”.
·Ràng buộc logic: Mối quan hệ giữa các thuộc tính với nhau không phải là các ràng buộc giải tích, được gọi là phụ thuộc hàm. Thuộc tính Y phụ thuộc hàm vào thuộc tính X, nghĩa là một giá trị của X xác định giá trị của Y. Ví dụ nếu giá trị của số điện thoại có thể xác định thông tin về thuê bao có số điện thoại đó. Những ràng buộc logic có thể ánh xạ một – một hặc một – nhiều.
Phần 2. Lý thuyết thiết kế CSDL
1.Phụ thuộc hàm
2.Khóa tối thiểu
3.Chuẩn hóa CSDL
3.1Chuẩn 1NF:
-Một lược đồ quan hệ R được gọi là ở dạng chuẩn 1 (1NF) nếu và chỉ nếu toàn bộ các miền có mặt trong R đều chỉ chứa các giá trị nguyên tố (hay các thuộc tính của mọi bộ đều mang giá trị đơn)
- NX: Quy tắc 1NF nhằm loại bỏ nhóm lặp, nghĩa là bảng 1NF không được chứa các thuộc tính có thể xuất hiện nhiều lần đối với cùng một kiêủ thực thể
3.2Chuẩn 2NF:
-Một quan hệ là 2NF nếu và chỉ nếu nó ở dạng 1NF và mỗi thuộc tính không khóa đều phụ thuộc hàm đầy đủ vào khóa chính.
- Nhận xét: Nếu quan hệ ở 1NF và có khóa chỉ là một thuộc tính thì nó đã tồn tại ở 2NF.
3.3Chuẩn 3 NF:
-Một quan hệ là 3NF nếu và chỉ nếu nó ở 2NF và mọi thuộc tính không khóa đều phụ thuộc hàm trực tiếp vào khóa chính (hay không có thuộc tính không khóa này lại PTH vào thuộc tính không khóa khác).
-Nhận xét: Nếu một quan hệ ở 2NF và không có hoặc có một thuộc tính không khóa thì nó sẽ tồn tại ở 3NF.
3.4 Chuẩn BCNF:
-Một lược đồ quan hệ R(u) với mỗi tập PTH F được gọi là ở dạng chuẩn boye-codd nếu với mọi X à A thuộc F+ và AÏX thì X chứa một khóa của R.
- Mục đích của BCNF: Loại bỏ sự dư thừa dữ liệu và tránh các dị thường cập nhật do thao tác thêm và thao tác xóa. Tuy nhiên, dạng chuẩn BCNF còn có thể loại bỏ được một số dị thường mà dạng chuẩn 3NF không loại bỏ được.
3.5Phép tách không mất thông tin và bảo toàn tập PTH về dạng chuẩn 3NF:
Giả sử sơ đồ quan hệ R được phân tách thành các sơ đồ con R1, R2,…,Rk và F là các PTH trên R, ta nói phép tách này là không mất mát thông tin nếu R1*R2*…*Rk ºR
- Vào: - R(U,Ftt)
- Ra: r - một phép tách không mất thông tin vàbảo toàn tập phụ thuộc hàm, r bao gồm 1 tập các sơ đồ con, trong đó mỗi sơ đồ con đều ở dạng chuẩn 3NF
3.6Phép tách một lược đồ về dạng chuẩn BCNF không mất thông tin:
Cho lược đồ a = (U, F), và phép tách d ={U1, U2,.., Uk}, phép tách một lược đồ thành một tập các lược đồ ở dạng BCNF là phép tách thoả mãn:
-phép tách d là phép tách kết nối không mất thông tin
-tất cả cỏc lược đồ con ai = (Ui, Fi) đều ở dạng BCNF
Phương pháp : xuất phát ừ một phụ thuộc hàm Xà A nào đó của F, phụ thuộc hàm XàA này vi phạm điều kiện BCNF, ta xây dựng phép tách d ={U1, U2}, tương ứng với lược đồ a1 và a2 sao cho:
-phép tách đó là phép tách kết nối không mất thông tin
-phụ thuộc hàm XàA là phụ thuộc hàm của lược đồ a1 và nó thoả món điều kiện của BCNF trong lược đồ này
-nếu như các lược đồ a1 và a2 vẫn chưa ở dạng BCNF thì tiếp tục quá trình đó, vì các điều vi phạm BCNF đều bị loại bỏ, cuối cùng ta thu được một tập các lược đồ con đều ở dạng BCNF và quá trình tách luôn luôn đảm bảo phép tách kết nối không mất thông tin.
Bạn đang đọc truyện trên: AzTruyen.Top