Thử nghiệm Trong đó: 1 Phân tích để hình thành bài toán: Giai đoạn này ta phải trả lời rõ ràng các câu hỏi: bài toán cho “ những cái gì?” và " phải làm những gì?" Một bài toán được hình
Trang 1BÀI GIẢNG CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT
Trang 2LỜI NÓI ĐẦU
Để đáp ứng nhu cầu học tập của các bạn sinh viên, nhất là sinh viênchuyên ngành công nghệ thông tin, chuyên ngành tin học kinh tế, các tác giả
Bộ môn Công nghệ phần mềm - Khoa Công Nghệ Thông Tin - Trường
Đ ại h ọc T há i n gu yê n chúng tôi đã tiến hành biên soạn các giáo trình,bài giảng chính trong chương trình học đào tạo theo tín chỉ Bài giảng mônCấu Trúc Dữ Liệu và thuật toán này được biên soạn cơ bản dựa trên
quyển: “Cấu trúc dữ liệu thuật toán” của tác giả Đinh Mạnh Tường, Nhà xuất bản Khoa học và Kỹ thuật, 2003 “Cấu trúc dữ liệu và giải thuật”, của tác giả: Đỗ Xuân Lôi, “ Cấu trúc dữ liệu + giải thuật= Chương trình” của N.
Wirth, 1983 Giáo trình này cũng được biên soạn dựa trên kinh nghiệmgiảng dạy nhiều năm môn Cấu Trúc Dữ Liệu và Giải Thuật của chúng tôi.Tài liệu này được soạn theo đề cương chi tiết môn Cấu Trúc DữLiệu v à t h u ậ t t o á n của sinh viên chuyên ngành Công nghệ thông tincủa Khoa Công Nghệ Thông Tin Trường Đại Học Thái nguyên Mục tiêu của
nó nhằm giúp các bạn sinh viên chuyên ngành có một tài liệu cô đọng dùnglàm tài liệu học tập, nhưng chúng tôi cũng không loại trừ toàn bộ các đốitượng khác tham khảo Chúng tôi nghĩ rằng các bạn sinh viên khôngchuyên tin và những người quan tâm tới cấu trúc dữ liệu và giải thuật sẽtìm được trong này những điều hữu ích
Mặc dù đã rất cố gắng nhiều trong quá trình biên soạn giáo trình nhưngchắc chắn giáo trình sẽ còn nhiều thiếu sót và hạn chế Rất mong nhậnđược sự đóng góp ý kiến quý báu của sinh viên và các bạn đọc để bàigiảng ngày một hoàn thiện hơn và có thể trở thành một giáo trình thực sựhữu ích
Thái nguyên, 11 / 2008 Các tác giả
Trang 3MỤC LỤC
Chương 1 Tổng quan về cấu trúc dữ liệu và giải thuật 5
1 1 Từ bài toán đến chương trình 5
1.2 Các khái niệm cơ bản 10
1.2.1 Mô hình dữ liệu ( Data model ) 10
1.2.2 Khái niệm trừu tượng hóa 13
1.2.3 Kiểu dữ liệu trừu tượng 13
1.2.4 Dữ liệu 13
1.2.5 Biểu diễn dữ liệu trên máy tính 14
1.2.6 Kiểu dữ liệu 14
1.2.7 Cấu trúc dữ liệu (Data Structures) 17
1.2.8 Giải thuật 18
1.2.6 Mối quan hệ giữa cấu trúc dữ liệu và giải thuật 19
1.3 Ngôn ngữ diễn đạt giải thuật 20
1.4 Đệ quy và giải thuật đệ 20
1.4.1 Khái niệm đệ quy 20
1.4.2 Giải thuật đệ quy và thủ tục đệ quy 20
Chương 2 Mô hình dữ liệu danh sách 23
2.1 Danh sách (List) 23
21.1 Khái niệm danh sách 23
2.1 2 Các phép toán cơ bản trên danh sách 24
2.1.3 Biểu diễn (cài đặt) danh sách trên máy tính 26
2.1.3.1 Danh sách cài đặt bằng mảng 26
2.1.3.2 Danh sách cài đặt bởi con trỏ 31
2.2 Ngăn xếp (Stack) và ứng dụng 41
2.2.1 Định nghĩa ngăn xếp 41
2.2.2 Các phép toán cơ bản trên ngăn xếp: 41
2.2.3 Cài đặt ngăn xếp 42
2.2.4 Ứng dụng ngăn xếp 43
2.3 Hàng đợi (QUEUE) 44
2.3.1 Định nghĩa hàng đợi 44
2.3.2 Các phép toán cơ bản trên hàng 44
2.3.3 Cài đặt hàng đợi 44
2.3.3.1 Cài đặt hàng bằng mảng 45
Trang 42.3.3.2 Cài đặt hàng bằng danh sách liên kết (cài đặt bằng con trỏ) 48
2.3.4 Một số ứng dụng của cấu trúc hàng 49
Chương 3 Mô hình dữ liệu Cây 51
3.1 Cây tổng quát 51
3.1.1 Định nghĩa cây và các khái niệm cơ bản trên cây 51
3.1.2 Các phép toán cơ bản trên cây 52
3.1.3 Các cách thăm ( duyệt) cây 53
3.1.4 Cài đặt cây 56
3.1.4.1 Biểu diễn cây bằng danh sách các con của mỗi đỉnh 56
3.1.4.2 Biểu diễn cây bằng con trưởng và em liền kề của mỗi đỉnh 59
3.1.4.3 Biểu diễn cây bởi cha của mỗi đỉnh 62
3.2 Cây nhị phân (binary tree) 64
3.2.1 Định nghĩa 64
3.2.2 Duyệt cây nhị phân 65
3.2.3 Cài đặt cây nhị phân 67
3.2.4 Các phép toán cơ bản trên cây nhị phân 67
3.3 Cây tìm kiếm nhị phân (binary search tree) 70
3.3.1 Định nghĩa cây TKNP 71
3.3.2 Cài đặt cây tìm kiếm nhị phân 71
3.3.3 Các phép toán cơ bản trên cây tìm kiếm nhị phân 72
CHƯƠNG 4 Mô hình dữ liệu Đồ thị (Graph) 79
4.1 Định nghĩa đồ thị và các khái niệm 79
4.2 Các phép toán cơ bản trên đồ thị 80
4.3 Biểu diễn đồ thị 81
4.3.1 Biểu diễn đồ thị bằng ma trận kề 81
4.3.2 Biểu diễn đồ thị bằng danh sách các đỉnh kề 82
4.4 Các phép duyệt đồ thị (TRAVERSALS OF GRAPH) 82
4.4.1 Duyệt theo chiều sâu (depth-first search) 82
4.4.2 Duyệt theo chiều rộng (breadth-first search) 83
4.4 Một số bài toán ứng dụng trên đồ thị: Xem như phần bài tập dành cho bạn đọc 83 Chương 5 Mô hình dữ liệu Tập hợp 84
5.1 Khái niệm tập hợp 84
5 2 Mô hình dữ liệu tập hợp 85
5.3 Cài đặt tập hợp và cài đặt các phép toán trên tập hợp 86
5.3.1.Cài đặt tập hợp bởi vectơ bit 86
Trang 55.3.2 Cài đặt tập hợp bởi mảng 87
5.3.3 Cài đặt bởi danh sách liên kết hoặc danh sách được sắp 88
5.5 Từ điển (Dictionary) 91
5.5.1 Từ điển là gì? 91
5.5.2 Các phương pháp cài đặt từ điển 91
5.5.3 Cấu trúc dữ liệu Bảng băm, cài đặt từ điển bởi bảng băm 92
5.5.3.1 Cài đặt từ điển bằng bảng băm mở 92
5.5.3.2 Cài đặt từ điển bằng bảng băm đóng 97
5.5.3.3 Các phương pháp xác định hàm băm 100
Chương 6 Thiết kế và phân tích đánh giá thuật toán 102
6.1 Các kỹ thuật thiết kế giải thuật 102
6.1.1 Kỹ thuật chia để trị 102
6.1.2 Kỹ thuật “Tham ăn” 107
6.1.3 Quy hoạch động 108
6.1.4 Kỹ thuật quay lui 109
6.1.5 Kỹ thuật tìm kiếm địa phương 111
6.2 Phân tích giải thuật 112
6.1.1 Sự cần thiết phải phân tích giải thuật 112
6.1.2 Thời gian thực hiện của giải thuật 112
6.1.3 Không gian của giải thuật 117
Trang 6Chương 1 Tổng quan về cấu trúc dữ liệu và giải thuật
Tổng quan:
1- Mục tiêu và yêu cầu
Trong chương này, chúng ta cần phải nắm vững các vấn đề sau:
1 Các bước phân tích, thiết kế và lập trình để giải quyết một bài toán thực tế.
2 Hiểu rõ các khái niệm cơ bản trong môn học.
3 Vai trò của cấu trúc dữ liệu và giải thuật trong lập trình giải các bài toán
2 - Nôị dung chính
- Quy trình giải một bài toán
- Các khái niệm
- Đệ quy
- Ngôn ngữ diễn đạt giải thuật
1 1 Từ bài toán đến chương trình
Để giải quyết một vấn đề trên MTĐT thông thường chúng ta cần phải qua một số giaiđoạn chính như sau:
1 Phân tích để hình thành bài toán
2 Phân tích và thiết kế chương trình: Mô hình hóa bài toán thực tế thành mô
hình toán học và xây dựng các thao tác trên các đối tượng của mô hình
2.1 Thiết kế xây dựng mô hình dữ liệu biểu diễn các đối tượng của bài toán
2.2 Thiết kế giải thuật xử lý các yêu cầu của bài toán
3 Cài đặt chương trình
4 Thử nghiệm
Trong đó:
1) Phân tích để hình thành bài toán: Giai đoạn này ta phải trả lời rõ ràng các câu
hỏi: bài toán cho “ những cái gì?” và " phải làm những gì?"
Một bài toán được hình thành khi ta chỉ rõ các thông tin đầu vào ( input) và cácyêu cầu xử lý trên các thông tin đó (thông tin đầu ra (output))
2) Phân tích và thiết kế chương trình
Trong giai đoạn này ta cần trả lời câu hỏi: “ làm như thế nào” để biểu diễn
các đối tượng dữ liệu của bài toán và thực hiện các yêu cầu của bài toán trên máy tính Công việc này còn được gọi là xây dựng mô hình toán học cho bài toán.
Trang 7Thật vậy, thông thường, khi khởi đầu, hầu hết các bài toán là không đơn giản,không rõ ràng Để giảm bớt sự phức tạp của bài toán thực tế, ta phải hình thức hóa
nó, nghĩa là phát biểu lại bài toán thực tế thành một bài toán hình thức (hay còn gọi
là mô hình toán học) Có thể có rất nhiều bài toán thực tế có cùng một mô hình toánhọc
Ví dụ 1: Tô màu bản đồ thế giới
Ta cần phải tô màu cho các nước trên bản đồ thế giới Trong đó mỗi nước đềuđược tô một màu và hai nước láng giềng (cùng biên giới) thì phải được tô bằng haimàu khác nhau Hãy tìm một phương án tô màu sao cho số màu sử dụng là ít nhất
Ta có thể xem mỗi nước trên bản đồ thế giới là một đỉnh của đồ thị, hai nướcláng giềng của nhau thì hai đỉnh ứng với nó được nối với nhau bằng một cạnh.Bài toán lúc này trở thành bài toán tô màu cho đồ thị như sau: Mỗi đỉnh đều phảiđược tô màu, hai đỉnh có cạnh nối thì phải tô bằng hai màu khác nhau và ta cần tìmmột phương án tô màu sao cho số màu được sử dụng là ít nhất Mô hình toán họcđược sử dụng trong bài toán này là mô hình đồ thị
Ví dụ 2: Đèn giao thông
Cho một ngã năm như hình 1.1, trong đó C và E là các đường một chiều theo
chiều mũi tên, các đường khác là hai chiều Hãy thiết kế một bảng đèn hiệu điềukhiển giao thông tại ngã năm này một cách hợp lý, nghĩa là: phân chia các lối đitại ngã năm này thành các nhóm, mỗi nhóm gồm các lối đi có thể cùng đi đồngthời nhưng không xảy ra tai nạn giao thông (các lối đi này có các hướng đi khôngcắt nhau), và số lượng nhóm chia là ít nhất có thể được
Ta có thể xem đầu vào của bài toán là tất cả các lối đi tại ngã năm này, đầu ra của bài toán là các nhóm lối đi có thể đi đồng thời mà không xảy ra tai nạn giao thông, mỗi nhóm sẽ tương ứng với một pha điều khiển của đèn hiệu, vì vậy ta phải tìm kiếm
A
B
C
DE
Hình 1.1
Trang 8lời giải với số nhóm là ít nhất để giao thông không bị tắc nghẽn vì phải chờ đợi quá lâu.
Trước hết ta nhận thấy rằng tại ngã năm này có 13 lối đi: AB, AC, AD, BA,
BC, BD, DA, DB, DC, EA, EB, EC, ED Tất nhiên, để có thể giải được bài toán taphải tìm một cách nào đó để thể hiện mối liên quan giữa các lối đi này Lối nào vớilối nào không thể đi đồng thời, lối nào và lối nào có thể đi đồng thời Ví dụ cặp AB
và EC có thể đi đồng thời, nhưng AD và EB thì không, vì các hướng giao thông cắtnhau Ở đây ta sẽ dùng một sơ đồ trực quan như sau: tên của 13 lối đi được viết lênmặt phẳng, hai lối đi nào nếu đi đồng thời sẽ xảy ra đụng nhau (tức là hai hướng đicắt qua nhau) ta nối lại bằng một đoạn thẳng, hoặc cong, hoặc ngoằn ngoèo tuỳ
thích Ta sẽ có một sơ đồ như hình 1.2 Như vậy, trên sơ đồ này, hai lối đi có cạnh nối
lại với nhau là hai lối đi không thể cho đi đồng thời
Với cách biểu diễn như vậy ta đã có một mô hình toán học đồ thị (Graph), trong
đó mỗi lối đi trở thành một đỉnh của đồ thị, hai lối đi không thể cùng đi đồng thờiđược nối nhau bằng một đoạn ta gọi là cạnh của đồ thị Bây giờ ta phải xác địnhcác nhóm, với số nhóm ít nhất, mỗi nhóm gồm các lối đi có thể đi đồng thời, nóứng với một pha của đèn hiệu điều khiển giao thông Giả sử rằng, ta dùng màu để
tô lên các đỉnh của đồ thị này sao cho:
- Các lối đi cho phép cùng đi đồng thời sẽ có cùng một màu: Dễ dàng nhận thấy rằng hai đỉnh có cạnh nối nhau sẽ không được tô cùng màu
- Số nhóm là ít nhất: ta phải tính toán sao cho số màu được dùng là
ít nhất Tóm lại, ta phải giải quyết bài toán sau:
"Tô màu cho đồ thị ở hình 1.2 sao cho:
Trang 9- Hai đỉnh có cạnh nối với nhau (hai còn gọi là hai đỉnh kề nhau) không cùng màu.
- Số màu được dùng là ít nhất."
Như vậy:
Cả hai bài toán trên, ban đầu có vẻ rất khác nhau, nhưng sau khi phân tích để hìnhthức hóa thì chúng đều được đưa về mô hình toán học đồ thị, và áp dụng thuật toán tômầu trên đồ thị để giải quyết các bài toán này
Chú ý: Có rất nhiều các cấu trúc toán học có thể làm mô hình dữ liệu trong tin học, ví
dụ dãy, tập hợp, ánh xạ, cây, đồ thị,
- Một bài toán thực tế bất kỳ thường bao gồm các đối tượng dữ liệu và các yêu cầu xử
lý trên những đối tượng đó, cho nên trong giai đoạn phân tích và thiết kế, khi xâydựng mô hình toán học cho bài toán cần chú trọng đến hai vấn đề :
+ Tổ chức biểu diễn các đối tượng dữ liệu của bài toán trong mô hình toán họcnhư thế nào? mô hình này ta còn gọi là mô hình dữ liệu
+ Xây dựng các thao tác xử lý trên đối tượng ra sao
Khi cài đặt chương trình giải quyết bài toán tương ứng ta quan tâm đến hai vấn đề:
+ Biểu diễn mô hình toán học của bài toán trên máy tính như thế nào để máytính có thể hiểu và thực hiên các thao tác trên chúng Giai đoạn này còn được gọi làxây dựng cấu trúc dữ liệu cho bài toán
Ta có thể cài đặt một mô hình dữ liệu bởi nhiều cấu trúc dữ liệu khác nhauTrong mỗi cách cài đặt, một số phép toán trên mô hình có thể được thực hiện thuậnlơi, nhưng các phép toán khác có thể lại không thuận lợi
+ Mã hóa các giải thuật xử lý trên các cấu trúc dữ liệu tương ứng để giải quyết cácyêu cầu của bài toán
3- Cài đặt chương trình
Ta có thể sử dụng một ngôn ngữ lập trình cụ thể nào đó (Pascal,C, ) để cài đặt kếtquả ở giai đoạn phân tích và thiết kế chương trình, ở bước này ta dùng các cấu trúc dữliệu được cung cấp trong ngôn ngữ, ví dụ Array, Record, để biểu diễn m ô h ì n h
d ữ l i ệ u c ủ a b à i t o á n , và mã hóa giải thuật bởi các câu lệnh trong ngôn ngữlập trình lựa chọn
Như vậy, ta có thể tóm tắt các bước từ bài toán đến chương trình như sau:
1) Về mặt dữ liệu: Mô hình dữ liệu-> Kiểu dữ liệu trừu tượng -> Cấu trúc dữ liệu
Thật vậy:
Trang 10Trong quá trình phát triển chương trình, nhất là khi phát triển các hệ thống phầnmềm lớn, ta cần đến hai dạng biểu diễn dữ liệu: Biếu diễn trừu tượng và biểu diễn cụthể
a) Trong giai đoạn phân tích thiết kế chương trình, ta cần sử dụng
dạng biểu diễn trừu tượng: được xác định bởi mô hình dữ liệu – đó là
mô hình toán học của các đối tượng dữ liệu cùng với các phép toánthực hiện trên các đối tượng đó, ví dụ như: Mô hình cây, danh sách,tập hợp, đồ thị, mô hình ERA, …… > Khi ta dùng mô hình dữ liệuvới một số xác định các phép toán nào đó, ta sẽ có một kiểu dữ liệutrừu tượng , ví dụ: Ngăn xếp, hàng đợi, bảng băm, …
=> Dạng biểu diễn dữ liệu này không phụ thuộc vào ngôn ngữ lập
trình cụ thể
b) Trong giai đoạn cài đặt chương trình, ta cần sử dụng dạng biểu
diễn cụ thể của dữ liệu: Là biểu diễn xác định cách lưu trữ vật lý của
dữ liệu trong bộ nhớ máy tính Biểu diễn cụ thể của dữ liệu được xácđịnh bởi các cấu trúc dữ liệu Các cấu trúc dữ liệu được mô tả trongngôn ngữ lập trình cụ thể mà ta sử dụng
=> Dạng biểu diễn này phụ thuộc vào ngôn ngữ lập trình cụ thể
Từ biểu diễn trừu tượng, ta có thể chuyển dịch thành các biều diễn cụ thể khácnhau, hay nói cách khác, từ các mô hình dữ liệu hoặc từ các kiểu dữ liệu trừu tượng, ta
có thể chuyển dịch thành các cấu trúc dữ liệu khác nhau Ví dụ, ta có thể cài đặt danhsách bởi cấu trúc dữ liệu mảng hoặc cấu trúc dữ liệu danh sách liên kết Khi cài đặt môhình dữ liệu bởi cấu trúc dữ liệu nào đó, thì các phép tóa trên mô hình được thực hiệnbởi các thao tác cần thiết trên cấu trúc dữ liệu đó
2) Về mặt xử lý dữ liệu: Giải thuật không hình thức >giải thuật bằng ngôn ngữ giả
->Giải thuật được mã hóa hoàn toàn bởi ngôn ngữ lập trình cụ thể, ví dụ: Pascal, C, Thật vây:
Từ những yêu cầu xử lý thực tế, ta tìm cá c giải thuật trên mô hình d ữ l i ệ u
đ ã x â y d ự n g Giải thuật có thể mô tả một cách không hình thức ( tức là nó chỉnêu phương hướng giải hoặc các bước giải một cách tổng quát)
Tiếp theo ta hình thức hoá giải thuật bằng ngôn ngữ giả, rồi chi tiết hoá dần("mịn hoá") các bước giải tổng quát ở trên ( làm mịn dấn) Ở bước này ta cần dùng cáckiểu dữ liệu trừu tượng (không phải là các khai báo cài đặt trong ngôn ngữ lập trình
cụ thể) và các cấu trúc lệnh điều khiển trong ngôn ngữ lập trình (không chú trọng đến
cú pháp ngôn ngữ) , kêt hợp ngôn ngữ tự nhiên để mô tả giải thuật
Trang 11Cuối cùng trong pha cài đặt, ta tiến hành mã hóa hoàn toàn giải thuật được mô
tả bởi ngôn ngữ giả, sử dụng ngôn ngữ lập trình cụ thể, thao tác trên cấu trúc dữ liệu
cụ thể
1.2 Các khái niệm cơ bản
1.2.1 Mô hình dữ liệu ( Data model )
Mô hình dữ liệu là gì?: Mô hình dữ liệu được sử dụng để mô tả cấu trúc logic của dữ
liệu được xử lý bởi hệ thống Là mô hình toán học cùng với các phép toán có thể thựchiện trên các đối tượng của mô hình
Các thành phần dữ liệu thực tế đa dạng, phong phú và thường chứa đựng những quan
hệ nào đó với nhau, do đó cần phải tổ chức, lựa chọn và xây dựng các mô hình dữ liệuthích hợp nhất sao cho vừa có thể phản ánh chính xác các dữ liệu thực tế này, vừa cóthể dễ dàng dùng máy tính để xử lý
Để tìm ra cấu trúc toán học thích hợp với một bài toán đã cho, chúng ta cầnphải phân tích kỹ bài toán để tìm ra câu trả lời cho các câu hỏi sau:
+ Các thông tin quan trọng của bài toán có thể biểu diễn bởi các đối tượng toánhọc nào ?
+ Có các mối quan hệ nào giữa các đối tượng ?
+ Các kết quả phải tìm của bài toán có thể biểu diễn bởi các khái niệm toánhọc nào ?
Sau khi đã có mô hình toán học mô tả bài toán, một câu hỏi đặt ra là, ta phảilàm việc với mô hình như thế nào để tìm ra lời giải của bài toán?
Chúng ta sẽ thiết kế các thuật toán thông qua các hành động, các phép toán thựchiện trên các đối tượng của mô hình
Ví dụ:
+ Trong mô hình dữ liệu đồ thị, trong số rất nhiều các phép toán, ta có thể kể ramột số phép toán sau: Tìm các đỉnh kề của mỗi đỉnh, xác định đường đi ngắn nhất nối
2 đỉnh bất kỳ, tìm các thành phần liên thông, tìm các đỉnh treo, tô mầu đồ thị, …
+ Trong mô hình dữ liệu danh sách ta có những phép toán sau:
Trang 121- Mô hình dữ liệu tuyến tính (danh sách): có quan hệ 1:1 giữa các phần tử; tức
là, nếu mô hình dữ liệu tuyến tính chứa các phần tử thì nó phải có phần tửđầu tiên và phần tử cuối cùng, mỗi phần tử (trừ phần tử đầu tiên và phần tửcuối cùng) có đúng một phần tử tiền bối (đứng ngay trước) và một phần tử
hậu bối (đứng ngay sau) Hình 1.3 biểu diễn một ví dụ về mô hình dữ liệu
tuyến tính
2- Mô hình dữ liệu phân cấp (cây): có quan hệ 1:n giữa các phần tử; tức là, mỗi
phần tử trong mô hình có nhiều hậu bối, nhưng chỉ có một tiền bối Hình 1.4 biểu diễn một ví dụ cụ thể về mô hình này Nếu ta di chuyển từ trên xuống dưới trong Hình 1.4
thì mỗi nút có thể trỏ đến nhiều nút khác, nhưng nếu ta di chuyển từ dưới lên thì mỗinút (trừ nút ở gốc) chỉ có quan hệ với 1 nút Mô hình dữ liệu phân cấp như vậy thườngđược gọi là cây, và đây là một loại mô hình dữ liệu quan trọng trong khoa học máytính:
Phần tử cuối
Hình 1.3 – Mô hình dữ liệu tuyến tính
Trang 133 - Mô hình dữ liệu thứ ba là đồ thị: đây là mô hình dữ liệu phong phú và phức
tạp nhất Trong đồ thị, các phần tử có mối quan hệ n:m Tức là, mỗi phần tử có thể có
quan hệ với một hoặc nhiều phần tử khác Hình 1.5 biểu diễn một ví dụ cụ thể về mô
hình này
4 - Loại mô hình dữ liệu cuối cùng là tập hợp Trong một tập hợp, các phần tử
không có mối quan hệ trực tiếp với nhau, giữa chúng chỉ có một mối quan hệ là thànhviên của tập hợp, ta không cần quan tâm tới vị trí chính xác của một phần tử nào đó
trong tập hợp Hình 1.6 biểu diễn một ví dụ cụ thể về mô hình này.
Hình 1.4 – Mô hình dữ liệu phân cấp
Hình 1.5 – Mô hình dữ liệu đồ thị
Trang 14Trên đây là bốn loại mô hình dữ liệu mà ta sẽ nghiên cứu Ta cũng sẽ nghiên cứucác dạng biểu diễn của các mô hình này bởi các cấu trúc dữ liệu khác nhau trong phacài đặt chương trình Nói chung, hầu hết các cấu trúc dữ liệu đều rơi vào một trongbốn dạng cơ bản này.
1.2.2 Khái niệm trừu tượng hóa
Trong tin học, trừu tượng hóa nghĩa là đơn giản hóa, làm cho nó sáng sủa hơn
và dễ hiểu hơn Cụ thể trừu tượng hóa là che đi những chi tiết, làm nổi bật cái tổngthể
1.2.3 Kiểu dữ liệu trừu tượng
Trong Mô hình dữ liệu, chúng ta có thể thực hiện một tập hợp các phép toán rất
đa dạng, phong phú Song trong nhiều áp dụng, chúng ta chỉ sử dụng mô hình với một
số xác định các phép toán nào đó Khi đó chúng ta sẽ có một kiểu dữ liệu trừu tượng
Kiểu dữ liệu trừu tượng (abstract data type): là một mô hình dữ liệu được xét
cùng với một số xác định các phép toán nào đó Ví dụ: Mô hình dữ liệu danh sách, chỉxét đến các phép toán thêm vào và lấy ra, ta gọi là kiểu dữ liệu hàng đợi hoặc ngănxếp, Mô hình tập hợp, chỉ xét đến các phép toán: Thêm vào, loại bỏ, tìm kiếm ta gọi làkiểu dữ liệu trừu tượng từ điển,
Khi nói đến một kiểu dữ liệu cần phải đề cập đến hai đặc trưng cơ bản sau :
1) Tập các giá trị thuộc kiểu
2) Tập hợp các phép toán có thể thực hiện được trên các dữ liệu của kiểu
1.2.4 Dữ liệu
Hình 1.6 Mô hình dữ liệu đồ thị
Trang 15Thực tế dữ liệu tồn tại ở rất nhiều dạng: hình ảnh, âm thanh, …….có rất nhiều dạngkhác nhau Trong một bài toán, dữ liệu được phân làm ba loại:
1.2.5 Biểu diễn dữ liệu trên máy tính
+ Trong MTĐT, các dữ liệu dù tồn tại ở những hình thức khác nhau (số, văn bản, hìnhảnh, đúng / sai, …) đều được biểu diễn dưới dạng nhị phân khi đưa vào MT xử lý.Tức là mỗi dữ liệu được biểu diễn dưới dạng một dãy các số nhị phân 0 hoặc 1.Ví dụ:
Số 10 = 0000 1010
=> Cách biểu diễn này rất không thuận tiện (dài, khó, không gợi nhớ, …) đối với con người Việc xuất hiện các ngôn ngữ lập trình bậc cao ( Pascal, C, … gần với ngôn ngữ tự nhiên) đã giải phóng con người khỏi những khó khăn khi làm việc với cách biểu diễn dữ liệu nhị phân trong MT
+ Trong các ngôn ngữ lập trình bậc cao: Các kiểu dữ liệu là sự trừu tượng hoá cáctính chất của các đối tượng dữ liệu có cùng bản chất trong thế giới thực (chỉ ra nhữngtính chất đặc trưng cho các đối tượng thuộc phạm vi bài toán đang xét)
Ví dụ: Ứng với các dữ liệu dạng số, tương ứng ta có các kiểu dữ liệu sốnguyên, số thực, số phức, … trong ngôn ngữ lập trình,
+ Như vậy tất cả các dữ liệu mô tả trong ngôn ngữ lập trình bậc cao được máy tính xử
lý đu phải thuộc một kiểu dữ liệu xác định
1.2.6 Kiểu dữ liệu
Kiểu dữ liệu T được xác định bởi một bộ <V,O> , với :
V : tập các giá trị hợp lệ mà một đối tượng kiểu T có thể lưu trữ
O : tập các thao tác xử lý có thể thi hành trên đối tượng kiểu T.
Ví du: Giả sử có kiểu dữ liệu mẫu tự = <Vc ,Oc> với
Trang 16Oi= { +, -, *, /, %}
Như vậy: muốn sử dụng một kiểu dữ liệu trong cài đặt cần nắm vững các thuộc tính
của kiểu dữ liệu đó Các thuộc tính của 1 kiểu dữ liệu bao gồm:
Tên kiểu dữ liệu: Từ khóa thể hiện cho kiểu đó
Miền giá trị: Một biến có kiểu dữ liệu đó có thể nhận các giá trị trong phạm vinào
Kích thước lưu trữ: Để tối ưu hóa việc sử dụng kiểu dữ liệu phù hợp, tránh hiệntượng dư thừa bộ nhớ
Tập các toán tử tác động lên kiểu dữ liệu: Các phép toán cơ bản mà kiểu dữ liệu đócung cấp
Ta thấy rằng, các loại dữ liệu cơ bản thường là các loại dữ liệu đơn giản, không có cấu trúc.Chúng thường là các giá trị vô hướng như các số nguyên, số thực, các ký tự, các giá trịlogic Các loại dữ liệu này, do tính thông dụng và đơn giản của mình, thường được cácngôn ngữ lập trình (NNLT) cấp cao xây dựng sẵn như một thành phần của ngôn ngữ để giảmnhẹ công việc cho người lập trình Chính vì vậy đôi khi người ta còn gọi chúng là các kiểu dữliệu định sẵn Thông thường, các kiểu dữ liệu cơ bản bao gồm :
Kiểu có thứ tự rời rạc: số nguyên, ký tự, logic , liệt kê, miền con …
Kiểu không rời rạc: số thực
Tùy ngôn ngữ lập trình, các kiểu dữ liệu định nghĩa sẵn có thể khác nhau đôi chút vềcác thuộc tính Ví dụ: Với ngôn ngữ C, các kiểu dữ liệu này chỉ gồm số nguyên, sốthực, ký tự Và theo quan điểm của C, kiểu ký tự thực chất cũng là kiểu số nguyên vềmặt lưu trữ, chỉ khác về cách sử dụng Trong khi đó PASCAL định nghĩa tất cả cáckiểu dữ liệu cơ sở đã liệt kê ở trên và phân biệt chúng một cách chặt chẽ
Các kiểu cơ sở rất đơn giản và không thể hiện rõ sự tổ chức dữ liệu trong mộtcấu trúc, thường chỉ được sử dụng làm nền để xây dựng các kiểu dữ liệu phức tạp khác
Tuy nhiên trong nhiều trường hợp, chỉ với các kiểu dữ liệu cơ sở không đủ đểphản ánh tự nhiên và đầy đủ bản chất của sự vật thực tế, dẫn đến nhu cầu phải xâydựng các kiểu dữ liệu mới dựa trên việc tổ chức, liên kết các thành phần dữ liệu cókiểu dữ liệu đã được định nghĩa Những kiểu dữ liệu được xây dựng như thế gọi làkiểu dữ liệu có cấu trúc Đa số các ngôn ngữ lập trình đều cài đặt sẵn một số kiểu cócấu trúc cơ bản như mảng, chuỗi, tập tin, bản ghi và cung cấp cơ chế cho lập trìnhviên tự định nghĩa kiểu dữ liệu mới
Ví dụ : Để mô tả một đối tượng sinh viên, cần quan tâm đến các thông tin sau:
- Mã sinh viên: chuỗi ký tự
- Tên sinh viên: chuỗi ký tự
Trang 17- Ngày sinh: kiểu ngày tháng
- Nơi sinh: chuỗi ký tự
- Điểm thi: số nguyênCác kiểu dữ liệu cơ sở cho phép mô tả một số thông tin như :
Giả sử đã có cấu trúc phù hợp để lưu trữ một sinh viên, nhưng thực tế lại cầnquản lý nhiều sinh viên, lúc đó nảy sinh nhu cầu xây dựng kiểu dữ liệu có cấu trúcmới, ví dụ danh sách hoặc mảng
Mục tiêu của việc nghiên cứu cấu trúc dữ liệu chính là tìm những phương cáchthích hợp để tổ chức, liên kết dữ liệu, hình thành các kiểu dữ liệu có cấu trúc từ nhữngkiểu dữ liệu đã được định nghĩa
1.2.7 Cấu trúc dữ liệu (Data Structures)
Trang 18CTDL = { Các dữ liệu thành phần}, trong đó:
Các dữ liệu thành phần có thể là dữ liệu đơn (sẵn có) hoặc là CTDL đã đượcxây dựng, chúng được liên kết với nhau theo một phương pháp liên kết nào đó, từnhững CTDL này người ta xây dựng các giải thuật tương ứng tác động trên CTDL đómột cách hiệu quả nhất
Ví dụ: Trong ngôn ngữ lập trình Pascal :
Mảng: Bao gồm một dãy có thứ tự các phần tử có cùng kiểu
Bản ghi: Bao gồm một tập các phần tử dữ liệu khác kiểu, có mối quan hệ với
nhau, ví dụ thông tin về 1 con người gồm họ tên, ngày sinh, chiều cao, cân nặng,
…
Một cấu trúc dữ liệu tốt phải thỏa mãn các tiêu chuẩn sau :
1- Phản ánh đúng thực tế : Đây là tiêu chuẩn quan trọng nhất, quyết định tính đúng
đắn của toàn bộ bài toán Cần xem xét kỹ lưỡng cũng như dự trù các trạng thái biếnđổi của dữ liệu trong chu trình sống để có thể chọn cấu trúc dữ liệu lưu trữ thể hiệnchính xác đối tượng thực tế
Ví dụ : Một số tình huống chọn cấu trúc lưu trữ sai :
- Chọn một biến số nguyên integer để lưu trữ tiền thưởng bán hàng (được tính theo
công thức tiền thưởng bán hàng = trị giá hàng * 5%), do vậy sẽ làm tròn mọi giá trịtiền thưởng gây thiệt hại cho nhân viên bán hàng Trường hợp này phải sử dụng biến
số thực để phản ánh đúng kết quả của công thức tính thực tế
- Trong trường trung học, mỗi lớp có thể nhận tối đa 28 học sinh Lớp hiện có 20 học
sinh, mỗi tháng mỗi học sinh đóng học phí 100.000 đ Chọn một biến số nguyên byte
( khả năng lưu trữ 0 - 255) để lưu trữ tổng học phí của lớp học trong tháng là khôngphù hợp vì giá trị tổng học phí thu được > 255, vượt khỏi khả năng lưu trữ của biến đãchọn, gây ra tình trạng tràn, dẫn đến sai lệch
2 - Phù hợp với các thao tác trên đó: Tiêu chuẩn này giúp tăng tính hiệu quả của
giải thuật, cụ thể là việc phát triển các thuật toán đơn giản, tự nhiên hơn; chương trìnhđạt hiệu quả cao hơn về tốc độ xử lý
Ví dụ : Một tình huống chọn cấu trúc lưu trữ không phù hợp:
Cần xây dựng một chương trình soạn thảo văn bản, các thao tác xử lý thường xảy ra làchèn, xoá sửa các ký tự trên văn bản Trong thời gian xử lý văn bản, nếu chọn cấu trúclưu trữ văn bản trực tiếp lên tập tin thì sẽ gây khó khăn khi xây dựng các giải thuật cậpnhật văn bản và làm chậm tốc độ xử lý của chương trình vì phải làm việc trên bộ nhớ
Trang 19ngoài Trường hợp này nên tìm một cấu trúc dữ liệu có thể tổ chức ở bộ nhớ trong đểlưu trữ văn bản suốt thời gian soạn thảo.
LƯU Ý :
Đối với mỗi ứng dụng , cần chú ý đến thao tác nào được sử dụng nhiều nhất để lựachọn cấu trúc dữ liệu cho thích hợp
3 - Tiết kiệm tài nguyên hệ thống: Cấu trúc dữ liệu chỉ nên sử dụng tài nguyên hệ
thống vừa đủ để đảm nhiệm được chức năng của nó Thông thường có 2 loại tàinguyên cần lưu tâm nhất : CPU và bộ nhớ Tiêu chuẩn này nên cân nhắc tùy vào tìnhhuống cụ thể khi viết chương trình Nếu cần một chương trình có tốc độ xử lý nhanhthì khi chọn cấu trúc dữ liệu yếu tố tiết kiệm thời gian xử lý phải đặt nặng hơn tiêuchuẩn sử dụng tối ưu bộ nhớ, và ngược lại
Ví dụ : Một số tình huống chọn cấu trúc lưu trữ lãng phí:
- Sử dụng biến integer (2 bytes) để lưu trữ một giá trị cho biết tháng hiện hành Biết rằng tháng chỉ có thể nhận các giá trị từ 1-12, nên chỉ cần sử dụng kiểu byte là đủ.
- Để lưu trữ danh sách học viên trong một lớp, sử dụng mảng 50 phần tử (giới hạn sốhọc viên trong lớp tối đa là 50) Nếu số lượng học viên thật sự ít hơn 30, thì gây lãngphí Trường hợp này cần có một cấu trúc dữ liệu linh động hơn mảng, ví dụ danh sáchliên kết – ta sẽ đề cập đến trong các tiếp theo
Như vậy:
Kiểu dữ liệu phức, hay còn gọi là cấu trúc dữ liệu, là kiểu dữ liệu trong đó các phần
tử của nó có thể phân tách thành các kiểu dữ liệu đơn hoặc kiểu dữ liệu phức khác Ví
dụ, kiểu dữ liệu phức trong Pascal bao gồm: array và record
1.2.8 Giải thuật
Khi đã có mô hình thích hợp cho một bài toán ta cần cố gắng tìm cách giải quyết bài toán trong mô hình đó Khởi đầu là tìm một giải thuật, đó là một chuỗi hữuhạn các chỉ thị (instruction) mà mỗi chỉ thị có một ý nghĩa rõ ràng tương ứng với một thao tác và thực hiện được trong một lượng thời gian hữu hạn
Knuth (1973) định nghĩa giải thuật là một chuỗi hữu hạn các thao tác để giải một bài toán nào đó Các tính chất quan trọng của giải thuật là:
- Hữu hạn (finiteness): giải thuật phải luôn luôn kết thúc sau một số hữu hạn
bước
- Xác định (definiteness): mỗi bước của giải thuật phải được xác định rõ ràng
và phải được thực hiện chính xác, nhất quán
- Hiệu quả (effectiveness): các thao tác trong giải thuật phải được thực hiện
Trang 20trong một lượng thời gian hữu hạn.
Ngoài ra một giải thuật còn phải có đầu vào (input) và đầu ra (output)
Nói
tóm l ại:
M ột giải thuật phải giải quyết xong công việc khi ta cho dữ liệu vào Cónhiều cách để thể hiện giải thuật: dùng ngôn ngữ tự nhiên, dùng lưu đồ, dùng ngônngữ giả, dùng các câu lệnh của ngôn ngữ lập trình, Và một cách dùng phổbiến là dùng ngôn ngữ giả, đó là sự kết hợp của ngôn ngữ tự nhiên và các câu lệnhcủa ngôn ngữ lập trình
1.2.6 Mối quan hệ giữa cấu trúc dữ liệu và giải thuật
Trong một chương trình: Giải thuật phản ánh các phép xử lý, còn đối tượng xử
lý của giải thuật lại là dữ liệu, chính dữ liệu chứa đựng các thông tin cần thiết để thựchiện giải thuật Để xác định được giải thuật phù hợp cần phải biết nó tác động đến loại
dữ liệu nào (ví dụ để làm nhuyễn các hạt đậu , người ta dùng cách xay chứ không bămbằng dao, vì đậu sẽ văng ra ngoài) và khi chọn lựa cấu trúc dữ liệu cũng cần phải hiểu
rõ những thao tác nào sẽ tác động đến nó (ví dụ để biểu diễn các điểm số của sinh viênngười ta dùng số thực thay vì chuỗi ký tự vì còn phải thực hiện thao tác tính trung bình
từ những điểm số đó)
Như vậy trong một chương trình máy tính, giải thuật và cấu trúc dữ liệu có mốiquan hệ chặt chẽ với nhau, được thể hiện qua công thức :
Cấu trúc dữ liệu + Giải thuật = Chương trình
Với một cấu trúc dữ liệu đã chọn, sẽ có những giải thuật tương ứng, phù hợp.Khi cấu trúc dữ liệu thay đổi thường giải thuật cũng phải thay đổi theo để tránh việc
xử lý gượng ép, thiếu tự nhiên trên một cấu trúc không phù hợp Hơn nữa, một cấutrúc dữ liệu tốt sẽ giúp giải thuật xử lý trên đó có thể phát huy tác dụng tốt hơn, vừađáp ứng nhanh vừa tiết kiệm bộ nhớ, giải thuật cũng dễ hiễu và đơn giản hơn
* Cấu trúc lưu trữ ( Storange structures)
+ CTDL được biểu diễn trong bộ nhớ máy tính còn được gọi là Cấu trúc lưutrữ
Trang 211.3 Ngôn ngữ diễn đạt giải thuật
- Là công cụ trung gian giúp giao tiếp giữa người và MTĐT
- Mỗi ngôn ngữ lập trình có một hệ kiểu, trong đó có một số là kiểu dữ liệu đơn haynguyên tử, một số là các cấu trúc dữ liệu bao gồm các kiểu đơn
- Ngôn ngữ diễn đạt giải thuật bao gồm một tập hợp các câu lệnh tuân theo một cúpháp nhất định Thông qua các câu lệnh mà MT có thể hiểu và thực hiện những côngviệc mà người dùng muốn MT làm
=> Ta sử dụng công cụ này để diễn đạt giải thuật
- Trong môn học CTDL ta sử dụng ngôn ngữ lập trình Pascal để minh hoạ
1.4 Đệ quy và giải thuật đệ
1.4.1 Khái niệm đệ quy
Một đối tượng được gọi là đệ quy nếu nó bao gồm chính nó như một bộ phậnhoặc đối tượng được định nghĩa dưới dạng của chính nó
Ví dụ : Cho n là số nguyên dương, giai thừa của n được định nghĩa là:
n! = 1 nếu n = 0 hoặc n = 1;
n*(n-1) ! nếu n >1
1.4.2 Giải thuật đệ quy và thủ tục đệ quy
a) Giải thuật đệ quy
Nếu lời giải của bài toán T được thực hiện bởi lời giải của một bài toán T’, códạng như T thì đó là một lời giải đệ quy Giải thuật chứa lời giải đệ quy được gọi làgiải thuật đệ quy (T’<T)
Ví dụ: Xét bài toán tìm một từ trong từ điển
Phác thảo giải thuật
Procedure SEARCH( dict, word)
{ dict được gọi là đầu mối để truy nhập được vào từ điển đang xét, word chỉ từ cần tìm }
1) If (từ điển chỉ còn là một trang )
Then (tìm word trong trang này) Else
Begin
Mở từ điển vào trang giữa;
Xác định xem nửa nào chứa word ;
Trang 22If (word nằm ở nửa trước của từ điển ) Then SEARCH(dict1, word)
Else SEARCH(dict2, word) End;
{dict1, dict2 là 2 đầu mối có thể truy cập được vào đầu trước và đầu sau của từ điển }
b) Đặc điểm của thủ tục đệ quy
+ Trong thủ tục đệ quy có lời gọi đến chính nó
+ Mỗi lần có lời gọi thì kích thước của bài toán đã thu nhỏ hơn trước
+ Có một trường hợp đặc biệt, trường hợp suy biến: Bài toán sẽ được giảiquyết theo một cách khác hẳn và gọi đệ quy cũng kết thúc
Đệ quy gồm : Đệ quy trực tiếp (thủ tục chứa lời gọi đến chính nó) và đệ quy gián tiếp(thủ tục chứa lời gọi đến thủ tục khác mà thủ tục này lại chứa lời gọi đến chính nó )
Tóm lại
Mặc dù các thuật ngữ kiểu dữ liệu (hay kiểu - data type), cấu trúc dữ liệu (datastructure), kiểu dữ liệu trừu tượng (abstract data type), mô hình dữ liệu (data model)nghe có vẻ như nhau, nhưng chúng có ý nghĩa rất khác nhau
Kiểu dữ liệu: là một tập hợp các giá trị và một tập hợp các phép toán trên các giá
trị đó Ví dụ kiểu Boolean là một tập hợp có 2 giá trị TRUE, FALSE và các phéptoán trên nó như OR, AND, NOT … Kiểu Integer là tập hợp các số nguyên có giátrị từ -32768 đến 32767 cùng các phép toán cộng, trừ, nhân, chia, Div, Mod…
Kiểu dữ liệu có hai loại là kiểu dữ liệu sơ cấp và kiểu dữ liệu có cấu trúc hay còn gọi là cấu trúc dữ liệu
Kiểu dữ liệu c ơ sở : là kiểu dữ liệu mà giá trị dữ liệu của nó là đơn nhất Ví
dụ: kiểu Boolean, Integer…
Kiểu dữ liệu có cấu trúc hay còn gọi là cấu trúc dữ liệu: là kiểu dữ liệu mà
giá trị dữ liệu của nó là sự kết hợp của các giá trị khác Ví dụ: ARRAY là một cấu trúc dữ liệu
Một kiểu dữ liệu trừu tượng: là một mô hình dữ liệu cùng với một tập hợp các
phép toán điển hình trên nó Có thể nói kiểu dữ liệu trừu tượng là một kiểu dữ liệu
do chúng ta định nghĩa ở mức khái niệm (conceptual), nó chưa được cài đặt cụ thểbằng một ngôn ngữ lập trình
Khi cài đặt một kiểu dữ liệu trừu tượng trên một ngôn gnữ lập trình cụ thể, chúng
Trang 23ta phải thực hiện hai nhiệm vụ:
1 Biểu diễn kiểu dữ liệu trừu tượng bằng một cấu trúc dữ liệu hoặc một kiểu dữ liệu trừu tượng khác đã được cài đặt
2 Viết các chương trình con thực hiện các phép toán trên kiểu dữ liệu trừu tượng mà ta thường gọi là cài đặt các phép toán
Trang 24Chương 2 Mô hình dữ liệu danh sách
Tổng quan:
1 Mục tiêu
Sau khi học xong chương này, sinh viên
- Nắm vững các kiểu dữ liệu trừu tượng như: danh sách, ngăn xếp, hàng đợi.
- Cài đặt các kiểu dữ liệu và các phép toán bằng ngôn ngữ lập trình cụ thể.
- Ứng dụng được các kiểu dữ liệu trừu tượng trong bài toán thực tế.
2 Nội dung cốt lõi
Trong chương này chúng ta sẽ nghiên cứu
- Mô hình danh sách (LIST)
- Kiểu dữ liệu trừu tượng ngăn xếp (STACK)
- Kiểu dữ liệu trừu tượng hàng đợi (QUEUE)
2.1 Danh sách (List)
21.1 Khái niệm danh sách
Mô hình toán học của danh sách là một tập hợp hữu hạn biến động các phần tửthuộc cùng một lớp đối tượng nào đó (có cùng một kiểu dữ liệu)
Ta cũng lưu ý rằng một đối tượng cũng có thể xuất hiện nhiều lần trong một danhsách Ta biểu diễn danh sách L như là một chuỗi các phần tử của nó: a1, a2, , anvới n ≥ 0 thì:
+ Nếu n=0 ta nói danh sách rỗng (empty list)
+ Nếu n > 0 ta gọi a1 là phần tử đầu tiên và an là phần tử cuối cùng của danhsách
+ Số phần tử của danh sách ta gọi là độ dài của danh sách
+ Một tính chất quan trọng của danh sách đó là tính tuyến tính: Các phần tử củadanh sách có thứ tự tuyến tính theo vị trí (position) xuất hiện của các phần tử
Ta nói ai đứng trước ai+1, với i từ 1 đến n-1; Tương tự ta nói ai là phần tử đứngsau ai-1, với i từ 2 đến n Ta cũng nói ai là phần tử tại vị trí thứ i, hay phần tửthứ i của danh sách
Ví dụ: Tập hợp họ tên các sinh viên của lớp TINHOC được liệt kê trên giấy như sau:
1 Nguyễn Trung Cang
2 Nguyễn Ngọc Chương
3 Lê Thị Lệ Sương
Trang 25là danh sách con của một danh sách bất kỳ.
- Một danh sách con bắt đầu từ phần tử đầu tiên gọi là phần đầu (prefix), một danhsách kết thúc bởi phần tử cuối cùng gọi là phần cuối (postfix) của danh sách
2.1 2 Các phép toán cơ bản trên danh sách
Gọi L là một danh sách đã cho, p là một vị trí (position) trong danh sách, x là mộtgiá trị nào đó cùng kiểu với kiểu dữ liệu của các phần tử trong danh sách Các phéptoán cơ bản sau được định nghĩa trên danh sách:
1) Chèn một phần tử vào danh sách
INSERT_LIST(x,p,L): xen phần tử x vào vị trí p trong danh sách L Tức là nếu
danh sách là a1, a2, , ap-1, ap , , an thì sau khi xen ta có kết quả a1, a2, , ap-1, x,
ap, , an Nếu vị trí p không tồn tại trong danh sách thì phép toán không được xácđịnh
2) Tìm vị trí của một phần tử trong danh sách
LOCATE(x,L) thực hiện việc xác định vị trí phần tử có nội dung x đầu tiên trong
danh sách L Locate trả kết quả là vị trí của phần tử x trong danh sách Nếu xkhông có trong danh sách thì vị trí sau phần tử cuối cùng của danh sáchđược trả về, tức là ENDLIST(L)
3) Lấy giá trị của phần tử ở vị trí nào đó
RETRIEVE(p,L) lấy giá trị của phần tử ở vị trí p của danh sách L; nếu vị trí p
không có trong danh sách thì kết quả không xác định (có thể thông báo lỗi)
4) Xoá một phần tử ở vị trí nào đó trong danh sách
DELETE_LIST(p,L): xoá phần tử ở vị trí p trong danh sách L Nếu vị trí p
không có trong danh sách thì phép toán không được định nghĩa và danh sách L sẽ không thay đổi
Trang 265) Tìm vị trí của phần tử đứng sau phần tử có vị trí xác đinh
LINK(p,L) cho kết quả là vị trí của phần tử đi sau phần tử p; nếu p là phần tử cuối
cùng trong danh sách L thì LINK(p,L) cho kết quả là ENDLIST(L) Link khôngxác định nếu p không phải là vị trí của một phần tử trong danh sách
6) Tìm vị trí của phần tử đứng trước phần tử có vị trí xác đinh
PREVIOUS(p,L) cho kết quả là vị trí của phần tử đứng trước phần tử có vị trí p
trong danh sách Nếu p là phần tử đầu tiên trong danh sách thì Previous(p,L) khôngxác định Previous cũng không xác định trong trường hợp p không phải là vị trícủa phần tử nào trong danh sách
7) Tìm vị trí của phần tử đứng đầu danh sách
FIRST(L) cho kết quả là vị trí của phần tử đầu tiên trong danh sách Nếu danh
sách rỗng thì ENDLIST(L) được trả về
8)Kiểm tra tính rỗng của danh sách
EMPTY_LIST(L) cho kết quả TRUE nếu danh sách rỗng, ngược lại nó cho
Lưu ý:
Trên đây là các phép toán trừu tượng do chúng ta định nghĩa, nó chưa đượccài đặt trong các ngôn ngữ lập trình Do đó để thực hiện được các phép toán đó taphải cài đặt chúng thành các chương trình con trong ngôn ngữ lập trình cụ thể Trongbài giảng này, với mỗi cấu trúc dữ liệu cài đặt mô hình danh sách ta vẫn giữ đúngnhững tham số trong cách cài đặt trên để thống nhất trong cài đặt
2.1.3 Biểu diễn (cài đặt) danh sách trên máy tính
? Muốn thêm 1 phần tử vào đầu hay cuối danh sách ta cần gọi các phép toán nào và gọi các phép toán đó như thế nào?
Trang 272.1.3.1 Danh sách cài đặt bằng mảng
Cài đặt danh sách bởi mảng hay còn gọi là cấu trúc dữ liệu danh sách đặc, hoặc cấu trúc dữ liệu danh sách kế tiếp, gọi tắt là: Danh sách đặc, hoặc danh sách kế tiếp, nó thuộc loại cấu trúc dữ liệu tĩnh
a) Mô tả cài đặt :
- Giá sử N là số phân tử tối đa trong danh sách: Với cách cài đặt này, dĩ nhiên,
ta phải ước lượng số phần tử tối đa của danh sách để khai báo số phần tử củamảng cho thích hợp Dễ thấy rằng số phần tử của mảng phải được khai báolớn hơn số phần tử của danh sách Nói chung là mảng còn thừa một số chỗ
trống, giả sử Item: Là kiểu dữ liệu của các phần tử trong danh sách
- Dùng một mảng để lưu giữ các phần tử của danh (giả sử mảng Elements).
- Count là một biến đếm đếm số lượng phần tử hiện có trong danh sách
Như vậy ta có thể định nghĩa danh sách như một cấu trúc bản ghi gồm 2 trường:
Elements: Chứa các phần tử trong danh sách
Count: Đếm số phần tử hiện có trong danh sách (chiều dài danh sách)
=> Khi đó mảng chứa các phần tư trong danh sách có dạng như sau
(rỗng) (rỗng)
b) Dạng cài đặt
Const N = <maxlist>;
Type List = Record
Elements : Array[1 N] of Item;
Count : 0 N;
End;
Var L : List;
c) Cài đặt các phép toán cơ bản
1- Khởi tạo danh sách rỗng
Danh sách rỗng là một danh sách không chứa bất kỳ một phần tử nào (hay độ dài
Trang 28danh sách bằng 0) Theo cách khai báo trên, trường count chỉ vị trí của phần tửcuối cùng trong danh sách và đó cũng độ dài hiện tại của danh sách, vì vậy để khởitạo danh sách rỗng ta chỉ việc gán giá trị trường count này bằng 0.
Procedure MakeNullList(Var L: List)
Begin
L count :=0;
End;
2- Kiểm tra danh sách rỗng
Danh sách rỗng là một danh sách mà độ dài của nó bằng 0
Function Empty_list(L : List) : boolean;
Phân tích cách chèn
Khi xen phần tử có nội dung x vào tại vị trí p của danh sách L thì sẽ xuất hiện các khả năng sau:
- Mảng đầy: mọi phần tử của mảng đều chứa phần tử của danh sách, tức là phần
tử cuối cùng của danh sách nằm ở vị trí cuối cùng trong mảng Nói cách khác, độdài của danh sách bằng chỉ số tối đa của mảng; Khi đó không còn chỗ cho phần tửmới, vì vậy việc xen là không thể thực hiện được, chương trình báo lỗi
- Ngược lại ta tiếp tục xét:
+ Nếu p không hợp lệ (p>count+1 hoặc p<1 ) thì chương trình con báo lỗi;( vì: Vị trí xen p<1 thì khi đó p không phải là một vị trí phần tử trong trongdanh sách đặc Nếu vị trí p>L.count+1 thì khi xen sẽ làm cho danh sách Lkhông còn là một danh sách đặc nữa
+ Nếu vị trí p hợp lệ thì ta tiến hành xen theo các bước sau:
* Dời các phần tử từ vị trí p đến cuối danh sách ra sau 1 vị trí
? Tại sao đối số L của thủ tục lại là tham biến
Trang 29* Độ dài danh sách tăng 1.
* Đưa phần tử mới vào vị trí p
Giải thuật chèn:
Procedure InsertList(X: Item, P: byte , Var L: List)
Var i: integer;
Begin
if (L.count =MaxLength) then
Writeln(‘Danh sach day’) else
if ((P<1) or (P>L.count+1)) then
Writeln (‘Vi tri khong hop le’) Else
begin {Dời các phần tử từ vị trí p đến cuối danh sách (Count) sang phải 1 vị trí}
4 - Xóa phần tử ra khỏi danh sách
Bài toán:
Cho danh sách L, hãy xoá phần tử ở vị trí p ra khỏi danh sách
Phân tích bài toán
Xoá một phần tử ở vị trí p ra khỏi danh sách L ta làm công việc ngược lại với chèn mộtphần tử: Trước tiên ta kiểm tra vị trí phần tử cần xóa xem có hợp lệ hay chưa?
+ Nếu p>L.count hoặc p<1 thì đây không phải là vị trí của phần tử trong danh sách
+ Ngược lại, vị trí đã hợp lệ thì ta phải dời các phần tử từ vị trí p+1 đến cuối
Trang 30danh sách (count) lên trước một vị trí để đè lên phần tử cần xóa và độ dài danh sáchgiảm đi 1 phần tử ( do đã xóa bớt 1 phần tử).
Giải thuật xoá
Procedure DeleteList(P: byte, var L: list)
For i:= P-1 to L.count -1do
o Nếu tìm thấy x thì vị trí của phần tử tìm thấy được trả về,
o Nếu không tìm thấy thì hàm trả về vị trí sau vị trí của phần tử cuốicùng trong danh sách, tức là ENDLIST(L) Giả sử ta choENDLIST(L) := L.count+1
Trong trường hợp có nhiều phần tử cùng giá trị x trong danh sách thì vị trí củaphần tử được tìm thấy đầu tiên được trả về
Giải thuật
Procedure Locate(X:Item, L:list) :integer;
Trang 31Var p: integer; found: boolean;
Bgein
Found = false;
P = First(L); //vị trí phần tử đầu tiên
/*trong khi chưa tìm thấy và chưa kết thúc danh sách thì
xét phần tử kế tiếp*/
while ((P < L.count+1) and (not Found) do
if (Retrieve(P,L) == X) then Found := true else P = Link(P, L);
Trang 32MakeNullList(L); //Khởi tạo danh sách rỗng
ReadList(L);
Writeln(‘Danh sach vua nhap: ‘);
Pr int _List(L); // In danh sach len man hinh
2.1.3.2 Danh sách cài đặt bởi con trỏ
Danh sách được cài đặt bởi con trỏ ta còn gọi là cấu trúc dữ liệu danh sách liên
kết - gọi tắt là danh sách liên kết, đây thuộc loại cấu trúc dữ liệu động
Trong cách cài đặt này, ta dùng con trỏ để liên kết các ô nhớ chứa các phần tử của
danh sách Các hình thức tổ chức liên kết các phần tử trong danh sách có thể là:
Ta có 1 kiểu lưu trữ khác: Lưu trữ móc nối, các ô nhớ chứa các phần tử trong danh sách không nhất thiết phải nằm ở những vị trí kế tiếp nhau, và chúng gắn kết với nhau thông qua cơ chế móc nối - lưu địa chỉ của nhau => danh sách được lưu trữ theo kiểu này gọi là danh sách móc nối hay danh sách liên kết Vậy lưu trữ móc nối là như thế nào, ta đi tìm hiểu nguyên tắc lưu trữ của nó?
Các ô nhớ chứa các phần tử của danh sách là một vùng liên tục, các vùng nhớ này được cấp phát ngay khi dịch chương trình vì nó là các ô nhớ tĩnh.
Nhược điểm chính: Số lượng các phần tử trong danh sách bị hạn chế vì phụ thuộc vào vùng nhớ trống liên tục trong bộ nhớ
Ta đã biết, với cấu trúc
danh sách kế tiêp thì:
Trang 33+ Liên kết đơn, tương ứng ta có cấu trúc dữ liệu danh sách liên kết đơn – gọi tắt làdanh sách liên kết đơn
+ Liên kết vòng: Tương ứng ta có cấu trúc dữ liệu danh sách liên kết vòng – gọitắt là danh sách liên kết vòng
+ Liên kết đôi: Tương ứng ta có cấu trúc dữ liệu danh sách liên kết đôi (liên kếtkép) – gọi tắt là danh sách liên kết kép
+ Đa liên kết: Tương ứng ta có danh sách đa móc nối
Trong bài giảng này ta trung nguyên cứu cấu trúc danh sách liên kết đơn Các cấutrúc danh sách liên kết khác dành cho bạn đọc
a) Danh sách liên kết đơn (single link list)
Mỗi phần tử trong danh sách là một ô nhớ, mỗi ô nhớ là một cấu trúc ít nhất làhai ngăn, một ngăn chứa dữ liệu của phần tử đó, một ngăn là con trỏ chứa địachỉ của ô nhớ đứng kế sau trong danh sách, ta có thể hình dung cơ chế này qua ví dụsau:
Giả sử 1 nhóm có 4 bạn: Đông, Tây, Nam, Bắc có địa chỉ nhà ở lần lượt làd,t,n,b Giả sử: Đông có địa chỉ của Nam, Tây không có địa chỉ của bạn nào, Bắc
giữ địa chỉ của Đông, Nam có địa chỉ của Tây, điều này được mô tả qua Hình 2.1
như sau
Hình 2.1
Như vậy, nếu ta xét thứ tự các phần tử bằng cơ chế lưu địa chỉ này thì ta có mộtdanh sách: Bắc, Đông, Nam, Tây Hơn nữa để có thể truy cập đến các phần tửtrong danh sách này thì chỉ cần giữ địa chỉ của Bắc (điah chỉ của ô nhớ chứaphần tử đầu tiên trong danh sách)
Trang 34+ Trường info chứa giá trị của các phần tử trong danh sách;
+ Trường link là một con trỏ giữ địa chỉ của ô kế tiếp trong danh sách:
- Mỗi nút có dạng như sau:
- Hình ảnh danh sách có dạng như sau:
Nút cuối cùng trong danh sách không có nút đứng sau, lên Trường link của
phần tử cuối trong danh sách, trỏ đến một giá trị đặc biệt là Nil (trỏ tới đất – không
trỏ tới đâu) Cấu trúc danh sách như vậy gọi là danh sách cài đặt bằng con trỏ hay
danh sách liên kết đơn hoặc danh sách móc nối đơn hay ngắn gọn gọi là danh sách liên kết.
+ Để truy nhập vào d/s ta phải truy nhập tuần tự đến vị trí mong muốn, xuất phát từphần tử đầu tiên, do đó để quản lý danh sách ta chỉ cần quản lý địa chỉ ô nhớ chứaphần tử đầu tiên của danh sách, tức là cần một con trỏ trỏ đến phần tử đầu tiên trongdanh sách - giả sử con trỏ L
+ Danh sách L rỗng khi: L=nil
* Dạng cài đặt
(Nói đến danh sách móc nối (Liên quan đến địa chỉ) ta phải nghĩ ngay đến biến trỏ,vậy biến trỏ là gì ?
Nói thêm về con trỏ trong Pascal:
- Chiếm 4 byte, là đối tượng dùng để lưu trữ địa chỉ của đối tượng khác
L
Trang 35Type <Tên kiểu con trỏ> = ^ <Kiểu T>;
Ví dụ: Type p = ^ Hs;
- Truy nhập đến đối tương qua con trỏ, sử dụng lệnh
<Tên biến con trỏ>^
- Một số hàm/thủ tục đối với con trỏ:
+ Thủ tục New(p): Xin cấp phát một vùng nhớ có kích thước bằng kích thước
của kiểu tương ứng với kiểu của con trỏ p:
*Nếu cấp phát được thì địa chỉ vùng nhớ đó sẽ được gán cho con trỏ p
*Nếu không cấp phát được thì P = nil+ Thủ tục Dispose(p): Giải phóng (thu hồi) vùng nhớ do con trỏ p trỏ tới,thường được sử dụng khi muốn loại bỏ 1 phần tử ra khỏi danh sách
-Với một nút được trỏ bới con trỏ p thì :
+ p^ infor : Cho giá trị là trường infor của nút
+ p^ Link: Cho địa chỉ của nút tiếp sau P
Dạng cài đặt của danh sách:
Type PList = ^ Nut;
Nut = Record Infor:Iem;
2- Kiểm tra một danh sách rỗng
Danh sách rỗng nếu con trỏ trỏ tới phần tử đầu danh sách = nil
Function EmptyList( L: Plist): boolean
Begin
EmptyList:= L=Nil;
Trang 363 - Xen một phần tử vào danh sách :
Xen một phần tử có giá trị x vào danh sách L tại vị trí p ta phải cấp phát một ômới để lưu trữ phần tử mới này và nối kết lại các con trỏ để đưa ô mới này vào vị trí
p Sơ đồ nối kết và thứ tự các thao tác (từ 1-> 4) được cho trong Hình 2.2.
Hình 2.2: Thêm một phần tử vào danh sách tại vị trí p Phác thảo giải thuật thêm
Procedure InsertList( X: Item, P: byte, var L: PList )
Var Temp, M: pList;
dem: byte;
y: Item;
Begin
- Yêu cầu máy tính cấp phát ô nhớ chứa dữ liệu cần thêm: New(Temp) {1};
- Đổ dữ liệu cần thêm vào ô nhớ vừa cấp phát: Temp^.infor:=x; {2}
- Xác định vị trí thêm: ví trí thứ P:
Nếu p=1: thêm vào đầu danh sách: Temp^.link:=L;L:=Temp;
Nếu (p>1) and (p<length(L)) thì:
Di chuyển con trỏ M đến vị trí thứ P:
M:=L; Dem:=1;
While Dem<> p do Begin
m:=m^.link Dem:= Dem +1;
End;
- Sửa đổi các mối liên kết để gắn kết Temp vào vị trí p trong danh sách L:
M
Trang 37a Gắn Temp vào sau M:
Trong đó Length(l) là hàm xác định chiều dài danh sách
4- Xóa phần tử ra khỏi danh sách L
Hình 2.3: Xoá phần tử tại vị trí p
Tương tự như khi xen một phần tử vào danh sách liên kết, muốn xóa một phần
tử khỏi danh sách ta cần:
+ Xác định vị trí của phần tử muốn xóa trong danh sách L, giả sử ví trí thứ p, ta
di chuyển con trỏ M tới vị trí trước p, temp trỏ tới vị trí p
+ Nối kết lại các con trỏ theo thao tác 1 như trong Hình 2.3.
+ Giải phóng vùng nhớ chứa phần tử thứ P
Giải thuật:
Procedure DeleteList(P: integer, Var L: PList )
Var M, Temp: Plist;
Trang 38If p<=length(L) then Begin
1- Danh sách nối vòng ( Circularly linked list)
- Là một cải tiến của d/s nối đơn
Trang 39- Trường Link của node cuối cùng trong d/s nối đơn chứa địa chỉ của node đầutiên của d/s
Hình ảnh của nó như sau:
Ưu điểm:
- Giúp cho việc truy nhập vào các node được linh hoạt hơn: vì node nào cũng có thểcoi là node đầu tiên và con trỏ L trỏ tới node nào cũng được, từ một nút trong danhsách ta có thể truy cập được đến các nút khác
Nhược điểm:
Trong xử lý, nếu không cẩn thận dẫn đến 1 chu trình không kết thúc (Vì khôngbiết được chỗ kết thúc d/s )
2- Danh sách nối kép (double link list)
* Với danh sách móc nối đơn và nối vòng, chỉ có phép duyệt 1 chiều, từ phần tử trước
có thể truy nhập đến phần tử đứng sau, nhưng từ phần tử đứng sau không truy cập trựctiếp đến phần tử đứng ngay trước nó được Khắc phục hạn chế này ta có danh sáchliên kết kép
* Mỗi phần tử trong danh sách nối kép là một nút (bản ghi) gồm 3 trường:
- Info : chứa thông tin về đối tượng
- LPTR : con trỏ trỏ tới phần tử bên trái
- RPTR : con trỏ trỏ tới phần tử bên phải
+ Quy cách một node:
+ Hình ảnh danh sách móc nối đối có dạng:
Để truy nhập các phần tử của d/s ta có thể truy cập xuất phát từ một trong hai đầucủa danh sách Do đó, ta quản lý danh sách bằng cách dùng 2 con trỏ L, R lần lượt trỏtới node cực trái, phải của danh sách Khi đó d/s rỗng nếu: L=R= nill
Hình 2.4 – hình ảnh danh sách liên kết đơn vòng
Hình 2.5 – hình ảnh danh sách liên kết đôi
Trang 40(Tương tự như danh sách móc nối đơn, với danh sách nối kép, ta cũng có các phép toán tác động tương ứng)
* Một số phép toán:
1) Phép bổ sung một phần tử (vào trước phần tử trỏ bởi con trỏ M)
(Giải thuật: Bạn đọc tự viết)
2) Phép loại bỏ 1 phần tử ra khỏi danh sách nối kép
+ Giả sử ta có một d/s nối kép, có 2 nút cực trái, cực phải là L, R loại bỏ nút trỏ
bởi con trỏ M ra khỏi danh sách
(Chú ý: trong nhiều bài toán cụ thể: Yêu cầu, nút cần loại bỏ là nút thoả mãn điều kiện nào đó, khi đó ta phải di chuyển con trỏ M trỏ đến nút đó )
{ M^ PPtr^ LPtr := M^ LPtr;
M^ LPtr^ RPtr := M^ Rptr ; (1)
(2)
{ R:= R^ LPtr ;R^ RPtr := nil ;Nếu : M =R :