NỘI DUNG Khái niệm bài toán và giải thuật Đặc trưng yêu cầu của giải thuật Các phương pháp diễn đạt giải thuật Sơ lược về đánh giá giải thuật Ngôn ngữ lập trình và các mức khác
Trang 1Chương 4 Giải thuật xử lý thông
tin và ngôn ngữ lập trình
Học phần: LẬP TRÌNH CƠ BẢN
Tài liệu tham khảo
Giáo trình tin học cơ sở, Hồ Sỹ Đàm, Đào Kiến Quốc, Hồ
Đắc Phương Đại học Sư phạm, 2004 – Chương 7, 9.
2 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 2NỘI DUNG
Khái niệm bài toán và giải thuật
Đặc trưng (yêu cầu) của giải thuật
Các phương pháp diễn đạt giải thuật
Sơ lược về đánh giá giải thuật
Ngôn ngữ lập trình và các mức khác nhau của ngôn
ngữ lập trình
Quá trình thực hiện chương trình trên ngôn ngữ bậc cao
3 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Output KHÁI NIỆM BÀI TOÁN
Cho số tự
nhiên n
n có phải số nguyên tố hay
không
“có” hay
“không”
Cho hồ sơ
điểm sinh viên
Tìm tất cả các sinh viên có điểm trung
bình trên 8
Danh sách sv thoả mãn
Thiết kế hình
học, tải trọng
Tính sức bền Độ bền
Cho một bài toán nghĩa là cho input,
và yêu cầu để tìm (tính) ra output
Trang 3KHÁI NIỆM THUẬT TOÁN
Thuật toán (algorithm) là một quá trình gồm một dãy hữu hạn các thao
tác có thể thực hiện được sắp xếp theo một trình tự xác định dùng để
giải một bài toán
Ví dụ : thuật toán Euclid tìm ước số chung lớn nhất của hai số tự
nhiên Thay vì phải tính toán theo định nghĩa chỉ làm rõ cấu trúc của
USCLN (tích của các ước số chung với số mũ nhỏ nhất) thuật toán
Euclid dựa trên các tính chất sau:
USCLN(a,b) = USCLN (b,a))
Nếu a> b, USCLN(a,b) = USCLN (a-b,b)
USCLN(a,a)= a
5 Giải thuật xử lý thông tin và ngôn ngữ lập trình
THUẬT TOÁN EUCLID
TIM USCLN CỦA HAI SỐ TỰ NHIÊN
Bài toán: Cho hai số m, n tìm d = USCLN(m,n)
Bước 1: Kiểm tra nếu m= n thì về bước 5, nếu không thực hiện tiếp
bước 2
Bước 2: Nếu m> n thì về bước 4 nếu không thực hiện tiếp bước 3
Bước 3: m <n, bớt n đi một lượng bằng m và quay về bước 1
Bước 4: bớt m đi một lượng bằng n và quay về bước 1
Bước 5: Lấy d chính là giá trị chung của m và n Kết thúc
1.
2.
3.
4.
5.
6 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 4m
15
n
21
15 6
VÍ DỤ CÁC BƯỚC CỦA THUẬT TOÁN EUCLID
m<n m>n m>n m<n m=n USCLN(15,21) = 3
7 Giải thuật xử lý thông tin và ngôn ngữ lập trình
CÁC ĐẶC TRƯNG CỦA THUẬT TOÁN
Input
Output
Tính xác định: Sau mỗi bước, bước tiếp theo hoàn toàn xác định
Tính khả thi: các chỉ dẫn đặt ra đều có thể thực hiện được
Tính dừng: quá trình tính toán luôn phải dừng sau một số hữu hạn bước
Tính phổ dụng: mỗi thuật toán không chỉ dùng cho một bài toán với dữ
liệu cụ thể mà có thể áp dụng với một lớp các bài toán cùng kiểu Chẳng
hạn người ta nói tới thuật toán tìm USCLN của hai số tự nhiên bất kỳ chứ
không phải thuật toán tìm USCLN của 15 và 21
Trang 5CÁC PHƯƠNG PHÁP BIỂU DIỄN THUẬT TOÁN
Dùng ngôn ngữ tự nhiên
Dùng sơ đồ khối
Dùng mã giả (pseudo-code)
9 Giải thuật xử lý thông tin và ngôn ngữ lập trình
THUẬT TOÁN BỐC SỎI
Dùng ngôn ngữ tự nhiên
mỗi người đến lượt mình bốc từ 1 đến 3 viên sỏi Ai bốc cuối
cùng là thắng Làm thế nào để người đi trước thắng.
1 Bước 1, bốc 2 viên
2 Bước 2: nếu số sỏi đã hết, dừng cuộc chơi, tuyên bố người (đi
trước) thắng cuộc Nếu không về bước tiếp theo
5 Bước 3: Đối phương bốc k viên 0 < k<4
7 Bước 4: Người đi trước bốc một lượng là 4 - k sau đó quay về
bước 2
10 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 6BIỂU DIỄN BẰNG LƯU ĐỒ HOẶC SƠ ĐỒ KHỐI
Khối thao tác
đối tượng:=
biểu thức
Khối input
Khối điều kiện
-+
Thứ tự xử lý
11 Giải thuật xử lý thông tin và ngôn ngữ lập trình
BIỂU DIỄN BẰNG LƯU ĐỒ THUẬT TOÁN EUCLID
Bắt đầu
m,n
m=n?
+
-m>n ? d:= m
n:= n - m
+
d
m:=m-n
Kết thúc
Trang 7Điều ch nh lại giá tr
của m và n
BIỂU DIỄN BẰNG GIẢ MÃ
Trong khi m ≠ n thì lặp lại khối sau: read(m,n);
while m <>
m>n m=m-n
else
n= n-m;
write(m);
Nếu m > n thì
Bớt m đi một lượng là n
ỉ
Nếu ngượ lại thì
ị
c Bớt n đi một lượng là m
Cho tới khi m = n thì tuyên bố USCLN
chính là giá trị chung của m và n
13 Giải thuật xử lý thông tin và ngôn ngữ lập trình
TÍNH NGHIỆM XẤP XỈ VỚI ĐỘ CHÍNH XÁC
ε = 0.000001 CỦA PHƯƠNG TRÌNH f(x)= ex- x3 = 0
Sử dụng thuật toán chia đôi dựa vào
tính chất: nếu một hàm f liên tục
trên đoạn [a,b] có f(a) và f(b) thì
phương trình f(x) = 0 nhất định thừa
nhận một nghiệm c nằm giữa [a,b]
Phương trình có hai nghiệm như
trong hình vẽ Ta vây nghiệm nhỏ
hơn trong đoạn [1,4]
14 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 8a:= c b:= c
TÍNH NGHIỆM XẤP XỈ VỚI ĐỘ CHÍNH XÁC
ε = 0.000001 CỦA PHƯƠNG TRÌNH f(x)= ex- x3 = 0
Ta có f(a)>0, f(b)<0 Thuật toánchia đôi tiến hành vây nghiệm, mỗi bước vây, giảm khoảng vây đi 2 lần.
c
1 Tính f(c) với c= (a+b)/2.
Không xảy ra f(c) = 0 Tiếp bước 2
Nếu f(c)> 0 thay a bởi c, sau
đó thực hiện bước 4
b
a
2.
3 Nếu f(c) <0 thay b bởi c Thực hiện bước tiếp theo
Nếu b-a > ε, quay về 1, nếu không làm tiếp
Dừng, lấy c làm nghiệm
4.
5.
15 Giải thuật xử lý thông tin và ngôn ngữ lập trình
TÍNH NGHIỆM XẤP XỈ VỚI ĐỘ CHÍNH XÁC
ε = 0.000001 CỦA PHƯƠNG TRÌNH f(x)= ex- x3 = 0
a:= 1; b:= 4; ε = 0.00001 c:= (a+b)/2
f(c) >0 ?
-+
c
b-a < ε
Trang 9BIỂU DIỄN BẰNG GIẢ MÃ
Cho ε = 0.000001, a=1 b=4
Lặp lại khối sau: a=1; b= 4;
epsi= 0.000001;
do
c= (a+b)/2;
if (epx(c)-sin(c) > 0) a=c
else
Tính c:= (a+b)/2
Tính f(c)
Nếu f(c) > 0 thì thực hiện khối
Thay a bởi c
Nếu ngược lại thì thực hiện khối
b= c
while (b-a < epsi) printf(c);
Thay b bởi c
Cho tới khi b-a < ε thì lấy c làm
nghiệm xấp xỉ
17 Giải thuật xử lý thông tin và ngôn ngữ lập trình
HIỆU QUẢ CỦA THUẬT TOÁN
Với mỗi bài toán có thể có nhiều thuật toán khác nhau Tuy
nhiên
hiệu quả của chúng có thể rất khác nhau
Trong tin học người ta quan tâm nhiều đến độ phức tạp về thời
gian:
giải bài toán đó cần bao nhiêu thời gian, vấn đề này được quy về số
phép tính cơ bản cần được thực hiện
Độ phức tạp không gian: sự tiêu tốn không gian
nhớ
Vấn đề hiệu quả thời gian là vấn đề được nghiên cứu nhiều hơn
cả
18 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 10VÍ DỤ HIỆU QUẢ TÌM KIẾM
Ví dụ bài toán tìm kiếm: cho một dãy n số khác nhau a1,a2 ai an
và
một số x.Hãy cho biết x có trong dãy số đó hay không và ở vị trí thứ
bao nhiêu Thuật toán tìm kiếm tuần tự như sau:
Bước 1 Cho i = 1
Bước 2 Nếu ai = x thì chuyển tới bước 5, nếu không thực hiện tiếp
bước 3
Bước 3 Tăng i lên 1 và kiểm tra i > n Nếu đúng về bước 4 Nếu
sai quay về bước 2
Bước 4 Tuyên bố không có số x Kết thúc
Bước 5 Tuyên bố số x chính là số thứ i Kết thúc
Số bước tìm trung bình là n/2 Nếu có 1 triệu phần tử thì phải mất khoảng
500.000 phép so sánh
19 Giải thuật xử lý thông tin và ngôn ngữ lập trình
HIỆU QUẢ CỦA THUẬT TOÁN
Nếu sắp xếp dãy số theo thứ tự tăng dần có thể tìm bằng thuật toán tìm kiếm nhị
phân, với tư tưởng thu hẹp dần vùng tìm kiếm
Bước 1 Cho d := 1, c:=n (d: đầu, c: cuối, g: giữa)
Bước 2 Tính g := [(d+c)/2]
Bước 3 So x với a g Nếu x=a g chuyển tới bước 7 Nếu khác thì tiếp tục thực hiện bước 4
Bước 4 Nếu d=c thì tuyên bố không có số x và kết thúc Nếu không thì thực hiện bước 5 tiếp
theo
Bước 5 Nếu x < a g thì thay c bằng a g và quay về bước 2 Nếu không thì thực hiện bước 6
tiếp theo
Bước 6 Thay d bằng a g và quay về bước 2
Bước 7 Tuyên bố số x chính là số thứ g Kết
thúc
Cứ mỗi lần không tìm được ta lại giảm độ dài vùng tìm kiếm đi hai lần Số bước tìm trung bình
là log 2 n Nếu có 1 triệu phần tử thì chỉ mất khoảng 20 lần tìm, rất nhỏ so với tìm tuần tự
Trang 11NGÔN NGỮ LẬP TRÌNH
Ngôn ngữ lập trình (programming language) là ngôn ngữ biểu
diễn thuật toán dùng để điều khiển máy tính thực hiện các công
việc đã định.
Các quy tắc viết được gọi là cú pháp (syntax) của ngôn ngữ
ý nghĩa mà ngôn ngữ chuyển tải gọi là ngữ nghĩa (semantic)
Một chương trình máy tính (program)phải được thể hiện trên
một ngôn ngữ xác định Như vậy một thuật toán có thể diễn đạt
bằng nhiều chương trình khác nhau trên những ngôn ngữ khác
nhau.
21 Giải thuật xử lý thông tin và ngôn ngữ lập trình
CÁC MỨC CỦA NGÔN NGỮ LẬP TRÌNH
Ngôn ngữ máy: ngôn ngữ thể hiện trực tiếp trong hệ lệnh của máy Nói chung
ngôn ngữ máy là ngôn ngữ ở mức các bít, nên cũng được gọi là ngôn ngữ nhị
phân
Hợp ngữ (assembly) là loại ngôn ngữ về cơ bản là gần với ngôn ngữ nhị phân,
mỗi lệnh của ngôn ngữ máy có một lệnh tương ứng của hợp ngữ nhưng hợp
ngữ sử dụng mã chữ
Ngôn ngữ bậc cao – còn gọi là ngôn ngữ thuật toán (Algorithmic language) là
ngôn ngữ biểu diễn thuật toán độc lập với hệ lệnh của máy
Mỗi ngôn ngữ xác định một kiểu diễn đạt kịch bản điều khiển máy tính Mỗi
một kịch bản điều khiển máy viết trên một ngôn ngữ lập trình gọi là một
chương trình (program)
22 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 12Mã máy nhị phân Mã hexa Ý nghĩa
1001 0001 0110 0000 0001 0000 A1 60 10 Nạp 1060 lên TG AX
0000 0011 0110 0110 0001 0000 03 66 10 Cộng AX với 1066 -> AX
1010 0011 0000 0000 0010 1011 A3 00 2B Ghi từ AX về 2B00
NGÔN NGỮ MÁY
Chính là ngôn ngữ được viết bằng lệnh máy trong hệ nhị phân
hoặc hệ 16
Ưu điểm, tận dụng được khả năng của máy, tối ưu được thời
gian chạy
Nhược điểm: khó viết, khó chữa lỗi, phụ thuộc vào từng loại
máy.
Nói chung chi phí cao.
23 Giải thuật xử lý thông tin và ngôn ngữ lập trình
HỢP NGỮ (ASSEMBLY)
Về cơ bản, mỗi lệnh hợp ngữ tương tự với một lệnh máy – nhưng dùng
mã chữ nên dễ hiểu, dễ sửa
Phải dịch ra ngôn ngữ máy (thay mã lệnh và địa chỉ)
Có các lệnh macro, cho phép thay thế hiệu quả hơn
Ưu điểm: dễ lập trình dễ sửa lỗi hơn ngôn ngữ máy
Nhược điểm: vẫn còn phức tạp và phụ thuộc vào máy
Trang 13DỊCH HỢP NGỮ (ASSEMBLY)
Để máy có thể chạy được thì phải dịch chương trình trên hợp ngữ thành một
chương
trình trên ngôn ngữ máy -> nhờ một phần mềm có tên là bộ hợp dịch (assembler)
thế mã lệnh và địa chỉ bằng các mã số.đầu tiên bộ hợp dịch sẽ phải bố trí không gian nhớ cho các đối tượng, sau đó thay
Thay thế được thực hiện với các lệnh macro, là các lệnh tương đương với
nhiều lệnh.
Kết quả của bước dịch đầu tiên là tạo ra các mô đun đối tượng, là các đoạn
chương trình dưới dạng nhị phân nhưng chưa có cấu trúc hoàn chỉnh để sẵn
sàng chạy ngay.
thành một chương trình nhị phân hoàn chỉnh Sau đó mới nạp chương trình này vàoThường thực hiện một bước khác là liên kết, để kết hợp nhiều mô đun đối tượng
thi hành
25 Giải thuật xử lý thông tin và ngôn ngữ lập trình
NGÔN NGỮ BẬC CAO
Ngôn ngữ máy và hợp ngữ phụ thuộc vào máy, lại khó dùng, vì nó
buộc
người lập trình phải viết tinh tế đến mức lệnh máy
Người ta muốn các ngôn ngữ chỉ diễn tả thuật toán mà thôi, không liên quan
đến các hệ lệnh đặc thù của máy tính cụ thể Các ngôn ngữ này gọi là ngôn
ngữ bậc cao (high level language) hay còn gọi là ngôn ngữ thuật toán
(algorithmic language)
Ngôn ngữ thuật toán có hình thức giống với ngôn ngữ tự nhiên hoặc ngôn
ngữ toán học nên dễ diễn đạt hơn nhiều so với ngôn ngữ máy hoặc hợp
ngữ
26 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 14* * *
VÍ DỤ VỀ NGÔN NGỮ BẬC CAO
Ví dụ giải phương trình
DELTA = B B - 4 A C
IF DELTA < 0 GOTO 10 X1= (- B + SQRT(DELTA))/(2*A) X2 =(- B - SQRT(DELTA))/(2*A) WRITE (3,20) X1, X2
20 FORMAT ('NGHIEM 1= ', F8.3, NGHIEM 2 = ', F8.3)
GOTO 30
DELTA := B*B - 4*A*C;
IF DELTA >= 0 THEN
BEGIN
X1 := (- B +
SQRT(DELTA))
/(2*A);
X2 := (- B - SQRT(DELTA))/(2*A);
WRITE (X1,X2);
END
ELSE
WRITE(‘Vô nghiệm)
10 40 30
WRITE(3,40) FORMAT('VO NGHIEM') END
27 Giải thuật xử lý thông tin và ngôn ngữ lập trình
DỊCH NGÔN NGỮ BẬC CAO
Máy tính chỉ có thể thi hành trực tiếp ngôn ngữ nhị phân, do đó phải dịch bằng
một cách nào đó để máy tính có thể thực hiện được
Có hai cách thực hiện:
- Sử dụng một chương trình mô phỏng (phần mềm này đã ở mã nhị phân gọi là
chương trình thông dịch - interpreter) Chương trình này đọc và thi hành các
lệnh trong ngôn ngữ bậc cao Do vậy chương trình thông dịch thực sự đóng vai
trò một máy ảo Trong chế độ thông dịch, không sinh chương trình tương ứng
trong mã nhị phân
- Dịch chương trình trong ngôn ngữ thuật toán thành một chương trình ở ngôn
ngữ máy bảo toàn ngữ nghĩa nhờ chương trình biên dịch (compiler)
Trang 15THỰC HIỆN CHƯƠNG TRÌNH TRÊN NGÔN NGỮ BẬC CAO
Soạn thảo chương trình nhờ một bộ soạn thảo nào đó
Phân tích từ vựng (lexical analys): tạo ra hồ sơ của tất cả các đối tượng của chương
trình phục vụ cho việc phân phối không gian nhớ sau này
Phân tích cú pháp (syntax analys): Cú pháp (syntax): quy tắc viết các câu lệnh
(statement) đảm bảo rõ nghĩa, không nhập nhằng Nếu không đúng sẽ không thể tạo
được mã Tất cả các lỗi cú pháp đều được phát hiện được trong khi dịch.
Tạo mã, tối ưu mã (code generation, optimalization)
Liên kết: (link) kết nối các mô đun đối tượng thành một chương trình hoàn chỉnh và
duy nhất.
Thực hiện, tải chương trình và nạp dữ liệu để chạy Khi chạy vẫn còn có thể có lỗi
ngữ
nghĩa Lỗi ngữ nghĩa chỉ có thể phát hiện khi chạy chương trình
29 Giải thuật xử lý thông tin và ngôn ngữ lập trình
DỊCH SANG NGÔN NGỮ MÁY
Phần mềm
soạn thảo
Chương trình dịch
Chương trình liên kết Dữ liệu
Kết quả
xử lý Chương trình
nguồn
Các mô đun đối tượng
Chương trình chạy được
Lỗi cú pháp Lỗi liên kết Lỗi thi hành
Soạn thảo Dịch Liên kết Thực hiện
30 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Trang 16MÔI TRƯỜNG PHÁT TRIỂN PHẦN MỀM
1985: với sự xuất hiện bộ phát triển Turbo Pascal đã hình thành một
khuynh
hướng mới về việc tạo ra các môi trường phát triển tích hợp IDE
(Intergated
Development Environment) -> toàn bộ các quá trình soạn thảo, dịch, liên kết ,
thi hành và gỡ lỗi được thực hiện trong cùng một mối trường liên hệ chặt chẽ
bước phát triển tiếp của IDE là việc phát triển hướng đối tượng, phát triển theo
mẫu, lập trình hướng tới thành phần (liên kết động các thành phần có sẵn trong
mã nhị phân) làm việc sinh mã chương trình trở nên hiệu quả hơn rất nhiều
Các hệ CASE (Computer Aided Software Engineering) còn cho phép phát
sinh
mã trên nền thiết kế là một bước tiến theo một khuynh hướng khác
31 Giải thuật xử lý thông tin và ngôn ngữ lập trình
Tóm tắt nội dung
Ngôn ngữ lập trình là phương tiện diễn tả thuật toán để máy tính có thể sử
dụng trực tiếp hoặc gián tiếp
Theo mức trừu tượng hoá có các mức là ngôn ngữ máy, hợp ngữ và ngôn
ngữ thuật toán Đối với hợp ngữ phải sử dụng phần mềm hợp dịch, với ngôn
ngữ thuật toán phải dùng phần mềm biên dịch để tạo ra phần mềm tương
ứng trong ngôn ngữ máy – ngôn ngữ mà máy có thể chạy trực tiếp
Các bước chính để dịch từ một chương trình nguồn sang mã nhị phân là
soạn thảo, phân tích từ vựng, phân tích cú pháp, dịch, tối ưu hoá, liên kết
mã Trong các môi trường tích hợp các khâu trên và cả khâu gỡ lỗi được
tích hợp vào trong một tổng thể
Trang 17THẢO LUẬN
Sự khác biệt giữa các mức ngôn ngữ lập trình, nguyên tắc
phân biệt các mức của NNLT.
Đánh giá hiệu quả của các thuật toán khác nhau cùng giải
quyết một bài toán.
Phân tích ưu, nhược điểm của từng phương pháp biểu
diễn giải thuật?
33 Giải thuật xử lý thông tin và ngôn ngữ lập trình
CÂU HỎI VÀ BÀI TẬP
Thuật toán là gì? Cho ví dụ
Xác định input và output cho các thuật toán sau đây:
a Rút gọn một phân số.
b Kiểm tra xem ba số cho trước a, b và c có thể là độ dài ba cạnh của
một tam giác hay không?
Trình bày tính chất xác định của thuật toán và nêu rõ nghĩa của tính
chất này
Cho tam giác ABC có góc vuông A và cho biết cạnh a và góc B Hãy
viết thuật toán để tính góc C, cạnh b và cạnh c
1.
2.
3.
4.
Hãy phát biểu thuật toán để giải bài toán sau: "Có một số quả táo Dùng cân
hai đĩa (không có quả cân) để xác định quả táo nặng nhất"
Chỉ dùng phép cộng, tính bình phương của một số
5.
6.
34 Giải thuật xử lý thông tin và ngôn ngữ lập trình