Một số cải tiến về ràng buộc xâu trong sinh dữ liệu kiểm thử tự động cho thực thi tượng trưng

Một cách tổng quát, với mỗi kỹ thuật được dùng trong một giai đoạn kiểm thửđộng dynamic run-time testing thì bất cứ phần mềm nào cũng có thể được phân ralàm hai công đoạn con: chuẩn bị c

Trang 1

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-TÔ HỮU NGUYÊN

MỘT SỐ CẢI TIẾN VỀ RÀNG BUỘC XÂU TRONG SINH DỮ LIỆU KIỂM THỬ TỰ ĐỘNG CHO THỰC THI TƯỢNG

Trang 2

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-TÔ HỮU NGUYÊN

MỘT SỐ CẢI TIẾN VỀ RÀNG BUỘC XÂU TRONG SINH DỮ LIỆU KIỂM THỬ TỰ ĐỘNG CHO THỰC THI TƯỢNG

TRƯNG

LUẬN ÁN TIẾN SĨ TOÁN HỌC

Chuyên ngành : Cơ sở toán học cho tin học

Trang 3

MỤC LỤC

MỤC LỤC i

LỜI CAM ĐOAN iii

LỜI CẢM ƠN iv

DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT v

DANH MỤC BẢNG BIỂU vi

DANH MỤC HÌNH VẼ vii

MỞ ĐẦU 1

CHƯƠNG 1 TỔNG QUAN VỀ KIỂM THỬ PHẦN MỀM VÀ THỰC THI BIỂU TRƯNG 5

1.1 Kiểm thử phần mềm 5

1.1.1 Các khái niệm cơ bản 5

1.1.2 Các phương pháp kiểm thử 10

1.2 Kỹ thuật kiểm thử hộp trắng dòng điều khiển 12

1.2.1 Kiểm thử hộp trắng dòng điều khiển theo hướng động 12

1.2.2 Kiểm thử hộp trắng dòng điều khiển theo hướng tĩnh 14

1.2.3 Các tiêu chí phủ kiểm thử 15

1.2.4 Đồ thị dòng điều khiển 16

1.2.5 Đường kiểm thử 17

1.3 So sánh kiểm thử hộp trắng dòng điều khiển theo hướng tĩnh và động 17

1.4 Thách thức trong kiểm thử phần mềm 18

1.5 Thực thi biểu trưng 19

1.5.1 Tổng quan về thực thi biểu trưng 19

1.5.2 Thực thi biểu trưng tĩnh 24

1.5.3 Thực thi biểu trưng động 27

1.5.4 Thực thi Concolic 33

1.5.5 Thực thi biểu trưng với các lời gọi phương thức 37

1.6.6 Ràng buộc xâu và vai trò của giải ràng buộc xâu 40

1.6 Kết luận chương 1 42

CHƯƠNG 2 THỰC THI BIỂU TRƯNG VÀ MÔ HÌNH HÓA RÀNG BUỘC 44

2.1 Đặt vấn đề 44

2.1.1 Bùng nổ đường đi 44

Trang 4

2.1.2 Mô hình hóa bộ nhớ 46

2.2 Thực thi biểu trưng và công cụ mở rộng 47

2.2.1 Thực thi biểu trưng và kiểm thử phần mềm 47

2.2.2 Thực thi biểu trưng trên ngôn ngữ Java 48

2.3 Giải các ràng buộc và thực thi biểu trưng 54

2.4 Ràng buộc hỗn hợp và cải tiến trong giải ràng buộc xâu 56

2.4.1 Đồ thị xâu 58

2.4.2 Xây dựng lại ràng buộc 58

2.4.3 Quá trình tiền xử lý 59

2.4.4 Sinh các ràng buộc xâu và kết quả thực hiện 60

2.4.5 Giải ràng buộc sử dụng Otomat 62

CHƯƠNG 3 GIẢI RÀNG BUỘC XÂU 63

3.1 Đặt vấn đề 63

3.2 Các vấn đề liên quan đến Bitvector và bộ thỏa mãn SMT (satisfiability modulo theories) 64

3.2.1 Lý thuyết thỏa mãn SMT 64

3.2.2 Giải ràng buộc xâu dựa trên phương pháp BitVector 66

3.3 Giải ràng buộc xâu dựa trên phương pháp sử dụng OTOMAT 67

3.4 Đề xuất giải ràng buộc xâu trong thực thi biểu trưng 70

3.4.1 Mô hình hoá ràng buộc xâu sử dụng đồ thị 71

3.4.2 Phát hiện thêm ràng buộc kiểu nguyên trên dữ liệu xâu 72

3.5 Thực nghiệm và đánh giá kết quả 72

KẾT LUẬN VÀ KIẾN NGHỊ 86

DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ 87

TÀI LIỆU THAM KHẢO 88

Trang 5

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi được hoàn thànhdưới sự hướng dẫn tận tình của tập thể hướng dẫn gồm

Các kết quả được viết chung với các tác giả khác đã được sự nhất trí củađồng tác giả khi đưa vào luận án Các kết quả nêu trong luận án là trung thực vàchưa từng được công bố trong bất kỳ công trình nào trước thời gian công trình củatôi và cộng sự được công bố

Hà Nội, ngày… tháng….năm …

Tác giả luận án

Trang 6

LỜI CẢM ƠN

Trước hết, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các thầygiáo hướng dẫn, TS Nguyễn Trường Thắng và PGS TS Đặng Văn Đức Sự tậntình giúp đỡ, chỉ bảo, động viện tận tình và quí báu mà các thầy đã dành cho tác giảtrong suốt quá trình thực hiện luận án là không thể nào kể hết được

Xin chân thành cảm ơn các thầy các cô, các nhà khoa học thuộc Viện Côngnghệ thông tin và Học viện khoa học và Công nghệ đã tận tình giúp đỡ và tạo mộtmôi trường làm việc hết sức thuận lợi giúp tác giả thực hiện tốt công việc nghiêncứu của mình

Xin chân thành cảm ơn Ban Giám Hiệu Trường đại học Công nghệ thông tin

và Truyền thông – Đại học Thái Nguyên đã hết sức tạo điều kiện về thời gian vàcông việc để tác giả có thể tập trung hoàn thành quá trình học tập, nghiên cứu củamình Đặc biệt xin gửi lời cảm ơn đến các thầy cô, các bạn đồng nghiệp trong KhoaCông nghệ thông tin đã động viên, giúp đỡ tác giả trong suốt quá trình nghiên cứu

Cuối cùng, xin gửi lời cảm ơn sâu sắc nhất tới gia đình, bạn bè và ngườithân, những người đã luôn là nguồn động viên để tác giả có thể học tập và nghiêncứu, luôn sẻ chia những khó khăn vất vả trong quá trình nghiên cứu và hoàn thiện

đề tài

Hà Nội, ngày… tháng….năm ….

Tác giả luận án

Trang 7

DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT

MJI Model Java Interface

DFA Deterministic Finite Automaton

PC Điều kiện đường dẫn (path condition)

QTKT Quy trình kiểm thử

SDLC Software Development Life Cycle

SE Thực thi biểu trưng (Symbolic Execution)

SET Cây thực thi biểu trưng (Symbolic Execution Tree)SMT Satisfiability Modulo Theories

SQA Software quality assurance

STLC Software Test Life Cycle

UT Kiểm thử đơn vị - Unit Testing

VSUnit Visual Studio Unit Testing

Trang 8

DANH MỤC BẢNG BIỂU

Bảng 1.1 Ví dụ về thực thi biểu trưng động 29

Bảng 1.2 So sánh thực thi Concolic với thực thi biểu trưng 34

Bảng 1.3 Minh họa việc chuyển đổi từ mã nguồn Java sang mã Jimple 35

Bảng 1.4 Mô tả ràng buộc xâu 41

Bảng 2.1 Xây dựng các ràng buộc cho các phép toán trên xâu 61

Bảng 3.1 Xây dựng ràng buộc tương ứng với các phép toán trên xâu 66

Bảng 3.2 Kết quả đánh giá mô hình cải tiến trên bộ dữ liệu 79

Trang 9

DANH MỤC HÌNH VẼ

Hình 1.1 Mối quan hệ giữa phát triển phần mềm và kiểm thử phần mềm 9

Hình 1.2 Quy trình chung của kiểm thử hộp trắng theo hướng động 13

Hình 1.3 Ví dụ về chèn mã nguồn trong DMS/SRT 14

Hình 1.4 Mã nguồn hàm triangle sau khi thêm mã nguồn 14

Hình 1.5 Quy trình chung của kiểm thử hộp trắng theo hướng tĩnh 15

Hình 1.6 Các cấu trúc điều khiển phổ biến 17

Hình 1.7 Ví dụ về ý tưởng thực hiện cụ thể của thực thi biểu trưng 23

Hình 1.8 Cây thực thi biểu trưng 26

Hình 1.9 Thực thi biểu trưng với phương thức nhận đầu vào là đối tượng 31

Hình 1.10 Cây thực thi biểu trưng được quản lý riêng 33

Hình 1.11 Thực thi biểu trưng trên lời gọi phương thức 38

Hình 2.1 Mô hình hoạt động của JPF 49

Hình 2.2 Sơ đồ trạng thái trong quá trình kiểm thử 50

Hình 2.3 Biểu diễn sơ đồ kiến trúc mức cao của JPF 51

Hình 2.4 Ví dụ về trừu tượng hoá dữ liệu 52

Hình 2.5 Một ví dụ khác về trừu tượng hoá dữ liệu 52

Hình 2.6 Quy trình sàng lọc dữ liệu 53

Hình 2.7 Đồ thị xâu 57

Hình 2.8 Thuật toán giải ràng buộc hỗn hợp 58

Hình 2.9 Đồ thị sau khi loại bỏ phép toán equals 60

Hình 2.10 Các ràng buộc không thỏa mãn sau khi loại bỏ phép toán equals 60

Hình 2.11 Các đỉnh mới đại diện cho độ dài xâu được bổ sung 61

Hình 3.1 Giải ràng buộc xâu dựa trên Otomat 69

Hình 3.2 Phương thức giải ràng buộc phủ định 70

Hình 3.3 Sơ đồ mô hình hoá ràng buộc xâu sử dụng đồ thị 71

Hình 3.4: Thuật toán giải ràng buộc xâu 73

Hình 3.5 Chương trình Java kiểm thử 75

Hình 3.6 Kết quả sinh dữ liệu biểu trưng trên một số phép toán trên xâu 76

Hình 3.7 Code kiểm thử 78

Trang 10

Hình 3.8 Kết quả đánh giá mô hình cải tiến trên bộ dữ liệu 80

Hình 3.9 Chương trình Java 81

Hình 3.10 Đồ thị xâu 1 82

Hình 3.11 Đồ thị xâu 2 83

Trang 11

MỞ ĐẦU

Kiểm thử phần mềm (testing) là một trong những hoạt động quan trọng nhấttrong chu trình phát triển phần mềm Theo số liệu thống kê thực tế, kiểm thử phầnmềm chiếm tới 50-60% tổng chi phí toàn bộ quy trình phát triển phần mềm Để giảmchi phí kiểm thử và tăng mức độ tin cậy của phần mềm, các nhà nghiên cứu đang cốgắng tự động hoá các hoạt động phục vụ công việc kiểm thử phần mềm [1, 2]

Một cách tổng quát, với mỗi kỹ thuật được dùng trong một giai đoạn kiểm thửđộng (dynamic run-time testing) thì bất cứ phần mềm nào cũng có thể được phân ralàm hai công đoạn con: chuẩn bị các ca kiểm thử (test case) cho việc kiểm tra phầnmềm và thực hiện chạy chương trình cần kiểm thử trên một nền tảng hỗ trợ các nghiệp

vụ kiểm thử (testing framework) với các ca kiểm thử đã có

Công việc đầu tiên và hết sức quan trọng đó là chuẩn bị bộ dữ liệu kiểm thử.Việc này thường được làm thủ công nên cần rất nhiều nhân lực để tạo ra bộ dữ liệuđầy đủ, có tính bao phủ cao (coverage criteria) trên toàn bộ các đường tính toán(computation paths) của chương trình Các ca kiểm thử bao gồm dữ liệu kiểm thử vàcác giá trị đầu ra mong muốn

Một trong các hoạt động quan trọng để giảm chi phí kiểm thử phần mềm làsinh các ca kiểm thử một cách tự động và có tính đầy đủ Các tổ chức phát triển phầnmềm thường phải chi phí một lượng lớn về tài chính cho các hoạt động liên quan đếnkiểm thử phần mềm Tính hiệu quả của tiến trình xác minh và thẩm định phụ thuộcnhiều vào số lỗi được tìm ra và được sửa chữa trước khi sản phẩm được chuyển giao.Điều này đồng nghĩa với quan điểm chất lượng của phần mềm phụ thuộc chặt chẽ vàochất lượng các ca kiểm thử được sinh ra

Trong những năm qua, nhiều nghiên cứu của các nhà khoa học trên thế giớinhằm ―sinh dữ liệu kiểm thử một cách tự động‖ [3, 4] để giảm thiểu chi phí cho phầnmềm Có hai cách tiếp cận căn bản để sinh dữ liệu kiểm thử đó là dựa vào mã nguồn(code) và dựa vào mô hình (model) Đối với phương pháp dựa vào mã nguồn làphương pháp cho khả năng bao phủ cao, có khả năng loại bỏ các dòng lệnh không cầnthiết chứa các tiềm ẩn gây lỗi nhưng cần thiết phải có khả năng tối ưu tính toán củacác phần mềm phân tích kiểm thử, do vậy gần đây có nhiều nghiên cứu tập trung vàophương pháp này [5, 6, 7]

Trang 12

Trong những năm qua, nhiều nghiên cứu về việc sinh các ca kiểm thử một cách

tự động như: sinh các ca kiểm thử dựa vào đặc tả, sinh các ca kiểm thử dựa vào môhình, sinh ca kiểm thử hướng đường dẫn và kỹ thuật thông minh Tuy nhiên, kiểm thửdựa vào thực thi biểu trưng đã và đang là hướng nghiên cứu được nhiều người quantâm

Các kỹ thuật cơ bản sinh dữ liệu kiểm thử tự động mà các nhà nghiên cứu đã đềxuất đó là: Dựa vào chứng minh định lý (test case generation by theorem proving) [8,9]; Dựa vào thực thi biểu trưng (test case generation by symbolic execution [5, 7, 10-12]); Dựa vào kiểm chứng mô hình (test case generation by model checking) [13];Dựa vào một mô hình luồng sự kiện (test case generation by an event-flow model[14]); Dựa vào việc sử dụng mô hình xích Markov (test case generation by using aMarkov chains model) [15]

Trong đó kỹ thuật thực thi biểu trưng (symbolic execution) đang là vấn đề đượcnhiều nhà khoa học trên thế giới tìm hiểu, phát triển và xây dựng các ứng dụng [5, 6,7] Hiện nay kỹ thuật này đã và đang được phát triển trên nhiều công cụ, nhiều ngônngữ như: C/C++, JavaScrip, Net, java, HTML vv Trong phạm vi giới hạn nghiêncứu, nội dung của luận án tập trung nghiên cứu về một số cải tiến trong bộ giải ràngbuộc xâu áp dụng sinh các ca kiểm thử Các cài đặt thực nghiệm và đánh giá đượcthực hiện bằng ngôn ngữ Java do Java là ngôn ngữ mạnh mẽ, hiện đại Hơn nữa, Javađang được sử dụng rộng rãi với các thư viện trên kiểu dữ liệu xâu đa dạng, phong phú

và được sử dụng trong nhiều dự án lớn trong hiện tại và tương lai

Mục tiêu nghiên cứu của luận án:

Nghiên cứu các phương pháp mô hình hóa ràng buộc giải ràng buộc từ đó cảitiến khả năng giải ràng buộc và áp dụng kỹ thuật thực thi biểu trưng trong tự độngsinh các ca kiểm thử Cài đặt thử nghiệm các phương pháp đề xuất trong sinh tự độngcác ca kiểm thử trên kiểu dữ liệu xâu và kiểu dữ liệu hỗn hợp Phân tích, đánh giá kếtquả sau khi thử nghiệm

Đối tượng và phạm vi nghiên cứu:

Tổng quan về các phương pháp tự động sinh các ca kiểm thử phần mềm, kỹ thuậtthực thi biểu trưng và ứng dụng trong sinh tự động các ca kiểm thử Các kỹ thuật mô hìnhhóa ràng buộc, giải ràng buộc trên các kiểu dữ liệu dựa trên hai phương pháp Otomata vàBitvector, Nghiên cứu, phân tích đánh giá các phương pháp hiện có sinh

Trang 13

ca kiểm thử trên các kiểu dữ liệu khác nhau Đánh giá hiệu quả, chất lượng của các cakiểm thử được tạo ra so với thực tế chương trình.

Nội dung nghiên cứu:

Các phương pháp kỹ thuật sinh tự động cá ca kiểm thử, các vấn đề liên quan môhình hóa ràng buộc trên các kiểu dữ liệu Nghiên cứu cải tiến mô hình hóa và giải ràngbuộc trên kiểu dữ liệu xâu kí tự, từ đó ứng dụng trong kỹ thuật thực thi biểu trưng thựchiện sinh các ca kiểm thử tự động trên kiểu xâu kí tự cho các chương trình kiểm thử

Phương pháp nghiên cứu:

Nghiên cứu, phân tích, tổng hợp các liệu liên quan đến thực thi biểu trưng, vaitrò của giải ràng buộc cũng như giải ràng buộc triên kiểu dữ liệu xâu trong thực thibiểu trưng trong sinh tự động các ca kiểm thử (các bài báo, tạp chí, trên mạngInternet ) Cải tiến mô hình hóa ràng buộc và nâng cao khả năng giải ràng buộc trênkiểu dữ liệu xâu và ràng buộc hỗn hợp, phân tích, đánh giá các kết quả đã công bố

Các đóng góp của luận án:

Xây dựng mô hình hóa ràng buộc trên kiểu dữ liệu xâu và ràng buộc hỗn hợp,cải tiến khả năng giải ràng buộc trong phương pháp thực thi biểu trưng Cài đặt kỹthuật mô hình hóa và giải ràng buộc dựa trên Otomat và Bitvector trong giải ràng buộcxâu, đánh giá so sánh các kết quả thu được với các các kết quả đã công bố

Bố cục của luận án:

Cấu trúc luận án bao gồm phần mở đầu, ba chương nội dung, phần kết luận,danh mục công trình công bố và danh mục các tài liệu tham khảo Nội dung chính củacác chương trong luận án như sau:

Chương 1 của luận án trình bày tổng quan về kiểm thử phần mềm và kỹ thuậtthực thi biểu trưng ứng dụng trong tự động sinh các ca kiểm thử Đồng thời trình bàycác lý thuyết cơ sở sử dụng trong luận án nhằm đưa ra cái nhìn tổng quan về bài toánnghiên cứu, về sử dụng kỹ thuật thực thi biểu trưng ứng dụng trong sinh tự động các

ca kiểm thử và hướng nghiên cứu cụ thể của luận án

Chương 2 của luận án trình bày kết quả nghiên cứu về các phương pháp môhình hóa ràng buộc, giải ràng buộc trong thực thi biểu trưng Áp dụng các công cụ nàyvào các trường hợp cụ thể cùng với các đánh giá tính hiệu quả của các phương phápnày trên kiểu dữ liệu cụ thể

Trang 14

Chương 3 của luận án trình bày các kết quả nghiên cứu của các cải tiến mô hìnhhóa ràng buộc trên kiểu xâu và ràng buộc hỗn hợp, giải ràng buộc trong thực thi biểutrưng trên kiểu dữ liệu xâu và dữ liệu hỗn hợp Đồng thời trình bày việc mở rộng kỹ thuậtthực thi biểu trưng, cách thực hiện giải ràng buộc xâu dựa trên phương pháp Otomat.

Phần kết luận nêu những đóng góp, hướng phát triển, những vấn đề quan tâm;danh mục các công trình đã được công bố của luận án và danh sách các tài liệu thamkhảo được sử dụng trong luận án cũng được trình bày

Trang 15

CHƯƠNG 1 TỔNG QUAN VỀ KIỂM THỬ PHẦN MỀM VÀ THỰC THI BIỂU

TRƯNG

Chương này trình bày lý thuyết tổng quan về kiểm thử và sinh dữ liệu kiểmthử, thực thi biểu trưng và ứng dụng của thực thi biểu trưng trong sinh các ca kiểmthử Trong đó, trình bày các khái niệm cơ bản và các phân tích liên quan đến kỹ thuậtthực thi biểu trưng Đồng thời, một vài thách thức và hướng phát triển của luận áncũng được trình bày trong chương này

1.1 Kiểm thử phần mềm

1.1.1 Các khái niệm cơ bản

Để đảm bảo một hệ thống phần mềm hoặc các thành phần của phần mềm làm việcnhư mong muốn là một thách thức lớn trong ngành công nghiệp phần mềm Các phầnmềm lỗi gây ra những tổn thất về kinh tế cũng như những hậu quả nghiêm trọng khác tùythuộc vào lĩnh vực mà phần mềm được sử dụng Do đó cần phải phát hiện và khắc phụccác lỗi của phần mềm trước khi sử dụng Có các phương pháp khác nhau để phát hiện lỗicủa phần mềm bao gồm kiểm chứng mô hình (model checking) [16], các kỹ thuật phântích tĩnh (static analysis) [17] và kiểm thử (software testing) [18 - 23]

Trong kiểm chứng mô hình, một mô hình của hệ thống được tạo ra để hỗ trợphân tích mọi sự thực thi có thể trong mô hình Kiểm chứng mô hình có thể kiểmchứng được rằng mô hình của hệ thống hoạt động chính xác trong tất cả trường hợp cóthể Hạn chế của kiểm chứng mô hình đó là không gian trạng thái của mô hình thườngquá lớn do đó việc khám phá tất cả các trạng thái không phải lúc nào cũng thực hiệnđược Trong khi đó, các kỹ thuật phân tích chương trình tĩnh thường đưa ra nhiều cảnhbáo (warnings) không tương ứng với các lỗi thực sự Các kỹ thuật kiểm thử phát hiện

ra các lỗi thực sự nhưng thường không phát hiện ra được tất cả các lỗi do chỉ phân tíchmột số sự thực thi trong chương trình

Kiểm thử phần mềm là quá trình thực thi một chương trình với mục đích tìm ra

lỗi Kiểm thử phần mềm đảm bảo sản phẩm phần mềm đáp ứng chính xác, đầy đủ vàđúng theo yêu cầu của khách hàng, yêu cầu của sản phẩm đã đặt ra Kiểm thử phầnmềm cũng cung cấp mục tiêu, cái nhìn độc lập về phần mềm, điều này cho phép việcđánh giá và hiểu rõ các rủi ro khi thực thi phần mềm

Kiểm thử phần mềm là một phần trong tiến trình bảo đảm chất lượng phần mềm(Software Quality Assurance -SQA) Trong SQA, phần mềm chuyên xử lý và kiểm

Trang 16

toán viên được quan tâm đến quá trình phát triển phần mềm hơn là chỉ các hiện vậtnhư tài liệu, mã số và hệ thống Họ kiểm tra và thay đổi phần mềm quy trình kỹ thuậtriêng của mình để giảm số lượng các lỗi mà kết thúc trong phần mềm được gửi: cáigọi là "tỷ lệ khiếm khuyết" Chúng tạo nên cái mà một "tỷ lệ lỗi chấp nhận được" phụthuộc vào bản chất của phần mềm Một chuyến bay mô phỏng trò chơi video sẽ có khảnăng chịu lỗi cao hơn nhiều so với phần mềm cho máy bay thực tế Mặc dù có nhữngliên kết chặt chẽ với SQA, các phòng kiểm thử thường tồn tại một cách độc lập, và cóthể không có chức năng SQA trong một số công ty.

Kiểm thử phần mềm được hiểu là quá trình phát hiện lỗi trong phần mềm bằngcách đối chiếu kết quả kỳ vọng từ một chương trình máy tính với kết quả thực tế của

nó cho một tập hợp các yếu tố đầu vào Ngược lại, bảo đảm chất lượng là việc thựchiện các chính sách và thủ tục nhằm ngăn ngừa khiếm khuyết xảy ra trong chươngtrình

Kế hoạch kiểm thử (Test plan)

Kế hoạch kiểm thử chính là tài liệu tổng quan về việc kiểm thử một dự án baogồm: phạm vi kiểm thử, hướng tiếp cận, quy trình kiểm thử (QTKT), tài nguyên vànhân lực kiểm thử cần có, các chức năng/mô đun cần được kiểm thử, các công cụ vàmôi trường kiểm thử cần có Kế hoạch kiểm thử bao gồm cả kế hoạch ai kiểm thửchức năng nào, khi nào bắt đầu thực hiện viết và hoàn thành ca kiểm thử, khi nào bắtđầu thực hiện kiểm thử và kế hoạch hoàn thành kiểm thử Dựa vào kế hoạch chungcủa dự án để lên kế hoạch cho bên kiểm thử Trong trường hợp khi làm thực tế thấy cókhả năng không đúng như kế hoạch đã lên thì phải báo cáo lại trưởng nhóm kiểm thửhoặc quản trị dự án sớm

Trang 17

Mục tiêu thiết kế ca kiểm thử là tìm ra nhiều lỗi nhất với chi phí và thời gian ítnhất Trong các thập kỷ 80-90 của thế kỷ XX, người ta đã nghiên cứu nhiều loạiphương pháp thiết kế ca kiểm thử.

Câu hỏi đặt ra là khi nào thì kiểm thử xong? Làm thế nào để biết rằng kiểm thử

đã đủ? Về nguyên tắc là không bao giờ kiểm thử được tất cả đồng thời vận hànhchương trình là đang kiểm thử và kiểm thử tiếp tục khi chương trình còn hoạt động Kỹ

sư phần mềm cần các tiêu chuẩn nghiêm ngặt để xác định có cần phải tiếp tục kiểmthử không

Thiết kế ca kiểm thử trong kiểm thử phần mềm là quá trình xây dựng cácphương pháp kiểm thử có thể phát hiện lỗi, sai sót, khuyết điểm của phần mềm để xâydựng phần mềm đạt tiêu chuẩn Thiết kế ca kiểm thử giữ vai trò quan trọng trong việcnâng cao chất lượng phần mềm bởi bước thiết kế ca kiểm thử Mục đích thiết kế cakiểm thử nhằm tạo ra các ca kiểm thử tốt nhất có khả năng phát hiện ra lỗi, sai sót củaphần mềm một cách nhiều nhất và tạo ra các ca kiểm thử có chi phí rẻ nhất, đồng thờitốn ít thời gian và công sức nhất

Một trong những yêu cầu quan trọng nhất trong kiểm thử chương trình là thiết

kế và tạo ra các ca kiểm thử có hiệu quả Với những ràng buộc về thời gian và chi phí

đã cho, thì vấn đề then chốt của kiểm thử trở thành xác định tập con nào của tất cả cakiểm thử có thể có khả năng tìm ra nhiều lỗi nhất

Thông thường, phương pháp kém hiệu quả nhất là kiểm tra tất cả đầu vào ngẫunhiên – quá trình kiểm thử một chương trình bằng việc chọn ngẫu nhiên một tập concác giá trị đầu vào có thể Về mặt khả năng tìm ra nhiều lỗi nhất, tập hợp các ca kiểmthử được chọn ngẫu nhiên có rất ít cơ hội là tập hợp tối ưu hay gần tối ưu Sau đây làmột số phương pháp để chọn ra một tập dữ liệu kiểm thử một cách thông minh

Để kiểm thử hộp đen và kiểm thử hộp trắng một cách thấu đáo là không thể

Do đó, một chiến lược kiểm thử hợp lý là chiến lược có thể kết hợp sức mạnh của cảhai phương pháp trên Nghĩa là phát triển một cuộc kiểm thử nghiêm ngặt vừa bằngviệc sử dụng các phương pháp thiết kế ca kiểm thử hướng hộp đen nào đó và sau đó

bổ sung thêm những ca kiểm thử này bằng việc khảo sát tính logic của chương trình,

sử dụng phương pháp hộp trắng

Trang 18

Do kiểm thử thường là khâu cuối cùng trong quá trình phát triển phần mềm(trước khi phần mềm được phân phối đến người sử dụng) nên cũng có thể đặt câu hỏitương đương ―Khi nào thì kết thúc việc kiểm thử và phân phối sản phẩm?‖

Có nhiều câu trả lời khác nhau cho những câu hỏi trên, mỗi câu trả lời hướngtới những kĩ thuật và hành động khác nhau Khi không có một sự đánh giá chuẩn thìquyết định dừng kiểm thử sản phẩm phần mềm dựa trên hai yếu tố chính, một là Tàinguyên: Quyết định có tiếp tục quá trình kiểm thử hay không dựa trên sự tiêu tốn tàinguyên, hai tiêu chuẩn trạng thái để dừng kiểm thử là ―Vượt quá thời gian và tiêu tốnquá nhiều tiền‖ Hai là quyết định dừng kiểm thử khi đã hoàn thành tất cả các hoạtđộng kiểm thử theo như kế hoạch kiểm thử đã đề ra

Đối với những giai đoạn đầu của quá trình kiểm thử hay các tiêu chuẩn kết thúckiểm thử, liên quan tới các hành động kiểm thử cục bộ, những tiêu chuẩn tin cậy dựatrên những kịch bản sử dụng của khách hàng và tần suất sử dụng có thể không còn ýnghĩa nhiều Ví dụ, trong một số hệ thống phần mềm, một số thành phần không baogiờ được sử dụng trực tiếp bởi người sử dụng và một số thành phần thì có tần suất sửdụng rất thấp Do vậy việc lựa chọn các tiêu chuẩn khác là cần thiết Những tiêuchuẩn mới này là các tiêu chuẩn bao phủ, nó bao hàm các tiêu chuẩn khác nhau, địnhnghĩa các kĩ thuật dùng trong tình huống kiểm thử và các thành phần khác có liênquan Các kĩ thuật kiểm thử hướng tới các tiêu chuẩn này được gọi là các kĩ thuậtkiểm thử hướng bao phủ

Ngoài các ràng buộc về tài nguyên và giới hạn của con người, có hai loại tiêuchuẩn để kết thúc hành động kiểm thử Tiêu chuẩn thứ nhất dựa trên thống kê sử dụngcủa người dùng để xác định các thành phần cũng như các yếu tố liên quan để kiểmthử, còn được gọi là kiểm thử thống kê hướng sử dụng Tiêu chuẩn thứ hai bao gồmcác tiêu chuẩn về mọi vấn đề liên quan tới kiểm thử đơn vị, xét tới mọi khả năng gâylỗi của chương trình (kết thúc kiểm thử) có các kĩ thuật kiểm thử hướng bao phủ

Vai trò của kiểm thử trong phát triển phần mềm, bảo trì và vận hành:

Kiểm thử nghiêm ngặt hệ thống và tài liệu có thể giúp giảm thiểu những vấn đềrủi ro xảy ra trong quá trình vận hành và góp phần nâng cao chất lượng của hệ thốngphần mềm, nếu như các lỗi được tìm thấy và sửa chữa trước khi hệ thống được vậnhành thực tế

Trang 19

Kiểm thử và chất lượng: Kiểm thử mang lại sự tự tin về chất lượng của phần mềm nếu

nó tìm thấy một vài lỗi hoặc không tìm thấy lỗi Kiểm thử đúng sẽ giảm thiểu đượctổng thể mức độ rủi ro của hệ thống Khi quá trình kiểm thử tìm thấy lỗi, chất lượngcủa hệ thống phần mềm được nâng cao sau khi những lỗi đó được sửa chữa

Kiểm thử bao nhiêu là đủ:

Việc quyết định kiểm thử bao nhiêu là đủ phụ thuộc vào mức độ của rủi ro baogồm kỹ thuật, độ an toàn, rủi ro trong kinh doanh và hạn mức của dự án như là thờigian và ngân sách Kiểm thử nên cung cấp đủ thông tin để các bên liên quan có thểquyết định về việc bàn giao phần mềm hoặc hệ thống đã qua kiểm thử cho các bướcphát triển tiếp theo hay bàn giao cho khách hàng

Kiểm thử chính là kỹ thuật được sử dụng phổ biến nhất để phát hiện và khắcphục các lỗi của phần mềm nhằm đảm bảo chất lượng của phần mềm Chi phí dànhcho việc kiểm thử chiếm khoảng 50% tổng chi phí trong phát triển phần mềm Kiểmthử là một tiến trình quan trọng trong kỹ nghệ phần mềm Kiểm thử đơn vị chính làbước đầu tiên trong quá trình kiểm thử đó

Hình 1.1 Mối quan hệ giữa phát triển phần mềm và kiểm thử phần mềm

Trong hình 1.1, phía bên trái của mô hình là vòng đời phát triển phần mềm SDLC (Software Development Life Cycle), phía bên phải của mô hình là vòng đờikiểm thử Phần mềm - STLC (Software Test Life Cycle) và toàn bộ nội dung được thểhiện dưới dạng chữ V, do đó mô hình này được gọi là Mô hình chữ V (V - model)

-Ngoài mô hình chữ V, còn có các mô hình phát triển lặp, trong đó việc phát triểnđược thực hiện theo từng giai đoạn, với mỗi giai đoạn sẽ phát triển thêm một chức năng

Trang 20

cho phần mềm Mỗi giai đoạn bao gồm các hoạt động xây dựng và kiểm thử độc lậpnhau.

1.1.2 Các phương pháp kiểm thử

Các kỹ thuật kiểm thử phổ biến [24] bao gồm:

Kiểm thử hộp đen (Black box testing)

Kiểm thử hộp đen là một phương pháp kiểm thử mà người kiểm thử sẽ chỉ xemxét đến đầu vào và đầu ra của chương trình mà không quan tâm mã nguồn bên trongđược viết ra sao Kỹ thuật viên kiểm thử thực hiện kiểm thử dựa hoàn toàn vào đặc tảyêu cầu Mục đích của kiểm thử hộp đen là tìm ra các lỗi ở giao diện, chức năng củaphần mềm

Kiểm thử hộp trắng (White box testing)

Kiểm thử hộp trắng là phương pháp kiểm thử mà cấu trúc thuật toán của chương

trình được đưa vào xem xét Các ca kiểm thử được thiết kế dựa vào cấu trúc mã hoặccách làm việc của chương trình Người kiểm thử truy cập vào mã nguồn của chươngtrình để kiểm tra nó

Các mức độ kiểm thử:

Kiểm thử đơn vị (Unit test)

Kiểm thử đơn vị là hoạt động kiểm thử nhỏ nhất Kiểm thử thực hiện trên cáchàm hay thành phần riêng lẻ Đây là công việc mà để thực hiện được nó thì ngườikiểm thử sẽ phải hiểu biết về mã nguồn, về chương trình và các hàm Thông thườnglập trình viên sẽ làm nó trước khi giao cho kiểm thử viên Mục đích của việc thực hiệnkiểm thử đơn vị là cô lập từng thành phần của chương trình và chứng minh rằng các

bộ phận riêng lẻ chính xác về các yêu cầu chức năng

Kiểm thử tích hợp (Intergration test)

Một phần mềm được tạo ra sẽ bao gồm rất nhiều mô đun trong đó Để chắcchắn rằng phần mềm hoạt động tốt thì việc gom các mô đun lại với nhau để kiểm tra

sự giao tiếp giữa các mô đun cũng như bản thân từng thành phần từng mô đun là hếtsức quan trọng Kiểm thử tích hợp bao gồm hai mục tiêu chính là phát hiện lỗi giaotiếp xảy ra giữa các đơn vị khi tích hợp các đơn vị riêng lẻ thành các hệ thống nhỏ vàcuối cùng là 1 hệ thống hoàn chỉnh để chuẩn bị cho bước kiểm thử hệ thống

Kiểm thử hệ thống (System test)

Trang 21

Kiểm thử một hệ thống đã được tích hợp hoàn chỉnh để xác minh rằng nó đápứng được yêu cầu Kiểm thử hệ thống thuộc loại kiểm thử hộp đen Kiểm thử hệ thốngtập trung nhiều hơn vào các chức năng của hệ thống Đồng thời, kiểm thử hệ thốngcũng thực hiện kiểm tra cả chức năng, giao diện và các hành vi của hệ thống một cáchhoàn chỉnh, đáp ứng với yêu cầu.

Kiểm thử chấp nhận (Acceptance test)

Trong kiểu kiểm thử này, phần mềm sẽ được thực hiện kiểm tra từ người dùng

để tìm ra nếu phần mềm phù hợp với sự mong đợi của người dùng và thực hiện đúngnhư mong đợi hay không Trong giai đoạn kiểm thử này, kiểm thử viên có thể cũngthực hiện hoặc khách hàng có các kiểm thử viên của riêng họ để thực hiện Có hai loạikiểm thử chấp nhận đó là kiểm thử Alpha và kiểm thử Beta:

Kiểm thử Alpha: là loại kiểm thử nội bộ Tức là phần mềm sẽ được một đội

kiểm thử độc lập hoặc do khách hàng thực hiện tại nơi sản xuất phần mềm

Kiểm thử Beta: là loại kiểm thử mà khách hàng thực hiện kiểm thử ở chính môi

trường của họ Loại kiểm thử này được thực hiện sau kiểm thử Alpha

Kiểm thử các yêu cầu chức năng (Functional testing)

Kiểm thử chức năng là một loại kiểm thử hộp đen và các ca kiểm thử của nóđược dựa trên đặc tả của ứng dụng phần mềm hoặc thành phần đang tiến hành kiểmthử Các chức năng được kiểm thử bằng cách nhập vào các giá trị nhập và kiểm tra kếtquả đầu ra, và ít quan tâm đến cấu trúc bên trong của ứng dụng Có thể hiểu một cáchđơn giản, kiểm thử chức năng là xác nhận tất cả các chức năng của hệ thống Nó đánhgiá ứng dụng và xác nhận liệu ứng dụng có đang hoạt động theo yêu cầu hay không

Kiểm thử các yêu cầu phi chức năng (Non Functional testing)

Loại kiểm thử này tập trung vào các khía cạnh phi chức năng của ứng dụng.Những khía cạnh phi chức năng bao gồm: Kiểm thử chịu tải, Kiểm thử bảo mật, Kiểmtra tính tương thích trên từng môi trường

Kiểm thử cấu hình (Shakeout testing)

Kiểu kiểm thử này cơ bản là kiểu kiểm thử về khả năng của hệ thống mạng, kếtnối dữ liệu và sự tương tác của các mô đun Thông thường thì kiểu kiểm thử này là donhóm quản lý cấu hình chuẩn bị thiết lập các môi trường kiểm thử thực sự Họ cũng kiểmtra xem liệu các thành phần chính của phần mềm có hoạt động bất thường không Kiểukiểm thử này thực hiện trước khi tiến hành thực hiện trong môi trường kiểm thử

Trang 22

Sau khi kiểm thử shakeout, bước kế tiếp là kiểm thử smoke (kiểu kiểm thử được thựchiện bởi tester sau khi biên dịch, được tiến hành trong môi trường kiểm thử).

Kiểm thử hiệu suất (Performance testing)

Trong loại kiểm thử này, ứng dụng được kiểm thử dựa vào sự phức tạp của giátrị, độ dài của đầu vào, độ dài của các câu truy vấn…Loại kiểm thử này kiểm tra bớtphần tải (stress/load) của ứng dụng có thể được chắc chắn hơn

Kiểm thử hồi quy (Regression testing)

Kiểm thử hồi quy là kiểm thử lại một chức năng đã được xây dựng xong, đã đượckiểm thử xong, đã hết lỗi nhưng do có sự sửa đổi một chức năng khác mà lại có ảnhhưởng đến nó Khi phải kiểm thử một chức năng đã xong rồi thì gọi là kiểm thử hồi quy

1.2 Kỹ thuật kiểm thử hộp trắng dòng điều khiển

Kiểm thử hộp trắng dòng điều khiển chia ra gồm kiểm thử hướng tĩnh và kiểmthử hướng động Đầu vào của hai kĩ thuật này đều là mã nguồn và tiêu chí phủ kiểmthử Sau một loạt quá trình phân tích, đầu ra tương ứng là tập ca kiểm thử Mỗi một kĩthuật đều có những ưu điểm và hạn chế riêng Mục tiêu của kiểm thử hộp trắng dòngđiều khiển là tìm tập ca kiểm thử tối thiểu nhưng đạt được độ phủ tối đa

1.2.1 Kiểm thử hộp trắng dòng điều khiển theo hướng động

Theo kĩ thuật này, mã nguồn sẽ được thêm các đoạn chương trình con trước khithực thi trong môi trường chạy Hình 1.2 trình bày quy trình chung của kiểm thử động.Nhìn chung, kĩ thuật này gồm sáu bước cơ bản được diễn giải theo thứ tự dưới đây:

Bước 1 Chèn thêm các đoạn mã nguồn mới vào mã nguồn cần kiểm thử.

Bước 2 Chọn ngẫu nhiên một tập giá trị đầu vào hợp lệ làm ca kiểm thử đầu tiên Bước 3 Thực thi chương trình với bộ giá trị vừa tìm được Nếu không thực thi

được, quay lại bước 2 để sinh bộ giá trị khác

Bước 4 Tìm tập các câu lệnh đã được đi qua với bộ giá trị ở bước 3 để xây

dựng được hệ ràng buộc tương ứng

Bước 5 Phủ định hệ ràng buộc thu được ở bước 4 để sinh các hệ ràng buộc

mới có tác dụng sinh các ca kiểm thử kế tiếp Nếu không thể sinh hệ phủ định nàokhác, thuật toán kết thúc

Bước 6 Giải hệ ràng buộc thu được ở bước 5 để sinh ca kiểm thử kế tiếp Nếu

không có ca kiểm thử nào thỏa mãn, quay về bước 5 để tìm hệ ràng buộc phủ định

Trang 23

mới sao cho khác hệ ràng buộc hiện tại Ngược lại, quay lại bước 3 để sinh ca kiểmthử kế tiếp.

Source

Pha chèn thêm khối Tiêu chí lệnh mới

Tìm ca kiểm thử khởi đầu ngẫu nhiên

Thực thi ca kiểm thử vừa tìm được

Tái tạo đường thực thi

Tạo đường thực thi

true false

Kết

Tìm được ca thúc kiểm thử mới

Hình 1.2 Quy trình chung của kiểm thử hộp trắng theo hướng động

Trong bước 1, quá trình chèn thêm khối mã nguồn mới vào mã nguồn cần kiểmthử được tiến hành một cách tự động Công cụ DMS/SRT 5 được đánh giá khá mạnh

mẽ để thực hiện pha này Đoạn mã nguồn thêm vào có chức năng đánh dấu, thoátchương trình hoặc ghi thông tin về quá trình thực thi ra tệp, v.v Để làm được điều này,chúng ta cần xây dựng các luật chèn thêm mã nguồn mới vào mã nguồn cần kiểm thử.Với công cụ DMS/SRT, mỗi một luật bắt đầu với từ khóa rule và theo sau là tênđặt cho luật Từ khóa rewrite to nêu cách biến đổi đoạn mã nguồn gốc về đoạn mãnguồn mới Kiểu dữ liệu có thể là expression (ứng với biểu thức), statement (ứng vớicâu lệnh gán hoặc khởi tạo), type (ứng với kiểu dữ liệu), identifier (ứng với định danhnhư tên biến, tên hàm), v.v Hình 1.3 mô tả một luật chèn thêm câu lệnh đánh dấu vàokhối lệnh điều khiển rẽ nhánh

Trang 24

Hình 1.3 Ví dụ về chèn mã nguồn trong DMS/SRT

Cụ thể, biến mảng visited đánh dấu vị trí câu lệnh đi qua được bổ sung vào mã nguồnban đầu ngay sau mỗi khối lệnh điều khiển rẽ nhánh Hình 1.4 đưa ra mã nguồntriangle sau khi áp dụng luật

Hình 1.4 Mã nguồn hàm triangle sau khi thêm mã

nguồn 1.2.2 Kiểm thử hộp trắng dòng điều khiển theo hướng tĩnh

Trong kiểm thử tĩnh, mã nguồn không được thực thi trong môi trường chạy đểsinh ca kiểm thử Trong kiểm thử tĩnh, quá trình chạy ca kiểm thử chỉ thực hiện duynhất một lần với từng ca kiểm thử để tính toán giá trị trả về và đảm bảo ca kiểm thử

Trang 25

thực thi không có vấn đề Các bước tổng quát trong kĩ thuật này được trình bày ở Hình1.5 Đầu tiên, đồ thị dòng điều khiển được xây dựng dựa trên mã nguồn và tiêu chíphủ kiểm thử Bước tiếp theo, từ đồ thị dòng điều khiển chúng ta xây dựng được tậpđường kiểm thử Mỗi một đường kiểm thử trong tập đường kiểm thử mô tả hành vichương trình với một miền bộ đầu vào nào đó Sau đó, pha tìm kiếm ca kiểm thử thỏamãn đường kiểm thử được tiến hành Cuối cùng, ca kiểm thử được thực thi trong môitrường chạy.

Hình 1.5 Quy trình chung của kiểm thử hộp trắng theo hướng

tĩnh 1.2.3 Các tiêu chí phủ kiểm thử

Tiêu chí phủ kiểm thử là một thước đo để đánh giá tính đúng đắn của mã nguồncần kiểm thử với một tập ca kiểm thử nào đó Tập ca kiểm thử khiến mã nguồn có độphủ cao được đánh giá là tốt hơn so với tập ca kiểm thử khác khiến mã nguồn có độphủ thấp hơn Chất lượng mã nguồn được đánh giá tỉ lệ thuận với độ phủ

Độ phủ được đánh giá dựa trên hai thông số gồm tiêu chí phủ kiểm thử và tập cakiểm thử Công thức tính độ phủ là tỉ lệ các thành phần được kiểm thử trên tổng số cácthành phần cần kiểm thử sau khi đã thực hiện tập ca kiểm thử Thành phần có thể là câulệnh, điểm quyết định, điều kiện con, đường thi hành hoặc là sự kết hợp của chúng

Tiêu chí phủ kiểm thử được giới thiệu lần đầu tiên vào 1963 trong tạp chí hàngtháng ―Communications of the ACM‖ Cho tới nay, nhiều tiêu chí phủ kiểm thử đượcđưa ra Luận án sử dụng ba tiêu chí phủ kiểm thử phổ biến để đánh giá chất lượng mãnguồn gồm:

Trang 26

Phủ câu lệnh: Mỗi một câu lệnh được thực thi ít nhất một lần sau khi chạy tập

đầu tiên của hàm, đỉnh cuối cùng của CFG là trạng thái kết thúc của hàm Đỉnh i nối đến đỉnh j thì câu lệnh tương ứng đỉnh j có thể được thực thi sau khi thực hiện câu lệnh tương ứng ở đỉnh i.

Trong ngôn ngữ C, các cấu trúc điều khiển trong CFG gồm tuần tự, rẽ nhánh,while do, do while, for Hình 1.6 minh họa các cấu trúc điều khiển nêu trên Trong

đó đỉnh có nhãn c biểu trưng cho câu lệnh điều kiện Các đỉnh còn lại tượng trưng câu

lệnh gán, khai báo, v.v Các thành phần cơ bản của đồ thị dòng điều khiển gồm đỉnhxuất phát, đỉnh xử lí, đỉnh quyết định, đỉnh kết nối và đỉnh kết thúc Trong đó:

Đỉnh xuất phát và đỉnh kết thúc: Hai đỉnh này là duy nhất, trong đó đỉnh xuấtphát đại diện cho tên hàm

Đỉnh quyết định: Là đỉnh tương ứng với câu lệnh điều kiện trong khối lệnhđiều khiển rẽ nhánh, do while, while do Ví dụ cụ thể, với khối lệnh điều khiển ―if(a b) { }‖ thì đỉnh quyết định tương ứng với ―a > b‖

Đỉnh kết nối: Là đỉnh có nhiều hơn hai đỉnh khác trỏ đến mà không phải đỉnhquyết định

Đỉnh xử lí: Là đỉnh tương ứng với câu lệnh gán, câu lệnh khởi tạo hoặc câulệnh khai báo và không phải đỉnh kết nối Các khối lệnh điều khiển cũng chứa các loại

câu lệnh này Ví dụ, khối lệnh ―for (i = 0; i < 10; i++)‖ chứa hai đỉnh xử lí gồm câu lệnh gán ―i = 0‖ và câu lệnh tăng giá trị biến i là ―i++‖.

Trang 27

c c

Hình 1.6 Các cấu trúc điều khiển phổ

biến 1.2.5 Đường kiểm thử

Với một bộ giá trị đầu vào, một tập các câu lệnh gán, câu lệnh khai báo và câulệnh điều kiện được đi qua Danh sách các câu lệnh này được sắp theo thứ tự thực hiệnchính là một đường đi Trong số tất cả các đường đi có thể, một tập đường đi đượcchọn sao cho thỏa mãn tiêu chí phủ kiểm thử được gọi là tập đường kiểm thử

Đường kiểm thử là một đường đi từ đỉnh đầu tiên đến đỉnh cuối cùng của CFGđược biểu diễn dưới một tập các đỉnh từ đỉnh v1đến đỉnh vn, trong đó hai đỉnh liền kề cócạnh nối với nhau Nếu cạnh (vi, vj ) (i≠ j) là nhánh false, câu lệnh lưu ở đỉnh v i được viết

giữa mọi cặp đường đi độc lập PATHi và PATHj (i ≠ j) không có ít có cạnh chung

Tìm kiếm tập đường kiểm thử là bước trung gian trong quá trình sinh tập cakiểm thử

1.3 So sánh kiểm thử hộp trắng dòng điều khiển theo hướng tĩnh và động

Mỗi một kĩ thuật kiểm thử đều có những ưu điểm và hạn chế riêng Để có cáinhìn tổng quan về hai kĩ thuật, luận án đưa ra sự so sánh về số ca kiểm thử, thời giansinh ca kiểm thử, khả năng kiểm thử vòng lặp, ảnh hưởng bởi phức tạp mã nguồn đốivới hai kĩ thuật

Về số ca kiểm thử Nhìn chung, với mã nguồn chỉ chứa các câu lệnh rẽ nhánh

và không chứa vòng lặp, hai kĩ thuật kiểm thử nêu trên cho số bộ ca kiểm thử nhưnhau Tuy nhiên, trong trường hợp có vòng lặp thì kĩ thuật kiểm thử tĩnh đưa ra số cakiểm thử ít hơn so với kiểm thử động Theo hướng tĩnh, các đường đi chứa vòng lặplặp lại một lần sẽ được cấu trúc lại để lặp nhiều hơn một lần Nói cụ thể hơn, từ một

Trang 28

đường kiểm thử chứa vòng lặp ban đầu sẽ sinh ra một tập các đường kiểm thử mớidùng để kiểm thử tính đúng đắn vòng lặp Nếu vòng lặp trong đường kiểm thử xácđịnh được số lần lặp tối đa thì số đường đi mới sinh ra là bảy Ngược lại, nếu vòng lặpkhông xác định số lần lặp tối đa thì số đường đi mới sinh ra là bốn.

Với mã nguồn chứa vòng lặp, kiểm thử động sử dụng kĩ thuật phủ định hệ đểsinh ca kiểm thử kế tiếp nên số ca kiểm thử có thể rất lớn hoặc không xác định

Trường hợp số ca kiểm thử không xác định xảy ra khi số lần lặp không được biết

trước như ―while (m!=n){ }‖, trong đó m và n là hai tham số kiểu nguyên truyền vào

hàm Để giải quyết hai vấn đề này, một vài công cụ kiểm thử như PathCrawler chèn thêm

mã nguồn xác định số lần lặp tối đa của mỗi vòng lặp hoặc thêm yêu cầu thời gian chạy.Tuy nhiên, nhìn chung số ca kiểm thử vẫn khá lớn gây khó khăn cho quản lí

Tầm quan trọng của tự động hóa QTKT hộp trắng dòng điều khiển

Một số những nguyên nhân chính dẫn đến vấn đề tự động hóa quy trình kiểmthử hộp trắng dòng điều khiển gồm: Thời gian sinh ca kiểm thử thủ công là khá lâu và

dễ dẫn đến sai sót Nguyên nhân chính phụ thuộc vào trình độ chuyên môn của kiểmthử viên, độ phức tạp mã nguồn và chịu áp lực bởi môi trường làm việc Mặt khác chiphí về nguồn nhân lực cho pha kiểm thử khá tốn kém Muốn đảm bảo chất lượng phầnmềm (đặc biệt với dự án lớn) thì chi phí nguồn nhân lực càng cao Do đó, vấn đề quản

lí khối lượng nguồn nhân lực trở nên phức tạp và rắc rối Các thống kê cho thấy chiphí pha kiểm thử có thể chiếm tới 40%-60% tổng chi phí phát triển dự án phần mềm[25] Các phần mềm hệ thống, phần mềm doanh nghiệp, v.v đều đòi hỏi chấtlượng cao nên pha kiểm thử luôn được chú trọng và không thể bỏ qua Hơnnữa, mỗi khi phần mềm được nâng cấp thì quá trình kiểm thử được tiến hànhlại dẫn đến chi phí đã cao nay càng cao hơn

1.4 Thách thức trong kiểm thử phần mềm

Tồn tại các ý tưởng không đúng về kiểm thử như: Có thể kiểm thử phần mềm

đầy đủ, nghĩa là đã vét cạn mọi hoạt động kiểm thử cần thiết; Có thể tìm tất cả lỗi nếu

kỹ sư kiểm thử làm tốt công việc của mình; Tập các ca kiểm thử tốt phải chứa rấtnhiều ca kiểm thử để bao phủ rất nhiều tình huống; Ca kiểm thử tốt luôn là ca kiểmthử có độ phức tạp cao; Tự động kiểm thử có thể thay thế kỹ sư kiểm thử để kiểm thửphần mềm một cách tốt đẹp; Kiểm thử phần mềm thì đơn giản và dễ dàng Ai cũng cóthể làm, không cần phải qua huấn luyện

Trang 29

Ngoài ra, việc kiểm thử còn gặp nhiều hạn chế bao gồm: Không thể chắc là

các đặc tả phần mềm đều đúng 100%; Không thể chắc rằng hệ thống hay công cụkiểm thử là đúng; Không có công cụ kiểm thử nào thích hợp cho mọi phần mềm; Kỹ

sư kiểm thử không chắc rằng họ hiểu đầy đủ về sản phẩm phần mềm; Không bao giờ

có đủ tài nguyên để thực hiệm kiểm thử đầy đủ phần mềm; Không bao giờ chắc rằng

ta đạt đủ 100% hoạt động kiểm thử phần mềm

1.5 Thực thi biểu trưng

1.5.1 Tổng quan về thực thi biểu trưng

Trong khoa học máy tính, thực thi biểu trưng là một phương tiện để phân tíchmột chương trình để xác định đầu vào nào gây ra mỗi phần của chương trình để thựcthi Một bộ biên dịch theo chương trình, giả sử nhận các giá trị biểu trưng cho các đầuvào thay vì nhận các đầu vào cụ thể như thực thi bình thường của chương trình Do

đó, các biểu thức theo các biến biểu trưng được truyền cho các biểu thức và biến trongchương trình cũng như các ràng buộc về các biểu trưng đó cho các kết quả có thể cócủa mỗi nhánh có điều kiện

Lịch sử hình thành và phát triển thực thi biểu trưng:

1976: Một hệ thống để tạo dữ liệu thử nghiệm và thực hiện các chương trìnhmột cách biểu trưng (Lori Clarke)

1976: Thực thi biểu trưng và thử nghiệm chương trình (James King)

2005-nay: thực hiện biểu trưng thực tế

Một ví dụ về thực thi biểu trưng như sau:

Trang 30

Trong ví dụ này, khi thực thi theo cách thông thường, các giá trị rời rạc sẽ đượcđọc và gán cho y Việc thực thi sau đó sẽ tiến hành nhân và nhánh có điều kiện, sẽđánh giá thành sai và in OK.

Với quá trình thực thi biểu trưng, chương trình đọc một giá trị biểu trưng (ví dụ làλ) và gán nó cho y Chương trình sau đó sẽ tiến hành nhân và gán λ * 2 cho z Khi đạt đếncâu lệnh if, nó sẽ đánh giá λ * 2 == 12 Tại thời điểm này của chương trình, có thể nhậnbất kỳ giá trị nào và do đó việc thực thi biểu trưng có thể tiến hành dọc theo cả hai nhánh,bằng cách "rẽ" hai đường dẫn Mỗi đường dẫn được gán một bản sao của trạng tháichương trình theo lệnh rẽ nhánh cũng như ràng buộc đường dẫn Trong ví dụ này, ràngbuộc đường dẫn là λ * 2 == 12 cho nhánh sau đó và λ * 2! = 12 cho nhánh khác Cả haiđường dẫn có thể được thực hiện một cách biểu trưng độc lập Khi các đường dẫn chấmdứt (ví dụ, do thực thi fail () hoặc đơn giản là thoát), thực thi biểu trưng sẽ tính một giá trị

cụ thể cho λ bằng cách giải quyết các ràng buộc đường dẫn tích lũy trên mỗi đường dẫn.Các giá trị cụ thể này có thể được coi là trường hợp kiểm thử cụ thể có thể, ví dụ, giúpcác nhà phát triển tái tạo lỗi Trong ví dụ này, bộ giải ràng buộc sẽ xác định rằng để đạtđược câu lệnh fail (), λ sẽ cần bằng 6

Một chương trình P có thể xem xét như một hàm, P : S→ R , trong đó S là tập hợpcác đầu vào (input) có thể và R là tập hợp các đầu ra (output) có thể S có thể được biểudiễn bởi vector I=(x1,…,xk,…,xn), trong đó xk là tham số đầu vào thứ k của P với k  N.Một bộ giá trị i=(d1, ,dk,…,dn) biểu thị cho một đầu vào của P, i  S, trong đó dk là cácgiá trị cụ thể sao cho dk  Dxk với Dxk là miền giá trị của tham số đầu vào xk Sự thực thicủa chương trình P với đầu vào i  S được biểu thị bởi P(i)

Biểu đồ luồng điều khiển (CFG) của một chương trình P là một bộ G=(N, E, s, e),trong đó G là một đồ thị có hướng, với N là tập hợp các nút (node), E = {(n,m) | n,m

 N} là tập hợp các cạnh, s là nút vào và e là nút ra, s và e là duy nhất Mỗi nút được

định nghĩa như một khối cơ bản (basic block) là một dãy liên tục các chỉ thị (câu

lệnh) sao cho luồng điều khiển khi đi vào nút và ra khỏi nút không bị ngưng lại(halt) Điều này có nghĩa là nếu bất cứ câu lệnh nào của block được thực thi thìtoàn bộ block được thực thi Mỗi cạnh của CFG nối 2 nút với nhau và được gánnhãn với một biểu thức

điều kiện rẽ nhánh Nếu cạnh không được gán nhãn có nghĩa là điều kiện luôn đúng

Một đường đi (path) cụ thể là dãy các nút: p=(p1, p2,…,pn) với pn là nút cuốicủa đường đi p và (pi,pi+1)  E (1 < i < n-1) Nếu tồn tại i  S sao cho sự thực thi P(i)

Trang 31

đi theo đường đi p thì p gọi là đường đi khả thi, ngược lại p là đường đi không khả thi.Một đường đi bắt đầu tại nút vào và kết thúc tại nút ra gọi là đường đi đầy đủ, nếu kếtthúc tại nút không phải là nút ra thì gọi là đường đi không đầy đủ (path segment).Một chương trình P cũng có thể xem gồm tập hợp các câu lệnh (statements) làthành phần nhỏ nhất trong một chương trình mà có thể được thực thi riêng rẽ Bằngviệc thực thi một câu lệnh chương trình có thể chuyển đổi trạng thái thực thi của nó từtrạng thái hiện thời tới trạng thái mới Một đường đi thực thi của chương trình P làmột dãy các câu lệnh mà có thể được thực thi theo thứ tự từ điểm bắt đầu của chươngtrình Đoạn đường đi đầu tiên (path prefix) có độ dài n của đường đi thực thi p là mộtdãy bao gồm n câu lệnh đầu tiên của p.

Do đó việc sinh dữ liệu kiểm thử cho chương trình là việc sinh một tập hợp tốithiểu các đầu vào i Є S sao cho có thể thực thi tất cả các đường đi trong CFG củachương trình được kiểm thử

Một vài hạn chế của thực thi biểu trưng gồm:

Bùng nổ đường đi: Biểu trưng thực hiện tất cả các đường dẫn chương trình khả thikhông mở rộng ra các chương trình lớn Số lượng đường dẫn khả thi trong một chươngtrình tăng theo cấp số nhân với sự gia tăng kích thước chương trình và thậm chí có thể là

vô hạn trong trường hợp các chương trình có các vòng lặp không giới hạn

[25] Các giải pháp cho vấn đề bùng nổ đường dẫn thường sử dụng phươngpháp phỏng đoán để tìm đường dẫn để tăng độ bao phủ mã [26] giảm thời gianthực hiện bằng cách song song các đường dẫn độc lập [27] hoặc bằng cách hợpnhất các đường dẫn tương tự [28]

Hiệu quả phụ thuộc vào chương trình: Thực thi biểu trưng được sử dụng để lýgiải về đường dẫn chương trình, đó là một lợi thế so với lý do về đầu vào của chươngtrình như các mô hình kiểm thử khác sử dụng (ví dụ: phân tích chương trình động).Tuy nhiên, nếu ít đầu vào đi theo cùng một đường dẫn qua chương trình, thì sẽ có rất

ít tiết kiệm so với việc kiểm tra riêng từng đầu vào

Bí danh bộ nhớ: Việc thực thi biểu trưng khó hơn khi cùng một vị trí bộ nhớ cóthể được truy cập thông qua các tên khác nhau (bí danh) Bí danh không thể luôn luônđược nhận dạng tĩnh, do đó, công cụ thực thi biểu trưng không thể nhận ra rằng mộtthay đổi đối với giá trị của một biến cũng thay đổi biến khác [29]

Mảng: Vì một mảng là một tập hợp của nhiều giá trị riêng biệt, nên thực thibiểu trưng phải coi toàn bộ mảng là một giá trị hoặc coi mỗi phần tử mảng là một vị

Trang 32

trí riêng biệt Vấn đề với việc xử lý riêng từng phần tử mảng là một tham chiếu như

"A [i]" chỉ có thể được chỉ định động, khi giá trị cho i có giá trị cụ thể [29]

Việc thực thi biểu trưng đã được triển khai ở cấp độ ngôn ngữ trung gian - đángchú ý là KLEE, hoạt động ở cấp độ LLVM IR Một trình biên dịch IR có sức mạnh trongngành như LLVM, trình bày các ưu điểm và nhược điểm để thực thi biểu trưng, xuất phát

từ độ chính xác cao với các tính năng ngôn ngữ và nền tảng đích được tính đến (ví dụ:hành vi không xác định, các quy ước gọi, v.v.) Độ chính xác này cho phép một công cụthực thi mang tính biểu trưng để phát hiện các lỗi cấp thấp, nhưng cũng tăng thêm độphức tạp, về mặt thời gian chạy, tính năng bổ sung và bảo trì mã Ngược lại, sự đơn giản

về cú pháp và ngữ nghĩa của Boogie làm cho nó trở thành một nền tảng lý tưởng đểnghiên cứu ban đầu sự kết hợp giữa thực thi biểu trưng với các phân tích khác và thiết kếcác tối ưu hóa mới để thực thi biểu trưng hiệu quả hơn

Tương tác môi trường

Các chương trình tương tác với môi trường của chúng bằng cách thực hiện cáccuộc gọi hệ thống, nhận tín hiệu, v.v Các vấn đề về tính nhất quán có thể phát sinh khithực thi đến các thành phần không được kiểm soát bởi công cụ thực thi biểu trưng(kernel hoặc thư viện) Hãy xem xét ví dụ sau:

Trang 33

thống trong kernel và nằm ngoài sự kiểm soát của công cụ thực thi biểu trưng Cáccách tiếp cận chính để giải quyết thách thức này là:

Thực thi gọi đến môi trường một cách trực tiếp: Ưu điểm của phương pháp này

là đơn giản để thực hiện Nhược điểm là các tác dụng phụ của các cuộc gọi như vậy sẽlàm tắc nghẽn tất cả các trạng thái được quản lý bởi công cụ thực thi biểu trưng Trong

ví dụ trên, hướng dẫn ở dòng 11 sẽ trả về "một số dữ liệu khác dữ liệu khác" hoặc

"một số dữ liệu khác" tùy thuộc vào thứ tự tuần tự của các trạng thái

Mô hình hóa môi trường: Trong trường hợp này, động cơ sẽ gọi hệ thống với

một mô hình mô phỏng hiệu ứng của chúng và giữ tất cả các tác dụng phụ trong lưutrữ theo trạng thái Ưu điểm là người ta sẽ nhận được kết quả chính xác khi thực hiệncác chương trình tương tác với môi trường Nhược điểm là người ta cần thực hiện vàduy trì nhiều mô hình gọi hệ thống phức tạp Các công cụ như KLEE [30], Cloud9 vàOtter [12] thực hiện phương pháp này bằng cách triển khai các mô hình cho các hoạtđộng của hệ thống tệp, ổ cắm, IPC, v.v

Phân nhánh toàn bộ trạng thái hệ thống: Các công cụ thực thi biểu trưng dựa

trên các máy ảo giải quyết vấn đề môi trường bằng cách loại bỏ toàn bộ trạng thái

VM Cách tiếp cận này làm giảm nhu cầu viết và duy trì các mô hình phức tạp và chophép hầu như bất kỳ nhị phân chương trình nào được thực thi một cách biểu trưng.Tuy nhiên, nó có tổng phí sử dụng bộ nhớ cao hơn

Cách thực hiện thực thi biểu trưng qua một ví dụ đầy đủ:

Hình 1.7 Ví dụ về ý tưởng thực hiện cụ thể của thực thi biểu trưng

Khi x và y được đưa các đầu vào mang tính biểu trưng (Hình 1.7) QTKT thực hiện như sau:

i Thực hiện chương trình trên các giá trị biểu trưng

ii Trạng thái biểu trưng ánh xạ các biến thành giá trị biểu trưng

Trang 34

iii Điều kiện đường dẫn (PC) là một công thức logic trên các đầu vào biểu trưng

mã hóa tất cả các quyết định nhánh được thực hiện cho đến nay

iv Tất cả các đường dẫn trong chương trình tạo thành cây thực thi của nó, trong đómột số đường dẫn là khả thi (feasible) và một số đường dẫn là không khả thi

(infeasible)

Ứng dụng của thực thi biểu trưng:

Thực thi biểu trưng được sử dụng rộng rãi trong thực tế Các công cụ dựa trênthực thi biểu trưng đã tìm thấy các lỗi nghiêm trọng và lỗ hổng bảo mật trong các hệthống khác nhau như các hệ thống máy chủ mạng, hệ thống tập tin, trình điều khiểnthiết bị, tiện ích Unix, thị giác máy vv

Thực thi Concolic: Kết hợp cả thực thi biểu trưng và thực thi cụ thể (bình

thường) Ý tưởng cơ bản là để thực thi cụ thể định hướng thực thi biểu trưng Ở đây,chương trình chạy như bình thường (nó cần được cung cấp một số đầu vào), nhưngngoài ra nó cũng duy trì thông tin biểu trưng thông thường

Thực thi biểu trưng so với diễn giải trừu tượng:

Có phải Thi hành biểu trưng là một ví dụ của Giải thích trừu tượng? Chẳnghạn, SE có phải là một trình thông dịch trừu tượng trên miền trừu tượng của công thứclogic, nơi chúng ta không thực hiện các phép nối?

Thực thi biểu trưng là một kỹ thuật phổ biến để phân tích các chương trình lớnhoàn toàn tự động, dựa vào các bộ giải SMT

• Để chấm dứt, có thể cần các vòng lặp ràng buộc dẫn đến gần đúng

• Để xử lý các ràng buộc phi tuyến tính và môi trường bên ngoài,trộn lẫn việc thực thi cụ thể và thực thi biểu trưng (được gọi là thực thi đồngthời) cũng dẫn đến sự gần đúng

1.5.2 Thực thi biểu trưng tĩnh

Ý tưởng chính của thực thi biểu trưng [31] là thực thi chương trình với các giá trị biểu trưng thay vì các giá trị cụ thể của các tham số đầu vào.Với mỗi tham số đầu vào một giá trị biểu trưng được đưa ra để kết hợp với nó.Mỗi biến trong chương trình P mà giá trị của nó phụ thuộc vào giá trị của các tham sốđầu vào thì trong quá trình thực thi biểu trưng một giá trị biểu trưng sẽ được tính toán

để kết hợp cùng với nó Mỗi giá trị biểu trưng biểu thị cho một tập hợp các giá trị cụthể mà một biến hoặc một tham số đầu vào có thể nhận Kết quả trả về của một

Trang 35

chương trình được thực thi tương trưng nếu có cũng được biểu thị bởi biểu thức củacác giá trị biểu trưng.

Giá trị biểu trưng của biến x có thể được biểu thị bởi:

(a) Một ký hiệu đầu vào

(b) Một biểu thức kết hợp giữa các giá trị biểu trưng bởi các toán tử,

(c) Một biểu thức kết hợp giữa giá trị biểu trưng và giá trị cụ thể bởi toán tử Một

ký hiệu đầu vào biểu thị cho giá trị biểu trưng của một tham số đầu vào lúc

bắt đầu thực thi chương trình Các tham số đầu vào khác nhau của P được biểu thị bởicác ký hiệu đầu vào khác nhau Các toán tử là các phép toán như cộng (+), trừ (),nhân (*), chia (/)

Nếu giá trị của một biến x không phụ thuộc vào các giá trị đầu vào thì không

có giá trị biểu trưng nào được tính toán để kết hợp với nó Giá trị biểu trưng của cácbiến và các tham số đầu vào được cập nhật như các giá trị cụ thể của nó trong quátrình thực thi

Trạng thái của một chương trình được thực thi tượng trưng bao gồm các giá trịcủa các biến trong chương trình, điều kiện đường đi (Path Condition - PC) và biếnđếm chương trình Biến đếm chương trình xác định chỉ thị (câu lệnh) tiếp theo sẽ đượcthực thi Mỗi PC là một biểu thức kết hợp bởi các ràng buộc mà các giá trị đầu vàochương trình cần thỏa mãn để chương trình được thực thi theo đường đi tương ứng với

PC đó Mỗi ràng buộc là một biểu thức biểu trưng dạng x*y trong đó x là giá trị biểutrưng , y là giá trị biểu trưng hoặc giá trị cụ thể và * là một trong các phép toán ≤, ≠,

=, <, >, ≥ Các ràng buộc đó chính là biểu thức của điều kiện rẽ nhánh và biểu thứcphủ định của điều kiện rẽ nhánh tương ứng với nhánh true và nhánh false Tại mỗi câulệnh rẽ nhánh, các ràng buộc được tạo ra Các ràng buộc này được biểu thị bởi biểuthức của các giá trị biểu trưng hay biểu thức của giá trị biểu trưng và giá trị cụ thể phụthuộc vào biến xuất hiện trong biểu thức điều kiện của câu lệnh rẽ nhánh có giá trịbiểu trưng được tính toán để kết hợp với nó hay không

Trong quá trình thực thi biểu trưng, việc chương trình được thực thi theo mộtđường đi cụ thể nào đó không phụ thuộc vào các giá trị cụ thể của các biến và cáctham số đầu vào Tại các điểm rẽ nhánh, cả hai nhánh ra sẽ được xem xét để điềuhướng sự thực thi hiện thời đi theo SE chủ yếu liên quan tới việc thực thi hai loại câulệnh đó là câu lệnh gán và câu lệnh rẽ nhánh Tại các câu lệnh gán thì giá trị biểu

Trang 36

trưng của các biến chương trình cũng như các tham số đầu vào có liên quan tới câulệnh gán đó được cập nhật Tại các câu lệnh rẽ nhánh, chương trình sẽ được điềuhướng để thực thi theo cả hai nhánh Và hai ràng buộc đường đi tương ứng với hainhánh sẽ được tạo ra Một ràng buộc là biểu thức điều kiện tại câu lệnh rẽ nhánh Cònràng buộc kia là phủ định của biểu thức điều kiện rẽ nhánh Các ràng buộc này sẽđược cập nhật vào điều kiện đường đi tương ứng với các nhánh đó Đồng thời các PCnày sẽ được đánh giá để xác định đường đi tương ứng với PC đó có khả thi Nếu PCđược đánh giá trở thành false thì SE sẽ quay lui và chỉ thực thi theo nhánh khả thi Các

PC được tạo ra bằng cách thu gom các ràng buộc trên các đường đi tương ứng và giảiquyết các ràng buộc này sẽ sinh ra các giá trị cụ thể cho các tham số đầu vào

Để mô tả sự thực thi biểu trưng một chương trình Một cây thực thi biểu trưng(Symbolic Execution Tree - SET) được đưa ra để biểu thị cho các đường đi thực thitrong quá trình thực thi biểu trưng một chương trình Các nút biểu thị cho các trạngthái của chương trình được thực thi biểu trưng và các cạnh biểu thị cho sự chuyển đổitrạng thái từ trạng thái này sang trạng thái khác

public void Swap(int x, int y){

}

Hình 1.8 Cây thực thi biểu trưng

Trang 37

Cây thực thi biểu trưng (Hình 1.8) biểu thị cho việc thực thi biểu trưng hàm Swap.Bắt đầu thực thi biểu trưng hàm Swap bằng cách gán giá trị biểu trưng cho các tham sốđầu vào x và y lần lượt là X và Y, đồng thời khởi tạo PC là true Tới câu lệnh rẽ nhánh 1,

cả hai nhánh đi của chương trình đều chọn để thực thi với các giá trị biểu trưng Tại câulệnh này, biểu thức điều kiện rẽ nhánh và biểu thức phủ định của điều kiện rẽ nhánh đượcthêm vào PC theo các nhánh tương ứng Trong thực thi biểu trưng

, nếu điều kiện rẽ nhánh được thêm vào PC thì PC đó tương ứng với PC củanhánh mà điều kiện rẽ nhánh nhận giá trị true Sau khi thực thi câu lệnh 1, hàmSwap tiếp tục được thực thi theo nhánh mà điều kiện rẽ nhánh ở câu lệnh 1nhận giá trị true Khi thực thi các câu lệnh gán 2, 3, 4 thì giá trị của các biếnđược cập nhật với giá trị mới Khi tới câu lệnh rẽ nhánh 5, thêm hai nhánh đimới được xem xét để thực thi với các giá trị biểu trưng PC tiếp tục được cậpnhật theo các nhánh tương ứng

Tại đây, PC được cập nhật với điều kiện rẽ nhánh ở 5 trở thành false do khôngtồn tại bộ giá trị nào thỏa mãn PC Vì vậy hàm Swap chỉ thực thi theo nhánh mà PCđược cập nhật với biểu thức phủ định của điều kiện rẽ nhánh tại 5 Và câu lệnh 6 sẽkhông bao giờ được thực thi

Tại mỗi điểm rẽ nhánh, PC được cập nhật và một bộ xử lý ràng buộc được sửdụng để xác định nhánh tương ứng với PC đó có khả thi hay không để điều hướngviệc thực thi hiện thời đi theo nhánh đó Nếu PC được đánh giá tới false thì SE sẽquay lui và chỉ thực thi chương trình theo nhánh mà PC được đánh giá tới true

1.5.3 Thực thi biểu trưng động

Thực thi biểu trưng động [32, 33] là kỹ thuật thực thi tượng trưng dựa trênphân tích chương trình động Thực thi biểu trưng động chính là sự kết hợp giữa thựcthi các giá trị cụ thể và thực thi với các giá trị biểu trưng Trong thực thi biểu trưngđộng, chương trình được thực thi nhiều lần với những giá trị khác nhau của tham sốđầu vào

Bắt đầu bằng việc chọn những giá trị tùy ý cho các tham số đầu vào và thực thichương trình với những giá trị cụ thể đó Với những giá trị cụ thể này thì chương trình

sẽ được thực thi theo một đường đi xác định Thực thi chương trình với các giá trị cụthể của tham số đầu vào và thu gom các ràng buộc trong quá trình thực thi theo đường

đi mà sự thực thi cụ thể này đi theo, đồng thời suy ra các ràng buộc mới từ những ràngbuộc đã thu gom được

Trang 38

Tại các câu lệnh rẽ nhánh, biểu thức điều kiện rẽ nhánh sẽ được đánh giá phụthuộc vào các giá trị cụ thể của các tham số đầu vào Nếu biểu thức điều kiện rẽ nhánhnhận giá trị là true thì biểu thức của điều kiện rẽ nhánh sẽ được thu gom vào ràngbuộc của PC và được ghi nhớ, đồng thời phủ định của điều kiện rẽ nhánh sẽ được sinh

ra và được thêm vào một PC tương ứng với nhánh còn lại mà sự thực thi cụ thể đókhông đi theo Một bộ xử lý ràng buộc sẽ được sử dụng để giải quyết các ràng buộcmới sinh ra này để sinh ra các giá trị cụ thể của tham số đầu vào Ngược lại, nếu làfalse thì biểu thức phủ định của điều kiện rẽ nhánh sẽ được thu gom vào ràng buộccủa PC tương ứng với nhánh đi mà sự thực thi hiện thời đang đi theo và được ghi nhớ.Đồng thời điều kiện rẽ nhánh sẽ được sinh ra và thêm vào PC tương ứng với nhánh đicòn lại mà sự thực thi hiện thời không đi theo Các giá trị mới được sinh ra của cáctham số đầu vào sẽ tiếp tục được thực thi và quá trình này sẽ được lặp lại cho tới khichương trình được thực thi theo tất cả các đường đi

Do các chương trình được thực thi với những giá trị cụ thể nên có thể thấy rằngtất cả các đường đi phân tích được trong quá trình thực thi biểu trưng động đều là cácđường đi khả thi

Các bước thực hiện thuật toán thực thi biểu trưng động với các thông tin đầuvào bao gồm :

S : Tập hợp tất cả các câu lệnh của chương trình P

s : Tập con của S (s S)

I : Tập hợp các đầu vào của P

P(i): Thực thi chương trình với đầu vào i  I, sao cho s được thực thi

J : Tập hợp các đầu vào của P được thực thi (J={i | P(i)})

C(i): Ràng buộc thu gom được từ việc thực thi P(i), hay còn gọi là điều kiện đường đi

C‟(i): Điều kiện đường đi suy ra từ C(i)

Trang 39

Bước 5: Quay lại bước 1

đó thực thi hàm DSE với giá trị null này Khi tới câu lệnh rẽ nhánh 2, điều kiệna==null được thỏa mãn do đó ràng buộc C(i):(a==null) được ghi nhớ Ràng buộc C‘(i)được suy ra bằng cách lấy phủ định của điều kiện rẽ nhánh, C‘(i): (a!=null) Solve(C‘(i)) suy ra được a={}

Tiếp tục thực thi chương trình với giá trị a={} Với a={} khi tới câu lệnh rẽnhánh 3, biểu thức a.length > 0 nhận giá trị false, ràng buộc C(i): (a!=null) && !(a.length >0) được ghi nhớ Ràng buộc C‘(i):(a!=null && a.length > 0) được sinh ra,solve (C‘(i)) ta được giá trị mới của tham số đầu vào là {0}

Tiếp tục thực thi hàm DSE với giá trị a={0} Với giá trị a={0} khi đi tới câulệnh rẽ nhánh 4, thì biểu thức điều kiện rẽ nhánh nhận giá trị false đo đó ràng buộcC‘(i):( a!=null && a.length>0 && a[0]!=123456789) được ghi nhớ Điều kiện C‘(i):(a!=null && a.length>0 && a[0]==123456789) được sinh ra, solve (C‘(i)) ta được giátrị a={12345678} Đến đây thì không còn đường đi nào của hàm DSE mà chưa đượcthực thi và qua trình thực thi sẽ được dừng lại

Bảng 1.1 Ví dụ về thực thi biểu trưng động

Ràng buộc C’(i) Input i Ràng buộc được ghi nhớ

C(i)

a!=null {} a!=null && !(a.length>0)

a!=null&& a.length>0 {0} a!=null && a.length>0

&& a[0]!=123456789

Trang 40

a!=null && a.length>0

{123456789} a!=null && a.length>0

&& a[0]!=123456789 && a[0]!=123456789

Một số hệ thống kiểm thử tự động cài đặt DSE bằng cách khởi tạo một câythực thi tượng trưng để biểu thị các đường đi thực thi khác nhau Nếu như có thể xâydựng được một cây thực thi biểu trưng đầy đủ thì có thể sinh ra các giá trị đầu vào saocho có thể đạt được sự bao phủ luồng điều khiển (CFG coverage) [34] ở mức cao

Với những hệ thống này, mã nguồn chương trình cần được sửa đổi để cho phépthực thi biểu trưng được thực hiện dọc theo việc thực thi cụ thể Chương trình đượcthực thi với những giá trị ngẫu nhiên với một chiều sâu (depth) định trước của SET.Chiều sâu được sử dụng để giúp cho việc thực thi một chương trình được dừng lạitrong trường hợp chương trình có vòng lặp vô tận hoặc các hàm đệ quy Khi chươngtrình bắt đầu được thực thi thì một cây thực thi tương trưng tương ứng cũng được khởitạo Trong quá trình thực thi, các giá trị biểu trưng của các biến sẽ đươc tính toán vàcác ràng buộc đường đi sẽ được sinh ra từ các giá trị biểu trưng đó Với mỗi ràng buộcđược sinh ra thì SET sẽ được thêm vào một đỉnh (node) tương ứng với ràng buộc đó.Việc xây dựng SET tiến hành trong suốt quá trình thực thi Có thể xem mỗi lần thựcthi là mỗi lần duyệt một đường đi của SET

Khi các câu lệnh rẽ nhánh được thực thi, các đường đi trong SET cũng được mởrộng theo các nhánh đó Với những giá trị cụ thể việc thực thi sẽ đi theo một nhánh cụthể Nhánh còn lại mà sự thực thi cụ thể đó không đi theo sẽ có một đỉnh mới được tạo ra

và được đánh dấu là chưa được thăm Đỉnh mới được tạo ra sẽ lưu các ràng buộc tươngứng với nhánh mà đỉnh đó được thêm vào Sau mỗi lần thực thi, một đỉnh chưa đượcthăm trong SET sẽ được chọn Ràng buộc đường đi tương ứng với đoạn đường đi từ nútgốc của SET tới đỉnh được chọn đó sẽ được thu gom và được đưa tới một bộ giải ràngbuộc để xử lý Nếu ràng buộc đường đi này không thỏa mãn, một đỉnh chưa được thămkhác của SET sẽ được chọn, còn nếu ràng buộc đường đi này thỏa mãn thì bộ xử lý ràngbuộc sẽ sinh ra các giá trị đầu vào cụ thể cho lần thực thi tiếp theo Khi các đỉnh tươngứng với các nhánh trong SET đều được thăm hết thì thuật toán sẽ tạm dừng Và các giá trịđầu vào cụ thể được sinh ra cùng với những thông tin phân tích được trong mỗi lần thựcthi sẽ được sử dụng để sinh ra các UT và cho mục đích báo cáo Các giá trị đầu vào cụ thểđược trả về sau mỗi lần chạy được

Định dạng
Số trang	105
Dung lượng	1,15 MB