Với một chương trình phần mềm đã sử dụng trong thời gian dài, nó có thể gặpphải các vấn đề như ngôn ngữ lập trình không còn được sử dụng, thiếu các công cụ hỗ trợ cần thiết, không đáp ứn
Trang 1HỌC VIỆN THUẬT MẬT MÃ Khoa Công Nghệ Thông Tin
Trang 2Lời nói đầu 4
1.1 Bảo trì hệ thống phần mềm 5 1.2 Tổng quan chung về tái kỹ nghệ 6 1.3 Qui trình chung tái kỹ nghệ phần mềm 10
1.3.1 Dịch mã nguồn 11
1.3.2 Kỹ nghệ ngược 12
1.3.2.1 Làm lại tài liệu 15
1.3.2.2 Phục hồi thiết kế 15
1.3.3 Cấu trúc lại hệ thống 16
1.3.4 Module hóa chương trình 18
1.3.5 Tái kỹ nghệ dữ liệu 19
1.4 Các công cụ sử dụng cho tái kỹ nghệ 22
1.4.1 Ngôn ngữ UML 22
1.4.2 Hệ thống phần mềm RATIONAl ROSE 25
1.4.3 Tái kỹ nghệ hệ thống với kỹ nghệ đảo ngược của Rational Rose 29
1.5 Những ưu điểm và hạn hế của tái kỹ nghệ 30
1.5.1 Các ưu điểm 30
1.5.2 Các hạn chế 30
1.6 Kết luận 31 Chương 2: Bài toán về chương trình “Sổ địa chỉ” 32 2.1 Giới thiệu chương trình sổ địa chỉ 32 2.1.2 Những vấn đề cần cải tiến chương trình 33 Chương 3: Tái kỹ nghệ chương trình sổ địa chỉ 35 3.1 Sơ đồ tiến trình thực hiện tái kỹ nghệ 35 3.2 Qui trình thực hiện tái kỹ nghệ chương trình sổ địa chỉ 35 3.2.1 Xây dựng tài liệu và mô hình thiết kế UML 35
3.2.2 Cấu trúc lại chương trình 36
3.2.3 Tái kỹ nghệ dữ liệu 40
3.2.4 Xây dựng mã nguồn 42
3.2.5 Hoàn thiện, cài đặt và sử dụng 44
3.3 Kết quả đạt được và một số đánh giá 45
Trang 33.3.1 Liên quan đến chương trình 45 3.3.2 Liên quan đến triển khai 46
3.3.3 Một số vấn đề tồn tại 46
Trang 4Lời nói đầu
Ngày nay, chúng ta đang sống trong một kỉ nguyên của công nghệ thông tin.Với sự bùng nổ của công nghệ thông tin, sự hỗ trợ của máy tính cho các hoạtđộng của con người ngày càng trở nên cần thiết hơn bao giờ hết Để đáp ứngnhững nhu cầu thiết yếu này, các phần mềm phục vụ con người ngày càng phổbiến hơn, số lượng lớn hơn và được nâng cấp để có chất lượng tốt hơn Tuynhiên, cùng với xu hướng phát triển của phần mềm, các hệ thống phần cứng, cácchương trình hỗ trợ cũng như các môi trường phát triển, hay các qui trình nghiệp
vụ cũng luôn đổi mới với tốc độ không ngừng Ngày hôm nay, một hệ thống cóthể là hiện đại, tối tân nhưng đến ngày mai nó đã trở nên lạc hậu và còn có thểkhông dùng được nữa Trước sự thay đổi nhanh chóng của các công cụ, môitrường hỗ trợ này, các phần mềm cũ có nguy cơ bị bỏ đi Vậy phải làm sao đểgiải quyết vấn đề này khi mà số lượng các phần mềm cũ ngày càng lớn? Nhiềugiải pháp được đưa ra cho việc bảo trì phần mềm
Bảo trì phần mềm chính là một giai đoạn trong quy trình tiến hóa phần mềm.Đây là giai đoạn có chi phí tốn kém nhất, như ta đã biết, nó chiếm đến 70%trong tổng chi phí phát triển phần mềm Tuy nhiên, nếu chúng ta thực hiện pháttriển mới phần mềm thì chi phí bỏ ra còn lớn hơn rất nhiều Cho nên một yêucầu được đặt ra là phải lựa chọn một phương pháp bảo trì phần mềm sao cho cóhiệu quả cao và giảm thiểu các rủi ro
Với một chương trình phần mềm đã sử dụng trong thời gian dài, nó có thể gặpphải các vấn đề như ngôn ngữ lập trình không còn được sử dụng, thiếu các công
cụ hỗ trợ cần thiết, không đáp ứng đủ yêu cầu của người dùng v.v… Vì vậy, để
có thể tiếp tục sử dụng được hệ thống phần mềm, ta thực hiện quá trình bảo trìcần phải có biện pháp xây dựng, cấu trúc lại những phần chương trình đã trở nênlạc hậu và không dùng được nữa Và một phương pháp rất phổ biến và hiệu quảcủa ngày nay, đó chính là tái kỹ nghệ lại hệ thống phần mềm
Tái kỹ nghệ là một phương pháp tiến hóa phần mềm có hiệu quả cao trong khichi phí bỏ ra ít hơn nhiều so với việc xây dựng mới phần mềm cũng như so vớimột số phương pháp tiến hóa khác Có được điều này bởi quy trình tái kỹ nghệđược hỗ trợ bởi các công cụ và phương tiện mới với một quy trình khép kín kháhoàn thiện và đầy đủ Một số công cụ hỗ trợ cho việc tái kỹ nghệ phần mềm nhưngôn ngữ mô hình hóa thống nhất UML, Rational Software Architecture,Rational Rose v.v… Trong phạm vi đề tài này, chúng em sẽ sử dụng hai công cụ
hỗ trợ cho việc tái kỹ nghệ là ngôn ngữ UML và Rational Software Architecture.Cùng với việc tìm hiểu về quy trình tái kỹ nghệ, để có thể hiểu sâu hơn các bướcthực hiện của quy trình, ta sẽ thực hiện tái kỹ nghệ cho một chương trình đơn
giản là: Sổ địa chỉ
Trang 5Chương 1: Tổng quan về tái kỹ nghệ
Sau một thời gian sử dụng, các phần mềm cần phải được bảo trì để đáp ứngcác yêu cầu phát sinh của người sử dụng, của công nghệ mới, và sự thay đổi củacác hoạt động nghiệp vụ theo thời gian đúng theo nghĩa vòng đời của một hệthống phần mềm, ta lại bắt đầu các công việc: phân tích, thiết kế, cài đặt, kiểmthử ở mức cao hơn Như vậy, việc tái sử dụng các phần đó được xây dựngtrước đây có ý nghĩa to lớn cho việc tiết kiệm công sức, thời gian, kinhphí trong hoạt động phát triển
Có nhiều cách thực hiện việc bảo trì hệ thống phần mềm và cũng có nhiềucông cụ để thiết kế lại phần mềm Mỗi công cụ thiết kế lại phần mềm đều cónhững ưu và nhược điểm riêng, tuỳ theo hoàn cảnh thực tế mà ta có thể lựa chọnmột công cụ sao cho hiệu quả nhất Dưới đây sẽ trình bày một số vấn đề về tái
kỹ nghệ hệ thống phần mềm bằng UML (Unified Modeling Language) và công
cụ Rational Rose
1.1 Bảo trì hệ thống phần mềm
Phát triển phần mềm phải trải qua nhiều giai đoạn Các giai đoạn đó baogồm: phân tích yêu cầu, kiến trúc hệ thống, thiết kế, cài đặt, kiểm thử, triển khaiphần mềm và bảo trì Bảo trì chính là giai đoạn cuối trong vòng đời phát triểnphần mềm Bảo trì bảo đảm cho hệ thống được tiếp tục hoạt động sau khi thựchiện kiểm thử hay sau khi đưa hệ thống vào hoạt động trong thực tế Bảo trìphần mềm bao gồm những sửa đổi làm hệ thống thích nghi với những yêu cầuthay đổi của người sử dụng, thay đổi dữ liệu cho phù hợp, gỡ rối, khử bỏ và sửachữa các sai sót mà trước đây chưa phát hiện ra
Ngày nay, việc xây dựng, phát triển cũng như quá trình bảo trì các hệ thốngphần mềm được hỗ trợ nhiều bởi các công cụ, đó là kĩ nghệ phần mềm có máytính trợ giúp (CASE) Công nghệ CASE đang phát triển mạnh mẽ, bao gồm cáccông cụ về: lập kế hoạch quản lý dự án, các công cụ trợ giúp phân tích và thiết
kế, cài đặt hệ thống, tích hợp và kiểm thử, làm bản mẫu …Ở đây chúng ta sẽquan tâm tới một số hoạt động trong quá trình bảo trì phần mềm bằng một sốcông cụ có sẵn
Bảo trì là giai đoạn cuối cùng trong tiến trình kĩ nghệ phần mềm, nó tiêu tốn rấtnhiều thời gian, công sức và kinh phí Tái kỹ nghệ là công nghệ đặc trưng giúpcho việc bảo trì các hệ thống phần mềm hiệu quả và nhanh chóng
Trang 61.2 Tổng quan chung về tái kỹ nghệ
Bản chất của việc tái kỹ nghệ phần mềm là để cải tiến hoặc biến đổi nhữngphần mềm đã có để nó có thể hiểu, điều khiển hay sử dụng được bằng một cáchkhác Ngày nay, số lượng các hệ thống được xây dựng từ đầu đang giảm dần,trong khi đó các hệ thống chúng ta được kế thừa lại ngày càng nhiều Chứcnăng của các hệ thống đó vẫn không đổi nhưng hệ thống phần cứng, các côngnghệ, môi trường làm việc thì ngày một đổi mới Những hệ thống phần mềmđược kế thừa lại đã trở nên lạc hậu, một số cấu trúc chương trình đã không còndùng được nữa do đó nhu cầu tái kỹ nghệ phần mềm được tăng lên đáng kể.Việc tái kỹ nghệ phần mềm trở nên rất quan trọng trong việc phục hồi và tái sửdụng lại những phần mềm hiện có, làm cho chi phí bảo trì phần mềm có thểkiểm soát được và tạo ra cơ sở cho việc tiến hóa phần mềm trong tương lai Thuật ngữ “Tái kỹ nghệ” nhanh chóng trở thành một từ được yêu thíchđối với những nhà quản lý và phát triển phần mềm, nhưng nó thực sự có ý nghĩanhư thế nào đối với họ? Về cơ bản thì tái kỹ nghệ là lấy các phần mềm đượcthừa kế hiện có mà việc bảo trì đối với chúng là rất đắt, hoặc là những thànhphần, kiến trúc của hệ thống đã không dùng được nữa và làm lại nó bằng nhữngcông nghệ phần mềm và phần cứng hiện thời Vấn đề khó khăn ở đây là phải có
sự hiểu biết về những hệ thống đó Thường thì những tài liệu phân tích yêu cầu,tài liệu thiết kế và tài liệu về mã nguồn của chương trình không còn nữa, hoặcnếu còn thì đã quá lỗi thời Vì vậy để hiểu các chức năng không còn sử dụngđược một cách rõ ràng là một điều khó khăn Thường thì hệ thống cũ vẫn baogồm cả những chức năng không cần thiết nữa vì vậy những chức năng nàykhông cần đưa vào hệ thống mới
Vậy thế nào là tái kỹ nghệ? Chikofsky và Cross đã định nghĩa tái kỹ nghệ
là: “ kiểm tra, phân tích, biến đổi hệ thống phần mềm hiện thời để xây dựng lại
thành một hệ thống mới, và bổ sung thêm một số thành phần mới vào trong đó”
(Chikofsky 1990) Định nghĩa này rõ ràng tập trung vào làm sáng tỏ đặc trưngcủa thuật ngữ, các thay đổi của kết quả phần mềm Arnold, đã định nghĩa một
cách khác về tái kỹ nghệ là: “bất kỳ hoạt động nào làm cải tiến sự hiểu biết về
phần mềm, hoặc là hoạt động cải tiến phần mềm và thường tăng khả năng bảo trì, khả năng sử dụng lại, khả năng tiến hóa” (Arnold 1993).
Quy trình tái kỹ nghệ thường là sự kết hợp của nhiều qui trình khác nhaunhư kỹ nghệ ngược, làm lại tài liệu, cấu trúc lại chương trình, chuyển đổi và kỹnghệ xuôi, dịch hệ thống sang một ngôn ngữ lập trình hiện đại hơn Mục đích là
để có cái nhìn rõ hơn về chương trình hiện thời (đặc tả, thiết kế, thực thi), sau
đó tái thực hiện lại để cải thiện các chức năng, hiệu suất, sự thi hành của hệthống Mục tiêu là để duy trì các chức năng hiện có và chuẩn bị cho các chứcnăng mới sẽ được thêm vào sau này Sau khi sửa đổi, các chức năng chính của
Trang 7phần mềm không thay đổi, và thông thường thì cấu trúc của chương trình vẫnđược giữ nguyên như cũ
Đứng từ quan điểm kỹ thuật, tái kỹ nghệ phần mềm chỉ là giải pháp thứhai trong vấn đề phát triển phần mềm sau lựa chọn giải pháp phát triển mới hệthống phần mềm Nguyên nhân là do cấu trúc phần mềm không được nâng cấp
vì thế việc phân phối những hệ thống có tính tập trung là một việc khó Nóthường không thể thay đổi triệt để ngôn ngữ lập trình hệ thống vì hệ thống cũvới ngôn ngữ lập trình thủ tục thì khó có thể chuyển đổi sang những ngôn ngữlập trình hướng đối tượng như Java hay C++ Do đó, những giới hạn cố hữu tồntại trong hệ thống vẫn sẽ duy trì bởi vì chức năng của phần mềm không đượcthay đổi
Tuy nhiên, đứng từ quan điểm nghiệp vụ, tái kỹ nghệ phần mềm là conđường duy nhất có thể đảm bảo rằng một hệ thống cũ vẫn có thể tiếp tục phục
vụ Sẽ là quá đắt và quá rủi ro nếu như chấp nhận một cách tiếp cận khác trongviệc phát triển phần mềm Để hiểu được những lí do cho vấn đề này, chúng ta
sẽ đưa ra một đánh giá sơ bộ về những vấn đề của hệ thống phần mềm cũ Vậy trong trường hợp nào chúng ta nên thực hiện tái kỹ nghệ hệ thống.Câu trả lời là tái kỹ nghệ sẽ có hiệu quả cao nhất khi thực hiện đối với một hệthống cũ được kế thừa lại (legacy system) Một hệ thống cũ được kế thừa lại cóthể là một phương thức, công nghệ đã cũ, một hệ thống máy tính hay mộtchương trình ứng dụng lạc hậu vẫn đang tiếp tục được sử dụng bởi các chứcnăng của nó vẫn đang đáp ứng những nhu cầu của người dùng Tuy nhiên, các
hệ thống này sẽ không có hiệu quả cao do công nghệ đã lạc hậu và các thủ tụchay các nền tảng hỗ trợ đã không còn tồn tại Hơn thế nữa, các hệ thống nàythường không còn các tài liệu đặc tả, phân tích, các mô hình thiết kế Vì vậy, để
có thể xây dựng lại hệ thống cần phải có sự hiểu biết sâu sắc về nó Do đó, tái
kỹ nghệ là lựa chọn tốt nhất trong những trường hợp này
Trang 8
Sự khác biệt then chốt giữa tái kỹ nghệ và phát triển một hệ thống phầnmềm mới chính là điểm xuất phát cho việc phát triển Đối với việc phát triểnmột hệ thống phần mềm mới, công việc sẽ bắt đầu với việc viết một tài liệu đặc
tả cho hệ thống, trong khi đối với tái kỹ nghệ, hệ thống cũ đã đóng vai trò nhưmột bản đặc tả cho hệ thống mới
Hình 1-02: Qui trình tái kỹ nghệ
Hình 1-02 mô tả một qui trình tái kỹ nghệ có khả năng thực hiện được.Đầu vào của qui trình là một chương trình được kế thừa và đầu ra là một phiênbản có các module có cấu trúc rõ ràng của chính chương trình đó Đồng thờicũng như là tái kỹ nghệ chương trình, dữ liệu cho hệ thống cũng có thể được tái
kỹ nghệ lại
Các hoạt động trong qui trình tái kỹ nghệ là:
1 Dịch mã nguồn Chương trình được chuyển đổi từ một ngôn ngữ lập trình
cũ sang một phiên bản mới hơn hoặc chuyển sang một ngôn ngữ khác
2 Kỹ nghệ ngược Chương trình được phân tích và lấy thông tin để làm tàiliệu cho tổ chức và các chức năng của chương trình
3 Cải tiến cấu trúc hệ thống Cấu trúc điều khiển của chương trình đượcphân tích và sửa đổi để giúp cho việc đọc và hiểu được dễ dàng hơn
Trang 94 Module hóa hệ thống Liên kết các phần của chương trình thành mộtnhóm với nhau, và những thành phần riêng biệt, dư thừa được bỏ đi.Trong một vài trường hợp, giai đoạn này có thể bao gồm cả việc biến đổicấu trúc chương trình
5 Tái kỹ nghệ dữ liệu Dữ liệu xử lý bởi chương trình được thay đổi đểphản hồi lại những thay đổi của chương trình
Chi phí của tái kỹ nghệ hiển nhiên được quyết định bởi qui mô công việc cầnphải được tiến hành Chi phí của các phương pháp tiếp cận đến tái kỹ nghệ đượcthể hiện trong hình 1-03 Chi phí tăng từ trái qua phải, vì thế chuyển đổi mãnguồn là lựa chọn rẻ nhất và tái kỹ nghệ chính là một phần của việc chuyểnhướng cấu trúc là cái có chi phí cao nhất
2. Công cụ hỗ trợ có sẵn cho việc tái kỹ nghệ Hoạt động tái kỹ nghệ sẽkhông có chi phí hiệu quả nếu không có các công cụ được sử dụng trong
đó Và Công cụ CASE là một công cụ cần thiết tất yếu cho hoạt động tái
kỹ nghệ vì nó có thể tự động trong việc chuyển đổi chương trình, và vì thếlàm giảm chi phí đáng kể
Trang 103 Phạm vi của chuyển đổi dữ liệu thiết yếu Nếu tái kỹ nghệ phụ thuộc lớnvào khối lượng dữ liệu được chuyển đổi, nó làm tăng đáng kể chi phí của tiếntrình
4 Tính sẵn có của đội ngũ nhân viên chuyên môn Nếu nhân viên chịu tráchnhiệm bảo trì hệ thống không thể tham gia vào qui trình tái kỹ nghệ, điều này
sẽ làm gia tăng chi phí Các kỹ sư tái kỹ nghệ hệ thống sẽ phải mất rất nhiềuthời gian để có thể thực sự hiểu được hệ thống
1.3 Qui trình chung tái kỹ nghệ phần mềm
Hình 1-04: Mô hình hoạt động tái kỹ nghệ
Tái kỹ nghệ sẽ bắt đầu với mã nguồn của chương trình được kế thừa lại vàkết thúc với mã nguồn của chương trình đích Qui trình này có thể chỉ đơn giản
là việc sử dụng một công cụ dịch mã để dịch mã nguồn từ ngôn ngữ này sangngôn ngữ khác (từ FORTRAN sang C ) hay từ hệ điều hành này sang hệ điềuhành khác (từ Linux sang Window) Mặt khác, công việc tái kỹ nghệ cũng cóthể rất phức tạp: sử dụng mã nguồn chương trình đã có để xây dựng lại thiết kế,xác định các yêu cầu của hệ thống đó sau đó so sánh chúng với yêu cầu hiện tại,
từ đó loại bỏ đi những cái không còn khả năng ứng dụng nữa, tổ chức và thiết kếlại hệ thống (sử dụng thiết kế hướng đối tượng), và cuối cùng là xây dựng mãcho hệ thống mới Chúng ta có thể hình dung rõ hơn về mô hình chung của hoạtđộng tái kỹ nghệ phần mềm qua hình 1-04
Trang 11Có thể đưa ra một công thức cho quá trình tái kỹ nghệ dựa trên hình 1-04như sau:
Tái kỹ nghệ = kỹ nghệ ngược + biến đổi + kỹ nghệ xuôi
Phải chú ý rằng, đôi khi tái kỹ nghệ và kỹ nghệ ngược được xem như làhai mặt hoàn toàn khác nhau Nhưng trong thực tế thì kỹ nghệ ngược được xemnhư là một phần của qui trình tái kỹ nghệ Thành phần đầu tiên trong qui trìnhtái kỹ nghệ, “kỹ nghệ ngược”, là hoạt động nhằm xác định những vấn đề trừutượng và xây dựng lại làm cho hệ thống trở nên dễ hiểu, dễ trình bày hơn Mụcđích chính ở đây là phải nắm bắt được những hiểu biết về hành vi và cấu trúccủa hệ thống, và có thể giao tiếp được với những phần khác Thành phần thứhai, “thay đổi”, chính là những thay đổi cần thiết cho hệ thống Những thay đổinày được thể hiện trong hai phạm vi trực giao Một là những thay đổi ở chứcnăng và một là những thay đổi công nghệ của các thành phần Các thay đổi chứcnăng đến từ các yêu cầu phải thay đổi các qui tắc nghiệp vụ của chương trình
Do đó, khi chúng ta sửa đổi các qui tắc nghiệp vụ sẽ dẫn đến kết quả sửa đổi hệthống Còn đối với thay đổi công nghệ của hệ thống thông tin có nghĩa là tổchức sẽ sử dụng một ngôn ngữ lập trình, một công cụ hay một cơ sở dữ liệu mới
để thay thế cho cái cũ Cuối cùng khi mọi vấn đề đã được hiểu thấu đáo, chúng
ta sẽ sử dụng kỹ nghệ xuôi để xây dựng hệ thống mới, với những cải tiến trongqui trình
1.3.1 Dịch mã nguồn
Dạng đơn giản nhất của tái kỹ nghệ phần mềm là dịch mã nguồn từ ngônngữ này sang một ngôn ngữ khác bằng các công cụ dịch tự động Do đó cấu trúccủa chương trình hoàn toàn không thay đổi Ngôn ngữ đích có thể là một phiênbản mới hơn của ngôn ngữ gốc (ví dụ từ COBOL-74 sang COBOL-85) hoặc làmột ngôn ngữ hoàn toàn khác (ví dụ từ FORTRAN sang C)
Cần phải chuyển đổi mã nguồn vì những lý do sau đây:
3. Những thay đổi chính sách tổ chức Một tổ chức hoàn toàn có thể quyếtđịnh những tiêu chuẩn cho ngôn ngữ lập trình của họ để có thể giảm đến
Trang 12mức tối thiểu chi phí cho phần mềm Tuy nhiên việc bảo trì các phiên bản
cũ của các trình biên dịch đó lại trở nên rất đắt
4. Thiếu những sự trợ giúp phần mềm Các nhà cung cấp các trình biên dịch
đã từ bỏ việc kinh doanh hoặc đã ngừng hỗ trợ cho sản phẩm của họ
Hình 1-05: Qui trình dịch mã nguồn
Hình 1-05 mô tả qui trình dịch mã nguồn Có thể không cần hiểu hoạtđộng chi tiết của phần mềm hoặc sửa đổi cấu trúc của hệ thống Những phân tíchliên quan có thể tập trung vào ngôn ngữ lập trình và có thể coi nó tương đươngnhư cấu trúc điều khiển của chương trình
Dịch mã nguồn sẽ chỉ thực sự kinh tế nếu như việc dịch tự động sẵn sàngcho việc dịch một số lượng lớn bản dịch Nó có thể là một chương trình đượcviết đặc biệt, một công cụ được mua để chuyển đổi từ ngôn ngữ này sang ngônngữ khác hoặc một mô hình hệ thống thích hợp Trong trường hợp thứ hai, cầnphải xây dựng tập hợp những hướng dẫn làm thế nào để chuyển đổi từ sự trìnhbày này sang sự trình bày khác Các mẫu tham số trong ngôn ngữ gốc phải đượcxác định và liên kết với các mẫu tương đương trong ngôn ngữ đích
Trong nhiều trường hợp, việc dịch tự động hoàn toàn là điều không thể.Cấu trúc trong ngôn ngữ nguồn có thể không tương đương với ngôn ngữ đích
Có thể mã nguồn được nhúng vào các lệnh điều kiện trong trình biên dịch màtrong ngôn ngữ đích không được hỗ trợ Trong những trường hợp này, chúng taphải thực hiện những thay đổi một cách thủ công để điều chỉnh và cải tiến hệthống tạo ra
1.3.2 Kỹ nghệ ngược
Trang 13Kỹ nghệ ngược là qui trình phân tích phần mềm với mục đích để phục hồinhững đặc tả và thiết kế của phần mềm đó Kỹ nghệ ngược không làm thay đổi
hệ thống hoặc tạo ra một hệ thống mới, nó chỉ là quá trình kiểm tra mà khôngthay đổi chức năng tổng thể của chương trình Trong qui trình kỹ nghệ ngược,
mã nguồn của chương trình chính là đầu vào Tuy nhiên, đôi khi ngay cả mãnguồn cũng không còn thì qui trình kỹ nghệ ngược phải bắt đầu với mã thực thicủa chương trình
Nhiều người cho rằng, tái kỹ nghệ và kỹ nghệ ngược là những tên gọikhác nhau của cùng một quá trình, nhưng trong thực tế kỹ nghệ ngược khôngphải là tái kỹ nghệ Mục đích của kỹ nghệ ngược là để thu được thiết kế hoặcđặc tả của hệ thống từ mã nguồn của nó Trong khi đó, mục đích của tái kỹ nghệ
là để tạo ra một hệ thống mới có khả năng bảo trì cao xuất phát từ một hệ thống
cũ Như vậy, kỹ nghệ ngược là một quá trình giúp cho nhà phát triển có nhữngcái nhình rõ ràng hơn về hệ thống, và nó chính là một phần của qui trình tái kỹnghệ Những ảnh hưởng của quá trình này sẽ ảnh hưởng tới thành công của dự
án tái kỹ nghệ
Kỹ nghệ ngược thường được sử dụng trong qui trình tái kỹ nghệ phầnmềm để khôi phục lại thiết kế và những đặc tả của chương trình, từ đó giúp chocác kỹ sư tái kỹ nghệ có thể hiểu rõ hơn trước khi bắt tay vào việc tổ chức lạicấu trúc của chương trình Tuy nhiên, kỹ nghệ ngược không nhất thiết phải luôn
có trong qui trình tái kỹ nghệ
1 Thiết kế và đặc tả của một hệ thống đang tồn tại có thể được kỹ nghệngược, vì vậy chúng có thể được sử dụng như một đầu vào, và chính là đặc tảyêu cầu của hệ thống thay thế
2 Ngoài ra, việc thiết kế và đặc tả có thể được kỹ nghệ ngược, do đó nóluôn sẵn sàng cho việc bảo trì chương trình Với những thông tin bổ sung, chúng
ta có thể không cần thiết phải kỹ nghệ lại mã nguồn của hệ thống
Trang 14Hình 1-06: Mô hình qui trình kỹ nghệ ngược
Qui trình kỹ nghệ ngược được chỉ ra trong hình 1-06, bắt đầu bằng việclấy ra các thông tin về yêu cầu và thiết kế chi tiết từ mã nguồn của chương trình
và các tài liệu còn tồn tại (nếu có) Sau qui trình, chúng ta sẽ thu được một tàiliệu yêu cầu và một bản thiết kế trừu tượng ở mức độ cao được thể hiện bằngbiểu đồ luồng dữ liệu và luồng điều khiển
Như vậy, hai công việc quan trọng trong kỹ nghệ ngược chính là: làm lạitài liệu và phục hồi thiết kế
Trang 151.3.2.1 Làm lại tài liệu
Vì các chương trình để tái kỹ nghệ thường không còn tài liệu, thiết kếv.v…, vì vậy việc làm lại tài liệu là một nhiệm vụ cần thiết trong quá trình tái kỹnghệ Chikofsky đã định nghĩa quá trình làm lại tài liệu là tạo ra hoặc sửa đổi lạitài liệu hiện thời (nếu có) sang một cách miêu tả có ngữ nghĩa tương đương vớimức trừu tượng tương đối Và kết quả của việc làm này là ta thu được một cáinhìn đan xen nhau về hệ thống (ví dụ như luồng điều khiển, cấu trúc điều khiển,luồng dữ liệu) Làm lại tài liệu là một hình thức đơn giản nhất và là giai đoạnkhởi đầu của kỹ nghệ ngược Và nhiều người cho rằng việc làm lại tài liệukhông gây ra thay đổi trong hệ thống
Làm lại tài liệu mã nguồn là sự biến đổi từ mã nguồn (cộng với nhữnghiểu biết về chương trình và các tài liệu khác) sang một tài liệu mã nguồn mớihoặc nâng cấp tài liệu mã nguồn Thông thường, những tài liệu này sẽ ở dạngvăn bản (ví dụ như là những ghi chú trong chương trình), nhưng nó cũng có thể
là những tài liệu bằng đồ họa Việc cải tiến phần mềm bằng cách nâng cấp tàiliệu (những chú thích, thiết kế, đặc tả được nhúng trong chương trình) là mộttrong những kỹ thuật tái kỹ nghệ cũ Làm lại tài liệu là một hoạt động quantrọng bởi việc bảo trì thường phải dựa vào những chú thích được viết trongchương trình và coi đó là cơ sở để có thể hiểu được những đoạn mã trongchương trình hoạt động như thế nào
Với việc làm lại tài liệu, những kĩ sư bảo trì sẽ có cái nhìn toàn diện vàđầy đủ hơn về hệ thống và hoạt động của nó Ngày nay, việc làm lại tài liệukhông phải chỉ thủ công mà đã có rất nhiều công cụ, hỗ trợ cho con người rấtnhiều trong việc xây dựng lại tài liệu Một số công cụ phổ biến như là “máy inchât lượng” là một chương trình có thể hiển thị một danh sách các mã trongdạng cải tiến, hay như máy tạo biểu đồ có thể tạo ra các biểu đồ trực tiếp từ mã,phản ánh các luồng mã và cấu trúc mã, hoặc là máy phát danh sách tham chiếuchéo Một mục tiêu chính của những công cụ này là giúp cho con người có thể
dễ dàng hình dung được mối quan hệ giữa các thành phần của chương trình, từ
đó có thể thấy phương hướng rõ ràng để thực hiện công việc
1.3.2.2 Phục hồi thiết kế
Sau bước làm lại tài liệu, việc phục hồi lại thiết kế của chương trình làmột việc làm cần thiết Phục hồi thiết kế là một tập hợp các kỹ thuật đảo ngượctrong đó chúng ta phải xây dựng lại thiết kế cho chương trình dựa trên việc trựctiếp kiểm tra hệ thống đó Ngoài ra, chúng ta phải thu thập thêm các thông tin,kiến thức bên ngoài của hệ thống, các nguyên nhân trích xuất không rõ ràng của
Trang 16hệ thống, từ đó giúp cho hệ thống có khả năng quan sát tổng quát hơn, với mức
độ trừu tượng cao hơn
Việc bảo trì phần mềm và thu hoạch những thành phần tái sử dụng lại từphần mềm đó, cả hai đều cần đến phân tích việc tái cấu trúc lại thiết kế của hệthống Nhưng thật không may, mã nguồn của chương trình thường không chứanhiều các thông tin về thiết kế trong giai đoạn đầu Qua mã nguồn, ta chỉ có thểcấu trúc lại các thông tin cơ bản nhất Do vậy, các nguồn thông tin bổ sung, do
cả con người hay tự động đều cần thiết Hơn thế nữa, vì qui mô của một phầnmềm để tái kỹ nghệ thường rất lớn (có đến hàng trăm dòng mã hoặc nhiều hơnnữa) cho nên việc phân tích cũng rất cần những hỗ trợ tự động để có thể hiểuđược qui trình
Phục hồi lại thiết kế là tạo lại thiết kế ở mức độ trừu tượng từ việc kếthợp mã chương trình, các tài liệu thiết kế của chương trình hiện tại (nếu có),kinh nghiệm của con người và các hiểu biết chung về hệ thống chương trình
Các thiết kế trừu tượng được phục hồi phải bao gồm các thành phần cơbản của kỹ nghệ phần mềm như là đặc tả hình thức, phân tích module, trừutượng hóa dữ liệu, luồng dữ liệu và ngôn ngữ đặc tả chương trình Ngoài rachúng ta phải bổ sung thêm những thông tin như miền vấn đề ngôn ngữ, cáchbiểu diễn ứng dụng trong môi trường của chương trình Tóm lại, phục hồi thiết
kế phải sao chép lại toàn bộ các thông tin cần thiết để một người có thể hiểu đầy
đủ về chương trình như chương trình làm cái gì, làm như thế nào, tại sao nó lạihoạt động như thế v.v… Vì vậy, việc tập trung vào phục hồi các thông tin xarộng trong thiết kế cần thiết hơn là tìm ra những đại diện hoặc mã của việc kỹnghệ phần mềm thông thường
Phục hồi thiết kế diễn ra trong một chuỗi các hoạt động từ phát triển phầnmềm đến bảo trì Các nhà phát triển phần mềm mới dành rất nhiều thời gian để
cố gắng hiểu cấu trúc của hệ thống và các thành phần của hệ thống Việc bảo trìphần mềm dành nhiều thời gian nghiên cứu cấu trúc của một hệ thống để hiểuđược bản chất và hiệu quả khi thay đổi yêu cầu Trong mỗi trường hợp, nhàphân tích đều đang tham gia phục hồi thiết kế Vì vậy, phục hồi thiết kế là mộtphần chung, đôi khi là một phần ẩn của các hoạt động rải rác trong suốt chutrình sống phần mềm
1.3.3 Cấu trúc lại hệ thống
Cấu trúc lại hệ thống là một giai đoạn quan trọng và rất cần thiết trong quitrình tái kỹ nghệ Cấu trúc lại hệ thống không chỉ đơn thuần là xây dựng lại cấutrúc cho hệ thống cũ, mà chúng ta phải thực hiện cải tiến lại hệ thống cũ, tạo ramột hệ thống mới phù hợp với môi trường hiện tại, cung cấp đầy đủ các tínhnăng mà hiện tại hệ thống được đòi hỏi Do nhu cầu ngày nay, các hệ thống cần
Trang 17sử dụng bộ nhớ lớn, do đó phải có sự tối ưu hóa việc sử dụng bộ nhớ chươngtrình Cộng với việc có nhiều người lập trình thiếu hiểu biết về kỹ nghệ phầnmềm dẫn đến hệ thống có cấu trúc không tốt Cấu trúc điều khiển chương trình
có thể sẽ khó hiểu do chương trình có nhiều nhánh rẽ không sử dụng các câulệnh điều kiện và logic điều khiển chương trình không được tốt Cũng có thể dochương trình thường xuyên phải bảo trì đã làm xuống cấp cấu trúc của hệ thống.Chúng ta có thể thay đổi để chương trình có thể thực hiện những đoạn mã màbình thường chúng không hoạt động, tuy nhiên điều này chỉ được phát hiện khisau khi đã có sự phân tích tổng thể
Tái cấu trúc chương trình tự động sẽ gặp các vấn đề sau:
− Mất ghi chú Nếu chương trình có các dòng ghi chú trong đó, nó sẽ
luôn bị mất đi trong quá trình tái cấu trúc
− Mất tài liệu Tương tự, tài liệu của chương trình cũng sẽ bị mất đi Tuy
nhiên, trong nhiều trường hợp, sau quá trình tái cấu trúc, cả các ghi chú vàtài liệu của chương trình đều trở nên lạc hậu Bởi vậy đây không phải làmột nhân tố quan trọng
− Nặng về nhu cầu tính toán Các thuật toán nhúng trong các công cụ tái
cấu trúc rất phức tạp Thậm chí ngay cả với các phần cứng nhanh và hiệnđại cũng phải mất một thời gian dài để hoàn thành qui trình tái cấu trúccho các chương trình lớn
Hình 1-10: Cấu trúc chương trình tự động
Nếu chương trình phụ thuộc vào dữ liệu trong đó các thành phần gắn kếtchặt chẽ với nhau thông qua việc chia sẻ cấu trúc dữ liệu, việc cấu trúc lại mãkhông đưa đến cải tiến sự hiểu biết một cách đáng kể Do vậy, việc module hóa
Trang 18chương trình có thể cần thiết Nếu chương trình được viết bằng một hệ ngôn ngữkhông chuẩn, các công cụ tái cấu trúc tiêu chuẩn có thể không hoạt động đúngđắn và sự can thiệp thủ công có ý nghĩa vô cùng cần thiết
Trong một số trường hợp, có thể không có chi phí hiệu quả để cấu trúc lạitoàn bộ các chương trình trong một hệ thống Một số có thể có chất lượng tốthơn so với số khác trong khi đó một vài cái lại không thể tùy thuộc vào các thayđổi thường xuyên Arthur (Arthur, 1988) cho thấy rằng một dữ liệu phải đượcthu thập để giúp xác định những chương trình nào có thể hưởng lợi nhiều nhất từtái cấu trúc Ví dụ, các thông số sau đây có thể được sử dụng để xác định cácchương trình thích hợp cho việc tái cấu trúc:
− Ước lượng thất bại
− Tỉ lệ phần trăm mã nguồn thay đổi trên mỗi năm
− Độ phức tạp của các thành phần Một số nhân tố khác như mức độ đểchương trình hoặc các thành phần của chương trình có thể đạt đến tiêu chuẩnnhư hiện thời cũng có thể dựa vào đó để quyết định cho việc tái cấu trúc
1.3.4 Module hóa chương trình
Module hóa chương trình là quá trình tổ chức lại chương trình sao cho cácphần chương trình có liên quan đến nhau được tập hợp lại với nhau trong cùngmột module Một khi việc module hóa chương trình đã được thực hiện, chúng ta
có thể dễ dàng loại bỏ được các thành phần dư thừa và tối ưu hóa tương tác giữacác thành phần đồng thời làm giảm giao diện giữa một thành phần với các phầncòn lại của hệ thống Ví dụ, trong chương trình xử lý dữ liệu chấn địa, toàn bộcác toán tử liên kết với thành phần đồ họa thể hiện của dữ liệu có thể tập hợp lạivới nhau trong cùng một module Nếu hệ thống được phân phối, các moduleđược tạo ra lại có thể gói gọn lại thành một đối tượng và có thể được truy cậpqua một giao diện chung
Có một vài kiểu module khác nhau có thể được tạo ra trong quá trìnhmodule hóa là: − Dữ liệu trừu tượng: Những kiểu dữ liệu trừu tượng nàyđược tạo ra bằng cách liên kết dữ liệu với các thành phần xử lý của nó
− Module phần cứng: Có sự liên quan chặt chẽ đến dữ liệu trừu tượng.Phải tập hợp tất cả các chức năng được sử dụng để điều khiển cùng mộtthiết bị phần cứng đặc biệt lại với nhau
− Module chức năng: Đây là module tập hợp các chức năng thực hiệntương tự nhau hoặc liên quan đến cùng một nhiệm vụ lại với nhau Ví dụ,toàn bộ các chức năng liên quan đến đầu vào và xác nhận đầu vào có thểkết hợp lại với nhau trong cùng một module
Trang 19− Module hỗ trợ cho qui trình: Toàn bộ các chức năng và các thành phần
dữ liệu cần thiết cho việc hỗ trợ các qui trình nghiệp vụ đặc biệt đượcnhóm lại với nhau trong cùng một module Ví dụ, trong hệ thống thư viện,một module hỗ trợ qui trình là toàn bộ các chức năng cần thiết để hỗ trợcho việc mượn và trả sách
Module hóa chương trình thường được thực hiện thủ công bằng cách kiểmtra và sửa đổi mã Để module hóa một chương trình, chúng ta phải xác định mốiquan hệ giữa các thành phần và đề ra xem các thành phần này làm những gì Cáccông cụ trực quan và các công cụ duyệt có thể giúp chúng ta trong quá trìnhmodule hóa, nhưng chúng ta vẫn không thể hoàn toàn thực hiện tự động quátrình này
1.3.5 Tái kỹ nghệ dữ liệu
Cho tới bây giờ, hầu hết các cuộc thảo luận về quá trình phát triển phầnmềm đều tập trung vào vấn đề các chương trình và hệ thống phần mềm luônluôn biến đổi Tuy nhiên, trong nhiều trường hợp, nó lại liên quan đến vấn đềphát triển dữ liệu Lưu trữ, tổ chức và định dạng của dữ liệu được xử lý bởichương trình cũ phải được tiến hóa để phù hợp với những thay đổi của phầnmềm Quá trình phân tích và tổ chức lại cấu trúc dữ liệu và đôi khi là cả giá trịcủa dữ liệu trong hệ thống làm cho nó trở nên dễ hiểu hơn được gọi là tái kỹnghệ dữ liệu
Nói chung, tái kỹ nghệ dữ liệu không cần thiết nếu như các chức năng của
hệ thống không thay đổi Tuy nhiên, trong thực tế, có rất nhiều lý do để chúng taphải sửa đổi dữ liệu khi chương trình của chúng ta là một hệ thống cũ được kếthừa lại:
− Sự thoái hóa dữ liệu Qua thời gian, chất lượng của dữ liệu sẽ dần trởnên suy tàn Thay đổi những dữ liệu có thông báo lỗi, các giá trị sao chép
có thể được tạo ra và thay đổi ở môi trường bên ngoài có thể sẽ khôngđược phản hồi trong dữ liệu Đây là một điều không thể tránh khỏi bởi vìvòng đời của dữ liệu thường rất dài
− Những giới hạn cố hữu được xây dựng trong chương trình Khi thiết kếban đầu, những người phát triển chương trình đưa vào những ràng buộcgắn liền với số lượng dữ liệu mà nó có thể xử lý Tuy nhiên, các chươngtrình ngày nay cần phải xử lý nhiều dữ liệu hơn so với những dự kiến banđầu của các nhà phát triển Vì vậy, tái kỹ nghệ dữ liệu là cần thiết để loại
bỏ các hạn chế này
Trang 20− Tiến hóa kiến trúc Nếu một hệ thống tập trung được chuyển thành mộtkiến trúc phân tán, thì điều cần thiết cốt lõi của kiến trúc nên là một hệthống quản lý dữ liệu mà các khách hàng ở xa có thể truy cập được Điềunày đòi hỏi phải có những nỗ lực lớn trong việc tái kỹ nghệ dữ liệu để dichuyển các dữ liệu từ các tệp riêng biệt vào trong hệ thống máy chủ quản
lý cơ sở dữ liệu Việc di chuyển đến một kiến trúc chương trình có thể bắtđầu khi tổ chức chương trình chuyển đổi từ quản lý dữ liệu dựa trên cáctệp sang hệ thống quản lý cơ sở dữ liệu
Hình 1-11: Chuyển đổi dữ liệu
Trang 21Cũng như định nghĩa dữ liệu không phù hợp, các giá trị dữ liệu cũng cóthể được lưu trữ một cách không phù hợp Sau khi các định nghĩa dữ liệu đượctái kỹ nghệ, giá trị của dữ liệu cũng phải được chuyển đổi để phù hợp với cấutrúc mới
Trước khi tái kỹ nghệ dữ liệu của chương trình, điểu cần thiết trước khilàm là phải phân tích chi tiết chương trình Những phân tích này nên nhằm vàomục đích phát hiện những chức năng định danh trong chương trình, tìm ra cácgiá trị cố định để thay đổi thành tên hằng số, phát hiện những qui tắc kiểmchứng dữ liệu nhúng và chuyển đổi đại diện của dữ liệu Các công cụ như làphân tích và mô hình tham chiếu chéo có thể được sử dụng để giúp cho quá trìnhphân tích được nhanh chóng và đơn giản hơn Một tập hợp các bảng nên đượctạo ra để chỉ ra các mục dữ liệu được tham chiếu và những thay đổi được tạo racho mỗi tham chiếu đó
Hình 1-12: Quá trình tái kỹ nghệ dữ liệu
Hình 1-12 minh họa quá trình tái kỹ nghệ dữ liệu, giả định rằng nhữngđịnh nghĩa dữ liệu được sửa đổi, các giá trị cố định được đặt tên, định dạng dữliệu được tổ chức lại và giá trị dữ liệu được chuyển đổi Bảng tóm tắt các chi tiếttrong thay đổi được tạo ra Do đó chúng được sử dụng ở tất cả các giai đoạn củaquá trình tái kỹ nghệ dữ liệu
Trong giai đoạn 1 của quá trình này, các định nghĩa dữ liệu trong chươngtrình được sửa đổi cho dễ hiểu hơn Dữ liệu không bị ảnh hưởng bởi các sửa đổi
Có thể tự động quá trình này ở một mức độ nào đó bằng cách sử dụng hệ thống
Trang 22kết hợp mô hình như là AWK (Aho, Kernighan và một số người khác, 1988) đểtìm và thay thế các định nghĩa hoặc để phát triển các mô tả UML của dữ liệu (StLaurent and Cerami, 1999) và sử dụng các công cụ chuyển đổi dữ liệu Tuynhiên, một vài việc làm thủ công hầu như là cần thiết để hoàn tất quá trình Quátrình tái kỹ nghệ dữ liệu có thể dừng lại ở giai đoạn này nếu mục đích chỉ đơngiản là làm tăng hiểu biết về các định nghĩa cấu trúc dữ liệu trong chương trình.Tuy nhiên, nếu có các vấn đề về giá trị dữ liệu như đã được trình bày ở trên thìgiai đoạn 2 có thể thực hiện
Nếu tổ chức quyết định tiếp tục giai đoạn 2 của quá trình, sau đó là tậptrung vào giai đoạn 3, chuyển đổi dữ liệu Nó thường là một quá trình rất tốnkém Chương trình phải được viết với đầy đủ những hiểu biết về tổ chức cũ vàmới Nó thực hiện chuyển đổi dữ liệu cũ và chuyển đổi thông tin đầu ra Một lầnnữa, hệ thống mẫu phù hợp có thể được sử dụng để tiến hành sự chuyển đổi này
1.4: Các công cụ sử dụng cho tái kỹ nghệ:
Có khá nhiều các công cụ hỗ trợ cho việc tái kỹ nghệ Trong mỗi giai đoạncủa quy trình lại có một công cụ phục vụ cho các công việc khác nhau Để dịch
mã nguồn sang mô hình thiết kế chúng ta có các công cụ như Rational SoftwareArchitecture, Rational Rose v.v Bộ công cụ DMS Software ReengineeringToolkit là công cụ tự động phân tích chương trình, tùy chỉnh mã nguồn, sửa đổi,dịch hay phát sinh ra hệ thống phần mềm Có rất nhiều các công cụ hỗ trợ nhưthế, nhưng trong phạm vi luận văn này sẽ tập trung vào việc tái kỹ nghệ phầnmềm với sự hỗ trợ của công cụ Rational Rose và ngôn ngữ mô hình hóa thốngnhất UML
1.4.1 Ngôn ngữ UML :
Ngôn ngữ mô hình hóa thống nhất (Unifield Modeling Language – UML)
là một ngôn ngữ mô hình có phần chính bao gồm những ký pháp đồ họa, đượccác phương pháp hướng đối tượng sử dụng để thể hiện và miêu tả các thiết kếcủa một hệ thống Nó là một ngôn ngữ để đặc tả, trực quan hoá, xây dựng vàlàm tài liệu cho nhiều khía cạnh khác nhau của một hệ thống phần mềm chuyênsâu UML có thể được sử dụng làm công cụ giao tiếp giữa người dùng, nhà phântích, nhà thiết kế và nhà phát triển phần mềm
Trong quá trình phát triển có nhiều công ty đã hỗ trợ và khuyến khíchphát triển UML có thể kể tới như: Hewlett Packard, Microsoft, Oracle, IBM,Unisys
UML có thể được sử dụng trong nhiều giai đoạn, từ phát triển, thiết kếcho tới thực hiện và bảo trì Vì mục đích chính của ngôn ngữ này là dùng cácbiểu đồ hướng đối tượng để mô tả hệ thống nên miền ứng dụng của UML baogồm nhiều loại hệ thống khác nhau như:
Trang 23− Hệ thống thống tin (Information System)
− Hệ thống kỹ thuật (Technical System)
− Hệ thống nhúng (Embeded System)
− Hệ thống phân bố ( Distributed System)
− Hệ thống Giao dịch (Business System)
− Phần mềm hệ thống (System Software)
Có thể nói UML không phải là một phương pháp mà là một ngôn ngữ môhình hóa đối tượng đã được công nhận là một phương pháp đối tượng và được
sử dụng chung trong cộng đồng công nghệ thông tin Nó đã trở thành một chuẩn
và được sử dụng phổ biến trong qui trình kỹ nghệ phần mềm Một số các kýpháp sử dụng trong UML
− Các thực thể cấu trúc
− Các thực thể hành vi
− Các ký pháp quan hệ