Trên cơ sở đó, khóa luận biểu diễn tri thức toán di truyền lớp 12 phần cơ sở của hiện tượng di truyền và biến dị, từ đó xây dựng thuật giải để giải các bài toán thuộc tri thức này.. Dạng
Trang 1ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ THÔNG TIN
Trang 2Lời cam đoan
Em xin cam đoan Khóa luận tốt nghiệp với đề tài: “Xây dựng hệ hỗ trợ giải
toán di truyền lớp 12” là do chính bản thân em thực hiện Các số liệu thu thập và kết
quả nghiên cứu nêu trong khóa luận là trung thực và do chính em thực hiện
Tp.HCM, ngày ……….tháng………năm…………
Học viên
Võ Trúc Vy
Trang 4MỤC LỤC
TÓM TẮT 1
Chương 1 Mở đầu 2
1.1 Về tính cấp thiết của đề tài 2
1.2 Tình hình nghiên cứu 2
1.3 Mục đích và nhiệm vụ nghiên cứu 4
1.4 Đối tượng và phạm vi nghiên cứu 4
1.5 Phương pháp nghiên cứu 5
1.6 Kết cấu của khóa luận 5
1.7 Kết cấu nội dung 6
Chương 2 Cơ sở lý thuyết 9
2.1 Tri thức hệ chuyên gia 9
2.1.1 Khái niệm tri thức (knowledge) 9
2.1.2 Hệ chuyên gia 9
2.1.3 Các thành phần của một hệ chuyên gia: 9
2.1.4 Kiến trúc tổng quát của các hệ chuyên gia 10
2.2 Các mô hình biểu diễn tri thức 11
2.2.1 Biểu diễn tri thức bằng mạng ngữ nghĩa 11
2.2.2 Biểu diễn tri thức bằng hệ luật dẫn 12
2.3 Tri thức Toán di truyền lớp 12, cơ chế của hiện tượng di truyền và biến dị 13
2.3.1 Cấu tạo hóa học của ADN 13
2.3.2 Cấu trúc không gian của phân tử ADN 14
2.3.3 Khái niệm Gen 15
2.3.4 Các dạng bài tập và công thức liên quan đến cấu trúc của gen 15
2.3.5 Khái niệm mã di truyền (côdon) 17
Trang 52.3.6 Cơ chế tự nhân đôi ADN: 17
2.3.7 Các dạng bài tập và công thức liên quan đến cơ chế tự nhân đôi của ADN 18
2.3.8 Phiên mã (Tổng hợp ARN) 18
2.3.9 Dịch mã (Tổng hợp prôtêin) 19
2.3.10 Các dạng bài tập và công thức liên quan đến tổng hợp Prôtêin 20
2.3.11 Đột biến gen 21
2.3.12 Các dạng bài tập và công thức liên quan đến đột biến gen 21
Chương 3 Biểu diễn tri thức 24
3.1 Biễu diễn tri thức toán di truyền lớp 12 trên máy tính 24
3.1.1 Yếu tố 25
3.1.2 Sự kiện 25
3.1.3 Tri thức dạng luật 26
3.1.4 Tri thức dạng công thức 27
3.2 Các dạng và các lớp bài toán 32
3.3 Biểu diễn tri thức trên mạng ngữ nghĩa 33
3.3.1 Định nghĩa 33
3.3.2 Mô hình 34
3.3.3 Các vấn đề trên mạng ngữ nghĩa 36
3.3.4 Cách giải quyết 36
3.4 Mô hình biểu diễn tri thức mạng ngữ nghĩa – luật dẫn 38
3.4.1 Định nghĩa 38
3.4.2 Cài đặt mô hình biểu diễn tri thức mạng ngữ nghĩa – luật dẫn 38
3.5 Thuật toán trên mô hình biểu diễn tri thức 39
3.5.1 Thuật toán 39
3.5.2 Tính giải được của bài toán 40
3.5.3 Chứng minh tính giải được của thuật toán 41
Trang 63.5.4 Phát biểu bài toán 42
3.5.5 Thuật toán 42
3.5.6 Ví dụ bài toán 43
Chương 4 Xây dựng ứng dụng 46
4.1 Yêu cầu của chương trình 46
4.2 Phương pháp thực hiện 46
4.3 Minh họa một số bài toán giải trên chương trình 47
Chương 5 Kết luận 57
5.1 Kết quả đạt được 57
5.2 Hạn chế của khóa luận 57
5.3 Hướng phát triển 57
PHỤ LỤC 59
TÀI LIỆU THAM KHẢO 70
Trang 7DANH MỤC HÌNH
Hình 2-1: Hoạt động của hệ chuyên gia 10Hình 2-2 Cấu tạo của một chuỗi polinucleotit 13Hình 2-3 Cấu tạo hóa học và cấu trúc không gian của phân tử ADN 14
Trang 8DANH MỤC BẢNG
Bảng 2-1Các dạng bài tập và công thức liên quan đến cấu trúc của gen 17Bảng 2-2 Các dạng bài tập và công thức liên quan đến cơ chế tự nhân đôi của ADN
18Bảng 2-3 Các dạng bài tập và công thức liên quan đến tổng hợp Prôtêin 21Bảng 2-4 Các dạng bài tập và công thức liên quan đến đột biến gen 23
Trang 91
TÓM TẮT
Khóa luận đã xây dựng một phương pháp biểu diễn tri thức, là sự kết hợp mạng ngữ nghĩa và hệ luật dẫn, gọi là mạng ngữ nghĩa – hệ luật dẫn
Trên cơ sở đó, khóa luận biểu diễn tri thức toán di truyền lớp 12 phần
cơ sở của hiện tượng di truyền và biến dị, từ đó xây dựng thuật giải để giải các bài toán thuộc tri thức này
Khóa luận đã xây dựng được một chương trình, là công cụ hỗ trợ học tập cho các em học sinh lớp 12 môn sinh học
Trang 102
Chương 1 Mở đầu
1.1 Về tính cấp thiết của đề tài
Hệ chuyên gia, còn gọi là hệ thống dựa tri thức, là một chương trình máy tính chứa một số tri thức đặc thù của một hoặc nhiều chuyên gia con người về một chủ đề cụ thể nào đó Các chương trình thuộc loại này đã được phát triển từ các thập niên 1960 và 1970, và trở thành ứng dụng thương mại từ thập niên 1980 Dạng phổ biến nhất của hệ chuyên gia là một chương trình gồm một tập luật phân tích thông tin (thường được cung cấp bởi người sử dụng hệ thống) về một lớp vấn đề cụ thể, cũng như đưa ra các phân tích về các vấn đề đó, và tùy theo thiết kế chương trình
mà đưa lời khuyên về trình tự các hành động cần thực hiện để giải quyết vấn đề Đây là một hệ thống sử dụng các khả năng lập luận để đạt tới các kết luận.[10]
Nhiều hệ chuyên gia đã được thiết kế và xây dựng để phục vụ các lĩnh vực kế toán, y học, điều khiển tiến trình (process control) , dịch vụ tư vấn tài chính (financial service) , tài nguyên con người (human resources) , v.v
Cũng như nhiều lĩnh vực khác, lĩnh vực giáo dục rất cần các hệ chuyên gia
Hệ chuyên gia hổ trợ giáo viên giảng dạy hiệu quả, giúp học sinh nâng cao kiến thức, giúp phát triển giáo dục Hệ chuyên gia giải toán tự động đã được phát triển ở các môn như Toán học, Vật lý, Hóa học,… ở các cấp 1,2 3
Môn Sinh học lớp 12 của bậc phổ thông trung học có phần toán di truyền là một dạng tri thức khó với rất nhiều học sinh, vì vậy một chương trình giải toán tự động là một nhu cầu chính đáng, là một công cụ tốt giáo dục môn Sinh học lớp 12
1.2 Tình hình nghiên cứu
Có rất nhiều đề tài về giải toán tự động, đặc biệt lãnh vực giáo dục rất được quan tâm như
[1] Đề tài Mạng tính toán và ứng dụng [7]
Trang 113
Xây dựng mô hình biểu diễn tri thức Mạng các đối tượng tính toán
Với định nghĩa
- Mạng tính toán : Mỗi mạng tính toán là một mạng ngữ nghĩa chứa các biến
M và những quan hệ F có thể cài đặt và sử dụng được cho việc tính toán : (M, F)
- Một đối tượng tính toán : Tập các biến và tập các quan hệ của đối tượng O lần lượt được ký hiệu là M (O) , F (O) Từ đó ta có thể viết :O = (M (O) ,F (O) )
- Mạng các đối tượng tính toán bao gồm một tập hợp các đối tượng tính toán :
O = O1,O2, , On
- và một tập hợp các quan hệ giữa các đối tượng :
F = f1,f2, , fm
[2] Đề tài Xây dựng hệ hỗ trợ chẩn đoán bệnh Ung thư gan [6]
- Sử dụng mô hình COKB (Computational Object Knowledge Base) có hiệu chỉnh một số thành phần gọi là mô hình Sub-COKB-Adapt để phù hợp với dữ liệu y khoa
- Mô hình Sub-COKB-Adapt ngoài các thành phần giống mô hình COKB như Attrs, Act, Rules, còn có thành phần Patient là một đối tượng cụ thể dùng để chẩn đoán bệnh
[3] Đề tài : Xây dựng mô hình biểu diễn tri thức thiết kế hệ hổ trợ giải các bài toán điện xoay chiều trong chương trình trung học phổ thông [8]
- Phát triển mạng suy diễn tính toán thành mạng suy diễn tính toán mở rộng
mà thành phần của nó có thể là giá trị thực hoặc giá trị là hàm
- Một đối tượng tính toán mở rộng (Extended C_Object) là một đối tượng O
có cấu trúc bao gồm:
(1) Một danh sách các thuộc tính Attr (O) = Mv Mf, với Mv là tập thuộc tính mang giá trị thực, Mf tập thuộc tính là các hàm và giữa các thuộc tính ta
Trang 124
có các quan hệ thể hiện qua các sự kiện, các luật suy diễn hay các công thức tính toán
(2) Các hành vi liên quan đến sự suy diễn và tính toán trên các thuộc tính
của đối tượng hay trên các sự kiện như:
Xác định bao đóng của một tập thuộc tính A Attr (O) , tức là đối tượng O
có khả năng cho ta biết tập thuộc tính lớn nhất có thể được suy ra từ A trong đối tượng O
Xác định tính giải được của bài toán suy diễn tính toán có A→B với A
Attr (O) và B Attr (O) Nói một cách khác, đối tượng có khả năng trả lời câu hỏi rằng có thể suy ra được các thuộc tính trong B từ các thuộc tính trong A không
Thực hiện các tính toán
Xem xét tính xác định của đối tượng hay của một sự kiện
1.3 Mục đích và nhiệm vụ nghiên cứu
- Xây dựng hệ hỗ trợ giải toán di truyền lớp 12 có cơ sở tri thức từ các chuyên gia để giúp học sinh lớp 12 học tốt môn sinh lớp 12 phần di truyền học
- Nghiên cứu tri thức thực tế toán di truyền lớp 12 để xây dựng mô hình biểu diễn tri thức
- Đưa ra những phương pháp giải toán phù hợp
1.4 Đối tượng và phạm vi nghiên cứu
- Tìm hiểu các phương pháp biểu diễn tri thức, áp dụng biểu diễn tri thức Toàn
bộ hay một phần Toán di truyền lớp 12
- Có thể xây dựng một mô hình biểu diễn tri thức phù hợp dựa vào các mô hình đã biết
- Phạm vi kiến thức: toàn bộ hay một phần toán di truyền lớp 12 thuộc chương trình lớp 12 của Bộ Giáo Dục và Đào Tạo
Trang 135
- Phạm vi về người dùng: chương trình hỗ trợ cho các học sinh học lớp 12
- Phạm vi chương trình: hỗ trợ học sinh lớp 12 giải toán di truyền
1.5 Phương pháp nghiên cứu
- Thu thập tri thức, dữ liệu toán di truyền lớp 12 từ sách giáo khoa, sách tham khảo, các tài liệu hướng dẫn ôn tập chương trình Sinh học 12, các công thức và phương pháp giải phù hợp các bài tập trong di truyền học trong chương trình Sinh học 12
- Xác định phạm vi vấn đề, phân loại các bài toán, phương pháp giải và yêu cầu xây dựng ứng dụng
- Xây dựng mô hình biểu diễn tri thức các bài toán di truyền lớp 12 Có thể sử dụng các mô hình mạng ngữ nghĩa, mô hình COKB để biểu diễn tri thức
- Trên cơ sở của mô hình đó ta tiến tới xác lập tổ chức lưu trữ tri thức trên máy tính Tác vụ trên cơ sở tri thức có thể thêm, xóa, sửa dữ liệu
- Mô hình hóa cơ sở tri thức và đưa ra thuật giải
- Thiết kế bộ suy diễn và thực hiện quá trình suy luận tìm kiếm cho ra kết quả
- Nghiên cứu các phương pháp giải toán di truyền phù hợp với học sinh lớp 12
và viết thuật giải theo mô phỏng hành động của người chuyên gia
– Thiết kế giao diện và cài đặt ứng dụng
Giao diện người dùng thân thiện, đơn giản, rõ ràng, đẹp, dễ hiểu
Có thể dùng phần mềm Visual Studio 2010, ngôn ngữ lập trình C# hay Java để cài đặt ứng dụng
– Thử nghiệm và đánh giá hệ thống
– Hiệu chỉnh, tổng hợp và báo cáo
1.6 Kết cấu của khóa luận
Chương 1 : Mở đầu
Trang 146
Nêu tính cấp thiết khi xây dựng khóa luận, khóa luận mang tính ứng dụng cao phục vụ cho công tác giáo dục học sinh lớp 12 môn Sinh học
Chương 2 : Cơ sở lý thuyết
Trính bày có sở lý thuyết của khóa luận, là nền tảng để xây dựng khóa luận bao gồm cơ sở lý thuyết của hệ chuyên gia và biểu diễn tri thức, tri thức về hệ thống bài tập di truuyền lớp 12
Chương 3 : Biểu diễn tri thức
Trình bày mô hình tri thức sử dụng dùng trong khóa luận, áp dụng để biểu diễn tri thức Toán di truyền lớp 12 Chứng minh là mô hình này phù hợp, đưa vào được máy vi tính và giải được
Chương 4 : Xây dựng ứng dụng
Nêu phương pháp xây dựng ứng dụng, kết quả đạt được Chứng minh chương trình đạt yêu cầu đề ra
Chương 5 : Kết luận
Nêu kết quả đạt được của khóa luận, những hạn chế và hướng phát triển
1.7 Kết cấu nội dung
Khóa luận gồm 5 chương
Chương 1 : Mở đầu
Chương 2 : Cơ sở lý thuyết
2.1.Tri thức hệ chuyên gia
2.1.1 Khái niệm tri thức (knowledge)
2.1.2 Các thành phần của một hệ chuyên gia
2.1.3 Kiến trúc tổng quát của các hệ chuyên gia
2.1.4.Các mô hình biểu diễn tri thức
Trang 157
2.2 Tri thức Toán di truyền lớp 12 :
2.2.1 Cơ chế của hiện tượng di truyền và biến dị
2.2.2 Tính quy luật của hiện tượng di truyền
2.2.2 Di truyền học người – di truyền liên kết với giới tính Chương 3 : Biểu diễn tri thức Toán di truyền lớp 12
3.1 Mô hình biểu diễn tri thức
3.1.1 Định nghĩa
3.1.2 Mô hình
3.1.3 Các vấn đề trên mô hình biểu diễn tri thức
3.1.4 Cách giải quyết
3.2 Biểu diễn tri thức Toán di truyền lớp 12
3.2.1 Mô hình biểu diễn
3.2.2 Các vấn đề trên mô hình
3.2.3 Cách giải quyết
3.3 Thuật toán trên mô hình biểu diễn tri thức
3.3.1 Thuật toán
3.3.2 Tính giải được của bài toán
3.3.3 Chứng minh tính giải được của thuật toán
Trang 179
Chương 2 Cơ sở lý thuyết
2.1 Tri thức hệ chuyên gia
2.1.1 Khái niệm tri thức (knowledge)
Tri thức được đề cập trong tài liệu [3] là sự hiểu biết về một vấn đề nào đó,
ví dụ hiểu biết về y khoa Tuy nhiên, trong thực tế, tri thức của một hệ chuyên gia thường gắn liền với một lĩnh vực xác định, chẳng hạn như hiểu biết về các căn bệnh nhiễm trùng máu Mức độ hỗ trợ (thành công) của một hệ chuyên gia phụ thuộc vào miền hoạt động của nó Thế nhưng, cách thức tổ chức các tri thức như thế nào
sẽ quyết định lĩnh vực hoạt động của chúng Với cách biểu diễn hợp lý, ta có thể giải quyết các vấn đề đưa vào theo các đặc tính có liên quan đến tri thức đã có
Tri thức là một hệ thống phức tạp, đa dạng và trừu tượng bao gồm:
Các khái niệm (concepts)
2.1.3 Các thành phần của một hệ chuyên gia:
Một hệ chuyên gia theo tài liệu [7] gồm ba thành phần chính là:
o Cơ sở tri thức (knowledge base)
Trang 1810
o Máy suy diễn hay môtơ suy diễn (inference engine)
o Hệ thống giao tiếp với người sử dụng (user interface)
Cơ sở tri thức chứa các tri thức để từ đó, máy suy diễn tạo ra câu trả lời cho
người sử dụng qua hệ thống giao tiếp Người sử dụng (user) cung cấp sự kiện (facts) là những gì đã biết, đã có thật hay những thông tin có ích cho hệ chuyên gia,
và nhận được những câu trả lời là những lời khuyên hay những gợi ý đúng đắn
(expertise)
Hoạt động của một hệ chuyên gia dựa trên tri thức:
Hình 2-1: Hoạt động của hệ chuyên gia
Mỗi hệ chuyên gia chỉ đặc trưng cho một lĩnh vực vấn đề (problem domain) nào đó, như y học, tài chính, khoa học hay công nghệ, v.v , mà không phải cho bất
cứ một lĩnh vực vấn đề nào
Tri thức chuyên gia để giải quyết một vấn đề đặc trưng được gọi là lĩnh vực tri thức (knowledge domain)
2.1.4 Kiến trúc tổng quát của các hệ chuyên gia
Một hệ chuyên gia theo tài liệu [5] gồm 7 thành phần cơ bản như sau:
– Cơ sở tri thức (knowledge base) Gồm các phần tử (hay đơn vị) tri thức, thông thường được gọi là luật (rule) , được tổ chức như một cơ sở dữ liệu
– Máy duy diễn (inference engine) Công cụ (chương trình, hay bộ xử lý) tạo
ra sự suy luận bằng cách quyết định xem những luật nào sẽ làm thỏa mãn các sự
Trang 1911
kiện, các đối tượng, chọn ưu tiên các luật thỏa mãn, thực hiện các luật có tính ưu tiên cao nhất
– Lịch công việc (agenda) Danh sách các luật ưu tiên do máy suy diễn tạo ra
thoả mãn các sự kiện, các đối tượng có mặt trong bộ nhớ làm việc
– Bộ nhớ làm việc (working memory) Cơ sở dữ liệu toàn cục chứa các sự kiện
phục vụ cho các luật
– Khả năng giải thích (explanation facility) Giải nghĩa cách lập luận của hệ
thống cho người sử dụng
– Khả năng thu nhận tri thức (explanation facility) Cho phép người sử dụng
bổ sung các tri thức vào hệ thống một cách tự động thay vì tiếp nhận tri thức bằng cách mã hoá tri thức một cách tường minh Khả năng thu nhận tri thức là yếu tố mặc nhiên của nhiều hệ chuyên gia
– Giao diện người sử dụng (user interface) Là nơi người sử dụng và hệ
chuyên gia trao đổi với nhau
2.2 Các mô hình biểu diễn tri thức
2.2.1 Biểu diễn tri thức bằng mạng ngữ nghĩa
Mạng ngữ nghĩa là một phương pháp biểu diễn tri thức đầu tiên và dễ hiểu Phương pháp này sẽ biểu diễn tri thức dưới dạng một đồ thị, trong đó đỉnh là các đối tượng (khái niệm) còn các cung cho biết mối quan hệ giữa các đối tượng (khái niệm) này
Mạng ngữ nghĩa là một loại đồ thị cho nên nó thừa hưởng được tất cả những mặt mạnh của công cụ này
Do định nghĩa ta thấy mạng ngữ nghĩa là tính kế thừa nên có nhiều đỉnh trong mạng mặc nhiên sẽ có những thuộc tính của những đỉnh khác, cho phép ta có thể thực hiện được rất nhiều phép suy diễn từ những thông tin sẵn có trên mạng
Trang 2012
Tuy nhiên mạng ngữ nghĩa là một kiểu biểu diễn trực quan nhưng hạn chế
và thao tác tìm kiếm trên mạng ngữ nghĩa thường khó khăn (đặc biệt đối với những mạng có kích thước lớn)
Do đó, mô hình mạng ngữ nghĩa được dùng chủ yếu để phân tích vấn đề Sau
đó, nó sẽ được chuyển đổi sang dạng luật hoặc frame để thi hành hoặc mạng ngữ nghĩa sẽ được dùng kết hợp với một số phương pháp biểu diễn khác
2.2.2 Biểu diễn tri thức bằng hệ luật dẫn
Phương pháp biểu diễn tri thức bằng luật sinh được phát minh bởi Newell và Simon trong lúc hai ông đang cố gắng xây dựng một hệ giải bài toán tổng quát Đây
là một kiểu biểu diễn tri thức có cấu trúc
Ý tưởng cơ bản là tri thức có thể được cấu trúc bằng một cặp điều kiện – hành động : "NẾU điều kiện xảy ra THÌ hành động sẽ được thi hành" Chẳng hạn : NẾU đèn giao thông là đỏ THÌ bạn không được đi thẳng, NẾU máy tính đã mở mà không khởi động được THÌ kiểm tra nguồn điện, …
Một cách tổng quát luật sinh có dạng như sau :
P1 P2 Pn Q
Tùy vào các vấn đề đang quan tâm mà luật sinh có những ngữ nghĩa hay cấu tạo khác nhau :
Trong logic vị từ : P1 , P2 , , Pn, Q là những biểu thức logic
Trong ngôn ngữ lập trình, mỗi một luật sinh là một câu lệnh
IF (P1 ADN P2 ADN ADN Pn) THEN Q
Để biễu diễn một tập luật sinh, người ta thường phải chỉ rõ hai thành phần chính sau :
(1) Tập các sự kiện F (Facts)
F = { f1, f2, fn }
Trang 2113
(2) Tập các quy tắc R (Rules) áp dụng trên các sự kiện dạng như sau :
f1 ^ f2 ^ ^ fi q
Trong đó, các fi , q đều thuộc F
2.3 Tri thức Toán di truyền lớp 12, cơ chế của hiện tượng di truyền
và biến dị
2.3.1 Cấu tạo hóa học của ADN
ADN là đại phân tử cấu tạo theo nguyên tắc đa phân, đơn phân là các nucleotit Mỗi nucleotit cấu tạo gồm 3 thành phần :
1 gốc bazơ nitơ (A, T, G, X)
Trang 2214
2.3.2 Cấu trúc không gian của phân tử ADN
Mỗi phân tử ADN gồm có hai chuỗi polinucleotit song song ngược chiều
nhau (chiều 3' 5' và chiều 5' 3') Các nucleotit của hai mạch liên kết với nhau
theo nguyên tắc bổ sung
- A – T liên kết với nhau bằng 2 liên kết H
- G - X liên kết với nhau bằng 3 liên kết H
Từ hệ quả của nguyên tắc bổ sung thì ta có thể suy ra được số lượng
nucleotit và thành phần của nucleotit ở mạch còn lại
Hình 2-3 Cấu tạo hóa học và cấu trúc không gian của phân tử ADN
Khoảng cách giữa hai cặp bazo là 3,4A0
Một chu kì vòng xoắn có 10 cặp nucleotit (20 nucleotit)
Đường kính của vòng xoắn là 20 Ao
Trang 2315
2.3.3 Khái niệm Gen
Gen là một đoạn ADN mang thông tin mã hoá cho một chuỗi pôlipeptit hay một phân tử ARN
Ví dụ: Gen Hb mã hoá chuỗi pôlipeptit , gen tARN mã hoá cho phân tử tARN
Cấu trúc chung của gen cấu trúc (gen mã hóa chuỗi Polipepetit)
Gen cấu trúc mã hoá prôtêin gồm 3 vùng trình tự nuclêôtit
Vùng điều hoà: nằm ở đầu 3’ của mạch mã gốc của gen, có trình tự các
nuclêôtit đặc biệt giúp ARN pôlimeraza có thể nhận biết và liên kết để khởi động quá trình phiên mã, đồng thời cũng chứa trình tự nuclêôtit điều hoà quá trình phiên
mã
Vùng mã hoá: mang thông tin mã hoá các axit amin
Vùng kết thúc: nằm ở đầu 5’ của mạch mã gốc của gen, mang tín hiệu kết
thúc phiên mã
2.3.4 Các dạng bài tập và công thức liên quan đến cấu trúc của gen
Dữ kiện đề cho Yêu cầu Công thức
Tổng số nu của gen
Chiều dài của gen
Lgen = Lmạch đơn gen = N 3,4A o
2
Số vòng xoắn của gen Lgen = Lmạch đơn gen = 10C3,4A o
Số nu của gen Khối lượng phân tử
của gen Mgen = N x 300 đvC
Số nu từng loại của
Tổng số nu của gen Số liên kết HT giữa
các nu của gen HT = N - 2
Trang 2416
Tổng số nu của gen Số liên kết HT của
gen
HT = 2 (N – 1) (đây là tổng liên kết HT giữa các nu và giữa các phân tử đường với axit photphoric trong các nu)
Chiều dài của gen
Số vòng xoắn của gen N = 20C (nu)
Khối lượng phân tử
M
(nu) Tổng số nu trên một
và hiệu giữa hai loại
nu không bổ sung với
nhau
Giải hệ H A G
G A
3 2
tỉ lệ % từng loại nu
trên mạch đơn
Số lượng từng loại
nu trên mạch đơn của gen
Trang 25số lượng từng loại nu
của gen
Tỉ lệ phầm trăm từng loại nu của gen
%A = %T =
%100
N T
%G = %X =
%100
N X
Tỉ lệ phầm trăm từng
loại nu trên từng mạch
đơn của gen
Tỉ lệ phần trăm từng loại nu của gen
%
%2
%A1 = %T2 =
%1002/
1
N A
%T1 = %A2 =
%1002/
1
N T
%G1 = %X2 =
%1002/
1
N G
%X1 = %G2 =
%1002/
1
N X
Bảng 2-1 Các dạng bài tập và công thức liên quan đến cấu trúc của gen
2.3.5 Khái niệm mã di truyền (côdon)
Mã di truyền là trình tự sắp xếp các nuclêôtit trong gen (mạch gốc) quy định trình tự sắp xếp các axit amin trong prôtêin
Mã di truyền được đọc từ một điểm theo chiều 3’ = >5’, theo từng bộ ba, không gối lên nhau
2.3.6 Cơ chế tự nhân đôi ADN:
2 mạch phân tử ADN tách nhau dần lộ ra 2 mạch khuôn tổng hợp nên mạch mới theo nguyên tắc bổ sung (A liên kết với T, G liên kết với X)
Trang 26Tính số lượng mỗi loại nu tự do cần
cung cấp khi gen tự nhân đôi 1 lần
Amt = Tmt = Agen (hay Tgen)
Gmt = Xmt = Ggen (hay Xgen) Tính số gen con tạo thành khi gen nhân
đôi x lần
Số gen con = 2x
Tính số gen con được tạo thành hoàn
toàn từ nu tự do của môi trường
Số gen mới hoàn toàn = 2x – 2
Tính số lượng nu tự do (Nmt) cần cung
cấp khi gen tự nhân đôi x lần
Nmt = Ngen x (2x – 1) (vì trong số gen con tạo ra có 2 gen con mà mỗi gen còn giữ lại một mạch của gen mẹ)
Tính số lượng mỗi loại nu tự do cần
cung cấp khi gen tự nhân đôi x lần
Amt = Tmt = Agen x (2x – 1)
Gmt = Xmt = Ggen x (2x – 1) Tính số liên kết HT hình thành khi gen
tự nhân đôi x lần HT = (Ngen – 2) x (2
x – 1) Tính số LKH phá vỡ hay hình thành khi
gen tự nhân đôi x lần LKH = (2A + 3G) x (2
Trang 2719
Phiên mã là quá trình tổng hợp ARN trên mạch khuôn ADN
ARN polimeraza bám vào vùng điều hòa làm gen tháo xoắn lộ mạch gốc có chiều 3’ = >5’ bắt đầu phiên mã
ARN polimeraza trượt trên mạch gốc theo chiều 3’ = >5’
mARN được tổng hợp theo chiều 5’ = >3’, mỗi nu trên mạch gốc liên kết với
nu tự do theo nguyên tắc bổ sung A-U, G-X, T-A, X-G (vùng nào trên gen được phiên mã song thì sẽ đóng xoắn ngay) Khi ARN polimeraza gặp tín hiệu kết thúc thì dừng phiên mã Một phân tử mARN được giải phóng
Kết quả: Tạo nên phân tử mARN mang thông tin di truyền từ gen tới ribôxôm để làm khuôn trong tổng hợp prôtêin
2.3.9 Dịch mã (Tổng hợp prôtêin)
1 Hoạt hoá axit amin:
Nhờ các enzim đặc hiệu và ATP mỗi axit amin được hoạt hoá và gắn với tARN tương ứng tạo axit amin tARN (aatARN)
Nhờ enzim đặc hiệu axit amin đầu tiên (Met) được cắt khỏi chuỗi tạo thành chuỗi polipeptit hoàn chỉnh Sau đó hình thành các cấu trúc bậc cao thực hiện chức năng sinh học của Protein
Trang 28Xác đinh số aa mà môi trường nội bào
cung cấp cho quá trình giải mã tạo
N
số chuỗi pôlipeptit được tổng hợp
Xác đinh số aa mà môi trường nội bào
cung cấp cho quá trình giải mã tạo phân
N
số phân tử prôtêin được tổng hợp
Thời gian tổng hợp 1 phân tử prôtêin
(t1)
t1 =
v
LmARN với v là vận tốc trượt của ribôxôm
Khoảng cách thời gian từ ribôxôm đầu
tiên đến ribôxôm cuối cùng (t2)
Trang 29Xác định vận tốc trượt của ribôxôm
d t
D t
Bảng 2-3 Các dạng bài tập và công thức liên quan đến tổng hợp Prôtêin
Đột biến thay thế một cặp nuclêôtit
Đột biến thêm hoặc mất một cặp nuclêôtit
2.3.11.3 Hậu quả của đột biến gen:
Đột biến thay thế một cặp có thể làm thay đổi trình axit amin trên Pro làm thay đổi chức năng Pro
Đột biến thêm, mất cặp nu làm mã di truyền bị đọc sai từ bộ ba đột biến đến cuối gen làm thay đổi trình tự axit amin, chức năng pro
2.3.12 Các dạng bài tập và công thức liên quan đến đột biến gen
Dạng bài tập Dữ kiện đề cho Trường hợp xác định
Cho biết cấu trúc
gen sau đột biến
Xác định dạng đột
- Tổng số nu không đổi
- Tổng số LKH không đổi
Thay thế các cặp nu cùng loại hoặc đảo vị trí các cặp nu
- Tổng số nu không đổi Thay thế các cặp nu khác loại
Trang 30- Ngen không thay đổi
- Dạng đột biến: Mất 3 cặp nu của cùng một bộ mã
- Cấu trúc gen sau đột biến: Ngengiảm; LKH giảm
Prôtêin đột biến kém prôtêin bình thường một
- Dạng đột biến: Thêm cặp nu
- Cấu trúc gen sau đột biến: Ngen
Trang 3123
tăng; LKH tăng
Prôtêin đột biến có số lượng aa không thay đổi
so với prôtêin bình thường
- Dạng đột biến: Thay thế cặp nu cùng loại hay khác loại hoặc đảo
vị trí các cặp nu (bộ mã ban đầu
và bộ mã đột biến cùng quy định một aa)
- Cấu trúc gen sau đột biến: Ngentăng; LKH có thể thay đổi hoặc không thay đổi
Bảng 2-4 Các dạng bài tập và công thức liên quan đến đột biến gen
Trang 3224
Chương 3 Biểu diễn tri thức
3.1 Biễu diễn tri thức toán di truyền lớp 12 trên máy tính
Tri thức sẽ được chia thành 4 dạng
1 Yếu tố: tri thức có miền giá trị số thực
2 Sự kiện: tri thức mệnh đề, có giá trị đúng hay sai
3 Công thức: tri thức là công thức toán học, bao gồm các yếu tố và các
Công thức: N = 20C, có sự tham gia của 2 yếu tố N và C
Nếu ta có giá trị của C, thì dễ dàng tính được giá trị của N
Sự kiện: Tổng số nucleotit không đổi Nkd, đột biến thay thế cặp nu ThayN, đảo vị trí cặp nu DaoN
Luật: Nếu đột biến thay thế cặp nu thì tổng số nu không đổi
ThayN Nkd
Tri thức dạng sự kiện: là tri thức biểu diễn dưới dạng mệnh đề, có giá trị đúng hay sai, theo ngữ cảnh bài toán thì ta có thể qui ước nó có giá trị là có hoặc không
Ví dụ: gen đột biến mất cặp nucleotit, nghĩa là có mất cặp nucletit, không có giá trị số cụ thể
Trang 3325
3.1.1 Yếu tố
Là tri thức có giá trị cụ thể, do đề bài hay là các giá trị tính toán được trong quá trình giải Ví dụ: Tổng số nucleotit của gen là 3000, N = 3000, thì N là tri thức dạng yếu tố tri thức dạng này sẽ có trong các tri thức dạng công thức Ta có các yếu
tố sau:
L, N, C, M, H (LKH) , HT, A, T, G, X, Ldb, Ndb, Cdb, Mdb, Hdb (LKH) , HTdb, Adb, Tdb, Gdb, Xdb, mN, mAT , mGX, mBoBa, M2BoBa , tN , tAT , tGX , thayN , thayAT , thayGX , thayNCL , thayNKL , Dao , Nkd , Nd , Ntang , Ngiam , Hkd , Hd , Htang , Hgiam , CLNkd , CLNd , ATtang , ATgiam , GXtang , Gxgiam,…
[3] Mất hoặc thêm các cặp nu
[4] Ngen thay đổi
[5] Tổng số LKH thay đổi
[6] Số lượng từng loại nu thay đổi
[7] Ngen không đổi
[8] Tổng số LKH thay đổi
[9] Số lượng từng loại nu không thay đổi
[10] Ngen không thay đổi
[11] Tổng số LKH thay đổi
Trang 3426
[12] Số lượng từng loại nu thay đổi
[13] Dạng đột biến: Mất 3 cặp nu của cùng một bộ mã
[14] Cấu trúc gen sau đột biến: Ngen giảm; LKH giảm
[15] Dạng đột biến: Mất 3 cặp nu của 2 một bộ mã liên tiếp
[16] Cấu trúc gen sau đột biến: Ngen giảm; LKH giảm
[17] Dạng đột biến: Thêm cặp nu
[18] Cấu trúc gen sau đột biến: Ngen tăng; LKH tăng
[19] Dạng đột biến: Thay thế cặp nu cùng loại hay khác loại hoặc đảo vị trí các cặp nu (bộ mã ban đầu và bộ mã đột biến cùng quy định một aa)
[20] Cấu trúc gen sau đột biến: Ngen tăng; LKH có thể thay đổi hoặc không thay đổi
Trang 35[38] thayN GXtang > thayAT
[39] thayGX > thayNKL [40] thayGX > ATtang [41] thayGX > GXgam [42] ATtang GXgamthayGX [43] thayN ATtang > thayGX
[44] thayN GXgam > thayGX
[45] Dao > CLNkd [46] Nd > Hd [47] mBoBa > mN [48] m2BoBa > mN
3.1.4 Tri thức dạng công thức
Cấu trúc của gen
[1] Lgen = Lmạch đơn gen = N 3,4A o
2 [2] Lgen = Lmạch đơn gen =
o
A
10 [3] Mgen = N x 300 đvC
Trang 3628
[4] Hgen (LKH) = 2A + 3G
[5] HT = N - 2
[6] HT = 2 (N – 1) (đây là tổng liên kết HT giữa các nu và giữa các phân
tử đường với axit photphoric trong các nu)
[8] N = 20C (nu)
[9] N = 300
M
(nu) [10] N = Nmạch đơn x 2 (nu)
3 2
Trang 37N T
[24] %G = %X =
%100
N X
%
%2
%
%G1 X2 G1 X2
[27] %A1 = %T2 =
%1002/
1
N A
[28] %T1 = %A2 =
%1002/
1
N T
[29] %G1 = %X2 =
%1002/
1
N G
[30] %X1 = %G2 =
%1002/
1
N X
Cơ chế tự nhân đôi ADN:
[31] Nmt = Ngen
[32] Amt = Tmt = Agen (hay Tgen)
[33] Gmt = Xmt = Ggen (hay Xgen)
[34] Số gen con = 2x
[35] Số gen mới hoàn toàn = 2x – 2
Trang 38số phân tử prôtêin được tổng hợp
[45] t1 = v
LmARN với v là vận tốc trượt của ribôxôm
d t
D t
Trang 3931
Đột biến gen
[51] Thay thế các cặp nu cùng loại hoặc đảo vị trí các cặp nu
[52] Thay thế các cặp nu khác loại
[53] Mất hoặc thêm các cặp nu
[54] Ngen thay đổi
[55] Tổng số LKH thay đổi
[56] Số lượng từng loại nu thay đổi
[57] Ngen không đổi
[58] Tổng số LKH thay đổi
[59] Số lượng từng loại nu không thay đổi
[60] Ngen không thay đổi
[61] Tổng số LKH thay đổi
[62] Số lượng từng loại nu thay đổi
[63] Dạng đột biến: Mất 3 cặp nu của cùng một bộ mã
[64] Cấu trúc gen sau đột biến: Ngen giảm; LKH giảm
[65] Dạng đột biến: Mất 3 cặp nu của 2 một bộ mã liên tiếp
[66] Cấu trúc gen sau đột biến: Ngen giảm; LKH giảm
[67] Dạng đột biến: Thêm cặp nu
[68] Cấu trúc gen sau đột biến: Ngen tăng; LKH tăng
[69] Dạng đột biến: Thay thế cặp nu cùng loại hay khác loại hoặc đảo vị trí các cặp nu (bộ mã ban đầu và bộ mã đột biến cùng quy định một aa)
[70] Cấu trúc gen sau đột biến: Ngen tăng; LKH có thể thay đổi hoặc không thay đổi