Nghiên cứu này sẽ thực hiện tìm hiểu,cải tiến và áp dụng các phương pháp tìm kiếm tối ưu tiên tiến để nâng caotốc độ hội tụ trong việc giải bài toán tối ưu thay đảo nhiên liệu.. Bài toán
Trang 1VIỆN NĂNG LƯỢNG NGUYÊN TỬ VIỆT NAM
Hà Nội - 2022
Trang 2Mục lục
2.1 Bài toán chuẩn cho lò phản ứng VVER-1000 nạp tải nhiên
liệu MOX 4
2.2 Chuẩn bị các hằng số nhóm 4
2.3 Phát triển chương trình LPO-V 5
2.3.1 Phương trình khuếch tán nhiều nhóm ở trạng thái dừng 5 2.3.2 Rời rạc hóa không gian bằng phương pháp sai phân hữu hạn 5
2.3.3 Các điều kiện biên 6
2.3.4 Phương pháp phục hồi kế thừa liên tục (SOR) 7
2.3.5 Mô hình hóa vùng hoạt bằng LPO-V 7
2.3.6 Tính toán kiểm tra mô-đun mô phỏng vùng hoạt của chương trình LPO-V 8
2.4 Phát triển phương pháp ESA 8
2.4.1 Phương pháp SA và ASA 8
2.4.2 Phương pháp ESA 9
2.5 Phát triển phương pháp SHADE rời rạc 9
2.5.1 Phương pháp tiến hóa vi phân (DE) 9
2.5.2 Các toán tử của SHADE 10
2.5.3 Cơ chế thích ứng dựa trên lịch sử thành công 11
2.5.4 Phương pháp SHADE rời rạc 12
i
Trang 32.6 Các hàm mục tiêu (OF) 12
2.7 Mann-Whitney U-Test 13
3 Tối ưu thay đảo nhiên liệu cho lò phản ứng VVER-1000 14
3.1 Tối ưu LP của lò phản ứng VVER-1000 bằng phương phápESA 14
3.1.1 Lựa chọn phương pháp ESA 14
3.1.2 So sánh giữa SA, ASA và ESA 15
3.1.3 Tối ưu LP của lò VVER-1000 MOX bằng phương
pháp ESA 16
3.2 Tối ưu LP của lò phản ứng VVER-1000 bằng phương phápSHADE 17
3.2.1 Xác định các tham số điều khiển 17
3.2.2 Tối ưu LP của lò VVER-1000 MOX bằng phương
4.2 Nghiên cứu dự định trong tương lai 21
Trang 4Danh sách các từ viết tắt
ASA Adaptive Simulated Annealing Mô phỏng tôi kim thích ứng
BC Boundary Condition Điều kiện biên
DE Differential Evolution Tiến hóa vi phân
ENDF Evaluated Nuclear Data File Tệp dữ liệu hạt nhân được
đánh giáESA Evolutionary Simulated
FDM Finite Difference Method Phương pháp sai phân hữu
LPO-V Loading Pattern Optimization
MCNP Monte Carlo N-Particle
-MOX Mixed Oxide Fuel Nhiên liệu oxit hỗn hơpPPF Power Peaking Factor Hệ số đỉnh công suất
RPI Relative Position Indexing Lập chỉ mục vị trí tương đối
SA Simulated Annealing Mô phỏng tôi kim
SHADE Success-History based Adaptive
Differential Evolution
Tiến hóa vi phân thích ứngdựa trên lịch sử thành côngSOR Successive Over-Relaxation Phục hồi kế thừa liên tụcVVER Vodo-Vodyanoi Energetichesky
Reaktor
Lò phản ứng năng lượng nước
áp lực
Trang 5Giới thiệu tổng quan
Vấn đề của bài toán quản lý nhiên liệu trong vùng hoạt (ICFM) làkhông gian tìm kiếm quá lớn, vì vậy cho đến nay chưa có thuật toán tìmkiếm tối ưu nào có thể xác nhận rằng nghiệm tìm được cuối cùng là nghiệmtối ưu toàn cục Do đó, các nghiên cứu tối ưu hóa hiện nay tập trung vàoviệc cải thiện tốc độ hội tụ của quá trình tìm kiếm nhằm tìm ra các nghiệmngày càng tốt hơn với cùng số phép Nghiên cứu này sẽ thực hiện tìm hiểu,cải tiến và áp dụng các phương pháp tìm kiếm tối ưu tiên tiến để nâng caotốc độ hội tụ trong việc giải bài toán tối ưu thay đảo nhiên liệu Luận vănnày có hai mục tiêu chính:
1 Nghiên cứu các phương pháp tìm kiếm tối ưu tiên tiến để áp dụng chobài toán tối ưu LP của lò phản ứng hạt nhân
2 Phát triển một công cụ tính toán để tìm kiếm cấu hình nạp tải tối ưucho lò phản ứng VVER
Các nội dung chính của luận văn bao gồm:
Chương 1 mô tả tóm tắt tổng quan về công nghệ lò phản ứng hạtnhân, bài toán tối ưu LP, các phương pháp tìm kiếm tối ưu và mụctiêu của luận văn
Chương 2 trình bày nghiên cứu phát triển các phương pháp tìm kiếmtối ưu tiên tiến và một chương trình mô phỏng vùng hoạt lò phản ứnghạt nhân Bài toán chuẩn của lò phản ứng VVER-1000 nạp tải 30%MOX được sử dụng cho các tính toán tối ưu áp dụng các phương pháp
Trang 6tìm kiếm tối ưu được phát triển Chương trình LPO-V được phát triểndựa trên phương pháp sai phân hữu hạn để giải phương trình khuếchtán nhiều nhóm, được dùng để tính toán các đặc trưng vật lý của lòphản ứng VVER và kết hợp với các phương pháp tìm kiếm tối ưu đểgiải bài toán tối ưu LP cho lò phản ứng VVER Các tính toán kiểmchứng cho thấy chương trình có độ chính xác đảm bảo và tốc độ tínhtoán nhanh, phù hợp với yêu cầu của bài toán tối ưu LP.
Hai phương pháp tìm kiếm tối ưu tiên tiến đã được phát triển: phươngpháp mô phỏng tôi kim tiến hóa (ESA) và phương pháp tiến hóa viphân dựa trên lịch sử thành công (SHADE) ESA là một cải tiến củaphương pháp SA ban đầu bằng cách sử dụng toán tử trao đổi chéo.SHADE đã được chứng minh là một phương pháp tiên tiến hiệu suấtcao với nhiều bài toán tối ưu hóa Trong luận văn này, phiên bảnSHADE rời rạc đã được xây dựng và áp dụng cho bài toán tối ưu hóa
LP Các hàm mục tiêu dựa trên phân bố công suất, kef f và hệ sốđỉnh công suất (PPF) đã được sử dụng để đánh giá cấu hình nạp tảinhằm tìm ra cấu hình tối ưu Phép kiểm tra thống kê Mann-WhitneyU-test cũng được áp dụng để so sánh hiệu quả của các phương pháptìm kiếm tối ưu
Chương 3 trình bày các tính toán cho lò VVER-1000 MOX áp dụngcác phương pháp ESA và SHADE Kết quả của phương pháp ESAđược so sánh với SA và ASA Đánh giá thống kê giữa các phươngpháp này cũng được thực hiện dựa trên Mann-Whitney U-test Kếtquả cho thấy rằng phương pháp ESA có hiệu suất cao hơn so với SA
và ASA Kết quả của phương pháp SHADE rời rạc cũng được so sánhvới phương pháp ESA Cấu hình nạp tải tối ưu được tìm thấy theohai phương pháp là giống nhau Kết quả cho thấy kef f của cấu hìnhtối ưu lớn hơn cấu hình tham chiếu của bài toán chuẩn khoảng 1580pcm Trong khi đó, P P F của cấu hình tối ưu nhỏ hơn khoảng 2,4 %
so với cấu hình tham chiếu
Chương 4 tóm tắt kết quả của luận văn này và đưa ra một số kế hoạchtrong tương lai
Trang 7Chương 2
Phương pháp và phát triển
tải nhiên liệu MOX
Trong nghiên cứu này, các tính toán tối ưu LP đã được thực hiệndựa trên bài toán chuẩn cho lò VVER-1000 nạp tải 30% nhiên liệu MOX.Bài toán chuẩn này được đề xuất bởi OECD/NEA để nghiên cứu hiệusuất neutronics của vùng hoạt hỗn hợp UO2-MOX, đồng thời xác minh cácchương trình và phương pháp tính toán [1] Cấu hình 1/6 vùng hoạt chuẩnbao gồm 28 bó nhiên liệu, trong đó có 19 bó nhiên liệu UO2 và 9 bó nhiênliệu MOX [1]
Mô-đun PIJ của chương trình SRAC2006 được sử dụng để tính toán
mô phỏng các ô mạng nhiên liệu và và các vật liệu khác trong vùng hoạtbằng cách sử dụng phương pháp xác suất va chạm Kết quả của các tínhtoán này là tập hợp các tiết diện vĩ mô nhiều nhóm nhóm (hằng số nhóm)của các ô mạng, và sẽ được sử dụng cho các tính toán toàn vùng hoạt trongchương trình LPO-V Đối với các bó nhiên liệu lò VVER-1000, mô hình lụcgiác với đối xứng xoay 60o được sử dụng
Trang 8Chapter 2: Phương pháp và phát triển
thái dừng
Phương trình khuếch tán là sự kết hợp của phương trình liên tục vàđịnh luật Fick [2] Với tính toán nhiều nhóm trong lò phản ứng hạt nhân,phương trình khuếch tán được viết cho mỗi nhóm g như sau:
ef f là một hệ số không đổi; χg là xác suất để mộtneutron phân hạch sẽ được tạo ra với năng lượng trong nhóm g
đa nhóm (2.1) như sau:
ag,i,i−1ϕg,i−1+ ag,i,iϕg,i+ ag,i,i+1ϕg,i+1+ ag,i,kϕg,k= Sg,i (2.2)hoặc dưới dạng phương trình ma trân:
trong đó ag,i,k là các thừa số bắt nguồn từ các hằng số nhóm của ô mạng
i, k; Sg,i là số hạng nguồn neutron cho nhóm g trong ô mạng i, bao gồm
Trang 9Hình 2.1: mô hình ô mạng tam giác 2D (a) và các ô mạng lân cận (b).nguồn phân hạch neutron và sự tán xạ neutron từ các nhóm khác đến nhómg.
Giải phương trình trên thu được giá trị riêng kef f và phân bố thônglượng neutron ϕg,i Phân bố công suất thu được bằng cách nhân ϕg,i vớitiết diện phân hạch Σf,g,i
Ba điều kiện biên (BC) được áp dụng để giải phương trình khuếchtán trong lò phản ứng hạt nhân BC mặt tự do thường được áp dụng chomặt bên ngoài của vùng hoạt lò phản ứng, trong khi BC phản xạ và BCtuần hoàn được áp dụng khi việc mô phỏng có xem xét đến tính đối xứngcủa lò phản ứng
BC mặt tự do giả định rằng thông lượng neutron bằng 0 ở một khoảngcách ngoại suy nhỏ ngoài bề mặt
trong đó rB là mặt biên và dg là khoảng cách ngoại suy của nhóm g Tronghầu hết các trường hợp, dg được tính là dg= 2.13Dg [2]
BC phản xạ được cho bởi mật độ dòng neutron bằng không trong tất
cả các nhóm năng lượng tại bề mặt phản xạ (ref_sur):
J(ref _sur)= 0 (2.5)
BC tuần hoàn cho bởi thông lượng neutron và mật độ dòng neutron tại hai
bề mặt tuần hoàn (per_sur_1 và per_sur_2) trùng nhau:
ϕ(per_sur_1)= ϕ(per_sur_2) và J(per_sur_1)= J(per_sur_2) (2.6)
Trang 10Chapter 2: Phương pháp và phát triển
Hình 2.2: Mô hình vùng hoạt VVER-1000 với 24 ô mạng tam giác trêm mỗi
bó nhiên liệu trong chương trình LPO-V
Phương pháp lặp được sử dụng để giải phương trình (2.3) gián tiếpkhi ma trận A trở nên rất lớn trong mô phỏng lò phản ứng Trong nghiêncứu này, SOR được sử dụng để giải hệ phương trình tuyến tính (2.3) [3].Phương trình của phương pháp SOR được viết như sau:
Mô hình 1/6 vùng hoạt được mô phỏng bằng chương trình Tối ưuhóa cấu hình tải cho các lò phản ứng VVER (LPO-V) được tác giả tự pháttriển Chương trình LPO-V được phát triển dựa trên lý thuyết khuếch tánnhiều nhóm cho các hệ hình học lục giác Chương trình này bao gồm mộtmô-đun tính toán vật lý vùng hoạt và một mô-đun tìm kiếm cấu hình nạptải tối ưu Hình2.2hiển thị mô hình 1/6 vùng hoạt VVER-1000 MOX với
24 ô mạng tam giác trên mỗi bó nhiên liệu trong chương trình LPO-V Bộtiết diện vĩ mô bốn nhóm của bó nhiên liệu được chuẩn bị từ các tính toán
ô mạng bằng mô-đun PIJ của hệ chương trình SRAC2006 và thư viện dữliệu ENDF/B-VII.0 [4]
Trang 112.3.6 Tính toán kiểm tra mô-đun mô phỏng vùng hoạt
của chương trình LPO-V
Tính toán kiểm tra mô-đun mô phỏng vùng hoạt của chương trìnhLPO-V được tiến hành dựa trên cấu hình tham chiếu của bài toán chuẩn
lò VVER-1000 MOX [1] Bảng 2.1 so sánh các giá trị kef f thu được từchương trình LPO-V với các giá trị từ MCNP4c được trình bày trong bàitoán chuẩn Kết quả so sánh cho thấy hai chương trình có sự thống nhấttốt trong mô phỏng vùng hoạt VVER-1000 MOX
Bảng 2.1: So sánh giá trị kef f được tính bởi LPO-V và MCNP4c cho nămtrạng thái (S1–S5) của bài toán chuẩn lò VVER-1000 MOX
Ký hiệu Tên trạng thái kef f Độ lệch
LPO-V MCNP4c (pcm) S1 Hoạt động có Boron 1.03664 1.03770 -102 S2 Nhiệt độ không đổi có Boron 1.05029 1.05132 -98 S3 Lạnh với nồng độ Boron cao 0.93415 0.93416 -1 S4 Hoạt động không Boron 1.13762 1.13871 -95 S5 Nhiệt độ không đổi không Boron 1.15302 1.15400 -85
Việc kiểm tra tốc độ tính toán cũng được thực hiện bằng cách so sánhgiữa LPO-V và mô-đun CITATION của chương trình SRAC2006 Thời giantính toán 2000 cấu hình lò VVER-1000 MOX bằng LPO-V là khoảng 340giây, nhanh hơn khoảng 3 lần so với mô-đun CITATION của SRAC2006(1040 giây) với cùng điều kiện tính toán Như vậy, mô-đun mô phỏng vùnghoạt của LPO-V phù hợp với bài toán tối ưu LP với số lượng cấu hình cầntính toán lớn
Phương pháp SA ban đầu dựa trên hiện tượng dao động tinh thểtrong quá trình làm nguội kim loại nóng chảy Phương pháp này đã sớmđược áp dụng cho bài toán tối ưu LP của lò phản ứng hạt nhân Trong SA,một cấu hình thử nghiệm mới được tạo ra từ cấu hình cơ sở bằng toán tửtrao đổi nhị phân hoặc bậc ba Phương pháp SA có khả năng thoát khỏi tối
Trang 12Chapter 2: Phương pháp và phát triển
ưu cục bộ bằng cách chấp nhận cấu hình thử nghiệm kém hơn là cấu hình
cơ sở mới theo một xác suất nhất định
SA thích ứng (ASA) là phiên bản nâng cao của phương pháp SA.ASA được thực hiện bằng cách áp dụng đồng thời hai chiến lược sau:
Quay lại cấu hình tốt nhất: Nếu cấu hình tốt nhất hiện tại không thayđổi sau một số lượng liên tiếp các cấu hình cơ sở được cập nhật, thìcấu hình tốt nhất hiện tại được sử dụng lại làm cấu hình cơ sở
Danh sách cấu hình hạn chế : Các cấu hình dùng thử nghiệm và cấuhình cơ sở được tính toán gần nhất được lưu trữ trong danh sách hạnchế Nếu cấu hình thử nghiệm mới có trong danh sách, thì việc tạocấu hình thử nghiệm mới sẽ được lặp lại
Phương pháp SA tiến hóa (ESA) đã đề xuất một cách tiếp cận mới
để tạo cấu hình thử nghiệm, bằng cách sử dụng toán tử trao đổi chéo vàđột biến để thay thế toán tử trao đổi nhị phân /bậc ba trong các phươngpháp SA Hai cấu hình cơ sở được sử dụng làm cha mẹ để tạo ra con cáibằng cách trao đổi chéo Sau đó, một cấu hình thử nghiệm mới được tạo ra
từ con cái bằng cách thực hiện đột biến
Kết hợp hai phương pháp trao đổi chéo và năm phương pháp để chọncấu hình cơ sở mẹ, mười phiên bản của phương pháp ESA được xem xét,
ký hiệu là ESA–CiAj với i = {1, 2} và j = {1, , 5} Việc khảo sát đã đượcthực hiện để so sánh và chọn một phiên bản phù hợp nhất cho bài toán tối
ưu LP
Bắt đầu từ một quần thể ban đầu ngẫu nhiên, DE tạo ra quần thểtiến hóa tiếp theo bằng cách áp dụng các toán tử đột biến, trao đổi chéo
và chọn lọc Tập hợp (P ) trong phương pháp DE là một tập hợp các vectơriêng lẻ xi = (x1,i, , xD,i) với i = 1, , N P Trong đó, D là số chiều củakhông gian vectơ các nghiệm và N P là kích thước của tập hợp P Trongthế hệ G, một tập hợp N P vectơ thử nghiệm được tạo ra từ tập hợp P hiện
Trang 13tại thông qua đột biến và trao đổi chéo Sau đó, thế hệ mới G + 1 được cậpnhật bởi toán tử lựa chọn.
Đột biến
Các toán tử SHADE tương tự như trong DE, nhưng các hệ số độtbiến F và trao đổi chéo CR được xác định tự động bởi một cơ chế thíchứng Trong nghiên cứu hiện tại, chiến lược DE/current − to − pbest/1 cùngvới một tập lưu trữ ngoài được sử dụng cho toán tử đột biến của phươngpháp SHADE Công thức của toán tử đột biến được viết là:
vi,G= xi,G+ Fi× (xpbest,G− xi,G) + Fi× (xr1,G− xr2,G), (2.8)
trong đó vi,G là vectơ đột biến trong thế hệ G; Fi là hệ số đột biến chovectơ xi, được xác định tự động bởi một cơ chế thích ứng; xpbest,G đượcchọn ngẫu nhiên từ N P × p (p ∈ (0, 1)) các nghiệm tốt nhất của tập hợp
PGcủa thế hệ G; xr1,Gđược chọn ngẫu nhiên trong tập hợp PG; xr2,G đượcchọn ngẫu nhiên trong PG∪ A, trong đó A là tập lưu trữ bên ngoài Cáclựa chọn xpbest,G, xr1,G và xr2,G cần thỏa mãn điều kiện r1 ̸= r2 ̸= pbest.Trao đổi chéo
Sau khi một vectơ đột biến được tạo ra bởi toán tử đột biến, toán tửtrao đổi chéo được thực hiện để tạo ra một vectơ thử nghiệm Trong toán
tử này, vectơ đột biến vi,G được trao đổi chéo với vectơ mẹ xi,G để tạo ramột vectơ thử nghiệm ui,G Một phép trao đổi chéo nhị thức phổ biến được
sử dụng như sau:
uj,i,G =
(
vj,i,G nếu rand[0, 1) ≤ CRi hoặc j = jrand
xj,i,G các trường hợp còn lại , (2.9)
trong đó, uj,i,G với j = {1, , D} là một phần tử của vectơ thử nghiệm
ui,G; rand[0, 1) là một số ngẫu nhiên được chọn trong [0, 1); jrand là một
số nguyên ngẫu nhiên trong [1, D]; và CRi ∈ [0, 1] là hệ số trao đổi chéo,được xác định bởi một cơ chế thích ứng
Lựa chọn
Khi tất cả các vectơ thử nghiệm ui,G với i = {1, , N P } trong thế
hệ G đã được tạo, toán tử lựa chọn được thực hiện để xác định tập hợp củathế hệ tiếp theo G + 1 Toán tử này so sánh mỗi xi,Gvới vectơ thử nghiệm
Trang 14Chapter 2: Phương pháp và phát triển
tương ứng ui,G và giữ vectơ thử nghiệm tốt hơn cho thế hệ tiếp theo G + 1như sau:
xi,G+1=
(
ui,G nếu f (ui,G) ≥ f (xi,G)
xi,G các trường hợp còn lại , (2.10)trong đó, f (ui,G) là giá trị hàm mục tiêu của vectơ ui,G
2.5.3 Cơ chế thích ứng dựa trên lịch sử thành côngTrong phương pháp SHADE, các tham số F và CR được xác địnhbởi cơ chế thích ứng dựa trên lịch sử thành công Trong quá trình tìm kiếm,SHADE duy trì hai tập lịch sử với số lượng phần tử H cho các tham số điềukhiển F và CR, được ký hiệu là MF và MCR
Trong mỗi thế hệ, Fi được xác định theo phân bố Cauchy với tham
số vị trí MF,r i và tham số tỷ lệ 0,1 như sau:
Tương tự, CRi được tạo bởi phân bố chuẩn (Gaussian) với trung bình
MCR,r i và độ lệch chuẩn 0,1 như sau:
Trong một thế hệ, các giá trị Fi và CRi, được sử dụng để tạo vectơ thửnghiệm thành công ui,G tốt hơn giá trị gốc xi,G trong Phương trình (2.10),được ghi lại vào hai tập lịch sử SF và SCR tương ứng Cuối mỗi thế hệ, cáctập lịch sử được cập nhật như sau:
MF,j,G+1=
(meanW L(SF) nếu SF ̸= ∅
MF,j,G các trường hợp còn lại , (2.13)and
MCR,j,G+1=
(meanW A(SCR) nếu SCR̸= ∅
MCR,j,G các trường hợp còn lại . (2.14)Trong các phương trình (2.13) và (2.14), meanW A là giá trị trungbình trọng số và meanW L là giá trị trung bình trọng số Lehmer, được tínhnhư sau [5]:
meanW L =
P|S F | k=1wk× S2
F,k
P|S F | k=1wk× SF,k, và meanW A =
|SCR|
X
k=1
wk× SCR,k (2.15)