1. Trang chủ
  2. » Giáo án - Bài giảng

Nghiên cứu độ bền nhiệt động của các hợp chất kim loại chuyển tiếp và kim loại đất hiếm bằng mạng nơ-ron

13 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu độ bền nhiệt động của các hợp chất kim loại chuyển tiếp và kim loại đất hiếm bằng mạng nơ-ron
Tác giả Phạm Tiến Lâm, Nguyễn Văn Quyền
Trường học Phenix University
Chuyên ngành Khoa học vật liệu
Thể loại Nghiên cứu khoa học
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 13
Dung lượng 404,79 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài viết Nghiên cứu độ bền nhiệt động của các hợp chất kim loại chuyển tiếp và kim loại đất hiếm bằng mạng nơ-ron trình bày các kết quả nghiên cứu ứng dụng mạng nơ-ron để biểu diễn các khía cạnh về độ bền nhiệt động bao gồm: năng lượng sinh, năng lượng phân li dựa trên việc phân tích bao lồi của giản đồ pha, và nhận diện các các cấu trúc có thể bền vững về mặt nhiệt động học. Mời các bạn cùng tham khảo!

Trang 1

180

Prediction of Thermodynamic stability of Lanthanide-Transition metal

alloys by Deep neural network

Nghiên cứu độ bền nhiệt động của các hợp chất kim loại chuyển tiếp và

kim loại đất hiếm bằng mạng nơ-ron

Phạm Tiến Lâm1, 2, *, Nguyễn Văn Quyền1

1 Faculty of Computer Science, Phenikaa University, Yen Nghia, Ha Dong Dist., Hanoi

2 Phenikaa Institute for Advanced Study (PIAS), Phenikaa University, Yen Nghia, Ha Dong

Dist., Hanoi

*Email: lam.phamtien@phenikaa-uni.edu.vn

Abstract

The utilization of machine learning, especially deep learning, in solving materials science issues bring an opportunity to accelerate the development process of new materials and draw the attention of researchers all over the world In this paper, we present our study on applying deep neural networks to represent and predict thermodynamic quantities including formation energy, convex hull distance, and to recognize potential thermodynamical stabile materials We employ our novel material descriptor, named orbital field matrix (OFM), to determine the feature vectors for materials The OFM descriptors were developed based on the information of valence electron configuration and the Voronoi analysis of the atomic structures of materials Our experiments show that deep neural networks can accurately predict formation energy with the mean absolute error of 0.12 eV/atom and 0.10 eV/atom for convex hull distance The classification neural network can yield an accuracy of 92% in distinguishing the stable and unstable materials

Tóm tắt

Việc ứng dụng các mô hình học máy đặc biệt là mạng nơ-ron và học sâu đã mang vào gải quyết các bài toán trong khoa học vật liệu đã mang lại những hiệu ứng tích cực cho các nghiên cứu về khoa học vật liệu, và thu hút được sự quan tâm của nhiều nhà khoa học Trong bài báo này chúng tôi trình bày các kết quả nghiên cứu ứng dụng mạng nơ-ron để biểu diễn các khía cạnh về độ bền nhiệt động bao gồm: (1) năng lượng sinh, (2) năng lượng phân li dựa trên việc phân tích bao lồi của giản đồ pha, và nhận diện các các cấu trúc có thể bền vững về mặt nhiệt động học Chúng tôi

Trang 2

sử dụng thông tin về lớp vỏ hoá trị của các nguyên tử và thông tin về cấu trúc thông qua phân tích giản đồ voronoi của các cấu trúc địa phương để xây dựng các vectors đặc trưng cho vật liệu Các kết quả nghiên cứu cho thấy việc ứng dụng mạng nơ-ron có thể dự đoán năng lượng sinh với sai số tuyệt đối là 0.12 eV/atom, và năng lượng phân li là 0.10 eV/atom, và có khả năng nhận diện cấu trúc bền vững và kém bền với độ chính xác 92%

1 GIỚI THIỆU

Trong những năm gần đây việc ứng dụng các phương pháp học máy (machine learning) hay trí truệ nhân tạo vào giải quyết các bài toán khoa học vật liệu đã và đang thu hút được sự được sự chú ý của rất nhiều nhà khoa học trong và ngoài nước Việc ứng dụng học máy được kì vọng sẽ giúp tăng tốc quá trình nghiên cứu phát triển các vật liệu tiên tiến cho các công nghệ mới, một trong những vấn đề then chốt của khoa học vật liệu

Gần đây dữ liệu các tính toán DFT cho vật liệu có kích thước vừa và nhỏ đang tăng lên rất nhanh Bên cạnh đó dữ liệu thực nghiệm cũng tăng lên nhanh chóng Do đó, các phương pháp học máy hiện đại được kì vọng có thể giúp các nhà nghiên cứu khoa học vật liệu phân tích hiệu quả các dữ liệu lớn này, từ đó giúp tăng tốc quá trình nghiên cứu và phát triển vật liệu mới Ngày nay, chúng ta có thể truy cập đến các cơ sở dữ liệu về vật liệu một cách dễ dàng thông qua mạng internet; ví dụ như Materials Projects [1], Open Quntum Materials Database (OQMD) [2,3], Atomwork [4], Nomad [5], Aflowlib [6], Để khai thác hiệu quả các dữ liệu này việc kết hợp giữa học máy và khoa học vật liệu đã tạo ra một lĩnh vực nghiên cứu mới rất hứa hẹn là tin học vật liệu (materials informatics) Tin học vật liệu là lĩnh vực nghiên cứu sử dụng các kỹ thuật tin học, đặc biệt là học máy và trí tuệ nhân tạo, để giải quyết các vấn đề trong khoa học vật liệu, với mục đích khai thác được những thông tin và tri thức ẩn từ những dữ liệu về vật liệu, từ đó có thể xây dựng được các thuật toán và phương pháp để thiết kế ra các vật liệu mới [7–15]

Trong những năm gần đây, nhiều nghiên cứu đã minh chứng hiệu quả của việc ứng dụng các phương pháp học máy vào khoa học vật liệu để tìm ra các thông tin ẩn trong các dữ liệu về vật liệu [10,16,17] ; giúp tính toán mặt thế năng (potential energy surface) một cách hiệu quả, cho phép các nhà nghiên cứu có thể mô phỏng nhiệt động lực học phân tử cho các hệ có kích thước lớn và phức tạp [8,14,15,18]; và giúp dự đoán nhanh các tính chất của vật liệu Đặc biệt, các phương pháp này có thể hỗ trợ tăng tốc quá trình khám phá ra vật liệu mới

Trang 3

182

Gần đây chúng tôi phát triển một phương pháp biểu diễn vật liệu dựa trên các thông tin về điện tử hoá trị và cấu trúc hình học địa phương dựa trên các phép phân tích voronoi của cấu trúc tinh thể 3 chiều của vật liệu [9,19] Chúng tôi đặt tên phương pháp biểu diễn vật liệu này là OFM (orbital field matrix) Các kết quả nghiên cứu của chúng tôi cho thấy phương pháp biểu diễn vật liệu này thể hiện sự hiệu quả trong việc dự đoán tính chất của vật liệu [9,19] và dự đoán vật liệu mới [20] Trong công trình này chúng tôi trình bày kết quả nghiên cứu sử dụng mạng nơ-ron để nghiên cứu độ bền nhiệt động của vật liệu kim loại chuyển tiếp và kim loại đất hiếm Các khảo sát của chúng tôi cho thấy việc sử dụng mạng nơ-ron và OFM cho phép chúng tôi xây dựng được các mô hình học máy (học sâu) để dự đoán độ bền nhiệt động của các vật liệu

2 MẠNG NƠ-RON

Nơ-ron nhân tạo đầu tiên được xây dựng và phát triển bởi McCulloch và Pitts [21] vào năm

1943 để nghiên cứu tín hiệu sử lý của bộ não Rosenblatt [22] cũng đã được truyền cảm hứng từ

tế bào thần kinh nhân tạo và khả năng học hỏi của nó, và mạng Perceptron bao gồm một hoặc nhiều đầu vào, một bộ xử lý cùng một đầu ra được ra đời, và tiếp tục được phát triển bởi Minsky [23] và Werbos [24] để cải thiện các điểm yếu Vào cuối những năm 1970 và 1980, một số phương pháp đã được phát triển để cải thiện độ chính xác và tin cậy của mạng nơ-ron nhân tạo, khiến chúng ngày càng được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau như hoá học, sinh học, vật lý, phân tích xử lý số liệu,

Mạng nơ-ron có thể được coi là một mô hình toán học của mạng các nơ-ron trong hệ thần kinh của con người [25]: mỗi nơ-ron sẽ tổng hợp các thông tin từ input dưới dạng tổng có trọng

số (w) và giá trị tổng này sẽ được truyền vào một hàm phi tuyến được gọi là hàm hoạt hoá (activation function): 𝑦𝑖 = 𝑔(∑ 𝑤𝑗 𝑗𝑥𝑖𝑗+ 𝑏) trong đó 𝑥𝑖𝑗 là các thông tin đặc trưng (các features) được truyền vào một nơ-ron, 𝑤𝑗 là trọng số gắn với đặc trưng thứ j, g là hoạt hoá, yi là output của nơ-ron với input xi thứ i tương ứng Khi chúng ta tập hợp các nơ-ron lại thành các lớp và output của lớp trước là input của lớp sau chúng ta được một mạng nơ-ron với các trọng số tương ứng Các trọng số là đại lượng đặc trưng mô tả sự liên kết giữa các nơ-ron, nó thể hiện sự trọng số của việc đóng góp các thông tin vào một nơ-ron Trong công trình này chúng tôi sử dụng hàm Relu (rectified linear unit) [25], Sigmoid, và Tanh cho các hàm hoạt hoá

Trang 4

Việc huấn luyện mô hình được lặp qua các vòng lặp (epoch) để giảm sai số của dữ liệu đầu

ra so với tập dữ liệu đã biết thông qua việc tối thiểu hàm mất mát (loss function), từ đó các trọng

số trên các nơ-ron tương ứng được cập nhật qua từng vòng lặp Rất nhiều các thuật toán tối ưu có thể được sử dụng để xác định các trọng số của mô hình như truyền ngược (back-propagation) [9,13], thuật toán Levenberg Marquardt [14],… Trong quá trình lặp, một số đại lượng có thể được tính toán để theo dõi độ chính xác của mô hình như sai số tuyệt đối trung bình (Mean absolute error), sai số bình phương trung bình (Mean square error), … Có nhiều yếu tố có thể ảnh hưởng tới việc huấn luyện mô hình như kích cỡ của mạng nơ-ron hoặc việc chia tập dữ liệu

để huấn luyện và kiểm tra Kích cỡ của mạng quá lớn có thể làm tăng thời gian tính toán đồng thời không hiệu quả, trong khi kích cỡ của mạng quá nhỏ có thể làm mất đi những đặc trưng cần

có của dữ liệu

3 BIỂU DIỄN VẬT LIỆU

Để xây dựng các mô hình học máy có thể khái quát hoá các tri thức hoá lí ẩn chứa trong dữ liệu về cấu trúc và tính chất của vật liệu, chúng ta phải xây dựng các thông tin của vật liệu dưới dạng một vector với số chiều xác định Gần đây chúng tôi đã phát triển được phương pháp biểu diễn vật liệu dựa trên việc phân tích giản đồ voronoi của cấu trúc nguyên tử của vật liệu và thông tin về điện tử hoá trị của các nguyên tử Với mỗi vật liệu chúng tôi được chia nhỏ thành các cấu trúc địa phương: mỗi cấu trúc địa phương bao gồm một nguyên tử trung tâm và các nguyên tử lân cận được xác định bằng việc phân tích giản đồ voronoi [9,19] Cấu trúc địa phương sau đó được biểu diễn bằng một ma trận các thành phần của nó, 𝑋𝑖𝑗 biểu diễn thông tin liên quan đến số lượng số lượng các orbital nguyên tử j bao quanh orbital nguyên tử i Trong đó i, j là các subshell orbital trong tập hợp sau: 𝐷 = {𝑠1, 𝑠2, 𝑝1, … , 𝑝6, 𝑑1, … , 𝑑10, 𝑓1, … , 𝑓14 } Hình XX biểu diễn một OFM của Sm trong Sm2Fe17N3: trong đó chiều ngang là mô tả các subshell orbitals của nguyên tử Sm, và chiều đứng biểu diễn các subshell orbitals của các nguyên tử lân cận

Trang 5

184

Hình 1 Orbital field matrix của nguyên tử Sm trong Sm 2 Fe 17 N 3 , thang màu biểu thị thông tin về số lượng

subshell orbitals của môi trường bao quanh nguyên tử Sm

Để xây dựng các OFM chúng tôi sử dụng kỹ thuật one-hot encoding để biểu diễn các các nguyên tử: các nguyên tử sẽ được biểu diễn bằng một vector với chủ yếu các thành phần là 0 và các thành phần tương ứng với cấu hình điện tử hoá trị của nguyên tử được biểu diễn là 1 Ví dụ

Fe có cấu hình điện tử là: [Ar]3d64s2 sẽ được biểu diễn bằng vector 32 chiều với các thành phần

là 0 trừ thành phần số 2 và số 14 tương ứng với orbital d6 và s2 Từ đó chúng tôi có thể xây dựng được vector biểu diễn cho môi trường hoá học của một nguyên tử trung tâm bằng việc lấy tổng

có trọng số của vector biểu diễn các nguyên tử lân cận: 𝑂𝑒𝑛𝑣 = ∑ 𝑤𝑘 𝑘𝑂𝑘 trong đó 𝑂𝑒𝑛𝑣 là vector biểu diễn cho môi trường hoá học của các nguyên tử trung tâm, 𝑂𝑘 là vector biểu diễn của nguyên tử hàng xóm thứ k, và 𝑤𝑘là trọng số gắn với nguyên tử hàng xóm thứ k tương ứng

Để xác định các nguyên tử lân cận, chúng tôi sử dụng phương pháp phân tích giản đồ voronoi: chúng tôi xác định các nguyên tử lân cận là các nguyên tử có chung mặt voronoi với nguyên tử trung tâm Trọng số tương ứng với một nguyên tử lân cận được xác định bởi góc khối tương ứng tạo bởi nguyên tử trung tập và mặt voronoi, 𝜃𝑘, và khảng cách tới nguyên tử trung tâm, 𝑟𝑘: 𝑤𝑘 = 𝜃𝑘

𝜃 𝑚𝑎𝑥

1

𝑟 𝑘 , trong đó 𝜃𝑚𝑎𝑥 là giá trị lớn nhất của các góc khối Từ đó chúng tôi có thể xây dựng được OFM bằng tích vô hướng của vector cột của nguyên tử trung tâm thứ 𝑞 trong cấu trúc tinh thể thứ 𝑝 và vector hàng biểu diễn môi trường hoá học tương ứng: 𝑋𝑝𝑞 =

𝑂𝑝𝑞× 𝑂𝑝𝑞𝑒𝑛𝑣 Vector biểu diễn cho vật liệu, 𝑞, được chúng tôi xác định thông trung bình cộng của của các OFM của các nguyên tử trong cấu trúc tinh thể:

𝑋𝑝= 1

𝑁 𝑝∑ 𝑋𝑞 𝑝𝑞, (1)

Trang 6

trong đó Np là số nguyên tử trong cấu trúc tinh thể của vật liệu thứ p

4 DỰ ĐOÁN ĐỘ BỀN NHIỆT ĐỘNG

Trong nghiên cứu này chúng tôi nghiên cứu độ bền nhiệt động của các hệ vật liệu tạo thành bởi kim loại chuyển tiếp (T), các nguyên tố họ lanthanide (LA), và các nguyên tử nhẹ (X) Chúng tôi thu thập tất cả các tổ hợp gồm: 1 hoặc 2 LA, 1 hoặc 2 T, và 1 X Ví dụ một tổ hợp Nd-Fe-B gồm 1 LA là Nd, 1 T là Fe, và 1 X là B Chúng tôi lựa chọn các nguyên tố LA trong {Y,

La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Tm, Yb, Lu} và T trong {Ti, V, Cr, Mn, Fe, Co, Ni, Y,

Zr, Nb, Mo, Tc, Ru, Rh, Pd, Ag, Cd, Hf, Re, Os, Ir, Pt, Au, Hg}, và X trong {H, B, C, N, O} Dữ liệu gồm cấu trúc của vật liệu, năng lượng sinh (formation energy, ΔEf) được thu thập từ nguồn

dữ liệu OQMD [2,3] Trong cơ sở dữ liệu OQMD năng lượng sinh được tính dựa trên lý thuyết phiếm hàm mật độ (density functional theory : DFT) Tổng cộng chúng tôi thu thập được 5967 vật liệu và đặt tên tập dữ liệu này là LATX Tập dữ liệu này được chia ngẫu nhiên thành tập dữ liệu huấn luyện (trainning set) với 4773 vật liệu (80%) và tập dữ liệu kiểm chứng (test set) 1194 vật liệu

Dựa trên tập dữ liệu này chúng tôi xây dựng mô hình mạng neuron để thực hiện các nhiệm

vụ sau: (1) dự đoán năng lượng sinh của vật liệu, (2) dự đoán độ bền nhiệt động của vật liệu, và (3) phân loại pha bền vững và kém bền của các vật liệu

4.1 Dự đoán năng lượng sinh

Một trong những thông số quan trọng của vật liệu đó là năng lượng sinh, nó cho biết lượng năng lượng có thể giải phóng ra khi hình thành vật liệu đó từ các đơn chất bền Đây là một thông

số rất quan trọng trong việc đánh giá độ bền nhiệt động của một vật liệu Trong phần này chúng tôi trình bày kết quả nghiên cứu ứng dụng mạng nơ-ron để biểu diễn năng lượng sinh từ đó có thể dự đoán năng lượng sinh cho các hệ vật liệu mới Chúng tôi sử dụng OFM (32 x 32 chiều) như mô tả trong phương trình 1 để biểu diễn thông tin của vật liệu Để thuận tiện cho việc xây dựng các mô hình học máy, chúng tôi sử dụng dạng vector của OFM với 2024 chiều để biểu diễn các vật liệu Mô hình học máy được xây dựng bằng mạng nơ-ron với 2 lớp ẩn với 32 nơ-ron để biểu diễn năng lượng sinh của vật liệu: 𝑦̂𝑝 = 𝑤3× 𝑔 (𝑤2× 𝑔(𝑋𝑝× 𝑤1+ 𝑏1) + 𝑏2) + 𝑏3, trong đó 𝑤1 là trọng số của lớp ẩn thứ nhất là ma-trận gồm 1024 hàng (số inputs) và 32 cột (số nơ-ron của lớp ẩn thứ nhất); 𝑤2 là trọng số của lớp ẩn thứ 2 gồm 32 hàng (outputs từ lớp ẩn thứ

Trang 7

186

nhất) và 32 cột (số nơ-ron của lớp ẩn thứ hai); 𝑤1là trọng số của lớp output gồm 1 cột (số output)

và 32 hàng (số output của lớp ẩn thứ 2); 𝑏1, 𝑏2, 𝑏3 là các hệ số bias tương ứng cho lớp ẩn thứ

nhất, thứ hai, và lớp output; g là hàm hoạt hoá

Bảng 1 Sánh kết quả dự đoán năng lượng sinh của mô hình mạng nơ-ron và kết quả tính toán DFT: MAE

(mean square error), RMSE (root mean square error), và R 2

Activation

MAE (eV/atom)

RMSE (eV/atom)

R2

Để xây dựng và triển khai (implement) mô hình, chúng tôi sử dụng thư viện Tensorflow/keras [26] Để huấn luyện mô hình (tìm các giá trị của 𝑤1, 𝑤2, 𝑤3, 𝑏1, 𝑏2, 𝑏3được ký hiệu là 𝑤 và 𝑏) chúng tôi sử dụng hàm losst là hàm mean square error (MSE):

𝐿(𝑤, 𝑏) = 1

𝑚∑ (𝑦̂𝑝 𝑝(𝑤, 𝑏) − Δ𝐸𝑝𝑓)2 (2) trong đó m là số điểm dữ liệu trong tập huấn luyện Chúng tô sử dụng thuật toán tối ưu ADAM [27] được cài đặt sẵn trong thư viện Tensorflow để cực thiểu hoá hàm loss theo các tham số 𝑤 và

b Chúng tôi không sử dụng toàn bộ dữ liệu để tối ưu hoá hàm loss, mà sử dụng các mini batch (các phần của dữ liệu) với kích thước là 256 (điểm dữ liệu) cho mỗi bước tối ưu Quá trình tối ưu được thực hiện thông qua 1000 bước

Chúng tôi khảo sát các hàm hoạt hoá Relu, Sigmoid, và Tanh để biểu diễn năng lượng sinh Sau khi huấn luyện mô hình mạng nơ-ron với các hàm hoạt hoá tương ứng chúng tôi sử dụng test set để đánh giá hiệu quả của mô hình thông qua RMSE (root mean square error), MAE (mean absolute error), và R2 (coefficient of determination) Các kết quả được tóm tắt trong Bảng

1 cho thấy mô hình mạng nơ-ron có thể cho kết quả dự đoán tốt trên test set với R2 lớn hơn

Trang 8

0.98 Kết quả khảo sát cũng cho thấy việc sử dụng hàm hoạt hóa tanh cho kết quả dự đoán tốt nhất với MAE, RMSE, và R2 tương ứng là 0.124 eV/atom, 0.176 eV/atom, và 0.983

4.2 Dự đoán độ bền nhiệt động

Trong phần này chúng tôi khảo sát khả năng ứng dụng mạng nơ-ron để biểu diễn độ bền nhiệt động của các vật liệu Độ bền nhiệt động của các vật liệu được đo bằng năng lượng phân huỷ thành các pha khác bền vững hơn của vật liệu dựa trên việc phân tích bao lồi (convex hull analysis) của giản đồ pha Ví dụ như trong hình 2, chúng tôi trình bày giản đồ pha của hệ Fe-O: trục hoành biểu diễn tỉ lệ của O, và trục tung biểu diễn năng lượng hình thành của các pha (vật liệu) Fe-O Phân tích bao lồi của giản đồ pha ta thấy các pha nằm trên bao lồi gồm: Fe, O2, FeO,

Fe2O3, Fe3O4 được biểu diễn bằng các điểm màu xanh, và các pha khác nằm trên bao lồi được biểu diễn bằng điểm màu đỏ Độ bền nhiệt động học sẽ được đánh giá dựa trên khoảng cách giữa năng lượng sinh của vật liệu và vị trí của vật liệu đó trên bao lồi (convex hull distance: Δ𝐸𝐶𝐻) Đây chính là giá trị năng lượng có thể giải phóng được khi phân ly vật liệu này thành các pha bền hơn Do đó chúng tôi tạm định nghĩa đây là năng lượng phân ly thành các pha bền vững hơn Cần chú ý rằng các điểm nằm trên bao lồi sẽ là các pha bền nhiệt động của vật liệu, và các điểm nằm trên bao lồi sẽ là các pha kém bền nhiệt động: các điểm nằm càng cao hơn bao lồi càng kém bền, và có thể bị phân huỷ thành các pha tương ứng

Hình 2 Giản đồ pha của hệ Fe-O: trục ngang biểu diễn tỉ lệ O trong các hợp chất, trục đứng biểu diễn

năng lượng sinh, đường màu đậm biểu diễn bao lồi, pha FeO 2 biểu diễn bằng điểm màu xanh

Trang 9

188

Chúng tôi sử dụng các thông số của mạng nơ-ron và cách tối ưu hoá tương tự cho trường hợp năng lượng sinh, và cũng khảo sát các hàm hoạt hoá Relu, Sigmoid, Tanh để xây dựng mô hình dự đoán Δ𝐸𝐶𝐻

Bảng 2 Sánh kết quả dự đoán độ bền nhiệt động của mô hình mạng nơ-ron và kết quả tính toán DFT:

MAE (mean square error), RMSE (root mean square error), và R 2

Activation

MAE (eV/atom)

RMSE (eV/atom)

R2 (eV/atom)

4.3 Phân loại vật liệu bền và kém bền

Trong việc phát triển các hệ vật liệu mới, thì việc nhận diện các pha của vật liệc có khả năng

là bền vững là điều đặc biệt quan trọng Trong mục này chúng tôi xây dựng mạng nơ-ron để nhận diện các cấu trúc của vật liệu có thể là các pha bền vững Sử dụng ngưỡng độ bền nhiệt động 0.1 eV/atom để phân loại vật liệu bền vững và kém bền vững: vật liệu bền sẽ được gán nhãn là 1 và vật liệu kém bền sẽ được gán nhãn là 0 Chúng tôi mô hình hoá xác suất để biểu diễn khả năng một vật liệu (được biểu diễn Xp}:

𝑃(𝑋𝑝) = 𝑒ℎ(𝑋𝑝)

Chúng tôi sử dụng mạng nơ-ron với 2 lớp ẩn (hidden layer) với 32 nơ-ron cho mỗi lớp ẩn để biểu diễn hàm h(Xp):

ℎ(𝑋𝑝) = 𝑤3× 𝑔 (𝑤2× 𝑔(𝑋𝑝× 𝑤1+ 𝑏1) + 𝑏2) + 𝑏3, (4)

trong đó 𝑔 là hàm hoạt hoá (activation function), ), 𝑤1 là trọng số cho lớp ẩn thứ 2; 𝑤2 là trọng

số cho lớp ẩn thứ 2; 𝑤3là trọng số cho lớp output; ; 𝑏1, 𝑏2, 𝑏3là các hệ số bias Để huấn luyện mô hình (tìm các trọng số phù hợp) chúng tôi sử dụng thuật toán tối ưu hoá ADAM để cực tiểu hoá hàm loss Hàm loss là một hàm đặc trưng cho độ chính xác của độ chính xác của phép biểu diễn:

Trang 10

hàm loss càng nhỏ thì mô hình càng phù hợp tốt Chúng tôi sử dụng hàm binary cross entropy để đánh để huấn luyện mô hình:

𝐿(𝑤, 𝑏) = − ∑𝑚𝑝=1𝑦𝑝𝑙𝑜𝑔(𝑝(𝑋𝑝)) + (1 − 𝑦𝑝)𝑙𝑜𝑔(1 − 𝑝(𝑋𝑝)), (5)

trong đó 𝑛 là số điểm dữ liệu trong tập huấn luyện, yp là nhãn thực của vật liệu 𝑝 Chúng tôi cũng sử dụng quá trình tối ưu hàm lost tương tự như trong trường hợp của năng lượng sinh và độ bền nhiệt động

Để đánh giá hiệu quả của mô hình chúng tôi sử dụng accuracy (số điểm dữ liệu dự đoán đúng chia cho số điểm dữ liệu dự đoán sại), recall (số điểm dữ liệu dự đoán là bền vững đúng chia cho số điểm dữ liệu dự đoán bền vững) và precision (số điểm dữ liệu dự đoán đúng là bền vững chia cho số điểm dữ liệu thực tế là bền vững) Chúng tôi khảo sát kết quả dự đoán với các hàm hoạt hoá Relu, Sigmoid, và Tanh Các kết quả đánh giá được tóm tắt trong Bảng 2 Kết quả cho thấy hàm Relu cho hiệu quả tốt nhất trong việc nhận diện vật liệu có khả năng bền vững với Recall là 0.86 và Precision là 0.85 Nghĩa là dựa trên dữ liệu test chúng ta thấy rằng 86% số vật liệu được dự đoán là bền vững sẽ thực sự được khẳng định là bền nhiệt động với các tính toán năng lượng sinh dựa vào lý thuyết phiếm hàm mật độ Kết quả này cho thấy tiềm năng lớn của

mô hình mạn nơ-ron trong việc sàng lọc các vật liệu có khả năng bền nhiệt động phụ vụ cho việc tìm kiếm các vật liệu mới

Bảng 3 Tóm tắt kết quả phân loại vật liệu bền và kém bền với dữ liệu test: accuracy (tỉ lệ số vật liệu phân

loại đúng trên tổng số vật liệu trong test set), Precision (số điểm dữ liệu dự đoán đúng là bền vững chia cho số điểm dữ liệu thực tế là bền vững), và Recall (số điểm dữ liệu dự đoán là bền vững đúng chia cho

số điểm dữ liệu dự đoán bền vững)

Activation Accuracy Precision Recall

Ngày đăng: 31/12/2022, 12:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w