Mẫu latex luận văn thạc sĩ phương pháp hàm phạt cho bài toán cực trị có điều kiện đại học đà nẵng.LATEX 1 là một hệ thống soạn thảo rất phù hợp với việc tạo ra các tài liệukhoa học và toán học với chất lượng bản in rất cao. Đồng thời, nó cũng rấtphù hợp với các công việc soạn thảo các tài liệu khác từ thư từ cho đến nhữngcuốn sách hoàn chỉnh. LATEX sử dụng TEX 2 làm bộ máy định dạng.
Trang 2% -\renewcommand{\theenumi}{\textbf{\arabic{enumi}}}%Danh lai so thu tu
\renewcommand{\labelenumi}{\theenumi )}%Danh lai so thu tu
\renewcommand{\theequation}{\thechapter.\arabic{equation}}% Danh lai so cong thuc toan
{\it}% Body font
{}% Indent amount (empty = no indent, \parindent = para indent)
{\bfseries}% Thm head font
{.}% Punctuation after thm head
{.5em}% Space after thm head: " " = normal interword space;
Trang 5{.5em}% Space after thm head: " " = normal interword space;
\addtocontents{toc}{\protect{\pdfbookmark[0]{MỤC LỤC}{toc}}} %Thêm mục lục vào bookmark
\fontsize{14pt}{14pt}\selectfont% Chon cỡ font
\setlength{\baselineskip}{21pt}%Dãn dòng 1,5=21/14
%khoảng cách phía trên công thức toán
\setlength{\belowdisplayskip}{2pt} %khoảng cách phía trên công thức toán
\setlength{\parskip}{4pt}% khoảng cách giữa các paragrap
Trang 8{\bf TRƯỜNG ĐẠI HỌC SƯ PHẠM }\\
Trang 9\Large\bfseries\MakeUppercase{PHƯƠNG PHÁP HÀM PHẠT CHO BÀI TOÁN CỰC TRỊ CÓ ĐIỀU KIỆN}
Trang 10$\mathbb{R}^n$ & n-dimensional vectors & không gian các vector n chiều\\
$\lambda_i$ & real eigenvalues & các giá trị riêng thực\\
$e_i$ & real eigenvectors & các vector riêng thực\\
$|\cdot|$ & standard Euclidean norm & chuẩn Euclide\\
$\partial f(x)/\partial x_i$ & partial derivative & các đạo hàm riêng theo biến $x_i$\\
$\nabla$ & gradient & gradient\\
$\phi$ & implicit function & hàm ẩn\\
$x^*$ & local minimum & cực tiểu địa phương\\
$L(x,\lambda)$ & Lagrange function & hàm số Lagrange\\
\hline
\end{tabular}
\end{center}
Trang 11CP & constrained programming & bài toán có điều kiện\\
ECP & equality constrained & bài toán có điều kiện cho bởi \\
& problem & phương trình\\
ICP & inequality constrained & bài toán có điều kiện cho bởi \\
& problem & bất phương trình\\
NLP & nonlinear programming & bài toán phi tuyến tính\\
NDP & nondifferentiable problem & bài toán không khả vi \\
K-T & Kuhn-Tucker Condition & điều kiện K - T\\
QP & quadratic programming & quy hoạch toàn phương\\
Trang 12\ \ \ \ Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nghiên cứu nào khác
Trang 13ơn -\chapter*{Lời cảm ơn}
Lời đầu tiên của luận văn tác giả xin gửi lời cảm ơn sâu sắc tới thầy giáo hướng dẫn TS Phạm Quý Mười
đã tận tình hướng dẫn tác giả trong suốt quá trình thực hiện để tác giả có thể hoàn thành được luận văn~này
Trang 14Phương pháp hàm phạt là một phương pháp được dùng để tìm nghiệm cho bài toán cực trị có điều kiện.
Ý tưởng chính của phương pháp là chuyển việc giải bài toán cực trị có điều kiện thông qua việc giải các bài toán cực trị tự do Các loại hàm phạt thường dùng là hàm phạt điểm ngoài, hàm phạt điểm trong, hàm phạt Lagrange Trong chương trình toán đại học, phương pháp này hầu như chưa được giới thiệu
Trang 15Hơn nữa, hầu hết các giáo trình tiếng Việt, chưa trình bày một cách đầy đủ về cơ sở lý thuyết của phương pháp hàm phạt.
Các bài toán dạng này thường xuất hiện trong các tài liệu, giáo trình dành cho học viên cao học Vì vậy, việc nắm vững lý thuyết về bài toán cực trị có điều kiện và các phương pháp giải là cần thiết cho học viên, giúp học viên có cái nhìn tổng quan và mạch lạc hơn đối với vấn đề cực trị của hàm nhiều biến Việcnắm chắc cở sở lý thuyết về bài toán cực trị có điều kiện và các phương pháp giải cũng giúp cho học viên
có khả năng giải và sáng tạo ra các bài toán mới
Với mong muốn tìm hiểu sâu hơn về bài toán cực trị có điều kiện, cũng như các phương pháp hàm phạt
để giải các bài toán đó; được sự đồng ý hướng dẫn của thầy giáo TS Phạm Quý Mười, em đã chọn đề tài: “\emph{Phương pháp hàm phạt cho bài toán cực trị có điều kiện}” cho luận văn thạc~sĩ của mình
{\bf 2 Mục đích nghiên cứu}
\vspace{0.3cm}
- Nắm được bài toán cực trị có điều kiện, định nghĩa và điều kiện cần và đủ của cực trị
- Phương pháp hàm phạt và ứng dụng để giải bài toán cực trị
- Sáng tạo được bài toán mới vận dụng phương pháp này
{\bf 3 Đối tượng và phạm vi nghiên cứu}
Trang 16Luận văn gồm 3 chương:
Chương 1: Trong chương này, trình bày một số kí hiệu, định nghĩa, định lí liên quan đến luận văn Cụ thể, định nghĩa tập mở, tập đóng, tập compact, tập lồi; định lí hàm ẩn, định lí giá trị trung bình và sự mở rộngcủa chuỗi Taylor
Chương 2: Chương này trình bày một số bài toán tối ưu có điều kiện cho bởi phương trình và bất
phương trình
Chương 3: Trình bày phương pháp hàm phạt, nêu các hàm phạt khả vi, không khả vi của bài toán cực trị
có điều kiện cho bởi phương trình và bất phương trình
\chapter{KIẾN THỨC CHUẨN BỊ}
Trang 17\noindent Trong chương này, trình bày một số kí hiệu, định nghĩa tập mở, tập đóng, tập compact, tập lồi;định lí hàm ẩn, định lí giá trị trung bình và sự mở rộng của chuỗi Taylor.
\section{Các kí hiệu đại số}
\noindent Chúng ta kí hiệu $\mathbb{R}$ là trường số thực và $\mathbb{R}^n$ là không gian gồm tất cả các vector $n$ chiều
Cho bất kỳ tập con $S \subset \mathbb{R}$ bị chặn trên (chặn dưới), chúng ta kí hiệu $\sup S \; (\inf S)$
là cận trên nhỏ nhất (cận dưới lớn nhất) của $S$ Nếu $S$ không bị chặn trên (dưới), chúng ta viết $\sup
S = \infty \; (\inf S = -\infty)$ Trong luận văn này, \textit{mỗi vector được xem xét là một vector cột} Phép chuyển vị của ma trận $A$ cỡ $m \times n$ được kí hiệu là $A'$ Một vector $x \in \mathbb{R}^n$ được xem như một ma trận cỡ $n \times 1$, và do đó $x'$ là một ma trận cỡ $1 \times n$ hoặc vector hàng Nếu $x_1, ,x_n$ là các tọa độ của vector $x \in \mathbb{R}^n$, ta viết $x = (x_1,x_2, ,x_n)^T$ Chúng ta cũng viết
$$x \ge 0 \; \textrm{nếu} \; x_i \ge 0, \; \forall i = 1, ,n,$$
$$x \le 0 \; \textrm{nếu} \; x_i \le 0, \; \forall i = 1, ,n.$$
Một ma trận đối xứng $A$ cỡ $n \times n$ được gọi là \textit{nửa xác định dương} nếu $x'Ax \ge 0,
\forall x \in \mathbb{R}^n$ Trong trường hợp này chúng ta viết
$$A \ge 0.$$
Khi đó, ma trận $A$ được gọi là \textit{xác định dương} nếu $x'Ax > 0, \forall x \ne 0$ và viết
$$A > 0.$$
Khi đó, $A$ là (nửa) xác định dương và nó là ma trận đối xứng
Một ma trận $A$ đối xứng cỡ $n \times n$ có $n$ giá trị riêng thực $y_1,y_2, ,y_n$ và tương ứng có
$n$ vector riêng thực khác không $e_1,e_2, ,e_n$ đôi một trực giao Khi đó ta có
\begin{equation}
\label{eq11}
\gamma x'x \le x'Ax \le \Gamma x'x, \; \forall x \in \mathbb{R}^n,
\end{equation}
Trang 18\noindent trong đó
$$\gamma = \min\{\gamma_1, ,\gamma_n\}, \; \Gamma = \max\{\gamma_1, ,\gamma_n\}.$$
Cho $x$ là vector riêng ứng với giá trị riêng $\Gamma(\gamma)$, bất phương trình ở bên phải (trái) trong công thức (\ref{eq11}) sẽ trở thành phương trình Do đó $A > 0 \; (A \ge 0)$, nếu và chỉ nếu các giátrị riêng của $A$ là dương (không âm)
Nếu $A$ xác định dương thì tồn tại duy nhất một ma trận xác định dương có bình phương bằng $A$ Đây
là ma trận có cùng các vector riêng như ma trận A và có giá trị riêng bằng căn bậc hai giá trị riêng của
$A$ Chúng ta kí hiệu ma trận này là $A^{1/2}$
Cho $A$ và $B$ là hai ma trận vuông và $C$ là một ma trận có chiều phù hợp Phương trình thường sử dụng
$$(A + CBC')^{-1} = A^{-1} - A^{-1}C(B^{-1} + C'A^{-1}C)^{-1}C'A^{-1}$$
\noindent là đúng với tất cả các ma trận nghịch đảo xuất hiện ở trên tồn tại Phương trình có thể được chứng minh bằng cách nhân phía bên phải bởi $(A + CBC')$
Trang 19\noindent trong đó
$$Q = (A - BD^{-1}C)^{-1},$$
\noindent với điều kiện tất cả các ma trận nghịch đảo xuất hiện ở trên tồn tại Chứng minh được thực hiện bằng cách nhân $M$ với biểu thức cho $M^{-1}$ nêu trên
\section{Các kí hiệu tôpô}
\noindent Chúng ta sẽ sử dụng chuẩn Euclide trong không gian $\mathbb{R}^n$ và được kí hiệu là $|
\cdot |$; tức là, đối với một vector $x \in \mathbb{R}^n$, chúng ta viết
$$|x| = \sqrt{x'x}.$$
Chuẩn Euclide của một ma trận $A$ cỡ $m \times n$ sẽ được kí hiệu là $|\cdot|$ Nó được cho bởi
$$|A| = \max\limits_{x\ne 0}\frac{|Ax|}{|x|} = \max\limits_{x \ne 0}\frac{\sqrt{x'A'Ax}}{\sqrt{x'x}}.$$
Từ công thức (1.1), ta có
$$|A| = \sqrt{\; \textrm{giá trị riêng lớn nhất của} (A'A)}.$$
Nếu ma trận $A$ là đối xứng, và $\lambda_1, ,\lambda_n$ là các giá trị riêng (thực) của $A$, thì các giátrị riêng của $A^2$ là $\lambda^2_1, ,\lambda^2_n$, và chúng ta thu được
$$|A| = \max\{|\lambda_1|, ,|\lambda_n|\}.$$
Một dãy các vectơ $x_0,x_1, ,x_k, ,$ trong $\mathbb{R}^n$, được kí hiệu là $\{x_k\}$, được gọi là hội
tụ đến một vector $x$ nếu $|x_k - x| \to 0$ khi $k \to \infty$ (có nghĩa là, nếu cho $\epsilon > 0$, có một $N$ sao cho với mọi $k \ge N$ chúng ta có $|x_k - x| < \epsilon$)
Nếu $\{x_k\}$ hội tụ đến $x$, chúng ta viết $x_k \to x$ hoặc $\lim\limits_{k \to \infty}x_k = x$ Tương
tự, cho một dãy các ma trận $\{A_k\}$ cỡ $m \times n$, chúng ta viết $A_k \to A$ hoặc $\lim\limits_{k
\to \infty}A_k = A$ nếu $|A_k - A| \to 0$ khi $k \to \infty$ Sự hội tụ của cả dãy vector và ma trận tương đương với sự hội tụ của mỗi dãy của các tọa độ hoặc các phần tử của chúng
Trang 20Cho dãy $\{x_k\}$, dãy con $\{x_k|k \in K\}$ tương ứng với một tập chỉ số vô hạn $K$ được kí hiệu $\{x_k\}_K$ Một vector $x$ được gọi là một \textit{điểm giới hạn} của dãy $\{x_k\}$ nếu có một dãy con
$\{x_k\}_K$ hội tụ đến $x$
Mọi dãy các số thực $\{r_k\}$ là đơn điệu tăng, tức là thỏa mãn $r_k \le r_{k+1} \; (r_k \ge r_{k + 1})$ vớimọi $k$, phải hội tụ đến một số thực hoặc $+\infty \; (-\infty)$ (nữa dãy không bị chặn trên (dưới)) Trong trường hợp sau cùng chúng ta viết $\lim\limits_{k \to \infty}r_k = +\infty \; (\lim\limits_{k \to
\infty}r_k = -\infty)$
Cho bất kì dãy số thực bị chặn $\{r_k\}$, chúng ta xét dãy $\{s_k\}$ trong đó $s_k = sup\{r_i|i \ge k\}$
Vì dãy này đơn điệu giảm và bị chặn, nên nó có một giới hạn, được gọi là \textit{giới hạn trên} của $\{r_k\}$ và được kí hiệu bởi $\lim\sup\limits_{k \to \infty}r_k$
Chúng ta định nghĩa tương tự cho \textit{giới hạn dưới} của $\{r_k\}$ và kí hiệu bằng
$\lim\inf\limits_{k \to \infty}r_k$ Nếu $\{r_k\}$ không bị chặn trên, chúng ta có $\lim\sup\limits_{k
\to \infty}r_k = +\infty$, và nếu nó không bị chặn dưới, chúng ta có $\lim\inf\limits_{k \to \infty}r_k = -\infty$
\section{Tập mở, tập đóng và tập compact}
\noindent Cho một vector $x \in \mathbb{R}^n$ và một số thực $\epsilon > 0$, chúng ta kí hiệu hình cầu
mở với tâm tại $x$ với bán kính $\epsilon > 0$ bởi $S(x;\epsilon)$; tức là,
Trang 21\label{dn11}
Một tập $S$ của $\mathbb{R}^n$ được gọi là tập mở, nếu với mọi vector $x \in S$, tồn tại một $\epsilon
> 0$ sao cho $S(x; \epsilon) \subset S$
\end{dn}
Nếu $S$ là tập mở và $x \in S$, thì $S$ được gọi là một lân cận của $x$ Phần trong của một tập $S
\subset \mathbb{R}^n$ là tập tất cả các phần tử $x \in S$ trong đó tồn tại $\epsilon > 0$ sao cho
Nói một cách khác: Một tập $S$ là tập compact nếu và chỉ nếu mọi dãy $\{x_k\}$ với các phần tử trong
$S$ có ít nhất một điểm giới hạn thuộc về $S$
Trang 22Một kết quả quan trọng nữa là nếu $S_0,S_1, ,S_k, $ là một dãy các tập compact khác rỗng trong
$\mathbb{R}^n$ sao cho $S_k \supset S_{k + 1}$ với mọi $k$ thì giao $\bigcap\limits_{k=0}^{\infty}S_k$
là một tập khác rỗng và compact
\section{Hàm liên tục}
\noindent Một hàm $f$ là một ánh xạ từ một tập con khác rỗng $S_1 \subset \mathbb{R}^n$ vào một tập $S_2 \subset \mathbb{R}^m$, được kí hiệu bởi $f:S_1 \to S_2$
Hàm $f$ được gọi là liên tục tại $x \in S_1$, nếu $f(x_k) \to f(x)$ với mọi dãy $x_k \to x$
Một cách phát biểu khác tương đương $f$ liên tục tại $x$ nếu với mọi $\epsilon > 0$ luôn tồn tại $\delta
> 0$ sao cho với mọi $y$ thỏa mãn $|y - x| < \delta$ và $y \in S_1$ ta có $|f(y) - f(x)| <\epsilon$
Hàm $f$ được gọi là liên tục trên $S_1$ (hoặc đơn giản là liên tục) nếu nó liên tục tại mỗi điểm $x \in S_1$ Nếu $S_1,S_2$, và $S_3$ là các tập khác rỗng và $f_1:S_1 \to S_2$ và $f_2:S_2 \to S_3$ là các hàm, thì hàm $f_2 \circ f_1:S_1 \to S_3$ được xác định bởi $(f_2 \circ f_1)(x) = f_2[f_1(x)]$ được gọi là hàm hợp của $f_1$ và $f_2$ Nếu $f_1: \mathbb{R}^n \to \mathbb{R}^m$ và $f_2: \mathbb{R}^m
\to \mathbb{R}^p$ là liên tục, khi đó $f_2 \circ f_1$ cũng liên tục
\section{Hàm khả vi}
\noindent Một hàm giá trị thực $f: X \to \mathbb{R}$ trong đó $X \subset \mathbb{R}^n$ là một tập mởđược goị là khả vi liên tục nếu các đạo hàm riêng $\partial f(x)/ \partial x_1, ,\partial f(x)/\partial x_n$ tồn tại, với $x \in X$ và là các hàm liên tục tại $x$
Trong trường hợp này chúng ta viết $f \in C^1$ trên $X$ Một cách tổng quát, chúng ta viết $f \in C^p$ trên $X$ cho một hàm $f: X \to \mathbb{R}$, trong đó $X \subset \mathbb{R}^n$ là một tập mở, nếu tất
cả các đạo hàm riêng của $f$ bậc $p$ tồn tại và liên tục trên $X$ Nếu $f \in C^p$ trên $\mathbb{R}^n$, thì chúng ta viết đơn giản là $f \in C^p$ Nếu $f \in C^1$ trên $X$, gradient của f tại một điểm $x \in X$ được định nghĩa là vector cột
$$\nabla f(x) = \left[ \begin{array}{c}
\frac{\partial f(x)}{\partial x_1}\\
\vdots\\
\frac{\partial f(x)}{\partial x_n}
Trang 23\end{array} \right].$$
Nếu $f \in C^2$, Ma trận Hessian của $f$ tại $x$ được định nghĩa là ma trận đối xứng cỡ $n \times n$ có
$\partial^2f(x)/\partial x_i \partial x_j$ là phần tử thứ $nm$ hàng $i$ cột $j$, tức là:
$$\nabla^2 f(x) = \left[ \begin{array}{c}
\frac{\partial^2 f(x)}{\partial x_i \partial x_j}
$$\nabla f(x) = [\nabla f_1(x) \nabla f_m(x)].$$
Như vậy, ma trận $\nabla f$ cỡ $n \times m$ có các cột là các gradient $\nabla f_1(x), ,\nabla f_m(x)$
Thỉnh thoảng chúng ta sẽ cần xem xét các gradient của các hàm số chỉ đối với một số biến số Kí hiệu sẽ như sau:
Nếu $f: \mathbb{R}^{n+r} \to \mathbb{R}$ là một hàm giá trị thực của $(x,y)$ trong đó $x =
(x_1, ,x_n) \in \mathbb{R}^n, y = (y_1, ,y_r) \in \mathbb{R}^r$, chúng ta viết
Trang 24$$\nabla_x f(x,y) = \left[ \begin{array}{c}
\frac{\partial f(x,y)}{\partial x_1}\\
\vdots\\
\frac{\partial f(x,y)}{\partial x_n}
\end{array} \right], \; \nabla_y f(x,y) = \left[ \begin{array}{c}
\frac{\partial f(x,y)}{\partial y_1}\\
\vdots\\
\frac{\partial f(x,y)}{\partial y_r}
\end{array} \right],$$
$$\nabla_{xx} f(x,y) = \left[ \begin{array}{c}
\frac{\partial f(x,y)}{\partial x_i \partial x_j}
\end{array} \right], \; \nabla_{xy} f(x,y) = \left[ \begin{array}{c}
\frac{\partial f(x,y)}{\partial x_i \partial x_j}
\end{array} \right],$$
$$\nabla_{yy} f(x,y) = \left[ \begin{array}{c}
\frac{\partial f(x,y)}{\partial y_i \partial y_j}
\end{array} \right].$$
Nếu $f: \mathbb{R}^{n+r} \to \mathbb{R}^m, f = (f_1, ,f_m)$, chúng ta viết
$$\nabla_x f(x,y) = [\nabla_x f_1(x,y) \; \ldots \; \nabla_x f_m(x,y)],$$
$$\nabla_y f(x,y) = [\nabla_y f_1(x,y) \; \ldots \; \nabla_y f_m(x,y)].$$
Cho $h: \mathbb{R}^r \to \mathbb{R}^m$ và $g: \mathbb{R}^n \to \mathbb{R}^r$, xét hàm $f:
\mathbb{R}^n \to \mathbb{R}^m$ được xác định bởi
$$f(x) = h[g(x)].$$
Trang 25Khi đó nếu $h \in C^p$ và $g \in C^p$, chúng ta cũng có $f \in C^p$ và
$$\nabla f(x) = \nabla g(x)\nabla h[g(x)].$$
\begin{dn}~\cite{Gateaux} \textbf{Hàm khả vi Gateaux}:
%\textit{
Cho $f$ là một hàm số trong một tập con mở $U$ của không gian Banach $X$ vào không gian Banach
$Y$ Chúng ta nói $f$ là khả vi Gateaux $x \in U$, nếu tồn tại giới hạn và toán tử tuyến tính $T: \; X \to Y$sao cho:
\section{Định lý giá trị trung bình và sự mở rộng của dãy Taylor}
\noindent Cho $f:X \to \mathbb{R}$, và $f \in C^1$ trên tập mở $X \subset \mathbb{R}^n$ Giả sử rằng
$X$ chứa đoạn thẳng nối hai điểm $x,y \in X$
Định lý giá trị trung bình khẳng định rằng tồn tại một số thực $\alpha$ với $0 < \alpha < 1$ sao cho
$$f(y) = f(x) + \nabla f[x + \alpha(y - x)]'(y - x).$$
Nếu thêm điều kiện $f \in C^2$, thì tồn tại một số thực $\alpha$ với $0 < \alpha < 1$ sao cho
$$f(y) = f(x) + \nabla f(x)'(y - x) + \frac{1}{2}(y - x)'\nabla^2f[x + \alpha(y - x)](y - x).$$
Cho $f: X \to \mathbb{R}^m$ và $f \in C^1$ trên tập mở $X \subset \mathbb{R}^n$ Giả sử $X$ chứa đoạn thẳng nối hai điểm $x,y \in X$ Dãy Taylor bậc nhất tới $x$ được cho bởi phương trình
$$f(y) = f(x) + \int\limits_{0}^{1}\nabla f[x + \alpha(y - x)]'(y - x)d\alpha.$$
Trang 26Nếu thêm điều kiện $f \in C^2$, thì chúng ta có
$$f(y) = f(x) + \nabla f(x)'(y - x) + \int\limits_{0}^{1}(\int\limits_{0}^{\xi}(y - x)'\nabla^2f[x + \alpha(y - x)](y - x)d\alpha)d\xi.$$
\section{Định lí hàm ẩn}
\noindent Xét hệ $n$ phương trình với $m + n$ biến
$$h(x,y) = 0,$$
\noindent trong đó $h: \mathbb{R}^{m+n} \to \mathbb{R}^n, \; x \in \mathbb{R}^m$, và $y \in
\mathbb{R}^n$ Các định lí hàm ẩn nhằm vào câu hỏi liệu người ta có thể giải được hệ phương trình cho vector $y$ theo vector $x$ hay không? Tức là có tồn tại một hàm $\phi$, được gọi là hàm ẩn, sao cho
$h[x,\phi(x)] = 0$ hay không? Định lý hàm ẩn cổ điển sau đây khẳng định rằng điều này có thể theo nghĩađịa phương, nghĩa là, trong một lân cận của một nghiệm $(\bar{x},\bar{y})$, có một ma trận gradient
$h$ đối với $y$ là hàm không chính quy
\begin{dl}
\textbf{Định lí hàm ẩn 1}: Cho $S$ là một tập con mở của $\mathbb{R}^{m+n}$, và $h:S \to
\mathbb{R}^n$ là một hàm, sao cho tồn tại $p \ge 0, h \in C^p$ trên $S$ và giả sử $\nabla_yh(x,y)$ tồn tại và liên tục trên $S$
Cho $(\bar{x},\bar{y}) \in S$ là một vector sao cho $h(\bar{x},\bar{y}) = 0$ và ma trận
$\nabla_yh(\bar{x},\bar{y})$ là ma trận không suy biến Khi đó tồn tại số thực $\epsilon > 0$ và $\delta >0$ và hàm số $\phi:S(\bar{x};\epsilon) \to S(\bar{y};\delta)$ sao cho $\phi \in C^p$ trên
$S(\bar{x};\epsilon), \bar{y} = \phi(\bar{x})$, và $h[x,\phi(x)] = 0$ với mọi $x \in S(\bar{x};\epsilon)$ Hàm số $\phi$ là duy nhất, nếu $x \in S(\bar{x};\epsilon), y \in S(\bar{y};\delta)$, và $h(x,y) = 0$, thì $y =
\phi(x)$ Hơn nữa, nếu $p \ge 1$, thì với mọi $x \in S(\bar{x};\epsilon)$ ta có:
$$\nabla\phi(x) = -\nabla_xh[x,\phi(x)][\nabla_yh[x,\phi(x)]]^{-1}.$$
\end{dl}
%Chúng ta cũng cần định lý hàm ẩn sau đây Đây là một trường hợp đặc biệt của một định lý tổng quát hơn được tìm thấy trong Hestenes (1966) Kí hiệu trong phương trình (1.3) được sử dụng trong phát biểu của định lý sau
Trang 27\textbf{Định lí hàm ẩn 2}: Cho $S$ là tập con mở của $\mathbb{R}^{m+n}$, $\bar{X}$ là một tập con compact của $\mathbb{R}^m$, và $h:S \to \mathbb{R}^n$ là hàm số sao cho tồn tại $p \ge 0, h \in C^p$ trên $S$ Giả sử $\nabla_yh(x,y)$ tồn tại và liên tục trên $S$
Giả sử $\bar{y} \in \mathbb{R}^n$ là một vector sao cho $(\bar{x},\bar{y}) \in S, h(\bar{x},\bar{y}) = 0$
và ma trận $\nabla_yh(\bar{x},\bar{y})$ không suy biến với mọi $\bar{x} \in \bar{X}$
Khi đó tồn tại các số thực $\epsilon > 0, \delta > 0$, và hàm số $\phi:S(\bar{X};\epsilon) \to
S(\bar{y};\delta)$ sao cho $\phi \in C^p$ trên $S(\bar{X};\epsilon), \bar{y} = \phi(\bar{x})$ với mọi
$\bar{x} \in \bar{X}$, và $h[x,\phi(x)] = 0$ với mọi $x \in S(\bar{X};\epsilon)$
Hàm số $\phi$ là duy nhất nếu $x \in S(\bar{X};\epsilon), y \in S(\bar{y};\delta)$, và $h(x,y) = 0$, khi đó
$y = \phi(x)$ Hơn nữa, nếu $p \ge 1$, thì với mọi $x \in S(\bar{X};\epsilon)$, ta có:
Trang 28Nếu thêm điều kiện $f \in C^2$ trên $S$, thì $\nabla^2f(x) \ge 0, \forall x \in S$ Ngược lại, nếu $f \in C^1$ trên $S$ và (\ref{eq14}), thì hàm số $f$ là hàm lồi trên tập $S$
%%%%%%%% - page 66 - 70
\chapter{BÀI TOÁN TỐI ƯU CÓ ĐIỀU KIỆN CHO BỞI PHƯƠNG TRÌNH VÀ BẤT PHƯƠNG TRÌNH}
\noindent Chương này nghiên cứu bài toán tối ưu có điều kiện, trình bày bài toán tối ưu có điều kiện tổng quát và điều kiện tối ưu cho bài toán này Sau đó, chương 2 tập trung vào một số bài toán tối ưu có điều kiện cho bởi phương trình, bất phương trình Ngoài ra, trong chương này cũng trình bày mối liên hệgiữa bài toán tối ưu có điều kiện cho bởi bất phương trình và bài toán tối ưu có điều kiện cho bởi phương trình Từ đó, các điều kiện tối ưu cho bài toán tối ưu có điều kiện (NLP) nhận được thông qua các kết quả đã biết về bài toán tối ưu (ECP)
Các phương pháp hàm phạt để giải các bài toán này sẽ được nghiên cứu trong Chương 3
\section{Tổng quan bài toán tối ưu có điều kiện}
Trước hết, chúng ta xét bài toán tối ưu có điều kiện (CP)
Chúng ta nhắc lại các khái niệm cơ bản sau:
Vector $x^* \in X$ được gọi là cực tiểu địa phương của (CP) nếu tồn tại một số $\epsilon > 0$ sao cho
Trang 30\end{md}
\section{Bài toán tối ưu có điều kiện cho bởi phương trình}
Trong phần này, chúng ta xét một trường hợp đặc biệt của bài toán (CP) Chúng ta xét bài toán cực trị có điều kiện cho bởi phương trình (gọi là bài toán (ECP)):
\noindent trong đó $f: \mathbb{R}^n \to \mathbb{R}$ và $h: \mathbb{R}^n \to \mathbb{R}^m$, với
$m \le n$ Các thành phần của $h$ được kí hiệu là $h_1, ,h_m$
\begin{dn}\cite{Dimitri}]
Giả sử $x^*$ là một vector sao cho $h(x^*) = 0$ và $h \in C^1$ trên $S(x^*;\epsilon)$ với một số thực
$\epsilon >0$ nào đó Khi đó, $x^*$ được gọi là một điểm chính quy nếu các gradient $\nabla
Trang 31Giả sử $x^*$ là một cực tiểu địa phương của bài toán (ECP), và $f \in C^1, h \in C^1$ trên
$S(x^*;\epsilon)$ với $\epsilon >0$ là một số thực dương nào đó Khi đó, nếu $x^*$ là một điểm chính quy thì tồn tại duy nhất một vector $\lambda^* \in \mathbb{R}^m$ sao cho
Cho $P$ là ma trận đối xứng cỡ $n \times n$ và $Q$ là ma trận đối xứng nửa xác định dương cỡ $n
\times n$ Giả sử $x'Px > 0, \forall x \ne 0$ thỏa mãn $x'Qx = 0$ Khi đó, tồn tại một số thực $c$ sao cho
Trang 32\label{md224}
Cho $x^*$ thỏa mãn $h(x^*) = 0$ và $f \in C^2$ và $h \in C^2$ trên $S(x^*;\epsilon)$ với một số
$\epsilon >0$ nào đó Giả sử tồn tại một vector $\lambda^* \in \mathbb{R}^m$ sao cho
Trang 33Khi đó, $x^*$ là một cực tiểu địa phương của bài toán (ECP).
Trang 34Bằng tính toán đơn giản, ta có:
Trang 35Từ (\ref{eq29}) và (\ref{eq214}), ta có
$$\forall x \in S(x^*;\epsilon), \; h(x) = 0: f(x) \ge f(x^*) + \gamma|x - x^*|^2,$$
\noindent điều này suy ra $x^*$ là một cực tiểu địa phương cho bài toán (ECP) $\blacksquare$
% Như vậy Mệnh đề 2.1.4 đã được chứng minh
%Đề xuất tiếp theo mang lại một sự thể hiện độ nhạy có giá trị của các nhân tử Lagrange Chúng ta cần
\textbf{Chứng minh:} Nếu ma trận $J$ suy biến, thì tồn tại $y \in \mathbb{R}^n$ và $z \in
\mathbb{R}^m$ khác rỗng sao cho $(y,z)$ là không gian rỗng của ma trận $J$ hoặc tương đương
\begin{equation}
\label{eq216}
Trang 38$$\nabla_ux(u)\nabla f[x(u)] + \nabla_ux(u)\nabla h[x(u)]\lambda(u) = 0$$
\noindent như vậy bài toán được chứng minh $\blacksquare$
\section{Bài toán tối ưu có điều kiện cho bởi phương trình và bất phương trình}
\noindent Bây giờ chúng ta xét bài toán tối ưu có điều kiện hỗn hợp gồm phương trình và bất phương trình [gọi là bài toán quy hoạch phi tuyến (NLP)]