Mở rộng đại số
Quan hệ tương đương
Giả thiết tập X 6= ∅ Tích Carte X ×X được định nghĩa như sau:
Tập X × X được định nghĩa là tập hợp các cặp (x, y) với x, y thuộc X Một tập con S của X × X được gọi là quan hệ hai ngôi trong X, và nếu (x, y) thuộc S, ta nói x có quan hệ S với y, ký hiệu là xSy Nếu giả thiết X không rỗng và S không rỗng là một quan hệ hai ngôi trong X, thì quan hệ S được xem là quan hệ tương đương trong X nếu thỏa mãn ba điều kiện cụ thể.
(1) (Phản xạ) Với mọi x ∈ X có xSx.
(2) (Đối xứng) Với mọi x, y ∈ X, nếu có xSy thì cũng có ySx.
(3) (Bắc cầu) Với mọix, y, z ∈ X, nếu có xSy vàySz thì cũng có xSz.
Khi S là một quan hệ tương đương trong tập X, chúng ta ký hiệu ∼ để thay thế cho S Đặt C(x) = {y ∈ X|y ∼ x}, ta gọi C(x) là lớp tương đương với x, trong đó x là đại diện Các tính chất của lớp tương đương này dễ dàng được chỉ ra.
Tính chất 1.1.3 Giả sử ∼ là quan hệ tương đương trong X Khi đó
(3) Với mọi x, y ∈ X, có hoặc C(x)∩C(y) =∅ hoặc C(x) = C(y).
Tập thương X/ ∼ đại diện cho các lớp tương đương không giao nhau Định nghĩa 1.1.4 nêu rõ rằng nếu X và S đều khác rỗng, thì S là một quan hệ thứ tự trong X nếu nó đáp ứng ba điều kiện cụ thể.
(1) (Phản xạ) Với mọi x ∈ X có xSx.
(2) (Phản đối xứng) Với mọi x, y ∈ X, nếu có xSy và ySx thì x = y.
(3) (Bắc cầu) Với mọix, y, z ∈ X, nếu có xSy vàySz thì cũng có xSz.Tập X được gọi là một tập sắp thứ tự nếu có quan hệ thứ tự trong X.
Mở rộng đơn
Giả thiết K là một trường và x là một biến Xét vành đa thức K[x]. Giả sử f(x) thuộc K[x] là một đa thức bất khả quy bậc n > 0 Trong
K[x] ta xét quan hệ ∼ được định nghĩa như sau.
Hai đa thức a(x), b(x) ∈ K[x] thỏa mãn quan hệ ∼ và viết a(x) ∼ b(x) nếu có đa thức c(x) ∈ K[x] để a(x)−b(x) =c(x)f(x).
Bổ đề 1.1.5 Quan hệ ∼ là một quan hệ tương đương trong vành K[x].
Chứng minh: Vì a(x)−a(x) = 0 = 0.f(x) nên a(x) ∼ a(x) với mọi đa thức a(x) ∈ K[x].
Giả sử a(x), b(x) ∈ K[x] thỏa mãn a(x) ∼ b(x) Khi đó có đa thức c(x) ∈ K[x] để a(x)−b(x) =c(x)f(x) Vậy b(x)−a(x) =−c(x).f(x). Điều này chứng tỏ b(x) ∼ a(x).
Giả sử a(x), b(x), d(x) ∈ K[x] thỏa mãn a(x) ∼ b(x) và b(x) ∼ d(x). Khi đó có c(x), e(x) ∈ K[x] để a(x)−b(x) =c(x)f(x) và b(x)−d(x) =e(x)f(x). Vậy a(x)−d(x) = a(x)−b(x) +b(x)−d(x) = [c(x) +e(x)]f(x). Điều này chứng tỏ a(x) ∼ d(x).
Tóm lại, ta đã chỉ ra quan hệ∼ là một quan hệ tương đương trong vành K[x].
Với quan hệ tương đương ∼, ta phân lớp vành K[x] bằng cách ký hiệu mỗi đa thức a(x) ∈ K[x] là lớp tương đương với a(x) làm đại diện Lớp tương đương được định nghĩa là a(x) = {b(x) ∈ K[x]|b(x) ∼ a(x)}.
Để biến tập K[x]/∼ thành một trường, ta định nghĩa hai phép toán hai ngôi: a 1 (x) + a 2 (x) = a 1 (x) + a 2 (x) và a 1 (x) · a 2 (x) = a 1 (x) a 2 (x) với mọi a1(x), a2(x) ∈ K[x]/∼ Việc kiểm tra cho thấy phép cộng và phép nhân này là những phép toán hai ngôi trong K[x]/∼ Theo định lý 1.1.6, tập K[x]/∼ với phép cộng và phép nhân đã được định nghĩa là một trường, được ký hiệu là K[x]/(f(x)) hoặc K ∗.
Tập K[x]/∼ với phép cộng và phép nhân tạo thành một vành giao hoán có đơn vị 1 và phần tử khác 0, bao gồm các đa thức chia hết cho f(x) Nếu a(x) khác 0, thì a(x) không chia hết cho f(x) Do f(x) là một đa thức bất khả quy, nên ước chung lớn nhất của a(x) và f(x) thuộc trường.
K Như vậy, theo Định lý Bezout sẽ có hai đa thức b(x), g(x ∈ K[x] để a(x)b(x) +g(x)f(x = 1 Từ đây suy ra a(x)b(x) = 1 hay a(x).b(x) = 1.
Vì K[x]/ ∼ là một vành giao hoán với đơn vị 1 và mọi phần tử khác 0 đều có nghịch đảo thuộc K[x]/∼ nên K[x]/ ∼ là một trường.
K và K' là hai trường, trong đó K được gọi là trường con của K' nếu K ⊆ K' Khi đó, K' được xem là trường mở rộng của K Qua khái niệm trường con, ta có thể chứng minh rằng K sẽ trở thành trường con của trường K* thông qua một phép nhúng.
Giả sử α, β ∈ K, nếu α = β thì α−β chia hết cho f(x) và ngược lại Đa thức f(x) có bậc n > 0 cho thấy α phải bằng β Do đó, α = β khi và chỉ khi α = β Từ đó, chúng ta có thể dễ dàng suy ra kết quả.
Bổ đề 1.1.7 Tập tất cả các lớp α ∈ K ∗ với α ∈ K lập thành một trường con K ′ của K ∗ và K ∼= K ′ bởi α 7→ α.
Với đẳng cấu này, chúng ta có thể đồng nhất α ∈ K với ảnh α ∈ K ∗, cho phép coi K ∗ là một trường mở rộng của K Ký hiệu γ = x ∈ K ∗ Thông qua phép cộng, phép nhân và phép nhúng K vào K ∗, chúng ta có thể biểu diễn phần tử thuộc K ∗ một cách rõ ràng.
Với đa thức g(x) ∈ K[x] ta biểu diễn g(x) = h(x)f(x) +g1(x), trong đú g1(x) = bmx m + ã ã ã+b1x+b0 và m < n, ta cú
Hàm f(x) có nghiệm γ thuộc K ∗, và mọi phần tử trong K ∗ có thể được biểu diễn dưới dạng bmγ^m + bm−1γ^(m−1) + + b1γ + b0, với các hệ số bi thuộc K và m nhỏ hơn n, tức là degf(x) Cách biểu diễn này là duy nhất.
Với các kết quả đã trình bày, ta có thể đưa ra định lý 1.1.8: Đối với mỗi đa thức bất khả quy f(x) ∈ K[x] với bậc degf(x) = n > 0, luôn tồn tại một trường mở rộng K ∗ của K sao cho f(x) có một nghiệm γ ∈ K ∗ Hơn nữa, mọi phần tử thuộc K ∗ đều có thể được biểu diễn dưới dạng bmγ m + bm − 1γ m − 1 + + b1γ + b0, với các hệ số bi ∈ K.
Chứng minh: Ký hiệu K(γ) = ng(γ) h(γ)|g(x), h(x) ∈ K[x], h(γ) 6= 0o với phép cộng và phép nhân cho g1(γ) h1(γ), g2(γ) h2(γ) ∈ K(γ) được định nghĩa g1(γ) h 1 (γ) + g2(γ) h 2 (γ) = g1(γ)h2(γ) +g2(γ)h1(γ) h 1 (γ)h 2 (γ) g1(γ) h1(γ).g2(γ) h2(γ) = g1(γ)g2(γ) h1(γ)h2(γ).
Nếu g1(γ) h1(γ) ∈ K(γ) là phần tử khác không, thì nghịch đảo của nó là h1(γ) g1(γ) K(γ) là một trường chứa γ và K như một trường con Đa thức f(x) có nghiệm γ ∈ K(γ).
Gia sử δ ∈ K(γ), có hai đa thức g(x), h(x) ∈ K[x] với h(γ) 6= 0 và δ = g(γ) h(γ) Do h(γ) 6= 0, h(x) và f(x) là nguyên tố cùng nhau Tồn tại p(x), q(x) ∈ K[x] sao cho h(x)p(x) + f(x)q(x) = 1 Do đó, h(γ)p(γ) = 1 suy ra 1/h(γ) = p(γ) Kết luận, δ = g(γ)p(γ) là một đa thức của γ.
Để chứng minh định lý, ta bắt đầu với hàm f(γ) = γ^n + a1γ^(n-1) + + an Sau đó, ta thay thế mỗi lũy thừa γ^(n+i) bằng biểu thức γ^(n-1) với các hệ số tương ứng, dẫn đến biểu diễn δ = bmγ^m + bm-1γ^(m-1) + + b1γ + b0 với các bi thuộc K Cuối cùng, việc chọn K* = K(γ) cho phép hoàn tất chứng minh.
Ta mở rộng K qua việc bổ sung thêm phần tử γ vào K Trường
K ∗ = K(γ) được gọi là một mở rộng đơn của K bởi γ Hiển nhiên K(γ) = K[γ] = g(γ)|g(x) ∈ K[x],degg(x) < n Mở rộng K(γ) là mở rộng nhỏ nhất, (theo quan hệ bao hàm), của K chứa γ Nếu ta coi
K(γ) là một K-không gian véc tơ chiều n, với cơ sở bao gồm 1, γ, , γ n − 1 Bậc của mở rộng này được ký hiệu là [K(γ) : K] và thể hiện số chiều n của không gian véc tơ K(γ) trên K.
Một đa thức f(x) bậc lớn 1 có nhiều nghiệm γ = γ1, γ2, , γn trong một mở rộng của trường cơ sở K Vấn đề đặt ra là xét quan hệ giữa các trường K(γi) Trong chứng minh định lý, ta chọn K ∗ = K(γ) Nếu không chọn K ∗ bằng K(γ), định lý sẽ chỉ ra rằng tất cả các trường K(γi) đều đẳng cấu với K ∗ Định lý 1.1.9 khẳng định rằng K(γi) luôn đẳng cấu với K ∗.
Chứng minh: Xét K(γ1) = K(γ) Ánh xạ φ : K[x] → K(γ), biến f(x) thành f(γ), là một toàn cấu với Ker(φ) = (f(x)).
Do vậy K(γ) ∼= K[x]/(f(x)) = K ∗ Tương tự, ta cũng có K(γi) ∼= K ∗ với mỗi i.
Ví dụ: Khi K = C thì đa thức bất khả quy trên K chỉ là đa thức bậc nhất Khi đó K ∗ = K Trường K ∗ có thể khác K.
Ví dụ: Với K = Q và đa thức bất khả quy f(x) = x 2 −3 trên Q ta có
Mở rộng đại số
Trong mục này K được ký hiệu là trường con của trường mở rộng K ∗ Định nghĩa 1.1.11 Phần tử α ∈ K ∗ được gọi là phần tử đại số trên
Nếu tồn tại các phần tử a1, , an ∈ K sao cho α n + a1α n − 1 + + a n − 1 α + a n = 0, thì α được gọi là phần tử đại số trên K Ngược lại, α được xem là phần tử siêu việt trên K Đặt f(x) = x n + a1x n − 1 + + an − 1x + an, thì đa thức f(x) được gọi là phương trình đại số của α trên K Theo định lý 1.1.12, mỗi phần tử đại số α trên K đều là nghiệm của một đa thức bất khả quy duy nhất f(x) thuộc vành K[x] với hệ tử cao nhất bằng 1, và tất cả các đa thức p(x) ∈ K[x] nhận α làm nghiệm đều phải chia hết cho f(x).
Vì α là phần tử đại số trên K, tồn tại đa thức f(x) ∈ K[x] với α là nghiệm Chúng ta chọn f(x) là đa thức bậc thấp nhất có hệ số cao nhất bằng 1 Nếu f(x) khả quy, nó có thể phân tích thành tích của hai đa thức g(x) và h(x) với bậc lớn hơn 0 và hệ số cao nhất cũng bằng 1 Do f(α) = 0, ta có g(α)h(α) = 0 Vì K* là trường, nên g(α) = 0, dẫn đến tồn tại đa thức g(x) với bậc nhỏ hơn f(x), mâu thuẫn với lựa chọn ban đầu Điều này chứng tỏ f(x) là bất khả quy Tiếp theo, với đa thức p(x) ∈ K[x] nhận α làm nghiệm, nếu p(x) = 0 thì p(x) chia hết cho f(x) Nếu p(x) ≠ 0, ta có thể viết p(x) = q(x)f(x) + r(x) với q(x), r(x) ∈ K[x] và degr < degf Vì f(α) = 0 và p(α) = 0, suy ra r(α) = 0, từ đó r(x) = 0 hay p(x) chia hết cho f(x).
Hệ quả 1.1.13 Trong vành K[x], phần tử x là siêu việt trên K.
Chứng minh: Ta coi K[x] là một tập con của một trường K ∗ nào đó.
Dễ dàng kiểm tra rằng các phần tử 0, x, x², , xⁿ là độc lập tuyến tính trên K Nếu x là phần tử đại số trên K, thì x là nghiệm của một đa thức f(x) ∈ K[x] với f(x) ≠ 0 và deg f(x) = n > 0 Do đó, các phần tử 0, x, x², , xⁿ là phụ thuộc tuyến tính trên K, dẫn đến mâu thuẫn Định nghĩa 1.1.14: Đa thức bất khả quy f(x) ∈ K[x] có hệ tử cao nhất bằng 1 và nhận α làm nghiệm được gọi là đa thức tối tiểu của α trên K.
K Các nghiệm α1, , αn của đa thức tối tiểu của α được gọi là các liên hợp của α trên K.
Ta công nhận kết quả sau đây: Định lý 1.1.15 Tập tất cả các phần tử thuộc K ∗ đại số trên K là một trường con của K ∗ chứa K.
Hoàn toàn tương tự như mở rộng đơn, ta có thể mở rộng trường cơ sở
K bởi một số hữu hạn các phần tử thuộc trường mở rộng K”củaK Với phần tửγ1 ∈ K”\K đại số trên ta mở rộng đơnK(γ1).Với phần tửγ2 ∈
Mở rộng đại số K(γ1) thành K(γ1, γ2) cho phần tử γ2 ∈ K”\K(γ1) và tiếp tục mở rộng K(γ1, , γs - 1) với γs ∈ K”\K(γ1, , γs - 1), ta có K(γ1, , γs - 1)(γs) = K(γ1, , γs - 1, γs) Định nghĩa K0 = K và Ki = K(γ1, , γi), cho thấy rằng quy trình mở rộng này luôn được duy trì.
Chứng minh: Ta chỉ cần chứng minh cho trường hợp s = 2 Trường hợp tổng quát được chứng mnh bằng phương pháp quy nạp theo s.
Giả sử α1, , αn là một cơ sở của K-không gian véc tơ K(γ1) và β 1 , , β m là một cơ sở của K(γ 1 )-không gian véc tơ K(γ 1 , γ 2 ) Giả sử u ∈ K(γ1, γ2) =K(γ1)(γ2).
Khi đó có các phần tử v1, v2, , vm ∈ K(γ1) để u = P m i=1 vjβi Vì các vi ∈ K(γ1) nên có các aij ∈ K để vi n
Tích mn αjβi với j = 1, , n và i = 1, , m chứng tỏ rằng đây là một hệ sinh của K-không gian véc tơ K(γ1, γ2) Hơn nữa, chúng ta có thể khẳng định rằng tích mn này là độc lập tuyến tính trên K.
Pn j=1 aijαjβi = 0 hay viết lại m
Vì β1, , βm là một cơ sở của K(γ1)-không gian véc tơ K(γ1, γ2) nên n
Vì α1, , αn là cơ sở của K-không gian véc tơ K(γ1), nên các hệ số aij bằng 0 cho mọi j = 1, , n và i = 1, , m Điều này dẫn đến mn tích αjβi với j = 1, , n và i = 1, , m trở thành một cơ sở của K-không gian véc tơ K(γ1, γ2) Hơn nữa, ta có mối quan hệ [K(γ1, γ2) : K] = [K(γ1, γ2) : K(γ1)][K(γ1) : K].
Trường mở rộng K ∗ của trường cơ sở K được gọi là mở rộng bậc hữu hạn nếu tồn tại một số hữu hạn phần tử γ1, , γs ∈ K ∗, sao cho mọi phần tử u thuộc K ∗ đều có thể được biểu diễn dưới dạng u = f(γ1, , γs) với f là một hàm số thích hợp.
Hệ γ1, , γs ∈ K ∗ được gọi là một cơ sở của K ∗ trên K nếu P s i=1 aiγi = 0 thì a1 = a2 = = as = 0, và s được xác định là bậc của mở rộng K ∗ của K Trường mở rộng K ∗ của trường cơ sở K được gọi là mở rộng đại số nếu mỗi phần tử thuộc K ∗ đều là phần tử đại số trên K Nếu K ∗ là mở rộng bậc hữu hạn s của K, thì mỗi phần tử thuộc K ∗ đều đại số trên K và đa thức tối tiểu của nó trên K có bậc không lớn hơn s.
Chứng minh: Giả thiết hệ γ1, , γs ∈ K ∗ là một cơ sở của K ∗ trên
K Giả sử u ∈ K ∗ Vỡ uγi ∈ K ∗ nờn uγi = ai1γ1 + ai2γ2 + ã ã ã+ aisγs với các aij ∈ K và i = 1,2, , s Do vậy, ta có một hệ phương trình tuyến tính thuần nhất
Vì hệ này có nghiệm không tầm thường γ1, , γs) 6= (0) trong K ∗ nên định thức của hệ phải bằng 0 hay a11 −u a12 ã ã ã a1s a21 a22 −u ã ã ã a2s ã ã ã ã as1 as2 ã ã ã ass−u
= 0. Đa thức F(x) a11−x a12 ã ã ã a1s a21 a22−x ã ã ã a2s ã ã ã ã as1 as2 ã ã ã ass −x có bậc s và số hạng
(−1) s x s 6= 0 Do vậy F(x) là đa thức khác 0 bậc s thỏa mãn F(u) = 0.
Vì đa thức tối tiểu của u là nhân tử của F(x), mỗi phần tử u thuộc K ∗ đều là đại số trên K, với đa thức tối tiểu có bậc không lớn hơn s Định lý 1.1.21 khẳng định rằng nếu K ∗ là một mở rộng của K và γ 1 , , γ s ∈ K ∗ là đại số trên K, thì trường K(γ1, , γs) sẽ là một mở rộng đại số của K.
Chứng minh rằng γ2 là đại số trên K cho thấy rằng γ2 cũng là đại số trên K(γ1) Tương tự, γs cũng được xác định là đại số trên K(γ1, , γs-1) Bằng cách áp dụng phương pháp quy nạp theo s và sử dụng Định lý 2.1.15 và Định lý 2.1.16, ta có thể kết luận rằng K(γ1, , γs) là một mở rộng đại số của K.
Một vài vận dụng
Giả sử f(x) là một đa thức bất khả quy thuộc vành K[x] Theo Định lý 2.1.3, tồn tại một mở rộng K∗ của K để f(x) có nghiệm γ1 ∈ K∗ Trong mở rộng đại số K(γ1) của K, f(x) có thể phân tích thành f(x) = (x−γ1) r1 f1(x) theo Định lý Bezout, với f1(x) ∈ K(γ1)[x] Nếu deg f1(x) > 1, ta tiếp tục mở rộng K(γ1) thành K(γ1, γ2) để f1(x) = (x − γ2) r2 f2(x) Quá trình này lặp lại cho đến khi nhận được trường K(γ1, , γs), từ đó đa thức f(x) được phân rã thành tích các nhân tử bậc nhất trong K(γ1, , γs)[x]: f(x) = (x−γ1) r1 (x−γ2) r2 (x−γs) rs.
Từ đó ta nhận được kết quả sau. Định lý 1.1.22 Với mỗi đa thức f(x) ∈ K[x] luôn có một mở rộng đại số K ∗ của K để f(x) phân rã hoàn toàn trong K ∗ [x].
Ví dụ 1.1.23 Đa thức f(x) = x 4 −10x 2 + 1 ∈ Q[x] là bất khả quy.
3)[x] có phân rã f(x) = (x−γ 1 )(x− γ 2 )(x −γ 3 )(x −γ 4 ), trong đó γ 1 = √
3, γ2 = −γ1, γ3 − 1 γ1 và γ4 = −γ3. Định lý 1.1.24 Nếu trường K có nhiều vô hạn phần tử và r đa thức fi(x1, , xn) ∈ K[x1, , xn] \ {0} thì có a1, , an ∈ K để fi(a1, , an) 6= 0 với mọi i = 1, , r.
Để chứng minh, đặt g(x) = Q r i=1 f i (x 1 , , x n ) Do đó, chỉ cần chứng minh định lý cho một đa thức Xét đa thức g(x1, , xn) khác 0 Với n = 1, ta có đa thức g(x1) = b0x m + b1x m − 1 + + bm với b0 khác 0 Theo Định lý 2.1.5, có thể mở rộng K ∗ của K để g(x1) m.
Trong một trường K với vô hạn phần tử, tồn tại a1 khác γi với mọi i từ 1 đến m, dẫn đến g(a1) khác 0 Giả sử giả thuyết đúng cho mọi đa thức với n−1 biến thuộc K[x1, , xn−1] Đối với đa thức g(x1, , xn) khác 0, có thể viết g(x1, , xn) = f1(x1, , xn−1)xn^r + + fr(x1, , xn−1), với f1(x1, , xn−1) khác 0.
Theo giả thiết quy nạp, với a1, , an − 1 ∈ K, ta có f1(a1, , an − 1) 6= 0 Do đó, đa thức g(a1, , an − 1, xn) = f1(a1, , an − 1)x r n + + fr(a1, , an − 1) 6= 0 Áp dụng trường hợp n = 1 đã được chứng minh, ta suy ra an ∈ K sao cho g(a1, , an − 1, an) 6= 0 Định lý 1.1.25 khẳng định rằng nếu đa thức f(x) ∈ C[x] và f(0) 6= 0, thì với mỗi số nguyên dương r, luôn tồn tại một đa thức g(x) sao cho g(x) r − x chia hết cho f(x).
Chứng minh: Vì C là một trường đóng đại số theo Định lý cơ bản của đại số, Định lý D’Alembert-Gauss, nên có sự phân rã đa thức f(x) aQ t i=1
(x−γi) s i trong C[x] Xét t đa thức h1(x), , ht(x) được xác định bởi các phương trình sau đây: h i (x) =γ i 1/r 1 + 1 rγi
Dễ dàng kiểm tra hi(x) r −x chia hết cho (x−γi) s i
Ví dụ 1.1.26 Cho số nguyên tố p > 3 Chứng minh rằng dư của phép chia số Q p j=1
Bài giải: Ta xét trường các lớp thặng dư Z p Mở rộng trường thành trường Z p [i] với i 2 = −1 Ta viết j ∈ Z p qua j, phân tích p
(j+ x) Hiển nhiên f(x) ≡x p −x trên Z p và như vậy p
Ví dụ 1.1.27 Cho số nguyên tố p > 3 Chứng minh rằng nếu dư của phép chia số p cho 8 bằng 1 thì 2 p−1
Bài giải: Ta xét trường các lớp thặng dư Z p Mở rộng trường thành
Z p (α) với α 4 = −1 Khi đó trường Z p (α) có đặc số p = 8t+ 1, t ∈ N ∗
(α+α − 1 ) p = α p +α − p = α+α − 1 Nhân hai vế với α+ α − 1 ta nhận được hệ thức dưới đây:
Từ (α+α − 1 ) 2 = 2 ta suy ra 2 p+1 2 ≡ 2(modp) hay 2 p − 2 1 ≡ 1(modp).
Ví dụ 1.1.28 [Euler] Với x1, x2, x3, x4, y1, y2, y3, y4 ∈ R ta luôn có (x 2 1 +x 2 2 +x 2 3 +x 2 4 )(y 1 2 +y 2 2 +y 3 2 +y 4 2 ) = u 2 1 +u 2 2 +u 2 3 +u 2 4 , trong đó
u1 = x1y1 −x2y2 −x3y3 −x4y4 u2 = x1y2 + x2y1 +x3y4 −x4y3 u3 = x1y3 −x2y4 + x3y1 +x4y2 u4 = x1y4 +x2y3 −x3y2 +x4y1 và suy ra bất đẳng thức u 2 1 + u 2 2 +u 2 3 +u 2 4 > (x1y1 +x2y2 +x3y3 + x4y4) 2
Chứng minh: Xét bài toán trong C. Đặt z1 = x1 +ix2, z2 = x3 +ix4, z3 = y1 +iy2 và z4 = y3 +iy4.
Ta có thể biểu diễn
Ví dụ 1.1.29 Giả sử hai dãy số nguyên (an) và (bn) xác định như sau:
a0 = 3, a1 = 2, a2 = −6 an+2 = 2an+1 −5an+ an − 1, n > 2; b0 = 3, b1 = −4, b2 = −2 bn+2 = −4bn+1−9bn −9bn − 1, n > 2.
Khi đó ta có các kết quả sau đây:
(i) an = C 0 n bn + 2 C 1 n bn − 1 +ã ã ã+ 2 n − 1 C n n − 1 b1 + 2 n C n n b0 bn = C 0 n an−2 C 1 n an − 1+ã ã ã+(−1) n − 1 2 n − 1 C n n − 1 a1+(−1) n 2 n C n n a0. (ii) Tìm số dư của phép chia ap cho p khi p là số nguyên tố.
Bài giải: (i) Xét bài toán trên C.
Phương trìnhf(x) =x 3 −2x 2 + 5x−1 = 0 Gọi ba nghiệm của nó trong
C là x1, x2, x3 Dễ dàng kiểm tra x 0 1 +x 0 2 +x 0 3 = a0, x1 +x2 +x3 = a1, x 2 1 +x 2 2 +x 2 3 = a2, tổng quát an = x n 1 +x n 2 + x n 3 , n > 0.
Trong bài viết này, chúng ta xem xét các nghiệm của phương trình g(y) = y^3 + 4y^2 + 9y + 9 = 0, với ba nghiệm y1, y2, y3 Các hệ thức an và bn được xác định như sau: an = x1^n + x2^n + x3^n = (y1 + 2)^n + (y2 + 2)^n + (y3 + 2)^n và bn = y1^n + y2^n + y3^n = (x1 - 2)^n + (x2 - 2)^n + (x3 - 2)^n, với n > 0 Ngoài ra, từ ap = x1^p + x2^p + x3^p, chúng ta có thể suy ra rằng ap = (x1 + x2 + x3)^p - i + j + k = p.
Với bộ ba i, j, k cố định nhưng có thể hoán vị, tổng con p! i!j!k! (x i 1 x j 2 x k 3 + x i 1 x k 2 x j 3 + x j 1 x i 2 x k 3 + x j 1 x k 2 x i 3 + x k 1 x j 2 x i 3 + x k 1 x i 2 x j 3) tạo thành một đa thức đối xứng của x1, x2, x3 Đa thức này có hệ số nguyên với các điều kiện x1 + x2 + x3 = 2, x1x2 + x2x3 + x3x1 = 5 và x1x2x3 = 1 Từ đó, ta có i + j + k = p.
0 6 i,j,k
2 thì a p ≡ 2 p ≡ 2(modp) Vậy dư bằng 2.
Phụ thuộc đại số và Định lý Hilbert về cơ sở
Phụ thuộc đại số
Giả thiết K ∗ là một trường mở rộng của trường K, trong đó các phần tử γ1, γ2, , γr ∈ K ∗ được xác định là phụ thuộc đại số trên K nếu tồn tại một đa thức khác không f(x1, x2, , xr) ∈ K[x1, x2, , xr] sao cho f(γ1, γ2, , γr) = 0.
Các phần tử α1, α2, , αr ∈ K ∗ được gọi là độc lập đại số trên K nếu không có đa thức khác không f(x1, x2, , xr) ∈ K[x1, x2, , xr] để f(α1, α2, , αr) = 0.
Khi r = 1, phần tử γ1 phụ thuộc đại số trên K nếu và chỉ nếu nó là đại số trên K Đối với các phần tử phụ thuộc đại số γ1, γ2, , γr trên K, ta thường chọn đa thức bất khả quy f(x1, x2, , xr) thuộc K[x1, x2, , xr] Trong trường hợp này, các phần tử độc lập đại số α1, α2, , αr trên K được xem như các biến, và trường mở rộng K(α1, α2, , αr) được gọi là trường các hàm số hữu tỷ của các biến αi.
Định lý cơ sở của Hilbert
Xét vành đa thức K[x1, x2, , xn], giả sử I là một iđêan của vành này Chúng ta sẽ chứng minh rằng I có thể được sinh bởi một số hữu hạn đa thức Theo định nghĩa, một iđêan I của vành R được gọi là có hệ sinh hữu hạn nếu tồn tại một số hữu hạn phần tử a1, , as thuộc I, sao cho mọi phần tử b trong I đều có thể được biểu diễn dưới dạng b = r1a1 + r2a2 + + rsas, với các hệ số ri thuộc R.
Bổ đề 1.2.3 Mỗi idêan I của vành đa thức một biến K[x] được sinh ra bởi một phần tử.
Giả sử I là một idêan của vành đa thức một biến x Nếu I = (0), I được sinh ra bởi phần tử 0 Nếu I khác (0) và có phần tử a ∈ K, a khác 0 thuộc I, thì mỗi β ∈ K có thể viết thành β = (βα − 1)α ∈ I, dẫn đến I = (1) = K[x] Nếu không có phần tử khác 0 thuộc K nằm trong I, thì có đa thức bậc dương của x thuộc I Chọn đa thức f(x) bậc thấp nhất d với hệ tử cao nhất bằng 1 trong số các đa thức bậc dương thuộc I Mỗi đa thức g(x) thuộc I có thể biểu diễn dưới dạng g(x) = f(x)h(x) + r(x) với degr(r(x)) < d Do g(x), f(x) ∈ I nên r(x) ∈ I và vì degr(r(x)) < d nên r(x) = 0 Do đó, g(x) = f(x)h(x), chứng minh rằng I được sinh ra bởi phần tử f(x) Định lý 1.2.4 khẳng định rằng mỗi idêan I khác (0) và (1) của vành đa thức K[x1, x2, , xn] đều có một hệ sinh hữu hạn.
Chúng ta sẽ chứng minh định lý thông qua phương pháp quy nạp theo số n của các biến x1, x2, , xn Đối với trường hợp n = 1, kết quả đã được xác nhận đúng theo Bổ đề 1.2.3 Giả sử rằng kết quả này cũng đúng cho mọi ý tưởng J khác (0) và khác với vành.
Trong vành K[x1, x2, , xn-1], một đa thức thuộc lý thuyết I ⊂ K[x1, , xn-1, xn] có thể được biểu diễn dưới dạng đa thức của xn với các hệ số thuộc vành này Khi xem xét các hệ số cao nhất theo biến xn của đa thức trong I, ta có thể viết f(x) = f(x1, , xn) = a1(x1, , xn-1)x^s_n + a2(x1, , xn-1)x^(s_n-1) + và chứng minh rằng các đa thức a1(x1, , xn-1) tạo thành một lý thuyết iđêan trong vành K[x1, x2, , xn-1].
Giả sử g(x) là một đa thức thuộc I với dạng g(x) = b1(x1, , xn − 1)x r n + b2(x1, , xn − 1)x r n − 1 + và s > r Khi đó, biểu thức f(x)−x s n − r g(x) sẽ trở thành một đa thức thuộc I, có hệ tử cao nhất là a1(x1, , xn − 1)−b1(x1, , xn − 1).
Nếu a(x1, , xn − 1) thuộc K[x1, , xn − 1], thì a(x1, , xn − 1)f(x) thuộc I với hệ tử cao nhất a(x1, , xn − 1)a1(x1, , xn − 1) Do đó, theo định nghĩa của iđêan, các hệ tử cao nhất của các đa thức trong I tạo thành một iđêan J thuộc K[x1, x2, , xn − 1] Theo giả thiết quy nạp, J có một hệ sinh hữu hạn gồm ht(x1, x2, , xn − 1) với t = 1, 2, , m0 Mỗi phần tử trong J có thể được biểu diễn dưới dạng tổng như sau m0.
X t=1 ct(x1, x2, , xn − 1)ht(x1, x2, , xn − 1) với các ct(x1, x2, , xn − 1) ∈ K[x1, x2, , xn − 1].
Do các đa thức của n−1 biến ht(x1, x2, , xn − 1) thuộc iđêan J nên có đa thức f t (x) =f t (x 1 , , x n ) ∈ I với biểu diễn f t (x) =f t (x 1 , , x n ) = h t (x 1 , x 2 , , x n − 1 )x s n t +ã ã ã , t = 1,2, , m 0 Đặt s = max{s1, s2, , sm 0} Giả sử f(x) = a(x1, , xn − 1)x r n + ã ã ã với r > s Biểu diễn a(x1, , xn − 1) m 0
X t=1 ct(x1, x2, , xn − 1)ht(x1, x2, , xn − 1). Khi đó đa thức f(x)− m
X t=1 ct(x1, x2, , xn − 1)x r n − s t ft(x1, , xn − 1, xn) thuộc I với bậc nhỏ hơn r Lặp lại quá trình, sau vài lần ta có thể viết f(x)− m
Xét các đa thức thuộc lý thuyết I với bậc theo xn nhỏ hơn s, ta chỉ cần chú ý đến các đa thức có bậc s−1 Giả sử g(x) và h(x) là hai đa thức với hệ số thuộc K[x1, x2, , xn − 1] Khi tính hiệu g(x)−h(x), ta nhận được một đa thức có bậc nhỏ hơn s Các hệ số cao nhất theo xn tạo thành một lý thuyết J1 ⊂ K[x1, x2, , xn − 1], và theo giả thiết quy nạp, J1 có một hệ sinh hữu hạn Đặt f m 0 +u (x) là các đa thức thuộc I với hệ số cao nhất và bậc theo xn bằng s−1 Mỗi đa thức k(x) ∈ I bậc theo xn bằng s−1 có thể được biểu diễn dưới dạng hiệu k(x) − P m 1 u=1 fm 0 +u(x), là một đa thức bậc không vượt quá s−2 Quá trình này có thể lặp lại cho đến khi đạt được kết quả mong muốn.
X t=1 bt(x1, x2, , xn − 1, xn)ft(x1, , xn − 1, xn) thuộcI với bậc0.Vậyf(x) m v
P t=1 bt(x1, , xn − 1, xn)ft(x1, , xn − 1, xn) theo giả thiết quy nạp.
Định lý không điểm của Hilbert
Giả sử K = C, một trường đóng đại số, để trình bày Định lý không điểm của Hilbert, chúng ta sẽ sử dụng Định lý 1.3.1 Theo định lý này, nếu hệ phương trình đa thức gi(x1, , xn) = 0 không có nghiệm, thì tồn tại các đa thức ai(x1, , xn) ∈ C[x1, , xn] sao cho tổng P r i=1 ai(x1, , xn)gi(x1, , xn) = 1.
Xét hệ các phương trình đa thức fi(x1, , xn) = 0 i = 1,2, , r Giả sử đa thứcg(x1, , xn) 6= 0 thỏa mãng(ξ1, ξ2, , ξn) = 0khi (ξ1, ξ2, , ξn) là nghiệm của hệ fi(x1, , xn) = 0 i = 1,2, , r.
Khi đó ta có kết quả sau: Định lý 1.3.2 [Hilbert’s zero-theorem] Giả sử g(x1, , xn) khác không thỏa mãn g(ξ1, ξ2, , ξn) = 0 khi (ξ1, ξ2, , ξn) là nghiệm của hệ fi(x1, , xn) = 0 i = 1,2, , r.
Khi đó có các đa thức bi(x1, , xn) ∈ C[x1, , xn] và số nguyên dương s thỏa mãn g(x1, , xn) s r
Chứng minh: Ký hiệu z là biến mới Coi các đa thức fi(x1, , xn) như là các phần tử thuộc vành đa thức C[x 1 , , x n , z] Xét hệ phương trình đa thức
fi(x) = fi(x1, , xn) = 0 i = 1,2, , r zg(x)−1 = zg(x1, , xn)−1 = 0.
Hệ này vô nghiệm Theo Định lý 1.3.1, tồn tại các ai(x1, , xn, z) và b(x1, , xn, z) thuộc vành C[x1, , xn, z] để r
X i=1 ai(x1, , xn, z)fi(x) +b(x1, , xn, z)(zg(x)−1) = 1. Đồng nhất thức này vẫn đúng khi ta thay z qua 1 g(x) Từ đây suy ra r
Nhân hai vế với một lũy thừa thích hợp của g(x) ta nhận được hệ thức g(x 1 , , x n ) s = P r i=1 b i (x 1 , , x n )f i (x 1 , , x n ).
Bổ đề 1.3.3 cho biết rằng với trường K có char(K) = 0, nếu g(x) = g(x1, , xn) là một đa thức khác không trong K[x] và ti = deg i g(x) là bậc của g(x) theo biến xi, thì ký hiệu các tập con Si ⊂ K thỏa mãn |Si| > ti + 1 với i = 1, , n Nếu g(α) = 0 cho mọi (α) = (α1, , αn) thuộc Si với i = 1, , n, thì ta có g(x) ≡ 0.
Để chứng minh kết luận, chúng ta sử dụng phương pháp quy nạp theo n Đối với n = 1, đa thức một biến g(x1) có bậc t1 triệt tiêu trên tập S1 với nhiều hơn t1 phần tử, do đó g(x1) ≡ 0 theo Định lý Bezout Giả sử kết luận đúng với tất cả các đa thức có ít hơn n biến, ta có thể biểu diễn lại đa thức g(x) thành đa thức của biến xn như sau: g(x1, , xn) = tn.
Với mỗi bộ (γ) = (γ1, , γn − 1) ∈ S1 ∩ S2 ∩ ∩ Sn − 1 cố định, ta có g(γ, x n ) = ∑_{j=0}^{t n} g j (γ)x j n ≡ 0 trên tập S n, dẫn đến g j (γ) = 0 với mọi j = 0,1, , tn và mọi (γ) ∈ S1 ∩ S2 ∩ ∩ Sn − 1 Theo giả thiết quy nạp, ta suy ra gj(x1, , xn − 1) ≡ 0 với mọi j = 0,1, , tn, từ đó kết luận g(x) ≡ 0 Bổ đề đã được chứng minh Định lý 1.3.4 [Noga Alon] giả thiết trường K có char(K) = 0, cho đa thức khác không g(x) = g(x1, , xn) ∈ K[x], ký hiệu các tập con Si ⊂ K thỏa mãn |Si| > 1 và pi(xi) = ∏_{s ∈ S i}.
Nếu g(x) triệt tiêu tại mọi nghiệm chung của p1, , pn thì tồn tại đa thức q1, , qn ∈ K[x1, , xn] thỏa mãn degqi 6 degg −degpi để g n
Chứng minh: Đặt ti = |Si| −1 với i = 1, , n Theo giả thiết ta có g(α) = 0 với mọi (α) ∈ S 1 ìS 2 ì ã ã ã ìS n Ta biểu diễn lại cỏc đa thức pi(xi) = Y s ∈ S i
Do pi(s) = 0 nên s t i +1 = P t i j=0 aijs j , aij ∈ Si, i = 1, , n Như vậy x t i i +1 t i
Đa thức g ∗ (x) được tạo ra từ g(x) bằng cách biểu diễn g(x) dưới dạng tổ hợp các đơn thức, trong đó x t i i +1 được thay thế bởi P t i j=0 aijx j i Đa thức này có bậc không quá ti đối với mỗi biến xi và được hình thành từ g(x) bằng cách trừ đi các tích dạng qipi, với q i ∈ K[x 1 , , x n ] và degq i ≤ degg − degp i Qua các biến đổi, ta luôn có g ∗ (α) = g(α) = 0 với mọi α ∈ Q n i=1.
Theo Bổ đề 1.3.3, g ∗ ≡0 dẫn đến g = P n i=1 qipi Định lý 1.3.5 của Noga Alon cho rằng với trường K có char(K) = 0, nếu g(x) = g(x1, , xn) là đa thức khác không trong K[x] với bậc degg(g) = P n i=1 ti (ti ∈ N) và các hệ số của đơn thức P n i=1 x ti i khác 0, thì tồn tại các tập con Si ⊂ K với |Si| > ti cho i = 1,2, , n, dẫn đến sự tồn tại của α 1 ∈ S 1 , , α n ∈ S n sao cho g(α) khác 0.
Chứng minh: Kết quả được suy ra từ Định lý 1.3.4.
Nghiệm của hệ đa thức
Kết thức và phép khử
Kết thúc của hai đa thức là một khái niệm quan trọng trong đại số máy tính, cho phép xác định tính chất đặc trưng của hai đa thức một biến trên trường K có nghiệm chung Phương pháp này sử dụng hệ số của các đa thức mà không cần tìm nghiệm cụ thể, và nó cũng là công cụ hữu ích trong việc giải quyết các bài toán liên quan đến hệ phương trình đại số.
Khái niệm kết thức và biệt thức
Giả sử u_0, u_1, , u_m và v_0, v_1, , v_n là một tập hợp gồm m+n+2 biến độc lập đại số trên trường K Hai đa thức trong K[u, v][x] có dạng: f_u = u_0x^m + u_1x^{m-1} + + u_m và g_v = v_0x^n + v_1x^{n-1} + + v_n Định thức cấp m+n được xây dựng từ n dòng cho các biến u_i và m dòng cho các biến v_j như sau:
ã ã ã u0 u1 ã ã ã um − 1 um v0 v1 v2 ã ã ã vn v0 v1 ã ã ã vn − 1 vn
Kết thúc hay Định thức Sylvester của hai hàm fu và gv được xác định bởi v0, v1, , vn, trong đó các vị trí trắng đều bằng 0 Từ định nghĩa này, chúng ta có thể rút ra một số tính chất quan trọng.
(i) Res(fu, gv) là đa thức thuần nhất với hệ số nguyên bậc m +n và là đa thức thuần nhất bậc n của các ui, bậc m của các vj.
Trong nghiên cứu về các hạng tử của Res(fu, gv), ta có hạng tử u^n v^m và u^n n v^0 với dấu + hoặc − Giả sử m > n và c thuộc K, ta có thể khẳng định rằng Res(fu+cgv, gv) = Res(fu, gv) Đối với đa thức ht, ta có công thức Res(fu, gvht) = Res(fu, gv)·Res(fu, ht) Theo Định lý 2.1.1, với hai đa thức fu và gv, luôn tồn tại hai đa thức h(u, v, x) và k(u, v, x) thuộc K[u, v][x] thỏa mãn hệ thức biểu diễn.
Res(fu, gv) =h(u, v, x)fu+k(u, v, x)gv.
Chứng minh: Sử dụng một hệ các đồng nhất thức như dưới đây:
x n − 1 fu = u0x m+n − 1 +u1x m+n − 2 +ã ã ã+umx n − 1 x n − 2 fu = u0x m+n − 2 +u1x m+n − 3 +ã ã ã+umx n − 2 fu = u0x m +u1x m − 1 +ã ã ã+um x m − 1 gv = v0x m+n − 1 +v1x m+n − 2 +ã ã ã+vnx m − 1 x m − 2 gv = v0x m+n − 2 +v1x m+n − 3 +ã ã ã+vnx m − 2 g v = v 0 x n +v 1 x n − 1 +ã ã ã+v n
Ta coi zi = x m+n − 1 − i , i = 0,1, , m+ n− 1, là các ẩn và định thức của hệ phương trình tuyến tính này là Res(fu, gv).
Ký hiệu ~ki, i = 0,1, , m+ n−1, là các véc tơ cột của ma trận ngay dưới đây
ã ã ã u0 u1 ã ã ã um − 1 um v0 v1 v2 ã ã ã vn v0 v1 ã ã ã vn − 1 vn
và~k = (x n − 1 fu, , fu, x m − 1 gv, , gv) T Khi đó ta có hệ phương trình z0~k 0 +z1~k 1 +ã ã ã+zm+n − 1~k m+n − 1 =~k.
Giải hệ qua định thức và khai triển định thức ta có hệ thức
Tiếp theo, thực hiện phép đặc biệt hóa K[u, v][x] thành K[x] bằng cách thay thế (u0, , um) bằng (a0, , am) và (v0, v1, , vn) bằng (b0, b1, , bn) Khi đó, ta có hai đa thức f a và g b, với f a = a0 x^m + a1 x^(m-1) + + am và g b = b0 x^n + b1 x^(n-1) + + bn, trong đó a0b0 khác 0 Kết thúc là Res(f a , g b ).
Res(fa, gb) a0 a1 a2 ã ã ã am a0 a1 ã ã ã am − 1 am
ã ã ã a0 a1 ã ã ã am − 1 am b0 b1 b2 ã ã ã bn b0 b1 ã ã ã bn − 1 bn
Bổ đề 2.1.2 nêu rõ rằng hai đa thức \( f_a \) và \( g_b \) có ước chung khác hằng số khi và chỉ khi tồn tại hai đa thức \( p(x) \) và \( q(x) \) thuộc \( K[x] \), với \( p(x) = c_0x^{m-1} + c_1x^{m-2} + \ldots + c_{m-1} \) và \( q(x) = d_0x^{n-1} + d_1x^{n-2} + \ldots + d_{n-1} \), không đồng thời bằng 0, sao cho \( q(x)f_a = p(x)g_b \).
Chứng minh: Giả sử ta có quan hệ q(x)fa = p(x)gb.
Trong trường hợp này, tất cả các nhân tử của đa thức fa không thể chỉ là các nhân tử của p(x) vì bậc của p(x) là 6 m−1, nhỏ hơn m Tương tự, mọi nhân tử của gb cũng không thể chỉ là các nhân tử của q(x) vì bậc của q(x) là 6 n−1, nhỏ hơn n Do đó, hai đa thức fa và gb phải có ít nhất một nhân tử chung bất khả quy.
Ngược lại, giả sử fa và gb có nhân tử chung là d(x) khác hằng số. Đặt fa = d(x)p(x) và gb = d(x)q(x).
Khi đó q(x)fa = q(x)d(x)p(x) = p(x)gb với m−1 > degp(x), n−1> degq(x).
Chú ý rằng, phương trình q(x)fa = p(x)gb tương đương với hệ phương trình tuyến tính m+n ẩn ci, dj như sau đây:
Hệ phương trình tuyến tính thuần nhất có dạng: d0a0 = c0b0, d0a1 + d1a0 = c0b1 + c1b0, và d0a2 + d1a1 + d2a0 = c0b2 + c1b1 + c2b0 Hệ này bao gồm m+n phương trình với các ẩn c0, c1, , cm-1, d0, d1, , dn-1 Nghiệm của hệ phương trình không tầm thường tồn tại khi và chỉ khi định thức cấp m+n bằng 0, được biểu diễn qua các hệ số a0, b0, a1, b1, a2, b2.
Res(fa, gb) a0 a1 a2 ã ã ã am a0 a1 ã ã ã am − 1 am
ã ã ã a0 a1 ã ã ã am − 1 am b0 b1 b2 ã ã ã bn b0 b1 ã ã ã bn − 1 bn
= 0 với những vị trí trắng đều bằng 0 Kết quả sau được suy ra từ Định lý 2.1.1:
Hệ quả 2.1.3 Cho đa thức fa và gb có hai đa thức α(x), β(x) ∈ K[x] để α(x)fa+ β(x)gb = Res(fa, gb).
Đa thức fa và gb được tạo ra từ việc đặc biệt hóa hai đa thức f u và g v Theo Định lý 2.1.1, tồn tại hai đa thức α(x) và β(x) trong K[x] sao cho α(x)fa + β(x)gb = Res(fa, gb) thông qua quá trình đặc biệt hóa.
Hệ quả 2.1.4 Cho đa thức fa và gb Hai đa thức fa và gb có nghiệm chung trong một mở rộng K ∗ của K khi và chỉ khi Res(fa, gb) = 0.
Giả sử hai đa thức fa và gb có nghiệm chung ξ ∈ K ∗, thì f a (ξ) = 0 và g b (ξ) = 0 Theo Hệ quả 2.1.3, ta có phương trình Res(fa, gb) = α(ξ)fa(ξ) + β(ξ)gb(ξ) = 0 Ngược lại, nếu Res(fa, gb) = 0, thì theo Định lý 2.1.2, fa và gb có nhân tử chung khác hằng số Do đó, fa và gb có nghiệm chung trong mở rộng K ∗ của K.
Mệnh đề 2.1.5 [Bezoút] Cho hai đa thức f(x), g(x) ∈ R[x] Điều kiện cần và đủ để ước chung lớn nhất (f(x), g(x)) = 1 là có hai đa thức p(x), q(x) ∈ R[x] để p(x)f(x) +q(x)g(x) = 1.
Chứng minh: Theo Hệ quả 2.1.3 tồn tại hai đa thức α(x), β(x) ∈ R[x] thỏa mãn α(x)f(x) +β(x)g(x) =Res(f, g) Chú ý rằng Res(f, g) ∈ R. Như vậy f và g không có nhân tử chung khác hằng số hay
(f(x), g(x)) = 1 khi và chỉ khi Res(f, g) 6= 0 Điều này tương đương với điều kiện 1
Ví dụ 2.1.6 Xác định điều kiện cần và đủ để f(x) = x 2 +ax + 1 và g(x) =px+ q có nghiệm chung.
Bài giải: Hai đa thức f(x) và g(x) có nghiệm chung khi và chỉ khi kết thức Res(f, g) = 0 Vậy f(x) và g(x) có nghiệm chung khi và chỉ khi
Ví dụ 2.1.7 Xác định điều kiện cần và đủ để f(x) = x 2 + ax+ b và g(x) =x 2 +px+q có nghiệm chung.
Bài giải: Hai đa thức f(x) và g(x) có nghiệm chung khi và chỉ khi kết thức Res(f, g) = 0 Vậy f(x) và g(x) có nghiệm chung khi và chỉ khi
Ví dụ 2.1.8 Xác định giá trị của a để hai phương trình x 3 −ax+2 = 0 và x 2 +ax+ 2 = 0 có nghiệm chung trong C.
Bài giải: Hai phương trình đã cho có nghiệm chung khi và chỉ khi kết thức tương ứng của chúng bằng 0 hay
Khi a = 3 hai phương trình x 3 −3x+ 2 = 0 và x 2 + 3x + 2 = 0 có nghiệm chung x = −2
Khi a = −1 hai phương trình x 3 + x + 2 = 0 và x 2 −x + 2 = 0 có nghiệm chung x = 1±i√
Xột đa thức f = a0x m + a1x m − 1 + ã ã ã + am − 1x+ am Biệt thức D(f) của f được định nghĩa bằng
Các mệnh đề sau được suy ra từ các kết quả trên.
Mệnh đề 2.1.9 Giả sử f = a0x m +a1x m − 1 +ã ã ã+am = a0 m
(x−αi). Khi đó ta có đồng nhất thức
Chứng minh: (i) Trong chứng minh của Định lý 2.1.14 ta đã chỉ ra đồng nhất thức Res(f, f ′ ) =a m 0 − 1 m
(αi − αj) Từ D(f) = (−1) m(m − 1)/2 a − 0 1 Res(f, f ′ ) ta suy ra hệ thức D(f) = (−1) m(m − 1)/2 a − 0 1 a m 0 − 1 Q m i=1 f ′ (αi) hay
Sau khi biến đổi tích ta có D(f) = a 2m 0 − 2 Q
Mệnh đề 2.1.10 Với đa thứcf vàg cóD(f g) = D(f)D(g)[Res(f, g)] 2
Ví dụ 2.1.11 Với đa thức f = ax 2 +bx+c = a(x−x 1 )(x−x 2 ) có
Ví dụ 2.1.12 Với đa thức f = x 3 +ax+b = (x−x1)(x−x2)(x−x3) có D(f) = (x1−x2) 2 (x2−x3) 2 (x1−x3) 2 = −f ′ (x1)f ′ (x2)f ′ (x3) Dễ dàng có được 3x 2 1 +a = (x1 −x2)(x1 −x3), 3x 2 2 +a = (x2 −x3)(x2 −x1) và 3x 2 3 +a = (x3−x1)(x3−x2) Vậy D(f) =−(a+ 3x 2 1 )(a+ 3x 2 2 )(a+ 3x 2 3 )
Biểu diễn kết thức qua nghiệm
Giả sử u0, z1, , zm và v0, t1, , tn là những biến độc lập đại số trên
K Xét hai đa thức fu = u0(x−z1) .(x−zm) =u0x m +u1x m − 1 +ã ã ã+um g v = v 0 (x−t 1 ) .(x−t n ) = v 0 x n +v 1 x n − 1 +ã ã ã+v n thuộc vành đa thức K[u, v][x].
Vấn đề đặt ra:Biểu diễn kết thức Res(fu, gv) qua cáczi, tj.Trước tiên ta cần bổ đề sau:
Bổ đề 2.1.13 Cho đa thức p(y1, , ys) ∈ K[y] Khi đó ta có đồng nhất thức p(y1, y2, , ys) −p(z1, z2, , zs) = P s i=1 γi(yi − zi), trong đó γi ∈ K[y1, , ys, z1, , zs].
Chứng minh: Coi p(y1, y2, , ys) như là một đa thức thuộc vành đa thúc K[y2, , ys][y1].
Khi đó ta có thể biểu diễn p(y 1 , y 2 , , y s ) = q(y 1 ) =X i c(y)y 1 i với c(y) ∈ K[y2, , ys] và ta có ngay q(y1)−q(z1) =X i c(y)(y 1 i −z 1 i ) =d(y, y1, z1)(y1 −z1).
Vận dụng kết quả này được p(y)−p(z) = p(y1, y2, , ys − 1, ys)−p(z1, z2, , zs − 1, zs)
= p(y1, y2, , ys − 1, ys)−p(z1, y2, , ys − 1, ys) + p(z1, y2, , ys − 1, ys)−p(z1, z2, , ys − 1, ys) + ã ã ã
Từ kết quả vừa chỉ ra ở trên suy ra p(y1, y2, , ys)−p(z1, z2, , zs) s
X i=1 γi(yi −zi) trong đó γi ∈ K[y1, , ys, z1, , zs].
Vận dụng bổ đề này ta chỉ ra công thức biểu diễn kết thức qua zi và tj. Định lý 2.1.14 Giả sử fu = u0
(x −tj) = v0x n + v1x n − 1 + ã ã ã+ vn Khi đú ta cú đồng nhất thức Res(fu, gv) = u n 0 v m 0 Q m i=1
Theo tính chất của kết thức, Res(fu, gv) là đa thức thuần nhất bậc n của các ui và bậc m của các vj Các ur là đa thức đối xứng cơ bản của các zi nhân với u0, trong khi các v là đa thức đối xứng cơ bản của các tj nhân với v0.
Res(fu, gv) = u n 0 v 0 m h(z, t), với h(z, t) ∈ Z[z1, , zm, t1, , tn] Khi z i = t j, hai đa thức f u và g v có nghiệm chung, dẫn đến Res(fu, gv) = 0 hay h(z, t) = 0 theo Hệ quả 2.1.4 Do đó, h(z, t) chia hết cho zi−tj theo Bổ đề 2.1.13 Mỗi cặp (i, j) tạo ra zi −tj là bất khả quy và các cặp (i, j) khác nhau cho ra zi −tj khác nhau Vì vậy, Res(fu, gv) chia hết cho u n 0 v 0 m Q m i=1.
(zi − tj) = u n 0 Q m i=1 gv(zi) = (−1) mn v 0 m Q n j=1 fu(tj).
S là một đa thức thuần nhất bậc m của các vj và bậc n của các ui Do đó, S và Res(fu, gv) chỉ khác nhau bởi một hằng số thuộc Z Hệ tử của u n 0 v 0 m trong S và Res(fu, gv) đều bằng 1.
Hệ quả 2.1.15 Giả sử hai đa thức fa = a0x m + a1x m − 1 + ã ã ã + am và gb = b0x n + b1x n − 1 + ã ã ã + bn thuộc K[x] với a0b0 6= 0 và cú cỏc nghiệm α1, , αm và β1, , βn trong K Khi đó ta có đồng nhất thức
Chứng minh: Thực hiện phép đặc biệt hóa Z[u 0 , v 0 , z, t] → K sau đây: u0 7→ a0, v0 7→b0 và (zi) 7→ (αi),(tj) 7→ (βj).
Từ Định lý 2.1.14 suy ra đồng nhất thức
Hệ quả 2.1.16 Với ba đa thức f1, f2 và g thuộc K[x] có đồng nhất thứcRes(f1f2, g) = Res(f1, g) Res(f2, g).
Chứng minh: Giả sử các αi và βj là nghiệm của f1f2 và g, tương ứng, trong một mở rộng của K.
Theo Hệ quả 2.1.15 ta có
Phép khử ẩn
Giả sử các đa thức f1, , fs thuộc K[x] với bậc không nhỏ hơn 1, chúng ta cần xác định điều kiện để các đa thức này có nghiệm chung Để giải quyết vấn đề này, ta lấy 2s biến u1, , us, v1, , vs độc lập đại số trên K và xét vành K* = K[u1, , us, v1, , vs] Trong K*[x], ta xem xét hai đa thức f(x) = u1f1(x) + u2f2(x) + + usfs(x) và g(x) = v1f1(x) + v2f2(x) + + vsfs(x).
Nếu các đa thức f1, , fs có nghiệm chung x = α thuộc trường K hoặc trường mở rộng của K, thì x = α cũng là nghiệm chung của các đa thức f và g Ngược lại, do các đa thức u1, , us và v1, , vs độc lập đại số trên K, nghiệm chung của f và g cũng sẽ là nghiệm chung của các đa thức fi Kết quả này cho thấy mối liên hệ giữa nghiệm chung của các đa thức và tính độc lập đại số.
Mệnh đề 2.1.17 Các đa thức f1, , fs ∈ K[x] với bậc đều không nhỏ hơn 1 có nghiệm chung khi và chỉ khi Res(f, g) = 0.
Ví dụ 2.1.18 Xác định điều kiện cần và đủ để f1(x) =x 2 +ax+ 1 và f2(x) = x 2 +bx+ 1 có nghiệm chung.
Bài giải: Hai đa thức f = u1f1(x) +u2f2(x) và g = v1f1(x) +v2f2(x) có nghiệm chung khi và chỉ khi Res(f, g) = 0 Vậy f1(x) và f2(x) có nghiệm chung khi và chỉ khi u1 +u2 u1a+u2b u1 +u2 0
Ví dụ 2.1.19 Cho đa thức p(x, z) của biến x, z và đa thức q(y, z) của biến y, z Khi đó hệ phương trình p(x, z) = 0 q(y, z) = 0 được đưa về giải phương trình đa thức r(x, y) = 0.
Bài giải cho thấy hai đa thức P(z) = p(x, z) và Q(z) = q(y, z) có thể được coi là đa thức của biến z, trong đó x và y là hằng số Hệ (x, y, z) sẽ thỏa mãn khi và chỉ khi P(z) và Q(z) có nghiệm chung, dẫn đến điều kiện r(x, y) = Res(P, Q) = 0.
Mệnh đề này cho thấy rằng hệ phương trình đa thức hai ẩn có thể được giải thông qua phương trình đa thức một ẩn, và được gọi là phép khử ẩn Định lý 2.1.20 trình bày hệ phương trình (A).
f(x, y) = 0 g(x, y) = 0 f, g ∈ R[x, y] được giải qua phương trình đa thức một ẩn.
Chúng ta coi F(x) = f(x, y) và G(x) = g(x, y) là đa thức theo biến x, với y là hằng số Giả sử (x0, y0) là nghiệm của hệ, thì F(x) và G(x) có nghiệm chung x0 tương ứng với y0, tương đương với H(y) = Res(F, G) = 0 Điều này cho thấy x0 là nghiệm chung của hai đa thức f(x, y0) và g(x, y0) Từ đó, phương trình kết thức Res(F, G) = 0 khi y = y0, dẫn đến việc giải hệ (A) được chuyển thành giải phương trình đa thức Res(F, G) = 0 theo biến y Với mỗi nghiệm y0, ta sẽ giải hệ f(x, y0) = 0 và g(x, y0) = 0, hoàn tất việc giải hệ (A).
Ví dụ 2.1.21 Giải hệ phương trình xy −1 = 0 x 2 + y 2 −4 = 0 trong R. Bài giải: Giải phương trình kết thức của hệ phương trình đã cho y −1 0
Ví dụ 2.1.22 Giải hệ phương trình x 2 −xy +y 2 −3 = 0 x 2 y +xy 2 −6 = 0 trong R. Bài giải: Giải phương trình kết thức của hệ phương trình đã cho
= 3y 6 −12y 4 + 9y 2 −36y + 36 = 0 hay y 6 − 4y 4 + 3y 2 − 12y + 12 = 0 Khi đó y = 1 hoặc y = 2 hoặc y 4 + 3y 3 + 3y 2 + 3y + 6 = 0 hay y 2 + 3
Ví dụ 2.1.23 Giải hệ phương trình x 3 −xy−y 3 +y = 0 x 2 +x−y 2 −1 = 0 trong R. Bài giải: Giải phương trình kết thức của hệ phương trình đã cho
5y 4 −2y 3 + 4y 2 + 2y + 1 = 0 hay y 2 −y 2 + y + 1 2 + 4y 4 + 2y 2 = 0 không có nghiệm thực.
Phép biến đổi Tschirnhaus
Vào năm 1683, E V von Tschirnhaus đã công bố một phương pháp biến đổi phương trình đại số trong Tạp chí "Acta eruditorum" tại Leipzig, với niềm tin rằng có thể giải một phương trình đa thức bậc tùy ý bằng căn thức Phương pháp này đánh dấu một bước tiến quan trọng trong lĩnh vực toán học.
Giả sử phương trình đa thức f(x) = 0 có n nghiệm x1, x2, , xn và phân thức hữu tỷ y = g(x) = p(x) q(x), trong đó q(xk) 6= 0 với mọi k = 1,2, , n, và (p(x), q(x)) = 1 Xác định phương trình đa thức
F(y) nhận y1, y2, , yn làm nghiệm, trong đó yk = p(xk) q(xk) với k = 1,2, , n.
Mệnh đề 2.1.24 Tồn tại đa thức h(x) bậc không lớn hơn n−1 thỏa mãn g(xk) =h(xk) với mọi k = 1,2, , n.
Chứng minh: Do bởi hai đa thức f(x) và q(x) không có nghiệm chung nên (f(x), q(x)) = 1.
Có hai đa thức u(x) và v(x) sao cho u(x)f(x) + v(x)q(x) = 1, theo Mệnh đề 2.1.5 Điều này dẫn đến v(xk)q(xk) = 1, hay 1/q(xk) = v(xk) với mọi k = 1, 2, , n Từ đó, ta có yk = g(xk) = p(xk)v(xk) với mọi k = 1, 2, , n.
Biểu diễn p(x)v(x) =t(x)f(x) + h(x) với degh(x) < degf(x) Khi đó yk = g(xk) = h(xk) với mọi k = 1,2, , n.
Mệnh đề 2.1.25 Đa thức h(y) có được qua khử x từ hệ phương trình f(x) = 0 p(x)−yq(x) = 0.
Qua các kết quả trên, phép biến đổi Tschrnhaus thường có dạng y = g(x) =p0 +p1x+ p2x 2 + ã ã ã+ pn − 1x n − 1 và ta có thể tính các hệ số của R(y) qua những phép thế.
Chú ý 2.1.26 (1) Phép biến đổi thường được sử dụng là y = ax+b cx+d. Khử x qua việc thay x = dy −b a−cy vào f(x) và ta nhận được h(y) = (a−cy) n f dy −b a−cy
(2) Biến đổi phương trình để từ phương trình đã cho ta xây dựng phương trình mới và các hệ thức mới.
Giả sử f(x) có n nghiệm x 1 , x 2 , , x n và phân thức hữu tỷ y = g(x) = p(x) q(x), trong đó q(xk) 6= 0 với mọi k = 1,2, , n, và
(p(x), q(x)) = 1 Khi có đa thức mới F(y) nhận yk = p(xk) q(x k ) làm nghiệm với k = 1, , n và tính được ngay hai biểu thức
Y k=1 p(x k ) q(xk). Mệnh đề 2.1.27 Giả sử x1 là nghiệm của phương trình x 3 + ax 2 +bx+ c = 0 Khi đó mỗi hàm hữu tỷ củax1 đều biểu diễn được thành dạng Ax1 +B
Chứng minh: Vì x 3 1 = −ax 2 1 −bx1 −c nên mọi phân thức hữu tỷ của x1 đều đưa được về dạng a1x 2 1 +b1x1 +c1 a2x 2 1 +b2x1 +c2
Từ đồng nhất thức dưới đây mx 2 1 +nx1 + p= (pm−bm 2 +amn−n 2 )x1 + (amp−np−cm 2 ) mx1 +ma−n ta có thể đưa hàm hữu tỷ của x1 về dạng Ax1 +B
Ví dụ 2.1.28 Giả sử x 3 + ax 2 +bx + c = 0 có ba nghiệm x1, x2, x3. Xác định phương trình đa thức bậc ba nhận y1 = x 2 1 −x2x3, y2 = x 2 2 −x3x1, y3 = x 2 3 −x1x2 làm nghiệm.
, y 3 = x 2 3 + c x3 ta sẽ khử x từ hệ x 3 +ax 2 +bx+c = 0 x 3 −yx+c = 0 hay
Từ hệ này suy ra phương trình đa thức
Ví dụ 2.1.29 Giả sử x 3 + ax 2 +bx + c = 0 có ba nghiệm x1, x2, x3. Xác định phương trình đa thức bậc ba nhận y 1 = −x 1 +x 2 + x 3 , y2 = −x2 +x3 +x1, y3 = −x3 +x1 +x2 làm nghiệm.
Bài giải: Thay y1 = −2x1 − a, y2 = −2x2 − a, y3 = −2x3 −a ta sẽ khử x từ hệ x 3 +ax 2 + bx+c = 0 2x+y +a = 0 hay
2 Từ hệ này có phương trình đa thức y 3 +ay 2 + (4b−a 2 )y −a 3 + 4ab−8c = 0 nhận y1 = −x1 +x2 + x3, y2 = −x2 +x3 +x1, y3 = −x3 +x1 +x2 làm nghiệm.
Với n = 3, xét phương trình f(x) = x 3 + a1x 2 + a2x + a3 = 0. Khi đó, nếu xi là nghiệm của f(x) = 0 thì x 3 i = −a1x 2 i −a2xi −a3 và yi = p0 +p1xi+p2x 2 i Biến đổi xy = x(p 0 +p 1 x+p 2 x 2 ) = p 0 x+p 1 x 2 −p 2 (a 1 x 2 +a 2 x+ a 3 )
Nếu xi là nghiệm của f(x) và yi = g(xi) thì hệ phương trình
(p0 −y)t0 +p1t1 + p2t2 = 0 p ′ 0 t0 + (p ′ 1 −y)t1 + p ′ 2 t2 = 0 p 0 ”t 0 +p 1 ”t 1 + (p 2 ”−y)t 2 = 0 có nghiệm không tầm thường (t0, t1, t2) = (1, xi, x 2 i ) khi y = yi Do vậy, ta nhận được phương trình của y : p0 −y p1 p2 p ′ 0 p ′ 1 −y p ′ 2 p0” p1” p2”−y
= y 3 + b1y 2 +b2y +b3 Đặc biệt, nếu chọn p0, p1, p2 để b1 = 0 và b2 = 0 thì F(y) =y 3 +b3.
Ví dụ 2.1.30 Giải phương trình x 3 +ax 2 +bx+c = 0.
3 qua x ta nhận được phương trìnhx 3 +px+q = 0. Xét y = g(x) = x 2 +ux+v.
Biến đổi y = v +ux+x 2 xy = x(x 2 +ux+v) = −px−q +ux 2 + vx = −q + (v −p)x+ux 2 x 2 y = x 2 (v +ux+x 2 ) = vx 2 +u(−px−q) +x(−px−q)
Nếu xi là nghiệm của f(x) và yi = g(xi) thì hệ phương trình
−qut1 + (−q −pu)t2 + (v −p−y)t3 = 0 có nghiệm không tầm thường (t 1 , t 2 , t 3 ) = (1, x i , x 2 i ) khi y = y i Do vậy, ta nhận được phương trình của y : v −y u 1
= y 3 +b 1 y 2 +b 2 y +b 3 Đặc biệt, nếu chọn u, v để b1 = 0 và b2 = 0 thì F(y) =y 3 +b3 Phương trình đa thức x 3 + ax 2 +bx+ c = 0 bậc ba được giải qua một hệ bậc hai b 1 = b 2 = 0 và y 3 +b 3 = 0.
Xác định nghiệm gần đúng
Phương pháp truy hồi
Để giải phương trình x = f(x) trong đoạn [a, b], ta cần xác định gần đúng nghiệm với điều kiện T Chúng ta xây dựng dãy số (an) với công thức an+1 = f(an) Nếu dãy số (an) hội tụ tới giá trị α nằm trong khoảng (a, b), thì với n đủ lớn, ta sẽ có giá trị gần đúng của nghiệm.
Ví dụ 2.2.1 Xác định gần đúng nghiệm dương của phương trình x 2 + x−1 = 0.
Bài giải: Vì x = 1 x+ 1 nên ta xét dãy (an) với a0 = 1 và an+1 = 1 an+ 1, n > 0 Giả sử nghiệm dương của phương trình đã cho là a Khi đó a = 1 a+ 1 Xét các hiệu dưới đây: a−a1 = 1 a+ 1 − 1 a0 + 1 = a0 −a
Vì các an > 0 và an < 1 nên |a − an| < |1−a|
(a+ 1) n Từ đây suy ra n →lim+ ∞ an = a √5−1
2 Như vậy, với n đủ lớn, ta có giá trị gần đúng an của nghiệm dương của phương trình x 2 + x−1 = 0.
Ví dụ 2.2.2 Xác định gần đúng nghiệm dương của phương trình x 2 − 2x+a = 0 với a ∈ [0,1].
2 nên ta xét dãy (an) với a1 = a
2 , n > 1 Ta thấy ngay các an > 0 và a2 > a1, an+1−an = a 2 n −a 2 n − 1
Bằng phương pháp quy nạp theo n, ta có thể chứng minh rằng dãy (an) là một dãy đơn điệu tăng Đối với a ∈ [0,1], ta dễ dàng thấy an ≤ 1 Do đó, giới hạn của dãy khi n tiến đến vô cực là lim n → + ∞ an = ℓ = 1 - √.
1−a Như vậy, với n đủ lớn, ta có giá trị gần đúng an của nghiệm dương của phương trình x 2 −2x+a = 0.
Ví dụ 2.2.3 Xác định gần đúng nghiệm âm của phương trình
Bài giải: Xét dãy (an)với a1 = 1và an+1 = 1
Hàm số 2ln(x² + 1) có đạo hàm f ′ (x) = x/(x² + 1) thỏa mãn điều kiện |f ′ (x)| ≤ 1, do đó, dãy (an) hội tụ theo Định lý Lagrange về giá trị trung bình Điều này dẫn đến giới hạn lim n → +∞ an = ℓ, mà ℓ chính là nghiệm của phương trình 2x + 2016 = ln(x² + 1) Vì vậy, với n đủ lớn, giá trị an sẽ gần đúng với nghiệm của phương trình 2x + 2016 = ln(x² + 1).
Ví dụ 2.2.4 Xác định gần đúng nghiệm dương của phương trình x = 3− x+ 2
Bài giải: Xét dãy (a n ) với a 1 = 1 và a n+1 = 3− an+ 2
2 a n , n > 1 Ta chỉ ra sự tồn tại giới hạn lim n → + ∞ an = ℓ Giới hạn bằng 2 chính là nghiệm duwng của phương trình x = 3− x+ 2
2 x Như vậy, với n đủ lớn, ta có giá trị gần đúng an của nghiệm của phương trình x = 3− x+ 2
Phương pháp dây cung
Giả sử hàm số y = f(x) liên tục trên đoạn [a, b] thỏa mãn điều kiện f(a)f(b) < 0 vàf ′ (x) 6= 0 với x ∈ (a, b).
Khi đó phương trìnhf(x) = 0có đúng một nghiệm thực ξ trong khoảng
Để tìm giá trị gần đúng thứ nhất của nghiệm ξ, ta có thể sử dụng công thức f(ξ)−f(a) f(b)−f(a) = ξ −a b−a Vì f(ξ) = 0, ta suy ra ξ ≈ a− (b−a).f(a) f(b)−f(a) Từ đó, x1 có thể được chọn theo một trong hai công thức: x1 = a− (b−a).f(a) f(b)−f(a) hoặc x1 = b− (b−a).f(b) f(b)−f(a).
Tiếp theo áp dụng phương pháp này cho: khoảng (a, x1) khi f(a)f(x1) < 0 hoặc khoảng (x1, b) khi f(x1)f(b) < 0.
Ta lại nhận được giá trị gần đúng thứ hai x2 = x1− (b−x1).f(x1) f(b)−f(x 1 ) của nghiệm đúng ξ, v.v Để ước lượng giá trị gần đúng thứ n là xn ta có công thức đánh giá
|x n −ξ| 6 |f(xn)| m với m = inf|f ′ (x)| a 0 trên khoảng (3,4) nên f ′ (x) đạt giá trị nhỏ nhất trên đoạn [3,4] bằng m = f ′ (3) = 27−3.4−4 = 11 Ta cũng có thể chọn x1 = 3− f(3) f(4)−f(3) = 3 + 10
Vì f(3,52) = −2,246592 nên bất đẳng thức |xn −ξ| 6 |f(xn)| m chưa thỏa mãn Tiếp tục xác định x2 = 3,52− 0,48.f(3,52) f(4)−f(3,52) Do vậy x2 = 3,52 + 1,078364160
Tiếp tục xác định được, x3 = 3,61− 0,39.f(3,61) f(4)−f(3,61) Do vậy x3 = 3,61 + 0,17874441
Phương pháp tiếp tuyến của Newton
Giả sử hàm số y = f(x) liên tục trên đoạn [a, b] thỏa mãn điều kiện f(a)f(b) < 0, f(a)f”(a) > 0 và f”(x) khác 0 với x thuộc (a, b) Để tìm giá trị gần đúng đầu tiên của nghiệm ξ của phương trình f(x) = 0, ta sử dụng công thức khai triển Taylor của f(ξ).
Khi f(b) +f ′ (b)(ξ−b) ≈ 0 ta có ngay ξ ≈ b− f(b) f ′ (b) và ta có thể lấy x1 = b− f(b) f ′ (b). Phương trình tiếp tuyến của đồ thị hàm y = f(x) tại điểm (b, f(b)) là y = f(b) +f ′ (b)(x−b).
Phương pháp tiếp tuyến được áp dụng khi tiếp tuyến ắt trục hoành, với y = 0 và hoành độ điểm cắt là nghiệm của phương trình f(b) + f ′ (b)(x−b) = 0, từ đó cho phép xác định x = x1 Tiếp theo, ta xét f(x) = 0 trên khoảng (a, x1) nếu f(a)f(x1) < 0, hoặc trên khoảng (x1, b) khi f(x1)f(b) < 0, giúp tìm giá trị gần đúng thứ hai x2 của nghiệm ξ Để ước lượng giá trị gần đúng thứ n là xn, ta vẫn có thể sử dụng công thức đánh giá.
|xn −ξ| 6 |f(xn)| m với m = inf|f ′ (x)| a 0, f”(x) = loge x > 0 trên khoảng (2,3) nên m = 0,7 Ta cũng có thể chọn x1 = 3− f(3) f ′ (3) = 3−0,473 ≈ 2,53.
Tiếp theo ta có thể xác định x2 = 2,53− f(2,53) f ′ (2,53) Do vậy x2 = 2,53−0,0237 = 2,5063.
Phương trình hàm ẩn
Giả sử ta muốn xác định hàm y = y(x) cho bởi phương trình
F(x, y(x)) = 0 và muốn xác định đạo hàm y ′ = y ′ (x).
Ví dụ 2.2.7 Chứng minh rằng, tồn tại hàm đơn trị y = y(x) duy nhất được xác định bởi phương trình y 3 + 3y = x và tính đạo hàm y ′ (x) theo biến x của nó.
Bài giải: Giả sử tồn tại hai hàm thực y 1 , y 2 thỏa mãn phương trình đã cho Khi đóy 1 3 + 3y1 = x, y 2 3 + 3y2 = x Vậy y 2 3 + 3y2−y 1 3 −3y1 = 0 hay
Vìy 2 2 +y1y2+y 1 2 + 3 > 0 nêny2 = y1.Như vậy, nếu phương trình đã cho có nghiệm thì nghiệm đó là duy nhất Vì phương trình bậc ba với hệ số thực luôn có ít nhất một nghiệm thực nên phương trình y 3 + 3y = x có đúng một nghiệm thực Chú ý rằng, đạo hàm x ′ (y) = 3y 2 + 3 > 0 nên hàm x(y) là đơn điệu Bởi vậy, tồn tại hàm ngược đơn điệu khả vi duy nhất y(x) với đạo hàm y ′ (x) = 1 x ′ (y) = 1
Ví dụ 2.2.8 Chứng minh rằng, với a ∈ [0,1) tồn tại hàm đơn trị y = y(x) duy nhất được xác định bởi phương trình y −asiny = x và tính đạo hàm y ′ (x) theo biến x của nó.
Bài giải: Giả sử tồn tại hai hàm thực y1, y2 thỏa mãn phương trình đã cho Khi đó y1 −asiny1 = x, y2 −asiny2 = x.
Phương trình 2 |y2 − y1| cho thấy nếu có nghiệm thì nghiệm đó là duy nhất, tức y2 = y1 Ta có thể dễ dàng chỉ ra rằng phương trình có nghiệm y = y(x) Đặc biệt, đạo hàm y' được xác định qua công thức y' − acos(y)·y' = 1, dẫn đến y' (x) = 1.
Phương pháp lặp và sự hội tụ của chúng
Xét biểu diễn của hàm f(x) dưới dạng f(x) = f(xn) +
Nhiều nhà toán học đã cải tiến phương pháp Newton bằng cách sử dụng các quy tắc xấp xỉ tích phân trong công thức, dẫn đến các phương pháp lặp tìm nghiệm đơn cho phương trình phi tuyến với tốc độ hội tụ cao hơn Bài viết này trình bày một số thuật toán từ các tài liệu trích dẫn, giải phương trình f(x ∗ ) = 0 với tốc độ hội tụ từ bậc ba đến bậc tám, kèm theo các ví dụ tính toán cụ thể.
Weerakoon và Fernando đã phát triển phương pháp tính xấp xỉ tích phân trong (1) bằng cách sử dụng quy tắc hình chữ nhật và hình thang, đạt được tốc độ hội tụ bậc ba.
Từ đó ta suy ra f(x) ≈ f(xn) + (x−xn)f ′ (xn) Vậy x ≈ xn+ f(x)−f(xn) f ′ (xn)
Kết hợp với f(x) = 0 ta được x ≈ xn− f(xn) f ′ (xn). Hơn nữa, từ f(x) ≈ f(x n ) + (x−x n )f ′ (xn) +f ′ (x)
2 ta nhận được x−xn ≈ 2 f(x)−f(xn) f ′ (x n ) +f ′ (x)
Với x = xn+1 ta nhận được xn+1 ≈ xn+ 2 f(x n+1 )−f(x n ) f ′ (xn+1) +f ′ (xn) Suy ra x n+1 ≈ x n − 2f(xn) f ′ (xn) +f ′ (xn+1)
Từ đây suy ra công thức lặp x n+1 ≈ x n − 2f(xn) f ′ (xn) +f ′ xn− f(xn) f ′ (x n )
Frontini và Sormani sử dụng công thức điểm giữa cũng thu được phương pháp có tốc độ hội tụ nhanh hơn: x
Sơ đồ lặp: xn+1 = xn − f(xn) f ′ xn− f(xn)
Vào năm 2005, Homeier đã sử dụng hàm ngược x(y) thay vì y = f(x) và đã đưa ra sơ đồ lặp có tốc độ hội tụ cao hơn: x(y) = x(yn) + y
X j=1 ωjf(ξj) với ξj = yn+ τj(y−yn), τj ∈ [0,1],P m j=1 ωjτj = 1 2 sao cho Rm có bậc nhỏ nhất là 1.
Ta có x(y) = x(yn) + (y −yn) P m j=1 ωjf(ξj).
Kết hợp với y = y ∗ = y(x ∗ ) = 0, x(y) = x(y ∗ ) = x ∗ và x(yn) = xn ⇔ yn = f(xn) ta được x ∗ = xn+ (y −yn) m
Mặt khác, y = f(x) ⇒x = g(y) Lấy đạo hàm hai vế theo x ta được:
Ta có đánh giá xn,j = x((1−τj)yn) Khai triển Taylor hàm y = f(x) tại x n : y = f(x) = f(xn) +f ′ (xn)(x−xn)
0 = f(x n ) +f ′ (x n )(x−x n ) x−xn = −f(xn) f ′ (xn) ⇒ x = xn− f(xn) f ′ (xn) Khi đó xn,j = xn−τj f(xn) f ′ (xn) Vậy ta lại có sơ đồ lặp có tốc độ hội tụ bậc ba: xn+1 = xn −f(xn) m
Khi m = 2, ω1 = ω2 = 1 2 , τ1 = 1 −τ2 = 0 ta có sơ đồ lặp có tốc độ hội tụ bậc ba sau: xn+1 = xn− f(xn)
Năm 2006, Jisheng Kou, Yitian Li và Xiuhua Wang cũng sử dụng công thức điểm giữa để xấp xỉ tích phân f(x) =f(yn) +
Zx x n f ′ (t)dt, yn = xn + f(xn) f ′ (xn) x
Kết hợp với f(x) = 0 ta được xn+1 = yn− f(yn) f ′ x n+1 2 +y n
Thay f ′ x n+1 2 +y n = f ′ x ∗ n+1 2 +y n , với x ∗ n+1 là phương pháp lặp Newton ta được xn+1 = xn− f x n + f f ′ (x (x n ) n ) −f(x n ) f ′ (xn) (2.4)
Phương pháp lặp này có tốc độ hội tụ bậc ba.
Năm 2011, P.Wang xấp xỉ tích phân trong công thức (3) theo quy tắc dưới đây: x
Kết hợp với f(x) = 0 sẽ cho chúng ta phương pháp lặp hội tụ bậc ba. xn+1 = xn − f(xn)
Năm 2010, Nazir Ahmad Mir, Naila Rafiq và Nursat Yasmin xấp xỉ tích phân bởi quy tắc hình chữ nhật thu được công thức bậc tám. x
2 ) ⇔x−zn = − f(zn) f ′ x+z 2 n ⇒ xn+1 = zn− f(zn) f ′ x ∗ +z 2 n Đặt ω = x ∗ +z 2 n Xét phương pháp Ostrowski và phương pháp Newton
Chúng ta có sơ đồ lặp sau:
yn = xn − f f ′ (x (x n n ) ) ωn = yn− 1 2 h (x f (x n − n ) y − n 2f )f (y (y n n ) ) + f f ′ (y (y n n ) ) i xn+1 = zn − f f ′ (z (ω n n ) )
Sử dụng khai triển Taylor mở rộng cho hàm f ′ (yn) tại điểm xn, ta có công thức f ′ (yn) ≈ f ′ (xn) + f ′′ (xn)(yn − xn) Kết hợp với xấp xỉ Taylor của f(yn), ta nhận được f(yn) ≈ f(xn) + f ′ (xn)(yn − xn) + 1.
Chúng ta có thể loại bỏ đạo hàm bậc hai và xấp xỉ f ′ (yn) bằng công thức: f ′ (yn) ≈ 2f(yn) − f(xn) / (yn − xn) − f ′ (xn) Như vậy, sơ đồ lặp sẽ được điều chỉnh theo công thức này.
2 f( yn yn−xn ) − f( xn ) − f ′ (x n ) xn+1 = zn − f f ′ (z (ω n n ) )
Năm 2010, Rostam K Saeed và W Khthr Fuad xấp xỉ tích phân theo phương pháp hình thang cải tiến đã thu được sơ đồ lặp bậc sáu.
2 [f ′′ (xn)−f ′ (x)] ta được phương trình
Ta tìm nghiệm xn+1 của phương trình Mn(xn+1) = 0 f(xn)+xn+1 −xn
Suy ra xn+1 = xn− 12f(xn) + (xn+1−xn) 2 [f ′′ (xn)−f ′′ (xn+1)]
Nếu xấp xỉ (xn+1−xn) trong vế phải của phương trình 2.7 bởi phương pháp Newton thì ta thu được xn+1 = xn− 12f(xn)f ′ 2 (xn) +f 2 (xn) [f ′′ (xn)−f ′′ (xn+1)]
Thayxn+1trong vế phải 2.8 bởi phương pháp lặp Newton ta có phương pháp mới hội tụ bậc ba: x n+1 = x n − 12f(xn)f ′ 2 (xn) +f 2 (xn)h f ′′ (xn)−f ′′ xn − f f ′ (x (x n n ) ) i 6f ′ 2 (xn)h f ′ (xn) +f ′ xn− f f ′ (x (x n n ) ) i ,n = 0,1,2,
Nếu xấp xỉ (x n+1 − x n ) trong vế phải của phương trình 2.7 bởi phương pháp Halley x n+1 −x n = − 2f(xn)f ′ (xn)
2f ′ 2 (xn)−f(xn)f ′′ (xn) thì ta thu được phương pháp với tốc độ hội tụ bậc bốn: xn+1 = xn− 12f(xn)f ′ 2 (xn) + f 2 (xn) [f ′′ (xn)−f ′′ (yn)]
(2.10) Trong đó yn = xn− 2f(xn)f ′ (xn)
2f ′ 2 (xn)−f(xn)f ′′ (xn) Kết hợp công thức 2.9 và phương pháp Newton, ta lại thu được phương pháp hội tụ bậc sáu: zn = xn − 12f ′ 2 (xn) +f 2 (xn)h f ′′ (xn)−f ′′ xn− f f ′ (x (x n n ) ) i
Định lý 2.3.1 khẳng định rằng nếu hàm f : I ⊂ R → R có một nghiệm đơn x ∗ trong khoảng mở I và là một hàm đủ trơn trong lân cận của nghiệm x ∗, thì phương pháp lặp được xác định bởi công thức 2.9 sẽ hội tụ với bậc ba Cụ thể, công thức lặp này là xn+1 = zn − f(zn) / f ′ (zn), với các điều kiện cần thiết về hàm f và đạo hàm f ′.
Chứng minh Đặt en = xn−x ∗ , sử dụng khai triển Taylor tại x ∗ f(xn) =f ′ (x ∗ )(en+c2e 2 n +c3e 3 n + ), cj = f (j) (x ∗ ) j!f ′ (x ∗ ), j = 2,3, f ′ (xn) =f ′ (x ∗ )(1 + 2c2en + 3c3e 2 n + ), f ′′ (xn) = f ′ (x ∗ )(2c2en+ 6c3en + 12c4e 2 n ), f(xn) f ′ (xn) = en −c2e 2 n + 2(c 2 2 −c3)e 3 n + (−3c4 + 7c2c3 −4c 3 2 )e 4 n +O(e 5 n ).
Kết hợp phương pháp Newton với công thức yn = xn − f/f′(xn) cho ra kết quả yn = c2e²n + 2(c²² − c3)e³n + O(e⁴n) Sử dụng chuỗi Taylor tại x* cho ta: f(yn) = c2e²n + 2(c²² − c3)e³n + O(e⁴n), f′(yn) = 1 + 2c²²e²n − 4(−c3 + c²²)c2e³n + O(e⁴n), và f′′(yn) = 2c2 + 6c2c3e²n − 12(−c3 + c²²)c3e³n + O(e⁴n) Đặt k1 = 12f(xn)f′²(xn) + f²(xn)[f′′(xn) − f′′(yn)] và k2 = 6f′²(xn)[f′(xn) + f′(yn)].
Từ 2.9 và 2.12 ta có en+1 +x ∗ = en +x ∗ − en −c 2 2 e 3 n + (−7
Công thức lặp 2.9 hội tụ bậc ba, được chứng minh qua biểu thức 2c 2 c 3 −3c 3 2 )e 4 n +O(e 5 n ) Định lý 2.3.2 chỉ ra rằng, nếu hàm f : I ⊂ R → R có một nghiệm đơn x ∗ trong khoảng mở I và f(x) là hàm đủ trơn gần nghiệm x ∗, thì phương pháp lặp theo công thức 2.10 sẽ hội tụ bậc bốn.
Chứng minh Từ phương pháp Halley ta có yn = (−c3 +c 2 2 )e 3 n + (−3c4 + 6c2c3 −3c 3 2 )e 4 n +O(e 5 n )
Sử dụng chuỗi Taylor tại điểm x ∗ , ta được: f(yn) = (−c3 +c 2 2 )e 3 n + (−3)e 4 n +O(e 5 n ) f ′ (yn) = 1−2(−c3 +c 2 2 )c2e 3 n −6c2(c4 −2c2c3 +c 3 2 )e 4 n +O(e 5 n ), f ′′ (yn) = 2c2 + 6(−c3 +c 2 2 )c3e 3 n −18c3(c4 −2c2c3 +c 3 2 )e 4 n +O(e 5 n ), Đặt l1 = 12f(xn)f ′ 2(xn) +f 2 (xn) [f ′′ (xn)−f ′′ (yn)] l2 = 6f ′ 2 (xn) [f ′ (xn) + f ′ (yn)]
Từ 2.10 và 2.13 ta thu được en+1 +x ∗ = en +x ∗ − en −c 3 2 e 4 n +O(e 5 n )
Phương pháp 2.10 hội tụ bậc bốn, được thể hiện qua công thức ⇔en+1 = c 3 2 e 4 n +O(e 5 n ) Theo Định lý 2.3.3, nếu hàm f : I ⊂ R → R có một nghiệm đơn x ∗ và f(x) là hàm đủ trơn trong lân cận của nghiệm x ∗, thì phương pháp lặp được xác định bởi 2.11 sẽ hội tụ bậc sáu.
Chứng minh Theo định lý 2.3.1, ta có k3 = en−c 2 2 e 3 n + (−7
2c 2 c 3 −3c 3 2 )e 4 n + O(e 5 n ) Kết hợp với việc mở rộng f(zn) tại x ∗ , ta thu được f(zn) = c 2 2 e 3 n + (7
⇒en+1 = c 5 2 e 6 n +O(e 7 n )Như vậy phương pháp xác định bởi công thức 2.11 hội tụ bậc sáu
Ví dụ minh họa
Bài viết này so sánh phương pháp Newton (PPN) với phương pháp của Homeier (2005) (PPH) cùng các phương pháp 2.9 (N1), 2.10 (N2) và 2.11 (N3) như trình bày trong Bảng 1 Để tính toán và tìm nghiệm xấp xỉ với sai số, người dùng có thể sử dụng máy tính điện tử bỏ túi Casio fx-570ms hoặc phần mềm Maple.
|xn+1−xn| < 10 − 15 Xét các hàm số sau và thực hiện tính toán tìm nghiệm gần đúng x ∗ chính xác đến số thập phân thứ 27. f1(x) = cosx−x, x ∗ = 0.739085133215606416553120876 f2(x) = x 3 + 4x 2 −10 x ∗ = 1.365230013414096845760806829 f3(x) = sinx− x 2 x ∗ = 1.895494267033980947144035738 f4(x) = (x+ 2)e x −1 x ∗ = −0.4428544010023885831413280000 f5(x) = (x−1) 3 −1 x ∗ = 2 f6(x) = x 2 −e x −3x+ 2 x ∗ = 0.257530285439860760455367304
Kết quả trong bảng (2.1) là số lần lặp của các phương pháp khác nhau tìm nghiệm gần đúng với sai số nhỏ hơn 10 − 15
Trong luận văn này chúng tôi đã đề cập những vấn đề sau:
(1) Mở rộng đơn, mở rộng đại số một trường.
(2) Chứng minh được Định lý Hilbert về cơ sở.
(3) Chứng minh được Định lý Hilbert về không điểm.
(4) Chứng minh được hai kết quả của Noga Alon.
(5) Trình bày được khái niệm kết thức và vận dụng.
(6) Trình bày được một số phương pháp giải gần đúng phương trình.