1. Trang chủ
  2. » Khoa Học Tự Nhiên

thiết kế thực nghiệm trong công nghệ hóa học

590 446 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 590
Dung lượng 35,06 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Các quá trình và hiện tượng trong tự nhiên xảy ra có điều kiện chịu ảnh hưởng của nhiều yếu tố.Bằng cách nghiên cứu các yếu tố gây ra cũng như quan hệ trong các hiện tượng(phenomenonresponse), khoa học đã thành công trong việc đi sâu(penetrating into) vào bản chất(essence) của các hiện tượng và các quá trình. Khoa học có thể phân sự hiểu biết này làm ba mức. Mức cao nhất là mức mà các yếu tố ảnh hưởng được xem như một phần của hiện tượng xem xét như các định luật tự nhiên mà chúng ta có thể tác động và nhận ra hiện tượng từ nó. Các yếu tố ảnh hưởng tới hiện tượng tuân theo một định luật tự nhiên thì liên hệ với nhau bởi một công thức toán học. Ví dụ một số biểu thức này là:E= ; F=ma ; S=vt ; Q=FW Mức hai thấp hơn một chút là mức mà tất cả các yếu tố cũng là một phần của hiện tượng xem xét nhưng chúng ta chỉ biết mối quan hệ qua lại (interrelationship)giữa chúng tức là sự ảnh hưởng lẫn nhau(influence). Đây là trường hợp phổ biến khi chúng ta xem xét các hiện tượng mà bị ảnh hưởng bởi nhiều yếu tố khác nhau. Đôi khi chúng ta có thể liên kết các yếu tố này bằng một hệ các phương trình vi phân tuyến tính (simultaneous differential equation) nhưng không có lời giải. Ví dụ hệ phương trình vi phân tuyến tính NavierStokes’ sử dụng để xác định dòng chảy của chất lỏng lý tưởng

Trang 1

Zivorad R Lazic

ThiÕt kÕ thùc nghiÖm

trong C«ng nghÖ Ho¸ häc

Trang 2

I.GIỚI THIỆU VỀ THỐNG KÊ CHO NGƯỜI THIẾT KẾ THÍ NGHIỆM

Các quá trình và hiện tượng trong tự nhiên xảy ra có điều kiện chịu ảnh hưởng của nhiều yếu tố.Bằng cách nghiên cứu các yếu tố gây ra cũng như quan hệ trong các hiện tượng(phenomenon-response), khoa học đã thành công trong việc đi sâu(penetrating into) vào bản chất(essence) của các hiện tượng và các quá trình

Khoa học có thể phân sự hiểu biết này làm ba mức Mức cao nhất là mức mà các yếu tố ảnh hưởng được xem như một phần của hiện tượng xem xét như các định luật tự nhiên mà chúng

ta có thể tác động và nhận ra hiện tượng từ nó Các yếu tố ảnh hưởng tới hiện tượng tuân theo một định luật tự nhiên thì liên hệ với nhau bởi một công thức toán học Ví dụ một số biểu thức này là:

tố này bằng một hệ các phương trình vi phân tuyến tính (simultaneous differential equation) nhưng không có lời giải Ví dụ hệ phương trình vi phân tuyến tính Navier-Stokes’ sử dụng để xác định dòng chảy của chất lỏng lý tưởng:

∇+

x

p X

∇+

∇+

Mức cuối cùng là mức mà chúng ta chỉ biết hiện tượng thông qua chỉ một số yếu tố, ví dụ

có một số lớn các yếu tố nhưng không chắc chắn yếu tố nào thì ảnh hưởng Ở mức này chúng

ta không biết một định luật tự nhiên nào chi phối, ví dụ một biểu thức toán học mà các yếu tố liên hệ với nhau Trong trường hợp này chúng ta phải làm thí nghiệm để tìm ra một định luật

tự nhiên có thể

Trang 3

Chúng ta có thể lấy một ví dụ cho mức này là định luật kinh nghiệm Darcy-Weisbah’s về áp suất nhỏ giọt của chất lỏng khi đi qua một ống [1]:

d

f H

2 2

2 3

175.1

Hay phương trình xác định sự nóng hay lạnh của chất lỏng chảy bên trong hoặc ngoài ống

mà không thay đổi về thể (phrase) [1]:

67 0 14

0 33

0 67

.

0

/86.1

µλ

đó, chứa hai khái niệm :hàm số được tìm thấy trong tất cả các trường hợp như một giá trị trung bình, và độ lêch nhỏ hơn hoặc lớn hơn của các trường hợp riêng lẻ từ các mối quan hệ đó

Mức thấp nhất thường được xem với các hiện tượng mới khi mà các yếu tố và định luật về

sự thay đổi thì đều không biết, như sự trả lời có tính kết quả cho hiện tượng quan sát là giá trị ngẫu nhiên với chúng ta Sự ngẫu nhiên này là kết quả của sự thiếu khả năng quan sát tất cả các mối quan hệ và những ảnh hưởng của tất cả các yếu tố lên sự trả lời hệ thống Mặc dù sự phát triển của nó, khoa học vẫn tiếp tục nghiên cứu để tìm ra những sự liên kết, mối quan hệ

và những yếu tố ảnh hưởng mới, cái sẽ làm cho sự ngẫu nhiên tiến gần tới thực tế hơn

Trên cơ sở những phân tích đã đề cập chúng ta có thể kết luận rằng quá trình ngẫu nhiên là những hiện tượng mà hoàn toàn ngẫu nhiên, không được xác định chính xác nghĩa là các hiện tượng có sẵn và ngẫu nhiên thì ở giới hạn bên trái và phải của hiện tượng ngẫu nhiên Để tìm

ra mối quan hệ ngẫu nhiên sự thực hành thiết kế ngày nay sử dụng ngoại trừ những cái khác, còn có thực nghiệm và những tính toán thống kê để thu được kết quả

Thống kê, ngành khoa học miêu tả và giải thích các số liệu, có xuất xứ thô sơ từ sự điều tra dân số và hệ thống thuế bắt nguồn từ Ai Cập và Babilon cổ đại Thống kê phát triển hơn đến những bảng số liệu đơn giản và cho đến khi phát triển thành lý thuyết vào thế kỷ mười tám và mười chín Khi khoa học thực nghiệm phát triển, những phương pháp phân tích và thể hiện

Trang 4

mới cần được cải tiến Những người đi tiên phong trong thống kê toán học như Bernoulli, Poison, và Laplace, đã phát triển thống kê và lý thuyết xác suất vào giữa thế kỉ 19 Có lẽ ứng dụng đầu tiên của thống kê là sử dụng lý thuyết xác suất trong những trò chơi may rủi Thậm chí ngày nay, những nhà lý thuyết về xác suất vẫn chọn một đồng xu hoặc một cỗ bài như mẫu thí nghiệm của họ Thống kê áp dụng cho sinh học được phát triển ở Anh vào nữa sau của thế kỉ 19 Ứng dụng quan trọng đầu tiên của thống kê trong công nghệ hóa học là ở một công ty của Dublin thuộc Ireland vào thời gian chuyển tiếp giữa hai thế kỉ Vì sự cần thiết của việc phải giải quyết một số vấn đề kĩ thuật, nhiều sinh viên toán của trường đại học Oxford và Cambridge trong đó có cả W.S.Gosset, đã cam kết(engaged) tham gia Anh được nhận việc vào năm 1899, Gosset đã áp dụng những hiểu biết của anh về toán học và hóa học để điểu khiển chất lượng của sản phẩm Mà sau này phương pháp mẫu nhỏ của ông đã được áp dụng trong hầu hết các lĩnh vực hoạt động của con người Ông đã xuất bản thành sách phương pháp này vào năm 1907 với bút danh ‘Student’, còn được biết đến tận ngày nay Phương pháp này cũng được áp dụng nhưng hạn chế trong công nghiệp đến năm 1920 Ứng dụng lớn hơn được đăng kí trong suốt chiến tranh thế giới thứ 2 trong công nghệ quân sự Từ đó xác suất và thống kê được ứng dụng trong tất cả các lĩnh vực của khoa học công trình(engineering).

Cùng với sự phát triển của máy tính điện tử, phương pháp thống kê bắt đầu phát triển mạnh

và đóng vai trò quan trọng trong nghiên cứu đòi hỏi kinh nghiệm và tối ưu hóa hệ thống Phương pháp thống kê cho nghiên cứu các hiện tượng có thể được chia làm 2 nhóm cơ bản Nhóm đầu tiên bao gồm sự ghi(recording) và quá trình mô tả (processing-description) của các biến trong hiện tượng được quan sát và nó thuộc về thống kê mô tả (Description statistics) Kết quả chúng ta áp dụng thống kê mô tả cho ta thông tin số về hiện tượng quan sát như số liệu thống kê được thể hiện trong bảng và đồ thị Phương pháp thứ hai đặc trưng bởi

sự phân tích thống kê, lọc các biến quan sát được nhờ sự phân loại và sắp xếp chuỗi thống kê tương quan Đây là lĩnh vực của thống kê suy luận tuy nhiên không thể đặt ra ngoài thống kê

mô tả

Đối tượng của những nghiên cứu thống kê là tập hợp (gồm:vũ trụ, khối thống kê, vũ trụ cơ bản và sự đầy đủ) và các mẫu được đưa từ tập hợp Tập hợp phải tiêu biểu cho một quá trình hóa học liên tục bằng một vài đặc trưng như tính chất của sản phẩm Nếu chúng ta muốn tìm một tính chất của sản phẩm, chúng ta phải đưa ra một mẫu từ một tập hợp mà bằng lý thuyết thống kê toán học nó là sự tụ họp vô hạn của nhiều đơn vị cơ bản

Ví dụ chúng ta có thể đưa ra hàng trăm mẫu từ một quá trình cân bằng và xem xét nó bằng

sự phân tích hóa học hoặc một vài xử lý khác để thiết lập tính chất nào đó( như đưa ra một mẫu từ một phản ứng hóa học với mục đích thiết lập hiệu suất của phản ứng, hay đưa ra một mẫu về một chất nổ đẩy tên lửa cùng với ý tưởng thiết lập những tính chất cơ học như cường

Trang 5

độ sức căng, độ giãn dài lúc nổ vv…) Sau khi đưa ra một mẫu và thu được những tính chất của nó chúng ta có thể ứng dụng thống kê mô tả để tìm ra đặc trưng của mẫu Tuy nhiên nếu chúng ta muốn tìm ra những kết luận về tập hợp từ mẫu thì ta phải dùng sự suy luận thống kê Vậy chúng ta có thể suy ra những gì từ mẫu ?Rõ ràng mẫu phải là sự lựa chọn tiêu biểu từ các giá trị đưa từ tập hợp hoặc ngược lại chúng ta sẽ không thu được gì Do đó, chúng ta phải lựa chon một mẫu ngẫu nhiên.

Một mẫu ngẫu nhiên tập hợp các giá trị được lựa chọn từ một tập các giá trị theo cách mà mỗi giá trị trong tập có một sự thay đổi lựa chọn cân bằng

Thường tập hợp cơ sở thì hoàn toàn có tính giả thuyết Giả sử chúng ta làm năm bước cho một phản ứng mới trong phản ứng gián đoạn ở điều kiện không đổi và sau đó phân tích sản phẩm Mẫu của chúng ta sẽ lấy số liệu từ năm bước nhưng tập hợp thì ở đâu? Chúng ta có thể mặc nhiên công nhân một tập hợp giả thuyết là tất cả các bước đã làm và trong tương lai sẽ làm ở cùng điều kiện này Chúng ta đưa ra mẫu này và kết luận rằng nó là mẫu tiêu biểu của tập hợp vì vậy tập hợp có thể không xác định

Nếu sự suy luận của chúng ta về tập hợp là hợp lý, chúng ta phải tạo ra những điều kiện làm việc đồng nhất với những điều kiện trong mẫu

Để có một mẫu tiêu biểu cho tập hợp, nó phải chứa những dữ liệu trên toàn bộ giá trị của các biến được đo Chúng ta không thể ngoại suy ra kết luận tới toàn bộ biến số Một giá trị đơn tính từ một dãy những quan sát gọi là một thống kê

Mean, median và mode:những tiêu chuẩn đánh giá

Chúng ta hiểu giá trị trung bình X là giá trị trung bình số học của tính chất của các biến tính

chất X1, X2, X3, …, X3 Khi chúng ta nói tới giá trị trung bình chúng ta hiểu rằng nó là giá trị trung bình của mẫu, cái được tính bằng cách lấy tổng tất cả các giá trị của biến chia cho số biến trong mẫu Giá trị trung bình là giá trị đơn giản nhất và quan trọng nhất trong tất cả các

số liệu để đánh giá

n

X

X =∑ i (1.1)

Ở đây X là giá trị trung bình của n biến

Xi là một giá trị trong mẫu

Kí hiệu X chỉ giá trị trung bình của mẫu Giá trị trung bình ước lượng của tập hợp được kí

hiệu là: μ Chúng ta không thể nào xác định chính xác giá trị của μ từ mẫu trừ khi trong trường hợp đơn giản ở đó chúng ta có thể ước lượng khá chính xác trên cơ sở giá trị trung bình của mẫu Một giá trị trung bình khác được sử dụng thường xuyên để đánh giá đó là giá trị median Giá trị này được định nghĩa như sự quan sát mẫu mà ở đó số quan sát trên và dưới

Trang 6

nó bằng nhau Median được định nghĩa như sự quan sát trung tâm của mẫu nơi các giá trị thì sắp xếp theo cỡ

Giá trị thứ ba là mode, được định nghĩa là giá trị mà có số lần quan sát nhiều nhất Mode là giá trị có thể nhất trong các giá trị ngẫu nhiên riêng lẻ, khi với các biến ngẫu nhiên, nó là biến ngẫu nhiên mà hàm mật độ xác suất đạt giá trị lớn nhất Nói trong thực hành, nó là giá trị được đo, ví dụ tính chất mà được lặp lại nhiều nhất trong mẫu Giá trị trung bình được sử dụng nhiều nhất trong phân tính thống kê thực hành Giá trị median thì thỉnh thoảng thích hợp hơn giá trị trung bình trong việc đánh giá Giá trị mode thì hiếm khi được sử dụng Sự phân

bố đối xứng như là phân bố Normal, giá trị đề cập thì xác định

Ví dụ 1.1 [2] về sự khác nhau của ba giá trị trên, chúng ta xem xét mức tiền lương trong

một công ty nhỏ Lương hàng năm như sau:

Giám đốc : 50000

Người bán hàng nam: 15000

Kế toán : 8000

Quản đốc : 7000

Hai nhân viên kĩ thuật mỗi người được : 6000

Bốn công nhân mỗi người được : 4000

Nếu lấy tiền lương đặt trong một dãy chúng ta thu được : 4000 ; 4000 ; 4000 ; 4000 ; 6000 ; 6000 ; 7000 ; 8000 ; 15000 ; 50000 Mode median Trong suốt quá trình trả tiền lương, giám đốc khẳng định rằng lương trung bình chia cho 10 người làm công là 9000$/năm, và không cần một sự tăng

Người đại diện của liên hiệp công ty khẳng định rằng cần thiết phải tăng lương vì hơn nửa số người lao động đang có mức lương là 6000$ hoặc ít hơn và nhiều người đang làm với mức 4000$ Rõ ràng, giám đốc công ty đã sử dụng giá trị trung bình và liên hiệp công ty đã sử dụng median và mode

Phép đo sự thay đổi, phạm vi, độ trêch trung bình và phương sai (variance)

Như chúng ta thấy, giá trị trung bình, số trung bình, median, và mode là những phép đo xác định vị trí (measure of Location) Khi xác định được vị trí của số liệu, chúng ta có thể đặt ra câu hỏi số liệu trải ra ngoài khoảng giá trị trung bình như thế nào Sự đo đơn giản nhất của những biến đổi là phạm vi (range) và interval(khoảng, đoạn) Phạm vi thì được xác định như

là sự khác nhau giữa giá trị lớn nhất và nhỏ nhất trong mẫu

(Interval-range) = Xmax- Xmin (1.2)

Phép đo này có thể được tính toán dễ dàng nhưng nó chỉ cho ta sự đo xấp xỉ những thay đổi của dữ liệu, khi nó bị ảnh hưởng chỉ giới hạn các giá trị tính chất quan sát mà có thể khác so

Trang 7

với những giá trị khác Để có phép đo chính xác hơn của những thay đổi chúng ta phải bao gồm tất cả giá trị tính chất trả lời (property-response), ví dụ từ những sự trệch khỏi trung bình mẫu, phần lớn là số trung bình Như giá trị trung bình của các biến của sự trệch khỏi giá trị trung bình mẫu thì bằng không, chúng ta có thể đưa ra phép đo của những biến đổi sự trệch giá trị trung bình Sự trệch giá trị trung bình được định nghĩa như là giá trị trung bình của các giá trị tuyệt đối của sự trệch khỏi giá trị trung bình mẫu :

X X

Giới thiệu về thống kê kỹ thuật

Công thức tính toán hũư ích thường được sử dụng là:

X X

Kv = 100%

X

S X

S x x

= ( 1.6)Khoảng giá trị rộng của hằng số biến cho thấy số kiệu bị phân tán rộng quanh giá trị trung bình và ngược lại, nếu các điểm thực nghiệm gần như nhau thì hằng số biến sẽ rất nhỏ

Ví dụ 1.2 [2].Lấy 10 giá trị khác nhau của 5 quan sát ngẫu nhiên trên X và tính toán giá trị

trung bình và độ lệch của mỗi nhóm

Trang 8

là vô hạn vì vậy các mẫu phải có sự phân bố vô hạn , điều này trong thống kê được gọi là quy luật Glivenko[3].

Hãy xem xét ví dụ trên để minh thấy được sự khác nhau giữa mẫu ước lựơng và thông số phân bố.giá trị trung bình của mẫu và độ lệch chuẩn được tính toán từ công thức và tạo bảng Thông thường, ta không thể tính toán hơn các gia trị ước lượng của thông số phân bố µ.và σx2

một cách tương ứng tuy nhiên, trong trường hợp này, số được chọn từbảng các giá trị ngẫu nhiênxắp xếp từ 1-9 bảng A trong các bảng giá trị ngẫu nhiên, dù kích thức không xác định,

tỷ lệ của mỗi số bằng 1/10 và tỷ lệ này cho phép tính được giá trị thông số phân bố chính xác:

10

987654321

0+ + + + + + + + + =

σx2 =( ) ( ) ( ) 8.25

10

5.49

5.415.4

Có thể thấy rằng giá trị trung bình của mẫu phân tán xung quanh trung bình phân bố giá trị trung bình của 10 nhóm là 4.58 rất gần với giá trị phân bố hai giá trị này có thể được nhận dạng nếu lượng mẫu là ô hạn

Tương tự, sự biến thiên của mẫu phân tán quanh phân bố biến và giá trị trung bình 7.69 gần với phân bố biến

1.1 Sự rời rạc đơn giản và phân bố liên tục.

Trang 9

Chúng ta thường xây dựng các mô hình toán học nhằm mô tả các hệ kỹ thuật thực tế Các hệ này thừong dựa trên kinh nghiệm, trực giác, hay qua các giả thiết về tính chất vật lý của đối tựợng.

Trong nhiều trừơng hợp, viẹc xây dựng mô hình lý tưởng là hết sức khó khăn vì các tính chất vật lý của hệ quá phức tạp Ngay cả đối với định luật khí cung phải dựa trên giả thiết khí là khí hiếm và nhiều điều kiện lý tưởng khác mà trong thực tế hầu như khó có thể đạt được.Tuy nhiên, khi gặp các vấn đề quá khó khăn, người ta thường sủ dụng mô hình thống kê có thể lớn hơn hay nhỏ hơn hệ thực tế nhưng luôn cho kết quả chính xác và mô tả tôt đặc tính của hệ

Trong chương này, chúng ta làm quen với định luật xác xuất – một định luật cung cấp những

mô hình đơn giản nhưng rất hữu ích trong việc mô tả các mẫu trong phân bố ( tức là mô hình xác xuất đơn giản tỏ ra hữu ích trong việc mô tả sự phân bố định trước nằm trong những mẫu ngẫu nhiên bất kỳ)

Trong số các khái niệm quan trọng nhất cuả thuyết xác xuất có khái niệm về biến ngẫu nhiên

Ta biết rằng mỗi biến ngẫu nhiên đều có thể được đặc trưng bằng nhiều số- các giá trị thay đổi, mà các giá trị này đều có thể xảy ra được gọi là biến ngẫu nhiên biến ngẫu nhiên thường được định nghĩa là một hàm mà với mỗi sự kiện thành phần được định mức bởi một số do các tình huống ngẫu nhiên nên các biến ngẫu nhiên có thể có các giá trị số khác nhau và không thể tiên đóan được giá trị mà biến ngẫu nhiên đó có thể mang vì nó khác với giá trị thực nghiệm nhưng ta lại hoàn toàn có thể đoán trước được toàn bộ giá trị mà nó có thể mang Để đặc trưng một biến ngẫu nhiên một cách hoàn toàn, ta không chỉ biết đến giá trị có thể của biến mà còn phải quan tâm đến tần số xuất hiện của mỗi giá trị Số các giá trị khác nhau mà biến ngẫu nhiên có thể mang trong thực nghiệm là giới hạn Khi các biến ngẫu nhiên lấy những giá trị xác định hữu hạn tương ứng với xác xuất của nó thì được gọi là biến ngẫu nhiên rời rạc ta nhận thấy rằng, các biến cố luôn xảy ra trong cuộc sống hàng ngày ví dụ như khi tung đồng xu thì việc xấp ngửa của đồng xu đóng vai trò của một biến cố Các biến ngẫu nhiên là liên tục nếu với xác suất tương ứng, chúng có thể nhận các giá trị trong một khỏang xác định Ví dụ về biến ngẫu nhiên liên tục là thời gian chờ xe buýt, thời gian giữa các lần phát xạ của sự phân rã chất phõng xạ

Mô hình xác xuất đơn giản.

Thuyết xác xuất có nguồn gốc từ nhu cầu muốn tiên đoán khả năng có thể xảy ra của trò chơi xác suất Bắt đầu với một đồng xu, ta nhận thấy xác suất đồng xu sau khi tung có mặt xấp hay ngửa là như nhau, vậy là mỗi biến cố đều có xác suất là 0.5 và tổng các khả năng xác suất của các biến cố thông thường là 1.0

Trang 10

Khi tung hai đồng xu, chúng ta chú ý rằng việc mỗi đồng xu xấp hay ngửa không phụ thuộc vào đồng xu thứ hai (độc lập) xác xuất của mỗi đồng xu vẫn là 0.5 nhưng khả năng để cả hai đồng xu cùng có mặt ngửa là hệ quả của hai biến cố đơn lẻ do các biến đơn lẻ là độc lập với nhau.

P(đều ngửa) = 0.5*0.5=0.25

Tương tự, nếu có 100 đồng xu cùng tung lên và xác suất để có cùng mặt ngửa một lúc là: P(100 ngửa ) =0.5100

Ví dụ về đồng xu là một ví dụ điển hình của phân bố Bernulli

Sư phân bố xác xuất giới hạn giá trị các biến đến chính xác hai giá trị rời rạc,một là xác xuất

p, hai là xác suất (1-p) với đồng xu, hai giá trị xấp là p và ngửa là1-p với p=0.5 được gọi là đồng xu công bằng

Phân bố Bernulli áp dụng vứoi những trường hợp có hai khả năng cùng xảy đến cho một thực nghiệm đơn lẻ và khi các sản phẩm tạo thành được chấp nhận hay có thiếu sót (bị loại), khi nguồn nhiệt là tắt hay bật, khi một dự đoán là có hay không Phân bố Bernulli thường biẻu diễn bởi số 0( không thể ) hoặc1(có thể ) đại diện cho hai khả năng có thể xảy ra của biến cố

Giá trị trung bình và biến.

Khi tung đồng xu, sự xấp ngửa của đông xu là biến cố ta nói rằng biến cố là do sự phân tán cơ

sở trong đó xác xuất để có mặt ngửa là 0.5 Tuy nhiên, khi chung ta tung 100 đông xu cùng lúc thì có thể co 46 xấp và 54 ngửa Ta không thể xác minh chính xác trực giác dù cho lượng mâu lớn nhưng chúng ta có thể có giá trị gần đúng

Các kết quả thực nghiệm liên quan tới trung bình phân bố vàbiến như thế nao? một định nghĩa hữu ích khác là giá trị mong muốn( expected value) giá trị mong muốn là tổng của các giá trị

có thể của các kết quả thực nghiệm, với mỗi gía trị là xác suất của kết qủa thu được giá trị mong muốn là giá trị trung bình có lợi( weighed average)

Trung bình của xác suất dựa trên cơ sở của biến ngẫu nhiên X đựoc định nghĩa là giá trị mong muốn của X:

µ = E(X) = ΣXipi (1.7)

Trong đó,

µ: trung bình xác suất

E(X): giá trị mong muốn của X

Bằng việc lấy gần đúng, có thể xác định giá trị mong muốn của hàm biến X- là mục tiêu của thuyết xác suất

Ví dụ, giá trị mong muốn của biến X đơn giản làtổng biùnh phương ủacác giá trị, mỗi giá trị chính là xác suất thu được của giá trị

Trang 11

Phân bố biến của các biên ngẫu nhiẽn được định nghĩa làgiá trị mong muốn của bình phương

độ lệch của X và giá trị trung bình

Ví dụ khác về sự các biến ngẫu nhiên là ván bài, môi quânbài tương ứng với xác suất 1/52 trong phép phân bố rời rạc định nghĩa về giá trị mong muốn là:

Trong đó,

Xi : giá trị của thực nghiệm

P : xác suất mà giá tị thực nghiệm có thể xảy ra

Trung bình xác suất và biến ở đây có thể liên quan đến trung bình mẫu và biến qua công thức sau đây.µ

E(X) = E(Σ Xi/n)=µE( Xi/n)=Σµ/n=nµ/n=µ (1.14)

Trang 12

2 2

2 2

X nE X

−+

(1.22)Khi đó

P(X=k)=( n)pk(1-p)n-k (1.24)

kí hiệu :

( )n =

k n!/k!(n-k)! (1.25)

Trang 13

Giá trị p(X=k) cho các giá trị khác có thể được tính toán và biểu diễn trên đồ thị phân bố xác xuất , hình 1.1

Hình 1.1 Phân bố nhị thức p = 0,1 và n = 10

bảng 1 Phân phối rời rạc

kỳ vọng

2 mặt xấp ngửa của đồng tiền những quyết điểm của mẫu Binomial

k n k

M N

k n

) (

n N M N M

một loại, N đối tượng của loại khác

Mô tả n đối tượng

Cũng là những quyết điểm của mẫu đưa ra không thay thế

Trang 14

tìm thấy k đối tược của loại M n đối tượng mô tả từ….

(population) không thay thế sau mỗi mô

số lần xấp trước khi xuất hiện số lần ngửa đầu tiên

λ là tham số

Phân huỷ chất phóng xạ, đập

vỡ thiết bị

Một thiếu sót trong mẫu là đã đưa ra khả năng xảy ra nhất nhưng tỷ lệ mẫu đưa ra giảm 4/10 lần, dù vậy cũng giống tỷ lệ (population proportion) Trong ví dụ trước chúng ta kỳ vọng sai số mắc phải là 1/10 Theo trực giác chúng ta lấy tỷ lệ p = 0,1 đó là giá trị kỳ vọng trong mẫu ngẫu nhiên Điều chứng minh này là đúng có thể chỉ ra đối với phân phối nhị thức:

Trang 15

1.12 PHÂN PHỐI LIÊN TỤC

Một hàm phân phối liên tục được cho là xác suất đối với một khoảng liên tục của biến

ngẫu nhiên Nghĩa là xác suất nhận giá trị bằng không tại giá trị nào đó trong khoảng Phân

phối liên tục tương phản với phân phối rời rạc Phân phối rời rạc cho là chỉ một giá trị đối với

biến ngẫu nhiên Do đó, biến ngẫu nhiên liên tục không thể đặc trưng cho những giá trị mà nó được hiểu như xác suất tương đương Bởi vậy trong trường hợp biến ngẫu nhiên liên tục chúng ta thấy xác suất p (x < X < ∆x) mà nó lấy giá trị từ khoảng (x; x + ∆x) Với ∆x là rất nhỏ Sự thiếu xác suất này là phụ thuộc vào ∆x, xác suất tiến tới không khi ∆x tiến tới 0 Theo sắp xếp vượt qua sự thiếu sót này hãy quan sát hàm:

(

;lim

)

(

x dP x f x

x x X x P x

∆+

dx x f

x ) ( )

(

2 2

x

f

x

Trang 16

Phân phối liên tục đơn giản nhất là phân phối đồng dạng mà cho là hàm thống kê không đổi với vùng giá trị từ a – b Và cho là xác suất bằng 0 với tất cả giá trị của biến số ngẫu nhiên [a,b] (hình 2).

Hàm xác suất thống kê đại diện cho phân phối đồng dạng là đạt được kết quả bằng cách hợp thành một thể thống nhất tất cả các giá trị của x, với f(x) không đổi khi x ∈ [a,b], f(x) = 0 khi x ngoài [a,b]

f a b dx

;11

b

xdx X

2

1)

a a

b

dx

x

12)

(2

Trang 17

Giỏ trị ngẫu nhiờn trong vớ dụ này là thời gian T cho đến khi xe buýt kế tiếp đến giả thiết rằng chỳng ta khụng biết được kế hoạch của xe buýt T là phõn phối đồng dạng từ 0 – 15 phỳt Ở đõy, chỳng ta núi rằng xỏc suất của tất cả những lần xe buýt đỗ tiếp theo là như nhau

Do đú:

15

1015

1)

P

Chỉ cú 1/3 trường hợp là cần đợi 10 phỳt hoặc lõu hơn Xỏc suất mà chỳng ta phải đợi chớnh xỏc 10 là 0 Khi đú xỏc suất = 0 mụ tả giỏ trị đặc biệt trong phõn phối liờn tục Đặc trưng của một vài phõn phối liờn tục được đưa ra ở bảng 1.2

Bảng 1.2 Phõn phối liờn tục

Phõn phối và mật độ Giỏ trị kỳ

vọng

Phương sai

Đồng dạng

b x a a b

σ

x x

y

f

(a+b)

21

γ1

à

0

12

)(ba 2

2

2

σ

f(x )không đổi Phân phối rời rạc là sự thành công của phân phối Poisson

Phân phối chuẩn Gauss

Một trờng hợp

đặc biệt của hàm phân

Đang chờ xe buýt

Thời gian bứt

ra của hạt trong quá trình phân hủy chất phóng xạMột vài tình huống thí nghiệm

Một vài tình huống thí

Trang 18

Khi bỡnh phương

0

;2

!12

x x

ơng những biến số đợc chuẩn hóa k

1.13 PHÂN PHỐI CHUẨN

Phõn phối chuẩn được đề cử bởi nhà toỏn học Đức Gauss

Phõn phối này đó được ứng dụng khi phõn tớch mó hoỏ thớ nghiệm và khi ước lượng ngẫu nhiờn cỏc sai số Nú được gọi là phõn phối Gauss Sử dụng rộng nhất của phõn phối liờn tục là phõn phối chuẩn Vỡ những lý do sau:

+ Nhiều biến cố ngẫu nhiờn được xuất hiện qua thớ nghiệm cú phõn phối chuẩn

+ Nhiều biến cố ngẫu nhiờn tuõn theo quy luật gần chuẩn

+ Nếu một biến số ngẫu nhiờn khụng thể làm một phõn phối chuẩn, khụng làm gần chuẩn, nú cú thể biến thành một biến ngẫu nhiờn chuẩn bằng biến đổi toỏn học đơn giản.+ Chắc chắn phõn phối Complex cú thể xấp xỉ bằng phõn phối chuẩn (phõn phối nhị thức)

+ Chắc chắn những biến số ngẫu nhiờn mà cú những thay đổi để được xỏc minh thống

kờ cú phõn phối chuẩn

Gauss đó giả định rằng tất cả những sai số trong mẫu tập quan sỏt là do những tương tỏc độc lập của quy luật số lớn Mỗi tương tỏc ấy chỉ tạo ra một yếu tố nhiễu nhỏ Nếu theo giả thiết đú đường cong cú hỡnh chuụng chuẩn được sử dụng Mặc dự mụ hỡnh chuụng chuẩn đó

mụ tả đầy đủ những tỡnh huống thực gồm cỏc mẫu tập quan sỏt được Khụng cú lý do gỡ để coi rằng những mẫu tập quan sỏt cần thiết đú thớch ứng với mụ hỡnh Gauss Cho vớ dụ, Maxwell sử dụng một mụ tả mụ hỡnh phỏt sinh 1 hàm phõn phối cho tốc độ phõn phối hạt của khớ Nhưng kết quả chỉ là giỏ trị xấp xỉ của chuyển động (Behavior) của khớ thực Lỗi trong đo lường mẫu do kết quả tổng hợp của quy luật số lớn của yếu tố nhiễu độc lập nhỏ là giả sử chớnh gồm mụ hỡnh mà cỏc mụ hỡnh đú hàm phõn phối chuẩn được ứng dụng Giả sử chớnh này dẫn đến dạng mẫu tập của phõn phối chuẩn

Giả thiết của một phõn phối chuẩn là thường xuyờn và thường khụng phõn biệt đó được làm trong việc thớ nghiệm Bởi vỡ nú là một phõn phối gần chuẩn Trong đú, một vài thủ tục

Trang 19

thống kê đã được ứng dụng, một vài tình huống mẫu tập như lỗi ngẫu nhiên, yield data có thể

mô tả đầy đủ phân phối chuẩn, nhưng nó không phải luôn luôn đúng

Thuật ngữ µ và σ2 là định nghĩa đơn giản như tham số trong hàm phân phối chuẩn.Thuật ngữ µ quyết định giá trị mà hình chuông úp là trung tâm và σ2 quyết định sự trải rộng của đường cong hình 1.3

Một phương sai lớn cho một đường cong rõ và phẳng, trong khi một phương sai nhỏ cho một vùng cong cao và hẹp với xác suất tập trung giá trị gần µ

Giá trị trung bình hay giá trị kỳ vọng của hàm chuẩn thu được bằng áp dụng phương trình 1.28

2

2

1exp2

1)

(

σ

µπ

σ (1.37)Phép tính tích phân trong công thức (1.37) là quá dài dòng và hầu như dễ dàng hoàn thành bằng cách dung bảng tích phân xác định Để mở rộng ,chúng ta định nghĩa thêm một biến mới

dy dx

y x

y X

E

2

exp2

exp2

1

)

(

2 2

σπ

y

(1.40)

Trang 20

0.1360 0.0214

0.3413 0.3413

0.1360 0.0214 f(z)

3 2 1 0 -1 -2 -3 0 0.1 0.2 0.3

z x

1)

()

Trang 21

y z

0.0139 0.1151 0.4207

0.0107 0.0968 0.3821

0.0082 0.0808 0.3446

0.0062 0.0668 0.3085

0.0019 0.0287 0.1841 +0.0

0.5793 0.8849 0.9893

0.6179 0.9032 0.9893

0.6554 0.9192 0.9918

0.6915 0.9332 0.9938

0.8159 0.9713 0.9981

Trang 22

Điều đề cập là những phân phối nhất định có thể xấp xỉ tới một phân phối thông thường Đây là một sự gần đúng hữu ích cho những mẫu lớn

5.0(

*)100

^(

K k

Biểu thức này quá dài dòng khi ước lượng , vì vậy , chúng ta sử dụng phép tính xấp xỉ Bằng phương trình (1.26), chúng ta có :

Quan sát 36 lần một mẫu được lấy ra từ một quy luật phân bố bình chuẩn có mức trung bình

là 20 và với sai lệch là 9 Bao nhiêu phần của quy luật phân bố có giá trị lớn hơn 26 ?

Bài 1.5

Mức độ tập trung trung bình của các hạt hóa chất tại một phòng trong một nhà máy công nghiệp hóa chất được đo 6 giờ trong một lần đo và đo trong 30 ngày bằng đồng hồ đo hình khối siêu nhỏ Kết quả đo được cho trong bảng sau :

Trang 23

b) Hỏi xác suất để vượt mức giới hạn trên là bao nhiêu ?

c) Hỏi xác suất hoạt động an toàn tuyệt đối với mức dưới 65 mg/m3 là mấy?

Giả thiết trọng lượng cơ thể của 800 sinh viên phân phối chuẩn vớiµ=66kg,σ =5kg

.tính số lượng sinh viên có trọng lượng :

ε cm.Qua một thời gian dài quan sát , nó phân bố với độ lệch chuẩn σ =0.03

Giả thiết rằng chiều dài X của các thanh kim loại có phân phối chuẩn để phần trăm của các thanh kim loại đặt trong pham vi dung sai Hỏi với dung sai bằng bao nhiêu để có 95%trong

số các thanh kim loại được sản xuất nằm trong dung sai giới hạn ?

Bài 1.9

Trang 24

Trong phòng điều chế ,20 mẩu của một hợp chất phản ứng nhanh đã được trộn dưới điều kiện chính xác , tấc cả chúng đều có thành phần giống nhau Kiểm tra thành phần chất nổ thu được

và tốc độ đốt cháy ở áp suất 70 bar.Tốc độ đốt cháy trung bình là X =8.5mm/s và phương sai

tính toán là σ^2=0.3.Hỏi có bao nhiêu phần có tốc độ cháy :

a) trong khoảng 8 đến 9 mm/s

b) trên 9mm/s

c) dưới 8mm/s

1.2 giả thuyết thống kê

Sau khi tổng hợp từ dữ liệu thực nghiệm , chúng ta thường hi vọng sử dụng nó để rút ra một kết luận chung về .ví dụ ,từ dữ liệu về hiệu suẩt của một phản ứng hạt nhân , chúng ta có thể muốn :

- giải quyết mặc dù hiệu suất trung bình của một vài phản ứng tại những điều kiện phản ứng nhất định mà đáp ứng được yếu tố kinh tế;

- xác định mặc dù một điều kiện phản ứng đưa ra tính hiệu suất cao hơn các điều kiện khác

- ước lượng hiệu suất trung bình có thể đạt tới trong những điều kiện đặc biệt

- tìm một phương trình định lượng để có thể dùng dự đoán trước hiệu suất tại những điều kiện phản ứng khác

chúng ta có thể dùng phương pháp toán học khác của thống kê để đi đến những kết luận này.Bởi vì dữ liệu nghiên cứu là những đối tượng từ những thí nghiệm có sai phạm và có thể không chính xác như mô hình chúng ta dự đoán., chúng ta có thể rút ra những kết luận chỉ với những điều kiện đặc biệt chắc chắn.Chúng ta có thể không bao giờ hoàn thành những kết luận chung về một phân phối bằng những thống kê chung /

Thống kê có thể chia thành 2 phân lớp chính như sau :

- kiểm định thống kê

- ước lượng thông kê

Trong phân lớp thứ nhất , chúng ta đưa ra một giả thuyết về phân bố và nhận định chấp nhận hoặc bác bỏ nó bằng kiểm định một mẫu dữ liệu Hai ví dụ đầu trong phần đầu trên thuộc nhóm kiểm định thống kê.Trong ví dụ thứ nhẩt , giả thiết rằng hiệu suất trung bình bằng hiệu suất đề ra

Ước lượng bao gồm số liệu giá trị của những tham số phân phối khác nhau như : kì vọng ,

độ lệch chuẩn ….Những số liệu này để đánh giá các tham số thực nhưng về mặt thống kê chúng cho phép ta xác nhận độ chính xác của việc ước lượng

Trang 25

1.2.1-Kiểm định thống kê

là bản trình bày đơn giản kết hợp với phân bô xác suấtcủa một biến ngẫu nhiên Một giả thuyết được đưa ra , sử dụng quy luật thống kê để kiểm định nó , vì vậy nó có thể được chấp nhận hoặc có thể bị bác bỏ Trước khi giả thuyết được trình bày rõ ràng , hầu như luôn luôn cần thiết chọn lựa một mô hình mà chúng ta cho rằng nó phù hợp với mô hình phân phối

cơ sở Việc chọn lựa một mô hình dựa vào điểm đặc của dạng phân phối xác suất của các tham số mật độ mà chúng ta quan tâm Đưa ra một giả thuyết thông kê , sau đó dựa vào những kết luận thống kê để xác minh giả thuyết đưa ra có thể chấp nhận hay có thể bị bác bỏ Nói chung , chúng ta không thể trả lời được ngay câu hỏi giả thuyết thông kê trên là đúng hay sai Nếu thông tin từ mẫu là phù hợp với giả thuyết thì chúng ta chấp nhận nó Tuy nhiên , nếu

dữ liệu trái với giả thuyểt thống kê đưa ra thì chung ta bác bỏ nó

Theo nguyên tắc , có 2 giả thuyết được đưa ra :

- sơ cấp hoặc giả thuyết không H0

- giả thuyết loại từ H1

Nếu chúng ta chấp nhận giả thuyết không H0 , thì sẽ chính là bác bỏ H1

Nhiều giả thuyết thống kê cùng loại đó có thể là các tính kiểm định riêng hoặc là thang giá trị của một hay nhiều thông số thông kê.Như là những giả thuyểt đưa ra từ những đặc tính của mẫu dữ liệu Khi một mẫu được rút ra từ một phân bố không phải là dạng chuẩn thì chúng ta thu được một mẫu đại diện đầy đù Chúng ta có khả năng mắc sai lầm mỗi khi chấp nhận hoặc bác bỏ một giả thuyết

Những loại sai lầm sau :

Khi kiểm định giả thuyết thống kê , có 2 sai lầm có thể xác định được , cùng với xác suât sai lầm xảy ra

- sai lẩm loại 1 :bác bỏ H0 khi nó là đúng Gọi α là xác suất để xảy ra sai lầm loại 1

- sai lầm loại 2 : chấp nhận H0 khi nó là sai (điều đó có nghĩa là H1 đúng ).Gọi β là xác suất để xảy ra sai lầm loại 2

- Người ta có thể nói rằng α và β là yếu điểm của giả thuyết chấp nhận sự sai lệch Một cách lí tưởng chúng ta sẽ thích 1 sự kiểm tra mà có thể giảm thiểu được cả 2 loại sai số Thật không may là khi α giảm, β cũng có xu hướng giảm theo, và ngược lại Ngoài những thuật ngữ chúng ta đã đề cập, chúng ta nên giới thiệu thêm một thuật ngữ mới : Khả năng kiểm tra Khả năng kiểm tra được định nghĩa như là một khả năng có thể xảy ra của sự loại trừ

Trang 26

Ho khi nó bị sai Kí hiệu của nó là: khả năng kiểm tra = 1- β hoặc khả năng có thể tạo ra 1 quyết định chính xác

Sự kiểm tra thống kê

Để kiểm tra 1 giả thuyết, các số liệu mẫu được sử dụng để tính toán 1 kiểm tra thống kê Dựa trên giá trị của phép tính thống kê, giả thuyết ban đầu Ho được chấp nhận hoặc đuợc loại bỏ Vùng tới hạn được định nghĩa như là khoảng giá trị của phép kiểm tra thống kê mà yêu cầu sự loại bỏ Ho Phép kiểm tra thống kê được xác định bởi sự phân bố thống kê đặc trưng và bởi các thông số được lựa chọn để kiểm tra

Quy trình của phép kiểm tra một giả thuyết

Quy trình chung cho 1 phép kiểm tra giả thuyết thống kê là:

1 Chọn 1 mẫu xác suất và một biến ngẫu nhiên liên kết với nó Sự lựa chọn này có thể được dựa trên kinh nghiệm trước kia hoặc trực giác

2 Áp dụng công thức tính Ho và H1 Cần phải cẩn thận tính toán để có thể đưa ra một kết luận đáng tin cậy

3 Chỉ rõ phép kiểm tra thống kê

4 Chọn 1 mức độ α có nghĩa cho phép kiểm tra

5 Xác định sự phân bố của phép kiểm tra thống kê và vùng giới hạn cho phép kiểm tra thống kê

6 Tính toán giá trị của phép kiểm tra thống kê từ một mẫu thử ngẫu nhiên của dữ liệu

7 Chấp nhận hoặc loại bỏ Ho bằng phép so sánh giá trị đã tính toán của phép kiểm tra thống kê với vùng giới hạn

Các ví dụ sau đây sẽ minh họa cho quy trình kiểm tra thống kê [7] Đầu tiên, chúng ta xem xét 1 ví dụ đơn giản kiểm tra trên 1 quan sát đơn lẻ Bước thứ 2 áp dụng quy trình bảy bước cho 1 phép kiểm tra trên 1 sự trung gian của 1 population nhị thức sử dụng 1 phép tính xấp sỉ thông thường Ở đây, và trong 1 ví dụ thứ 3, chúng ta giới thiệu ý tưởng của phép kiểm tra 1 phía và phép kiểm tra từ 2 phía, trong khi ở ví dụ thứ 4 chúng ta minh họa phép tính toán của sai lệch loại II, và sức mạnh chức năng của phép thử

Ví dụ 1.8.

Bài toán một nhân tố được thực hiện để tính với tập phân bố bình thường với 1 giá trị trung bình là 10 và một phương sai là 9 Nhân tố khảo sát là X = 16 Vậy liệu bạn có thể kết luận rằng phép tính đó là từ tập đã được giả định trên ?

Để trả lời câu hỏi này, chúng ta làm theo quy trình 7 bước:

Trang 27

1 Mô hình xác suất là một sự phân bố thường : µ=10; σ2=9 Biến số ngẫu nhiên là giá trị của X

2 Giả thiết không : H0: X=16, là từ 1 tập phân bố thường với N(10;9)

Giả thiết liên quan H1: X=16, không phải từ tập giả định trên

3 Bởi vì chúng ta chỉ có 1 nhân tố cho X, phép tính thống kê chỉ đơn giản là giá trị chuẩn hóa, Z = (X- µ)/ σx Bảng giá trị chuẩn cho biết phân bố của phép tính thống kê này

4 Lựa chọn mức độ có nghĩa của α : là ngẫu nhiên Chúng ta sẽ sử dụng α=0.01 và α=0.05 bởi vì một trong những giá trị này thừong được sử dụng

5 Phép tính thống kê được phân bố thường là với µ=10; σx =9, nếu H0 là đúng Một giá trị của X mà quá cao hoặc quá thấp so với giá trị trung bình thì nên loại bỏ, vậy chúng ta chỉ chọn một miền giới hạn tại mỗi đoạn cuối phân bố thường Như được minh họa trong hình 1.5, phần 0,025 của tổng diện tích dưới đường cong bị cắt ở đoạn cuối của đường α=0.05 Từ bảng B, chúng ta xác định rằng giới hạn tương ứng của diện tích này là Z=-1,96 và Z = 1,96.; cốt là để nếu đơn nhân tố của chúng ta rơi vào khoảng giữa, chúng ta chấp nhận H0 Giá trị tương ứng cho α=0.01 là Z=± 2,58

6 Tính toán giá trị:

Z=(16-10)/

7 Do 2>1,96, chúng ta loại bỏ H0 tại α=0.05 Nhưng do 2<2,58 chúng ta chấp nhận H0

tại α=0.01

Hình 1.5 Miền giới hạn của phép kiểm tra từ 2 phía

Liệu chúng ta có sẵn sàng chấp nhận rủi ro trong việc loại bỏ H0 , khi nó đúng 5 lần trong 100 lần, chúng ta có thể loại bỏ nó, nhưng nếu chúng ta muốn giảm độ rủi trong việc loại bỏ một giả thiết có thực xuống 1 trong 100, chúng ta phải chấp nhận H0 như là một ví dụ Thông thường, chúng ta không cùng làm việc với 2 giá trị α Một mức độ có nghĩa mong muốn được lựa chọn ngay từ đầu và sự quyết định được dựa trên nó Những thử nghiậm này minh họa cho quy trình và chứng minh y nghĩa của mức có nghĩa của phép kiểm tra

Ví dụ 1.9:

Thí nghiệm tại một nhà máy chế biến lốp xe hơi cho kết quả là, bình quân 4,8% số sản phẩm bị loại bỏ do không hoàn hảo Trong một lần vận hành gần đây, 60 trong 1000 lốp xe bị loại bỏ Liệu có li do gì để tin rằng quy trình sản xuất đã hoạt động không tốt hay không?

Vấn đề này cần được giảm xuống như 1 phép kiểm tra trên một vài mẫu thử Chúng ta

có thể sử dụng dữ liệu trên một khoảng dài để ước tính thông số tần số (p = 0,048), do chúng

ta không có các khác để biết nó Chúng ta lại theo quy trình 7 bước:

Trang 28

1 Đây là phân bố nhị thức với 2 kết luận logic: chấp nhận hoặc loại bỏ Tuy

nhiên, do kích thước mẫu qua lớn, chúng ta co thể sử dụng gần đúng thông thường Do p=0.048, chúng ta biết rằng µ = np = 1000x0.048 = 48

Và phương sai là :

σ2 = np(1-p) = 1000x0.048(1-0.048) = 45,7

2 Như đã nêu vấn đề, Giả thiết ban đầu là không được chỉ rõ Chúng ta chọn

để so sánh trung bình của tập số được giả định là từ dưới mức sản phẩm của ngày tới giá trị trung bình trong khoảng dài:

H0 : µ ≤ 48; H1 > 48

Câu hỏi đặt ra là liệu tỉ lệ sản phẩm thải lên tới 60 chiếc là thực sự cao để có thể loại đi giả thiết rằng tỉ lệ thải là 48 hoặc ít hơn

3 Do chúng ta sử dụng gần đúng thông thường, phép tính thống kê đơn giản là

biến tiêu chuẩn thông thường:

Z = (X – 0,5 - µo)/ σ

Sự trừ đi 0,5 của giá trị mẫu sẽ tăng cường sự gần đúng thông thường Nó được gọi là “sự hiệu chỉnh liên tục” Tử số của phương trình là độ lệch của giá trị mẫu so với giá trị trung bình của tập Mẫu số đơn giản là độ lệch chuẩn của tập giả định

Do vậy, Z là một số chỉ độ lệch chuẩn so với giá trị trung bình tại đó chúng ta tìm ra giá trị X

Ở đây chúng ta đã sử dụng giá trị của mẫu X như là 1 ước tính của giá trị trung bình giả định

là dưới mức sản xuất thông thường

4 Hãy để α=0.05 Điều này nghĩa là, chúng ta sẽ loại bỏ rủi ro giả thiết có liên

quan rằng µ=48 là 1 trong 20

5 Để xác định vùng thực, chúng ta phải biết mật độ phân bố của phép kiểm tra

thống kê Trong trường hợp này, Z được phân bố như là một phân bố chuẩn thông thường Với H0: µ < 48 và α=0.05, chúng ta xác định được rằng miền tới hạn sẽ bao gồm 5% diện tích của đoạn cuối của đường chuẩn thông thường Hình 1.6 Giá trị Z đã được giảm 5% trên đường cong được tìm thấy là 1,645 , từ bảng phân bố chuẩn như bảng B Do đó, nếu giá trị Z

đã được tính tóan lớn hơn 1,645 chúng ta loại bỏ H0

6 Trong trương hợp này, σ2= 45,7; X = 60, µ = 48; n=1000, và: Z = 1,70

7 Do 1,70 > 1,645, chúng ta loại bỏ H0 và tính toán rằng tỉ lệ loại bỏ phế thải

60 trong 1000 chiêc lốp là thực sự lớn hơn 4,8% Chúng ta có thể tiếp tục tìm kiếm nguyên nhân của sự thay đổi này bằng cách kiểm tra lại quy trình sản xuất

Trang 29

Hình 1.6 Miền giới hạn của phép kiểm tra từ một phía

Giả thiết rằng thay vào 60 chiếc lốp hỏng trong 1000 chiếc, chúng ta chỉ tìm thấy 6 trong 100 chiếc bị hỏng Khi đó chúng ta sẽ tính như sau:

Z = (6-0,5-4,8) / 4,57= 0,327 ; α=0.05

Do đó, với α=0.05như ở trên, chúng ta nên chấp nhận H0 Sự loại bỏ 6 chiếc lốp trong 100 chiếc không thực sự khác biệt đáng kể so với tần số p=0,048, nhưng 60 trong 1000 là một sự khác biệt đáng kể Điều này minh họa cho ảnh hưởng của kích thước tập trong phép kiểm tra thống kê Một số mẫu nhỏ hơn sẽ bị ảnh hưởng nhiều hơn bởi sự biến thiên ngẫu nhiên so với

1 tập lớn hơn; cốt là để sự khác biệt về đổng tỉ lệ trong một tập lớn thì có tính thống kê rõ rệt hơn là một tập có kích thước bé hơn

Điều này minh họa cho kiểu kiểm tra 1 phía, rằng vúng tới hạn là ở một phía của phân bố chuẩn bởi vì cách giả thiết được phát biểu

Trang 30

Ví dụ 1.10:

Giả thiết chúng ta thà chọn để kiểm tra xem liệu rằng trong tỉ lệ loại bỏ hàng ngày là 60 trên

1000 có sự khác biệt đáng kể so với độ tin cậy thống kê 0,048 hay không, hơn là xem xem có

sự khác biệt cao hơn so với độ tin cậy thống kê của tập như trong ví dụ trước Trong trường hợp này, giả thiết sẽ là:

Với α = 0,05, cho phép kiểm tra 2 phía, Z = 1,96 và X = 48 + 1,96 45 = 61,3.,7

Đây là giới hạn thấp hơn so với miền giới hạn như được chỉ ở dưới đường cong của H0 trong hình 1.7 Tương tự như thế, X = 48 – 1,96 45 = 34,7 cũng nằm dưới mức giới của miền ,7giới hạn thấp Do đó, nếu X nằm giữa 34,7 và 61,3 , H0 được chấp nhận cho dù nó đúng hay sai

Ở đây chúng ta đã loại bỏ sự hiệu chỉnh liên tiếp Điều này có thể chấp nhận được đối với kích cỡ tập lớn Thêm vào đó, phương pháp được sử dụng ở đây chỉ gần đúng bởi vì nó cho rằng phương sai là không đổi đối với H1 Nếu H1 : µ = 50 đã đúng và H0 do vậy sẽ sai, đường cong của H1 trong hình 1.7 sẽ là đường đúng; nhưng giới hạn 34,7 và 61,3 vẫn chỉ rõ miền

Trang 31

chấp nhận được của H0 Do Ho sẽ được chấp nhận khi H1 đúng và nếu X rơi vào khoảng giữa (34,7 ; 61,3), khi đó diện tích dưới đường cong H1 ở giữa những đường giới hạn này sẽ là β,

và có thể là khả năng gây sai lầm loại II Diện tích được đánh dấu trong hình 1.7 Để xác định diện tích này, chúng ta sử dụng giới hạn gốc với đường cong của H1 để xác định giới hạn chuẩn của miền β

Giới hạn trên: Z =

45,7

50 -61,3

= 1,67

Giới hạn dưới: Z =

45,7

50 -34,7

Trang 32

Giả sử rằng bây giờ chúng ta lặp lại phép tính toán về xác suất cho các giá trị cụ thể khác của

H1 và vẽ chúng trên hình 1.8 Sự xem xét kỹ lưõng hình 1.8 chỉ ra rằng xác suất sẽ biến đổi từ giá trị của α khi H1 : µ=48 cho tới giá trị 1,0 khi H1 : ±∞ Những tính toán như thế sẽ nhận được đường cong cho hàm xác suất, như đã chỉ ra trong hình 1.8 Như đã chấp nhận, giá trị

µ1 bị loại bỏ từ µo = 48, giá trị cao hơn cũng có thể gây ra sự loại bỏ giả thiết H0 Sự xem xét

kỹ lưõng hình 1.7 chỉ ra rằng β giảm và α cũng giảm , cốt là để chúng ta có thể nhận được khả năng cao hơn của mức độ có nghĩa Một khả năng cao hơn đối với cùng một giá trị α là

có thể nếu 1 tập có kích thước lớn được sử dụng

Trong phần này, chúng ta có thể xem xét một cách đại cương kiêm định thống kê và nhận

ra rằng không có phép kiểm tra nào mà lại không có sai số Chúng ta có thể giảm thiểu khả năng bác bỏ một giả thuyết đúng chỉ bằng cách chấp nhận rủi ro khi thừa nhận một giả thuyết

có thể sai Chúng ta lưu ý rằng nếu kích thước của tập số liệu lớn sẽ giảm thiểu khả năng gây sai số

Một yếu cầu đối với mức độ có nghĩa cao ít nhất là 0,9999 đối với công nghiệp vũ trụ

và kĩ thuật tên lửa Để đạt tới mức độ có nghĩa này, cần phải loại bỏ gần như toàn bộ β để không cs cơ hội cho những lỗi không hoàn thiện trong những chiếc máy bay

1.3 Sự đánh giá thống kê

Các kĩ sư thường hay gặp vấn đề về sử dụng bộ dữ kiện để tính toán, đó là họ hi vọng

sẽ mô tả được bản chất mà bộ số liệu được đưa vào Vì quá trình đo các biến số có thể phụ thuộc vào sự thay đổi ngẫu nhiên như sai số ngẫu nhiên Sự tính toán, ước lượng của các kĩ sư phụ thuộc vào sai số, nhưng là bao nhiêu? Phương pháp đánh giá thống kê có thể giúp giải quyết điều đó

Sự đánh giá thống kê sử dụng mẫu số liệu để đạt được sự đánh giá tốt nhất có thể về mật độ các thông số Giá trị p của sự phân phối Binomial, giá trị µ trong sự phân phối Poison, hoặc các giá trị µ vàσ trong sự phân phối đơn giản được gọi là các tham số Theo như trên, chúng ta nhấn mạnh một lần nữa rằng, một phần của toán học thống kê có quan hệ với sự phân phôi, ước lượng các khả năng xảy ra của mật độ các thông số dựa trên các mẫu số liệu thông tin, gọi là lí thuyết đánh giá Hơn nữa, sự đánh giá cung cấp số lượng các sai số có thể mắc phải trong khi ước lượng Kết quả là các kĩ sư không những được sử dụng tốt nhất các số liệu mà còn có thể ước tính bằng số sự chính xác của kết quả nữa

Có hai loại đánh giá có thể làm là: điểm đánh giá và khoảng đánh giá

Điểm đánh giá sử dụng mẫu số liệu để tính một giá trị tốt nhất, mà đánh giá một tập hợp số liệu Điểm ước tính là một số, một điểm trên trục số, được tính từ mẫu và cho giá trị

Trang 33

gần đúng của một tập số liệu chưa biết từ mẫu đã được xử lý Một điểm đánh giá một mình không cho biết được khoảng sai số trong quá trình đánh giá Nếu thông số đánh giá được biểu diễn trong một dãy được gọi là khoảng đánh giá.

J.Newman gọi những khoảng này là khoảng tin cậy, với mỗi khoảng thông số ước lượng, các dãy được biết mức độ chính xác sẽ được chọn Một khoảng ước tính cho một dãy giá trị đó có thể được mong đợi bao gồm giá trị chính xác với phần trăm chắc chắn có thể xác định rõ Điều đó cung cấp khoảng sai số trong quá trình ước tính Càng mở rộng dãy của khoảng đánh giá càng ít điểm đánh giá

1.3.1 Điểm đánh giá

Điểm ước lượng tốt nhất phụ thuộc vào tiêu chuẩn mà chúng ta tiến hành ước lượng Phương pháp thống kê cung cấp rất nhiều cách để ước tính các tập số liệu, và một vài thuộc tính của ước lượng đã được định rõ giúp chúng ta lựa chọn được phương pháp tốt nhất cho mục đích của mình

Ví dụ 1.12 [ ]8

Giả thiết rằng có 11 chiều hướng trên một lò phản ứng hạt nhân thí điểm ở điều kiện không đổi và có giá trị của phần trăm sản phẩm mong muốn tạo ra là: 32, 55, 58, 59, 60, 63,

63, 63, 63, 67

Số liệu thay đổi vì không điều khiển được các biến số và không biết được sai số Giả

sử chúng ta cần một giá trị tốt nhất của lượng sản phẩm mong muốn sinh ra chúng ta tính được giá trị trung bình X =58,4, số trung vị Med=60, và số trội là 63 nhưng có lẽ 32% sản phẩm sinh ra là một chiều hướng có liên quan đến một vài sai số nào đó mà ta chưa biết đến Chúng ta không thể tuỳ tiện chấp nhận giá trị này mà không biết nguyên nhân của việc tại sao giá trị lại thấp trong khi giá trị trung bình lại cao quá mức so với nó

Chúng ta có thể sử dụng số trung vị (60) như sự ước tính tốt nhất cho lượng sản phẩm mong muốn kì vọng, từ khi số trung vị không cao quá mức so với giá trị thấp nhất Mặt khác

ta đã đạt được giá trị 63% bo0ón lần trong 11 giá trị Có lẽ giá trị này là sự ước tính tốt nhất của cách tiến hành trong tương lai ở điều kiện được điều khiển cẩn thận Hiển nhiên, các con

số thống kê không đưa ra được sự đánh giá cần có trong ví dụ này Nếu ta có thể nói rắng 58,4

là sự ước tính tốt nhất của các số liệu ở dưới điều kiện chắc chắn, cung cấp dữ liệu từ những

số liệu ngẫu nhiên của tập số liệu Nếu như 32% sản phẩm mong muốn xuất hiện như bất kì các giá trị khác thì số trung bình là sự ước tính tốt nhất

Trang 34

Một vài thuộc tính của sự ước lượng giúp chúng ta lựa chọ sự ước tính tốt nhất cho mục đích của mình chúng ta sẽ cân nhắc ở đây:

* Không thay đổi

Khuynh hướng này nhằm đưa những giá trị đúng của tập số liệu như các size mẫu

được tăng lên Ví dụ, khi n tiến tới vô cùng, giá trị trung bình X hướng tới giá trị µ vì vậy

X là sự ước tính không thay đổi của µ .

* Bias

Một sự ước tính là unbiased nếu ở mức trung bình nó dự đoán được giá trị chính xác

Về lĩnh vực toán học, một sự ước tính là unbiased nếu nó cho một giá trị ngang bằng cho tập

số liệu mà nó ước lượng Ví dụ, giá trị trung bình X là sự ước tính unbiased của tập hợp các

giá trị µ vì:

E( X )=µMặt khác, phương sai được định nghĩa như sau là biased:

n

X X

i X

=

2 2

E =σhoặc loại ước lượng thay đổi là không unbiased nhương biased Tập hợp sự đánh giá khác nhau đưa đến phương sai được tính:

1

2 2

i X

Các biến ngẫu nhiên mà sự đánh giá có, cách một khoảng nhất định so với giá trị trung bình, chính là sự sai khác của chúng Nó chứng minh rằng, khi lựa chọn một sự đánh giá nào

đó không đủ thì cần một sự đánh giá không đổi và biased nó thật dễ dàng để trích dẫn các ví

dụ của các sự đánh giá khác nhau cho consistent and biased basic population means Tiêu chuẩn cho một sự đánh giá tốt là: sự đánh giá cho độ phân tán nhỏ Nào, ta thừa nhận có hai

Trang 35

cách đánh giá không đổi và biased cho θ1,θ2 cho một tập số liệu và giả thiết rằng θ1 có độ phân tán nhỏ hơn θ2 Hình 1.9 chỉ ra sự phân phối của hai sự đánh giá đem lại.

Thật rõ ràng khi thấy từ hình vẽ, cả hai sự đánh giá cùng cho một giá trị trung bình, hay:

( )θ1 E( )θ2

E = = population parameterCác giá trị biến của θ1 phân bố gần trung tâm xung quanh giá tr ị trung b ình h ơn so với θ2 Điều đó có nghĩa là sai số mắc phải khi đánh giá theo θ1 nhỏ hơn θ2 Cách đánh giá

22/

σ

n

n E

X

Thuộc tính hiệu quả còn quan trọng hơn thuộc tính unbiasedness Một sự thống kê có thể chứng minh là unbiased vì độ lệch rộng của những giá trị khác bên cạnh giá trị đúng sẽ loại trừ lẫn nhau, nhưng có thể khả năng không hiệu quả cao hơn

1.3.2 Khoảng ước lượng

Còn một điều chưa kể đến, khoảng cách từ điểm ước lượng tồn tại một khoảng thông

số ước lượng Không vấn đề gì trong việc thế nào là sự ước lượng thông số tốt để được chọn,

nó chỉ cần hợp lí để kiểm tra độ lệch ước lượng từ giá trị đúng, được xác định từ mẫu Ví dụ, kết quả phân tích đạt được của sự hoà tan xấp xỉ 3,24 và ±0,03 là độ lệch lớn nhất, chúng ta hoàn toàn chắc chắn rằng khoảng (3,24-0,03=3,21;3,24+0,03=3,27) chứa các giá trị phân tán chưa biết chính xác của phép toán Bởi vậy vấn đề quyết định của khoảng ước tính là con đường để công thức hoá nó:

Ta theo dõi thuộc tính của yếu tố X quyết định mật độ phân phối của hàm f(X) Vẽ một đường ngẫu nhiên di qua các điểm X1, X2, …, Xn Lấy hai giá trị trước (1-α) gần 1.0, do

đó tập hợp giá trị chưa biết không có trong khoảng này, khi đó α nằm ngoài khoảng Khoảng

Trang 36

giới hạn được quyết định bằng cỏc giỏ trị đưa vào X1, X2, …, Xn Ta nói rằng (Zα/ 2;Z1−α/ 2 )

là khoảng tin cậy cho mật độ thông số nếu nó là giá trị dúng sẽ nằm trong khoảng (1-α )

Xác suất (1-α ) hệ số tin cậy của khoảng tin cậy

Khoảng xỏc định trong cỏch này được quy là một khoảng tin cậy và kết thỳc của khoảng này được gọi là giới hạn tin cậy

Hệ số tin cậy (1-α ) cú thể được viết như sau:

P(Zα / 2 < population parameter <Z1 − α / 2) = 1-αKhoảng(Zα / 2; Z1 − α / 2) là một biến số ngẫu nhiờn cú thể thay đổi, từ mẫu này sang mẫu khỏc

Một số khoảng chỉ bao gồm tham số “population parameter” Tuy nhiờn, ở một mẫu lớn, cỏc trường hợp xảy ra một cỏch tương đối khi mật độ dõn số xấp xỉ (1- )α Trong trường hợp khụng cú tham số mật độ dõn số thỡ tần số thỡ tần số tương đối khụng tiến tới (khụng vượt quỏ) giỏ trị α

Lấy 1 vớ dụ, chọn 1-α = 0,95 ta cú thể cho rằng khoảng 95%, mẫu được chọn để đưa

ra khoảng tin cậy chứa tham số mật độ

Nếu chọn 1-α = 0,99, chỳng ta cú thể hy vọng khoảng tin cậy để chứa tham số

“population parameter” là 99 trong 100 trường hợp Nhưng điều đú sẽ được xem xột sau, khoảng tin cậy tương ứng với hệ số 1-α = 0,99 là lớn hơn trong trường hợp 1-α = 0,95 Sự tăng lờn của khoảng tin cậy là kết quả ngược lại của sự tăng lờn của hệ số tin cậy Mỗi giỏ trị

hệ số tin cậy 1-α được chọn trong thực tế phụ thuộc vào những rủi ro được chấp nhận.

Giả định rằng giỏ trị “population parameter” thụng thường à chưa biết, sự khỏc nhau 2

x

δ

đó biết, mẫu được chọn là:X1, X2…Xn được đưa ra Khoảng tin cậy cho à sẽ được xỏc định.

Dựa vào định lý giới hạn chớnh, giỏ trị trung bỡnh X cú: n( ,à δx2/n) hoặc:

Trang 37

P(Zα / 2 <

n

X

x

à

− <Z1 − α / 2) = 1-αhoặc khoảng tin cậy là:

Zα / 2 <

n

X

x

à

− <Z1 − α / 2 → Zα/2

n x

δ < X −à <Z1 − α / 2

n x

δ

Đổi chiều bất đẳng thức và thờm X vào mỗi vế ta cú:

X - Z1 − α / 2

n x

δ

< à < X - Zα/2

n x

δ < à < X + Z1−α/2

n x

δ

Thay Eq từ (1.51) vào Eq (1.48) ta có:

P( X + Zα / 2

n x

δ < à < X + Z1−α/2

n x

δ) = 1-α (1.52)Cụng thức (1.52) là một khoảng ước tớnh của à.

11

9) = 0,95 (1.53) P(53,09<à<63,71) = 0,95; (1.54)

Khoảng xác định bằng cách này đề cập đến khoảng tin cậy và kết thúc của khoảng gọi

là giới hạn tin cậy Số 1-α là hệ số tin cậy Chúng ta phải nhớ rằng, X và từ đây, giới hạn tin cậy đều là các giá trị ngẫu nhiên trong thống kê, còn àlà hằng số Nếu tiếp tục chúng ta sẽ xác định đợc các bộ khác của giới hạn tin cậy Ví dụ, giả sử ta có 1 bộ 11 số liệu về lợng sản

phẩm mong muốn là 47, 53, 56, 58, 58, 61, 61, 62, 64, 64, 65 khi đó X =59,0 và khoảng tin

Trang 38

Kiểm tra giả thuyết với khoảng tính toán.

Khoảng tin cậy có thể đợc dùng để kiểm tra giả thuyết về thông số của tập hợp số liệu trong ờng hợp khoảng tin cậy đã có đủ cơ sở Ví dụ giả sử dùng số liệu của ví dụ 1.13 chúng ta muốn kiểm tra

tr-H0: à = 57

H1: à < 57 hoặc : à > 57

Nếu khoảng tin cậy bao gồm phần lớn những giả thuyết đề cập đã ở H0 thì ta chất nhận H0 cho dữ kiện đầu tiên, phơng trình (1.54) cho thấy có thể chấp nhận đợc H0 vì 57 nằm trong khoảng xác định

P (53,05 < à < 63,7) = 0,95

Quy trình này là phơng pháp dễ nhất để chúng ta kiểm tra giả thyết Nh đã xem ở phơng trình (1.47) – (1.52) Trong phần này, trớc tiên chúng ta phải kiểm tra sự có nghĩa, nếu thừa nhận rằng sự khác nhau về tập số liệu là biết trớc Điều đó là có thực trong qúa trình tiến hành công việc Thông thờng chúng ta phải dùng nhiều mẫu khác nhau mà tại đó có thể tích toán đợc các dữ liệu Kết quả kiểm tra thống kê cho thấy có sự phân bố không bình thờng, chúng ta sẽ thấy

đợc ở phần sau của chơng này

Kiểm tra và tính toán với ý nghĩa thống kê.

Nghĩa là các thông số đơn rất quan trọng trong nhiều trờng hợp bởi vì nó là điểm mấu chốt cơ bản của của tập số liệu

Trong hầu hết các lần kiểm tra và tiính toán có nghĩa, nó đợc chấp nhận để theo dõi, có thể thấy nó hoàn toàn độc lập với tập số liệu trung bình Đây là giả định không có giới hạn giống

nh nó xuất hiện lần đầu tiên của định lí giới hạn trung tâm

Định lí này là rất quan trọng để đi xa hơn trong số liệu thống kê, trạng thái mà:

• Tổng số sự phân phối độc lập ngẫu nhiên có thể là phân phối trung bình đối với một l ợng mẫu lớn, không kể kích cỡ, sự phân bố có thể xảy ra trong của tập số liệu và với nhiều mẫu có thể thay đổi đợc

• Khi coi n là vô hạn thì sự phân phối ngẫu nhiên có thể xảy ra và X đợc coi nh là phân phối trung bình

Kết quả là:

Trang 39

Nếu thay đổi ngẫu nhiên X1, X2 Xn là độc lập với nhau thì sự phân phố có thể xảy ra khi:

2

2)(

;)

σ Điều đó nh là kết quả của định lí giới hạn trên Kiểm tra trên nhiều số liệu thống kê có thể chấp nhận đợc đó là hàm phân phối trung bình nó đã cung cấp một số liệu

n lớn, có thể thấy đợc mặc dù chúng ta không biết đợc phơng pháp nền tảng là gì? Thông

th-ơng có hàng triệu sự phân bố mà chúng ta đã sử dụng kết quả một cách dễ dàng phù hợp với

định lí giới hạn trung tâm bởi vì có hàng triệu sự phân bố đã đợc tổng kết độc lập với hàm phân phối Bernoulli Vậy số lợng n là bao nhiêu? Nói đúng ra nó tợng tự nh hàm phân phối trung bình với n là vô hạn Thực tế kích thớc của mẫu phụ thuộc vào mức độ chính xác của (desired)

Có hàng nghìn sự phân phối, phân phối xấp xỉ trung bình có thể đợc sử dụng với độ chính xác tốt cho số lợng mẫu nhỏ hơn bằng 8, nó đã cung cấp hàng nghìn k nhiều hơn 0,5 so với tính toán trong bảng thống kê số liệu trung bình Phần lớn thông số p gần 0 hoặc 1, một mẫu lớn sử dụng phải đạt đợc độ chính xác gần đúng

Kết quả đầu tiên nhận đợc từ nguyên lí giới hạn trung tâm là cho những mẫu lớn, nghĩa

là X là phân phối trung bình khi chúng ta cố gắng ớc tính hay làm kiểm tra với à nó sẽ cung

cấp cho chúng ta một số lợng lớn mẫu

Hầu hết chúng ta đều nhận thấy X là hàm thống kê đúng, có khả năng và ớc tính phù

hợp với à, nếu mẫu lấy từ cơ sở của hai tập số liệu trung bình thì thông thờng trong thực tế sẽ

bị lệch hớng nghĩa là không thể ớc tính đợc hoặc có tiêu chuẩn đánh giá nào khác giống nh trtị

số trung bình có thể phù hợp hơn Trớc tiên chúng ta minh họa bằng một sự kiểm tra đơn giản

có nghĩa với cơ sở của tập số liệu trung bình của mâu thuẫn đã biết Ta nên xem xét lại những trờng hợp đã tổng kết và áp dụng nó để kiểm tra giữa hai giá trị trung bình và khi đó ta lại tiến hành kiểm tra tại đó mà mâu thuẫn của tập số liệu là không biết

Kiểm tra và ớc tính với mâu thuẫn đã biết.

Để thảo luận dễ dàng hơn chúng ta kiển tra ớc tính đơn giản nhất trên nền tảng của hai tập số liệu trung bình khi đã biết mâu thuẫn và thiết lập lên giả thuyết:

Khi à0 là một vài giá trị cho trớc, những giả thuyết đó đã mang lại kết quả là kiểm tra không

đúng với phạm vi tới hạn những điểm trên cao của sự phân phối trung bình Chúng ta hoàn toàn có thể lập thành công thức với những giả thuyết khác nhau

Trang 40

H0 : à = à0 H : à < à0 hoặc à > à0 (1.61)

Sự lựa chọn trong cả ba trờng hợp này là tùy thuộc vào những gì chúng ta muốn kiểm tra Nếu chúng ta muốn xem à lớn hơn à0 thì dùng tập đầu còn nếu muốn kiểm tra sự nghi ngờ à nhỏ hơn à0 thì ta phải sử dụng tập hợp thứ hai thì sẽ thấy à tuyệt đối không bằng à0 Còn chúng ta

sử dụng tập thứ ba với hai phía của miền giới hạn Tất cả những tập hợp đó sử dụng để kiểm tra số liệu thống kê

n

X

Z

X

Z X

Khoảng cách tính toán này thực sự có cơ sở để kiểm tra hai phía tập thứ 3 của giả thuyết tr ớc tiên Mặc dù nó có thể thực hiện đợc định rõ “một phía” Khoảng cách đáng tin cậy cơ bản trên hai tập hợp là khác với giả thuyết (1.59 và 1.60), nh trờng hợp một bên là ít đợc sử dụng bởi một bên chúng ta biết khoảng cách ớc tính kéo dài khi thêm vào hoặc bớt đi phần nguyên

để để cho gới hạn của sự tin cậy là ngẫu nhiên Một bên có khoảng cách tin cậy có thể hiểu

nh là phạm vi giới hạn mà nó có thể xảy ra với n cấp α và một cấp khác là ±α

So sánh của hai nghĩa: Sự mâu thuẫn đã biết.

Khi hai mâu thuẫn là tơng đơng, chúng ta nên kiểm tra hai với hai nghĩa tơng đơng bằng cách sử dụng:

H0 : à1 = à2 H0 : à1 < à2 hoặc à1 > à2 (1.63)

Với kiểm tra số liệu thống kê

2 1

2 1 2 1

/1/1

)(

n n

X X

(1.64)

Khi H0 là đúng thì à1 - à2 = 0, phơng trình (1.64) là đơn giản Sự phân phối của Z là là bình ờng cho cơ sở của hai tập số liệu là trung bình hoặc cho kích cỡ mẫu lớn hơn Nếu mâu thuẫn của hai tập số liệu là khác nhau thì kiểm tra số liệu thống kê là:

th-2

2 1 2

2 1 2 1

//

)(

2

X X

Khi σ2X1và σ2X2biết trớc là khác nhau của hai tập số liệu

Kiểm tra và ớc tính với sự mâu thuẫn đã biết.

Thông thờng khi chúng ta có sự lựa chọn một số dữ kiện với ớc muốn sử dụng chúng để kiểm tra và ớc tính, chúng ta không có ý tởng với phần lớn mâu thuẫn của tập dữ liệu Nếu kết quả

Ngày đăng: 28/03/2016, 21:50

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w