(Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại (Bài thảo luận) Nghiên cứu về tỷ lệ sinh viên có người yêu và không có người yêu của Trường Đại học Thương Mại
Trang 1PHẦN I: LỜI MỞ ĐẦU
Lý thuyết kiểm định các giả thuyết thống kê là những bộ phận quan trọng của thống kê toán Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khácliên quan đến dấu hiệu cần nghiên cứu trong tổng thể
Kiểm định giả thuyết thống kê về tỉ lệ của đám đông, thông thường ta thường giả sử dấu hiệu X cần nghiên cứu trên đám đông có E(X) = μ, Var(X) = σ2, trong đó μ
chưa biết Từ một cơ sở nào đó người ta tìm được p = p0 , nhưng nghi ngờ về điều này Với mức ý nghĩa “ cho trước ta cần kiểm định giả thuyết H0 : p = p0 và tương tự, khi sosánh tỷ lệ của hai đám đông ta phải kiểm định giả thuyết H0 : p1 =p2 Đó là điều nhóm cần làm với vấn đề thảo luận”
Bài thảo luận này được xây dựng dựa trên cơ sở của: Giáo trình Lý thuyết xác xuất và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuyết xác xuất
và thống kê toán của trường Đại học Kinh tế quốc dân, các thông tin trên Internet, cùng với các kiến thức tiếp thu được từ các bài giảng của giảng viên bộ môn của trường đại học Thương Mại
1 Tính cấp thiết của đề tài:
Ngày nay theo xu hướng phát triển của thế giới, những ứng dụng của ngành khoa học xác suất thống kê ngày càng trở nên quan trọng trong hầy hết mọi lĩnh vực từkhoa học công nghệ đến kinh tế, chính trị và đời sống hằng ngày Việc nghiên cứu các
số liệu trở nên cần thiết hơn nhằm có thể đưa ra những con số biết nói giúp chúng ta trong công việc nghiên cứu khoa học và xã hội để từ đó đưa ra những điều chỉnh hợp
lý dựa trên thực tiễn cuộc sống vào nghiên cứu khoa học và vận dụng những thành tựu đạt được nhằm xây dựng xã hội tốt đẹp hơn
Sinh viên là tầng lớp luôn được quan tâm và trông đợi nhất, là cánh cửa bước vào tương lai của quốc gia Sinh viên là những tri thức trẻ của tương la, chính họ sẽ là những người đóng góp vai trò chủ chốt trong công nghiệp hoá, hiện đại hoá đất nước Bởi vì, sinh viên là bộ phận tiên tiến của xã hội, có trình độ học vấn cao, có khả năng tiếp nhận cái mới, iết thay đổi linh hoạt để thích nghi với sự thay đổi nhanh chóng của
xã hội hiện đại, đại diện cho một thế hệ tiến bộ mới
Mỗi sinh viên Trường Đại học Thương Mại đều nhận thức rõ vai trò rất to lớn của mình trong sự nghiệp xây dưng và bảo vệ Tổ quốc Để đảm nhiệm được trọng trách của mình, trức hêt sinh viên phải học tập, rèn luyện tốt Học tập là hoạt động cơ bản nhất trong lối sống sinh viên Chất lượng học tập chịu sự ảnh hưởng của các yếu tốkhách quan và chủ quan, đặc biệt là động cơ học tập
Trang 2Dựa vào đó, nhóm 7 chúng em đã lựa chọn đề tài nghiên cứu về tỷ lệ sinh viên
có người yêu và không có người yêu của Trường Đại học Thương Mại cho bài thảo luận và qua đó giúp sinh viên nhận thức sâu sắc hơn về vấn đề học tập cũng như mục đích, ý nghĩa của việc học Tù đó, các bạn sinh viên có thể tự tạo động lực cho mình để
có thể phấn đấu đạt được két quả tốt nhất trong việc học Ngoài ra, từ số liệu thống kê
đã điều tra được các giả thuyết về tỷ lệ sinh viên cao hay thấp và mức độ chi tiêu hàng tháng của sinh viên Trường Đại học Thương Mại
2 Mục đích nghiên cứu.
Nhóm 7 nghiên cứu đề tài với mục đích:
- Lấy được số liệu cụ thể về thực trạng sinh viên có người yêu của Trường Đại
học Thương Mại
- Phân tích cũng như so sánh về tỷ lệ sinh viên của người yêu và chưa có người
yêu
- Phân tích mức độ chi tiêu hàng tháng của sinh viên có người yêu của Trường
Đại học Thương Mại
3 Đối tượng, không gian và thời gian nghiên cứu.
- Đối tượng: sinh viên Trường Đại học Thương Mại
- Không gian: Trường Đại học Thương Mại
- Thời gian nghiên cứu: Từ 16/04/2021 đến 18/04/2021
Trang 3MỤC LỤC
PHẦN I: LỜI MỞ ĐẦU 1
1 Tính cấp thiết của đề tài: 1
2 Mục đích nghiên cứu 2
3 Đối tượng, không gian và thời gian nghiên cứu 2
PHẦN II: CƠ SỞ LÝ THUYẾT 4
1 ƯỚC LƯỢNG ĐIỂM 4
2 ƯỚC LƯỢNG KHOẢNG TIN CẬY 4
2.1 Khái niệm 4
2.2 Ước lượng kì vọng toán của ĐLNN 5
2.2.1 ĐLNN X phân phối theo quy luật chuẩn với σ 2 đã biết 5
2.2.3 Trường hợp chưa biết quy luật phân phối của X trên đám đông, nhưng kích thước mẫu n > 30 6
2.3 Ước lượng tỉ lệ 7
3 KIỂM ĐỊNH 8
3.1 Khái niệm kiểm định giả thuyết thống kê 8
a Phương pháp kiểm định một giả thuyết thống kê 9
b So sánh kỳ vọng toán của hai ĐLNN 10
Phần III: TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU 13
3.1 Số liệu 13
3.1.1 Số liệu – mẫu hỏi 13
3.1.2 Bảng mô tả số liệu 14
3.2 Giải quyết bài toán 15
3.2.1 Phát biểu bài toán 15
3.2.2 Giải quyết bài toán 15
IV/ KẾT LUẬN 22
Trang 4PHẦN II: CƠ SỞ LÝ THUYẾT
Ước lượng các tham số của đại lượng ngẫu nhiên
Giả sử cần nghiên cứu một dấu hiệu X thể hiện trên một đám đông nào đó Những số đặc trưng của X được gọi là các tham số lý thuyết (hay các tham số của đámđông) Kí hiệu chung các tham số lý thuyết cần ước lượng là θ Có hai phương pháp ước lượng θ là ước lượng điểm và ước lượng bằng khoảng tin cậy
1 ƯỚC LƯỢNG ĐIỂM
Từ đám đông lấy ra mẫu ngẫu nhiên kích thước n: W = (X1, X2,…Xn) Để ước lượng θ, từ mẫu này ta xây dựng một thống kê θ¿
= f(X1, X2,…Xn) thích hợp Ta sẽ ước lượng θ qua θ* (θ là một hằng số, θ* là một ĐLNN)
Để có ước lượng điểm của θ thông qua θ*, khi kích thước mẫu n khá lớn ta chỉ việc tính giá trị của thống kê θ* trên mẫu cụ thể w = (x1,x2 …xn):
- Từ đám đông lấy ra mẫu ngẫu nhiên kích thước n: W = (X1,X2, ,Xn)
- Tiếp đến ta xây dựng thống kê G = f(X1, X2…Xn,θ), sao cho quy luật phân phốixác suất của G hoàn toàn xác định (không phụ thuộc vào tham số θ) Với xác suất
γ = 1 - α cho trước, ta xác định cặp giá trị α1, α2 thỏa mãn các điều kiện α1≥ 0,α2
≥ 0và α1 + α2 = α Từ quy luật phân phối xác suất của G đã biết, ta tìm được phân vị g1-α1 và gα2 sao cho:
Trang 5P(G > g 1-α1 ) = 1 – α 1 và P(G > g α2 ) = α 2
Từ được gọi là ước lượng điểm của θ vì θđó được gọi là ước lượng điểm của θ vì θta được gọi là ước lượng điểm của θ vì θcó: P(g1-α1< G < gα2) = 1 – α1 – α2 = 1 – α = γ
Biến đổi tương đương, ta đưa công thức về dạng:
P(θ* 1 <θ<θ* 2 ) = 1 – α = γ Trong đó: Xác suất γ = 1 – α được gọi là độ tin cậy.
Khoảng (θ* 1 ;θ* 2 ) được gọi là khoảng tin cậy.
Độ dài I = θ* 2 - θ* 1 được gọi là độ dài khoảng tin cậy
Nhận xét:
Nếu thống kê G có hàm mật độ phân phối là đối xứng thì khoảng tin cậy 2 phía(α1 = α2 = α2) được gọi là khoảng tin cậy đối xứng
Nếu ước lượng giá trị tối đa hoặc tối thiểu của tham số θ thì ta chọn α1=0 hoặc
α2=0 (khoảng tin cậy 1 phía)
Khả năng mắc phải sai lầm của ước lượng
2.2 Ước lượng kì vọng toán của ĐLNN.
Giả sử trên một đám đông ĐLNN X có E(X) = μ và Var(X) = σ2 Trong đó μ chưa biết,cần ước lượng Từ đám đông ta lấy ra mẫu kích thước n: W = (X1, X2,…,Xn) Từ mẫu này ta tìm được trung bình mẫu X và phương sai mẫu điều chỉnh S’2
2.2.1 ĐLNN X phân phối theo quy luật chuẩn với σ 2 đã biết.
Vì X ~ N(μ;σ2) nên ta có X ~ N(μ;σ2/n)
Khi đó: U = X−μ
σ /√n ~ N(0,1)
a Khoảng tin cậy đối xứng (α1 = α2 = α2)
Khoảng tin cậy đối xứng của μ: (X −ε; X +ε) = (X − σ
Trang 6Khoảng tin cậy phải với độ tin cậy 1-α của μ là: μ min : (X − σ
√n U α ; +∞))
c Khoảng tin cậy trái (α1 = α; α2 = 0), dùng để ước lượng giá trị tối đa của μ
Khoảng tin cậy trái với độ tin cậy 1-α của μ là: μ max : (-∞); X + σ
√n U α )
2.2.2 ĐLNN X phân phối theo quy luật chuẩn với σ 2 chưa biết.
Vì X có phân phối chuẩn nên:
T = X −μ
a Khoảng tin cậy đối xứng (α1 = α2 = α2)
Khoảng tin cậy của μ: (X −ε; X +ε¿= (X − S ’
b Khoảng tin cậy phải (α1 = 0; α2 = α), dùng để ước lượng giá trị tối thiểu của μ
Khoảng tin cậy phải của μ là: μ min: (X − S ’
√nt α
(n−1)
; +∞))
c Khoảng tin cậy trái (α1 = α; α2 = 0), dùng để ước lượng giá trị tối đa của μ
Khoảng tin cậy trái của μ là: μ max: (-∞); X + S ’
Trang 7(X −ε; X +ε) = (X − σ
√n U α/2 ; X + σ
√n U α/2 ) Các phần còn lại giải quyết tương tự như 1.2.1
Trang 82.3 Ước lượng tỉ lệ.
Giả sử ta cần nghiên cứu một đám đông kích thước N, trong đó có M phần tử mang dấu hiệu A Khi đó P(A)=M/N=p là tỷ lệ phần tử mang dấu hiệu A trên đám đông Vì không điều tra cả đám đông nên thường chưa biết p Từ đám đông ta lấy ra mẫu kích thước n, điều tra trên mẫu này thấy cón A phần tử mang dấu hiệu A Khi đó
tần suất xuất hiện dấu hiệu A trên mẫu là f = n A
n Ta đi ước lượng p thông qua f Khi n khá lớn thì f ≃ N(p , pq
XDTK: U =
f − p
√pq n
≃N (0,1)
Trong được gọi là ước lượng điểm của θ vì θđó: q=1− p
b Khoảng tin cậy đối xứng (α1=α2=α
⇒ Khoảng tin cậy của f:
(p−√pq n U α2; p+√pq n U α2)
Trang 9b Khoảng tin cậy phải (α1 = 0; α2 = α), dùng để ước lượng giá trị tối thiểu của p, giátrị đối đa của f
Vì chưa biết khi n lớn ta lấy p ≈ f
Khoảng tin cậy phải của p là : p min:¿ +∞))
Khoảng tin cậy phải của f là : f max: (0; p+√pq n .U α¿
c Khoảng tin cậy trái (α1 = α; α2 = 0), dùng để ước lượng giá trị tối đa của p, giá trị tối thiểu của f
Vì chưa biết khi n lớn ta lấy p ≈ f
Khoảng tin cậy trái của p là:p max :¿)
Khoảng tin cậy trái của f là:f min: (p−√pq n U α ;1¿
3 KIỂM ĐỊNH
3.1 Khái niệm kiểm định giả thuyết thống kê
Giả thuyết thống kê
Giả thuyết thống kê là một nhận định, giả sử, nghi ngờ, khẳng định hay ý kiến
về một hiện tượng, quan hệ hay tình huống dự định khảo sát
Khi nghiên cứu hai hay nhiều ĐLNN thể hiện trên cùng một đám đông hoặc trên những đám đông khác nhau, ta có thể đưa ra các nhận xét: các ĐLNN đó độc lập hay phụ thuộc hoặc các tham số của chúng có bằng nhau hay không, đó cũng là các giảthuyết thống kê Một cách ngắn gọn ta có thể đưa ra định nghĩa:
Định nghĩa: Giả thuyết về dạng phân phối sác xuất của ĐLNN, về các tham số
đặc trưng của ĐLNN hoặc về tính độc lập của các ĐLNN được gọi là giả thuyết thống
kê, ký hiệu là H0
Giả thuyết không / giả thuyết gốc (H 0 )
Là một phát biểu về tham số của tổng thể
Thường là một tuyên bố bị nghi ngờ
Được cho là đúng cho đến khi nó được chứng minh là sai
Đối thuyết (H 1 )
Nhà nghiên cứu mong muốn ủng hộ và chứng minh là đúng
Là phát biểu ngược với H0
Được cho là đúng nếu H0 bị bác bỏ
Trang 10Ta quy ước khi đã chọn cặp giả thuyết H0 và H1 thì việc bác bỏ H0 tức là chấp nhận H1 và ngược lại H0 và H1 lập thành một cặp giả thuyết thống kê.
Kiểm định giả thuyết thống kê.
Kiểm định giả thuyết thống kê là tiến hành theo một quy tắc hay thủ tục nào đó
để từ một mẫu cụ thể được lấy ra từ đám đông cho phép ta đi đến quyết định chấp nhận hay bác bỏ một giả thuyết thống kê
Ta quy ước khi đã chọn cặp giả thuyết H0 và H1 thì việc bác bỏ H0 tức là chấp nhận H1 và ngược lại H0 và H1 lập thành một cặp giả thuyết thống kê
Nguyên tắc chung của việc kiểm định giả thuyết thống kê là sử dụng nguyên lý xác suất bé: “ Nếu một biến cố có xác suất khá bé thì trong thực hành ta có thể coi nó không xảy ra trong một lần thực hiện phép thử.”
a Phương pháp kiểm định một giả thuyết thống kê
Thủ tục kiểm định giả thuyết thống kê
Giả sử tổng thể có tham số θ chưa biết Với giá trị cụ thể θ0 cho trước nào đó Ta nghi ngờ θ hiện nay không đúng nên:
Bước 1: Xác định H0 , H1
Quy tắc đặt H0 , H1
H0 : không có gì bất thường, trong H0 luôn có dấu “=” (=, ≥, ≤ )
H1 : Ngược lại với H0, là các nghi ngờ, các giả định, không có dấu “ =” ( ≠,< , > )
Ta đưa ra giả thuyết : H0 : θ = θ0
Và cặp đối thuyết: H0 và H1:
H1: θ ≠ θ0 ( dạng 1): Kiểm định đối xứng
H1: θ > θ0 ( dạng 2) Kiểm định bên hpải
H1: θ < θ0 (dạng 3) Kiểm định bên trái
Bước 2: Tiêu chuẩn kiểm định (Trên mẫu ngẫu nhiên , xây dựng thống kê G)
Từ đám đông ta chọn ra một mẫu ngẫu nhiên kích thước n
W = f(X1,…,Xn ,)
Trong đó là một tham số liên quan đến H0 sao cho nếu H0 đúng quy luật phân phối xác suất của G hoàn toàn xác định
Bước 3:
Để xây dựng miền bác bỏ ta sử dụng nguyên lý xác suất nhỏ: Nếu một biến cố
có xác suất nhỏ ta có thể coi nó không xảy ra trong một lần thực hiện phép thử
Trang 11Vì đã biết quy luật phân phối xác suất của G, nên với một số α khá bé cho trước
ta có thể tìm được miền Wα gọi là miền bác bỏ, sao cho nếu giả thuyết H0 đúng thì xác suất để G nhận giá trị thuộc miền Wα bằng α:
Nếu gtn ∈ Wαthì bác bỏ H0, chấp nhận H1
Nếu gtn∉ Wα thì chưa có cơ sở để bác bỏ H0
Bước 4: Kết luận: Bác bỏ hay chấp nhận H0
Vì chỉ dựa trên một mẫu để kết luận các giá trị của tổng thể nên ta có thể phạm sai lầm khi đưa ra kết luận về giả thuyết H0
Sai lầm loại 1: Bác bỏ H0 trong khi H0 đúng
Sai lầm loại 2: Chấp nhận H0 trong khi H0 sai
Thực
Tế
Kết Luận
b So sánh kỳ vọng toán của hai ĐLNN
Giả sử ta có hai đám đông, trên đám đông thứ nhất dấu hiệu cần nghiên cứu là
X1 có phân phối chuẩn với E(X1)=µ1; Var(X1)= σ1 Còn trên đám đông thứ hai dấu hiệu cần nghiên cứu là X2 cũng có phân phối chuẩn với E(X2)=µ2; Var(X2)=σ2
Từ hai đám đông trên ta lấy ra hai mẫu độc lập với kích thước tương ứng n1 và n2:
Trang 12Tương được gọi là ước lượng điểm của θ vì θtự:
(X 2 i−X2)2là phương sai mẫu điều chỉnh của mẫu thứ hai
Thống kê X1´ − ´X2 là hiệu của hai ĐLNN độc lập cùng phân phối theo quy luật chuẩn, vì
vậy nó cũng là ĐLNN phân phối chuẩn Mặt khác ta chứng minh được:
Trang 14Phần III: TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU 3.1 Số liệu.
3.1.1 Số liệu – mẫu hỏi.
Mẫu hỏi
Để lấy số liệu thực tế cho bài báo cáo thảo luận nhóm môn xác suất thống
kê toán, Nhóm 7 đã thống kê những câu hỏi dưới đây hy vọng các bạn điền giúp nhóm để chúng mình hoàn thành tốt bài thảo luận
1 Bạn đang là sinh viên năm mấy?
3 Tình trạng quan hệ hiện tại của bạn?
○ Đang có người yêu
○ Chưa có người yêu
4 Mức chi tiêu trung bình tháng của bạn?
○ 1 - 1,7 triệu đồng
○ 1,7 - 2,3 triệu đồng
○ 2,3 - 2,9 triệu đồng
○ 2,9 - 3,5 triệu đồng
Trang 1642.86%
Tỷ lệ SV nam trường ĐHTM đang có và chưa có người yêu (%)
SV nam đang có người yêu
SV nam chưa có người yêu
53.45%
46.55%
Tỷ lệ SV nữ trường ĐHTM đang có và chưa có người yêu (%)
SV nữ đang có người yêu
SV nữ chưa có người yêu
3.2 Giải quyết bài toán.
3.2.1 Phát biểu bài toán.
Điều tra tình hình học tập và đi làm thêm của sinh viên có người yêu và chưa cóngười yêu của Trường Đại học Thương Mại thu được kết quả:
Sinh viên nam Sinh viên nữ
Với mức ý nghĩa là 5%
3.2.2 Giải quyết bài toán.
Trang 17Vấn đề 1 : Ước lượng mức chi tiêu trung bình hàng tháng của các bạn sinh viên nam, nữ đang có người yêu.
1 Ước được gọi là ước lượng điểm của θ vì θlượng được gọi là ước lượng điểm của θ vì θmức được gọi là ước lượng điểm của θ vì θchi được gọi là ước lượng điểm của θ vì θtiêu được gọi là ước lượng điểm của θ vì θtrung được gọi là ước lượng điểm của θ vì θbình được gọi là ước lượng điểm của θ vì θhàng được gọi là ước lượng điểm của θ vì θtháng được gọi là ước lượng điểm của θ vì θcủa được gọi là ước lượng điểm của θ vì θcác được gọi là ước lượng điểm của θ vì θbạn được gọi là ước lượng điểm của θ vì θsinh được gọi là ước lượng điểm của θ vì θviên được gọi là ước lượng điểm của θ vì θnam được gọi là ước lượng điểm của θ vì θđang được gọi là ước lượng điểm của θ vì θcó được gọi là ước lượng điểm của θ vì θ người được gọi là ước lượng điểm của θ vì θyêu
Trang 18 Với độ tin cậy là 95% ta có thể nói rằng mức chi tiêu hàng tháng của sinh viên nam có người yêu nằm trong khoảng (2,693 ; 3,399) triệu vnđ.
2 Ước được gọi là ước lượng điểm của θ vì θlượng được gọi là ước lượng điểm của θ vì θmức được gọi là ước lượng điểm của θ vì θchi được gọi là ước lượng điểm của θ vì θtiêu được gọi là ước lượng điểm của θ vì θtrung được gọi là ước lượng điểm của θ vì θbình được gọi là ước lượng điểm của θ vì θhàng được gọi là ước lượng điểm của θ vì θtháng được gọi là ước lượng điểm của θ vì θcủa được gọi là ước lượng điểm của θ vì θcác được gọi là ước lượng điểm của θ vì θbạn được gọi là ước lượng điểm của θ vì θsinh được gọi là ước lượng điểm của θ vì θviên được gọi là ước lượng điểm của θ vì θnữ được gọi là ước lượng điểm của θ vì θđang được gọi là ước lượng điểm của θ vì θcó được gọi là ước lượng điểm của θ vì θ người được gọi là ước lượng điểm của θ vì θyêu được gọi là ước lượng điểm của θ vì θ