Những lời nói cao đẹp xin gửi đến Cô đã giúp đỡ nhóm chúng em nói riêng và cả lớp nói chung trong suốt quá trình học tập và làm bài, thầy đã giúp đỡ rất nhiều trong công tác định hình về
Trang 1TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG KHOA CÔNG NGHỆ THÔNG TIN
BÀI THI CUỐI KÌ MÔN XÁC SUẤT THỐNG KÊ CNTT
PROBABILITY STATISTICS FINAL EXAMINATION
Người hướng dẫn: ThS NGUYỄN THỊ HUỲNH TRÂM
Người thực hiện: LÂM QUỐC HUY – 52000216
Lớp : 20050301
Khoá : 24
Trang 2TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG KHOA CÔNG NGHỆ THÔNG TIN
BÀI THI CUỐI KÌ MÔN XÁC SUẤT THỐNG KÊ CNTT
PROBABILITY STATISTICS FINAL EXAMINATION
Người hướng dẫn: ThS NGUYỄN THỊ HUỲNH TRÂM
Người thực hiện: LÂM QUỐC HUY – 52000216
Lớp : 20050301
Khoá : 24
THÀNH PHỐ HỒ CHÍ MINH, NĂM 2022
Trang 3LỜI CẢM ƠN
Em là Lâm Quốc Huy thay mặt mọi người viết lên những dòng tri ân này Những lời nói cao đẹp xin gửi đến Cô đã giúp đỡ nhóm chúng em nói riêng và cả lớp nói chung trong suốt quá trình học tập và làm bài, thầy đã giúp đỡ rất nhiều trong công tác định hình về góc nhìn thực tế của bài báo cáo về đề tài Những khía cạnh và công việc thực
tế mà có lẽ chúng em sẽ không nêu ra được nếu không có đầy đủ sự trải nghiệm và thấu hiểu quy trình vận hành Đồng thời, chúng em cũng muốn gửi lời cảm ơn chân thành đến tập thể khoa CNTT và toàn thể cán bộ công nhân viên chức trường Đại Học Tôn Đức Thắng Những sự cống hiến đóng góp thầm lặng của những con người anh hùng không tên, bỏ đi lợi ích của mình góp phần tạo nên giá trị to lớn của cả một thể hoàn chỉnh Xin
Trang 4ĐỒ ÁN ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
Tôi xin cam đoan đây là sản phẩm đồ án của riêng tôi và được sự hướng dẫn của ThS Nguyễn Thị Huỳnh Trâm; Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực và chưa công bố dưới bất kỳ hình thức nào trước đây Những số liệu trong các bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu thập
từ các nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo
Ngoài ra, trong đồ án còn sử dụng một số nhận xét, đánh giá cũng như số liệu của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồn gốc
Nếu phát hiện có bất kỳ sự gian lận nào tôi xin hoàn toàn chịu trách nhiệm
về nội dung đồ án của mình Trường đại học Tôn Đức Thắng không liên quan đến những vi phạm tác quyền, bản quyền do tôi gây ra trong quá trình thực hiện (nếu có)
TP Hồ Chí Minh, ngày 12 tháng 06 năm 2022
Tác giả
Lâm Quốc Huy
Trang 5PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN
Phần xác nhận của GV hướng dẫn
_ _ _ _ _ _ _
Tp Hồ Chí Minh, ngày tháng năm
Nguyễn Thị Huỳnh Trâm
Phần đánh giá của GV chấm bài
_ _ _ _ _ _ _
Tp Hồ Chí Minh, ngày tháng năm
Nguyễn Thị Huỳnh Trâm
Trang 6TÓM TẮT
Trình bày tóm tắt vấn đề nghiên cứu, các hướng tiếp cận, cách giải quyết vấn đề
và một số kết quả đạt được, những phát hiện cơ bản trong vòng 1 -2 trang
Trang 8DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT
Mean Giá trị trung bình
Median Giá trị trung tâm hay giá trị chính giữa
Mode Giá trị xuất hiện nhiều nhất
Standard deviation Độ lệch chuẩn
CÁC CHỮ VIẾT TẮT
Trang 10CHƯƠNG 1 – GIẢ SỬ TẬP DỮ LIỆU THỨ NHẤT
➢ ĐỀ BÀI : Khảo sát mức lương khởi điểm của sinh viên vừa ra trường của một lớp học gồm 65 sinh viên Kết quả được đánh số thứ tự như bảng sau
Giới tính W M M M W W W M M W M M W M M W W
Tiền lương 59 46 108 61 128 114 138 24 67 130 56 79 145 87 40 119 40 STT 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51
Giới tính M M W M M M W W W W M M W M M M W
Tiền lương 15 44 113 45 25 94 86 128 69 102 91 106 119 139 67 47 42 STT 52 53 54 55 56 57 58 59 60 61 62 63 64 65
Giới tính W W M M M W W W M M M W W M
Tiền lương 102 124 31 39 68 105 138 100 84 76 66 128 146 41
Trang 111.1 Câu 1 :
➢ Bảng phân bố tần số cho giới tính sinh viên bảng dữ liệu :
● Giới tính :
Số lượng nam giới trong lớp là : 37 M
Số lượng nữ giới trong lớp là : 28 W Tổng số lượng sinh viên là : 65 WM
Trang 12● Biểu đồ phân bố tần số giới tính :
Trang 13import matplotlib
from matplotlib import pyplot as plt
for idx,val in enumerate(data):
plt.title("Biểu đồ phân bố tần số giới tính",fontsize=14)
plt.ylabel("Số lượng người nam hoặc nữ",fontsize=12)
Trang 14● Tập dữ liệu tiền lương :
○ Bảng phân bố tần số của tập dữ liệu lương :
■ Giá trị tiền lương nhỏ nhất = 15
■ Giá trị tiền lương lớn nhất = 146
Trang 15○ Biểu đồ phân bố tần số của tập dữ liệu tiền lương khởi điểm :
■ Source code python :
Trang 16import matplotlib from matplotlib import pyplot as plt plt.hist(data,bins=[0,21,41,61,81,101,121,141,160],rwidth=0.9) plt.title("Biểu đồ phân bố tần số mức lương khởi điểm SV",fontsize = 14) plt.ylabel("Số lần xuất hiện",fontsize=12)
plt.xlabel("Khoảng giá trị mức lương",fontsize=12) plt.show()
○ Tính giá trị trung bình ( Mean )
■ Công thức tính giá trị trung bình :
Trung bình lương = 𝑙ươ𝑛𝑔1 + 𝑙ươ𝑛𝑔2 + … +𝑙ượ𝑛𝑔𝑁
𝑡ổ𝑛𝑔 𝑠ố 𝑙ượ𝑛𝑔 sinh 𝑣𝑖ê𝑛
=
27+61+52+69+88+85+99+90+77+145+41+83+140+74+143+131+34+59+46 +108+61+128+114+138+24+67+130+56+79+145+87+40+119+40+15+44+113
○ Tính giá trị trung vị ( Median )
Vị trí trung vị = 𝑆ố 𝑙ượ𝑛𝑔 sinh 𝑣𝑖ê𝑛
Trang 17○ Tìm giá trị xuất hiện nhiều nhất (Mode )
■ Giá Trị mode được định nghĩa là giá trị xuất hiện nhiều nhất trong tập
Trang 18+(102−84)2+(91−84)2+(106−84)2+(119−84)2+(139−84)2+(67−84)2+(47−84)2+(42−84)2+(102−84)2+(124−84) 2 +(31−84) 2 +(39−84) 2 +(68−84) 2 +(105−84) 2 +(138−84) 2 +(100−84) 2 +(84−84) 2
+(76−84)2+(66−84)2+(128−84)2+(146−84)2+(41−84)2
65
= 36.91153665809023
● Kết luận :
○ Vậy trung bình tiền lương sinh viên khi ra trường khởi điểm của sinh
viên vừa ra trường sẽ là 8.400.000 VNĐ
○ Vậy giá trị trung vị của tiền lương sinh viên chính là 8.400.000
VNĐ
○ Vậy giá trị xuất hiện nhiều nhất trong tập dữ liệu là 12.800.000 VNĐ
○ Vậy độ lệch chuẩn của tập dữ liệu lương khởi điểm sinh viên là
36.91153665809023 VNĐ
1.2 Câu 2 :
Sắp xếp tăng dần 3 số khác không, khác nhau và từ bên phải qua trong MSSV của bạn Gọi 3 số đó là abc với a<b<c Chọn ngẫu nhiên c sinh viên để phỏng vấn Tính xác suất để có
a) Có a sinh viên nam
b) Có ít nhất b sinh viên nữ
Ví dụ: Nếu mã số sinh viên của bạn là 64433550 thì a=3 b=4 c=5
MSSV : 52000216
Thì a = 1 , b = 2 , c = 6
Trang 19○ Phát biểu lại đề bài như sau :
Chọn ngẫu nhiên 6 sinh viên để phỏng vấn Tính xác suất để có :
a ) Có 1 sinh viên là nam
a Xác suất có 1 sinh viên là nam :
Gọi A là biến cố có « 1 sinh viên là nam khi lấy ra 6 sinh viên để phỏng vấn »
Công thức tính xác suất :
P(A) = 𝑛(𝐴)
𝑛(Ω)
Chọn ngẫu nhiên 1 sinh viên nam trong 37 SV nam của lớp : 𝐶371
Chọn ngẫu nhiên 5 sinh viên nữ trong 28 SV nữ của lớp : 𝐶285
Trang 20b Xác suất có ít nhất 2 sinh viên là nữ :
Gọi B là biến cố có « có ít nhất 2 sinh viên là nữ »
Công thức tính xác suất :
P(A) = 𝑛(𝐵)
𝑛(Ω)
Chọn ngẫu nhiên 4 sinh viên nam trong 37 SV nam của lớp : 𝐶374
Chọn ngẫu nhiên 2 sinh viên nữ trong 28 SV nữ của lớp : 𝐶282
Chọn ngẫu nhiên 3 sinh viên nam trong 37 SV nam của lớp : 𝐶373
Chọn ngẫu nhiên 3 sinh viên nữ trong 28 SV nữ của lớp : 𝐶283
Chọn ngẫu nhiên 2 sinh viên nam trong 37 SV nam của lớp : 𝐶372
Chọn ngẫu nhiên 4 sinh viên nữ trong 28 SV nữ của lớp : 𝐶284
Chọn ngẫu nhiên 1 sinh viên nam trong 37 SV nam của lớp : 𝐶371
Chọn ngẫu nhiên 5 sinh viên nữ trong 28 SV nữ của lớp : 𝐶285
Chọn ngẫu nhiên 0 sinh viên nam trong 37 SV nam của lớp : 𝐶370
Chọn ngẫu nhiên 6 sinh viên nữ trong 28 SV nữ của lớp : 𝐶286
Trang 21c Xem xét 01 chữ số cuối cùng khác không trong MSSV của bạn Nếu là
số chẵn thì giới tính được chọn là nữ, nếu là số lẻ thì giới tính được chọn
là nam Tính xác suất chọn được một bạn có mức lương cao hơn mức lương trung bình mà bạn đó có giới tính theo giới tính vừa được chọn
Ví dụ: Nếu mã số sinh viên của bạn là 64433550 thì số được chọn là 5 Vậy
giới tính được chọn là nam
Trang 22ác suất chọn được một bạn có mức lương cao hơn mức lương trung bình mà bạ
n đó có giới tính theo giới tính vừa được chọn :
■ MSSV = 52000216
● Số cuối = 6
○ Vậy giới tính được chọn là nữ
■ Đề bài được phát biểu lại như sau :
● Tính xác suất chọn được một bạn sinh viên nữ có mức lương cao hơn mức lương trung trình
Trang 23CHƯƠNG 3 – CƠ SỞ LÝ THUYẾT / NGHIÊN CỨU THỰC
Trang 24TÀI LIỆU THAM KHẢO
Tiếng Việt
1 Quách Ngọc Ân (1992), “Nhìn lại hai năm phát triển lúa lai”, Di tuyền học
ứng dụng, 98(1), tr 10-16
2 Bộ nông nghiệp & PTNT (1996), Báo cáo tổng kết 5 năm (1992-1996) phát
triển lúa lai, Hà Nội
3 Nguyễn Hữu Đống, Đào Thanh Bằng, Lâm Quang Dụ, Phan Đức Trực
(1997), Đột biến – Cơ sở lý luận và ứng dụng, Nhà xuất bản nông nghiệp,
Viện khoa học kỹ thuật nông nghiệp Việt Nam, Hà Nội
4 Nguyễn Thị Gấm (1996), Phát hiện và đánh giá một số dòng bất dục đực
cảm ứng nhiệt độ, Luận văn thạc sĩ khoa học nông nghiệp, Viện khoa học kỹ
thuật nông nghiệp Việt Nam, Hà Nội
………
23 Võ Thị Kim Huệ (2000), Nghiên cứu chẩn đoán và điều trị bệnh…, Luận án
Tiến sĩ y khoa, Trường đại học y Hà Nội, Hà Nội
Tiếng Anh
28 Anderson J.E (1985), The Relative Inefficiency of Quota, The Cheese Case,
American Economic Review, 75(1), pp 178-90
29 Borkakati R P.,Virmani S S (1997), Genetics of thermosensitive genic
male sterility in Rice, Euphytica 88, pp 1-7
30 Boulding K.E (1955), Economics Analysis, Hamish Hamilton, London
31 Burton G W (1988), “Cytoplasmic male-sterility in pearl millet
(penni-setum glaucum L.)”, Agronomic Journal 50, pp 230-231
32 Central Statistical Oraganisation (1995), Statistical Year Book, Beijing