Từ kết quả điều tra ban đầu này, chúng tôi thu hẹp câu hỏi nghiên cứu lại như sau: Môn SX – TK dạy ở Đại học Kinh tế TP.HCM đã cung cấp đủ kiến thức cho sinh viên để học có thể giải quy
Trang 1TẠO CỬ NHÂN KINH TẾ
LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH
Nguyễn Thùy Liên
VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ
Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán
Mã số: 60 14 01 11
LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS LÊ THỊ HOÀI CHÂU
Trang 3
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành nhất, sâu sắc nhất đến các Thầy, Cô Khoa Toán – Tin, lãnh đạo và các chuyên viên Phòng Sau đại học Trường Đại học Sư phạm thành phố Hồ Chí Minh đã giúp tôi hoàn thành chương trình học và luận văn này
Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS TS Lê Thị Hoài Châu Luận văn này sẽ không thể hoàn thành nếu không có sự hướng dẫn tận tình của Cô
Tôi cũng xin trân trọng cám ơn:
- PGS.TS Annie Bessot, TS Alain Birebent đã bỏ công từ Pháp sang Việt Nam để góp ý hướng nghiên cứu đề tài và giải đáp những thắc mắc trong nghiên cứu Didactic Toán cho chúng tôi
- Các thành viê n trong lớp Didactic Toán khóa 22 đã giúp đỡ tôi trong suốt khóa học
- Các thầy cô Khoa Toán – Thống kê, khoa Ngân hàng và các bạn sinh viên K38 trường Đại học Kinh tế TP.HCM đã giúp đỡ tôi rất nhiều trong vấn đề thực nghiệm của luận văn
C uối cùng, tôi muốn gửi lời cám ơn tới bố, mẹ và chồng tôi đã luôn động viên, khích lệ tôi hoàn thành luận văn này
Nguyễn Thùy Liên
Trang 4MỤC LỤC
LỜI CẢM ƠN 1
MỤC LỤC 2
DANH MỤC CÁC TỪ VIẾT TẮT 3
MỞ ĐẦU 4
1 Những ghi nhận ban đầu và câu hỏi xuất phát 4
2 Khung lý thuyết tham chiếu 7
3 Phương pháp nghiên cứu 9
CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG HAI GIÁO TRÌNH CHUYÊN NGÀNH 11
1.1 So sánh các mẫu dữ liệu thống kê 11
1.2 So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế 12
1.2.1 Phân tích giáo trình Phân tích và đầu tư chứng khoán 13
1.2.2 Phân tích giáo trình Kinh tế lượng 21
1.3 Tổng kết chương 1 29
CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG GIÁO TRÌNH XS – TK 31
2.1 Phân tích GT3 34
2.1.1 Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN 34
2.1.2 Giá trị trung bình, phương sai của tổng thể và mẫu 41
2.1.3 Hàm hồi qui 43
2.1.4 Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê 43
2.2 Tổng kết chương 2 48
CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM 51
3.1 Thực nghiệm 51
3.2 Phân tích tiên nghiệm 54
3.3 Phân tích hậu nghiệm 59
KẾT LUẬN 64
TÀI LIỆU THAM KHẢO 66
PHỤ LỤC 68
Trang 5DANH MỤC CÁC TỪ VIẾT TẮT
Trang 6MỞ ĐẦU
1 N hững ghi nhận ban đầu và câu hỏi xuất phát
Xác suất – Thống kê (XS – TK) là một khoa học nghiên cứu các đại lượng ngẫu nhiên nên đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của thế giới hiện đại, từ khoa học, công nghệ, đến kinh tế, chính trị,…Khoa học này trang bị cho chúng ta công cụ để tìm ra qui luật của những hiện tượng liên quan đến một tập hợp đông đảo các đối tượng mà ta chỉ
có thể tiếp cận một bộ phận của nó (gọi là mẫu thống kê) Chính vì vậy mà XS – TK là môn
học bắt buộc đối với sinh viên của tất cả các trường đại học, cao đẳng và hầu hết các trường đào tạo nghề trên cả nước Nhiệm vụ của môn học này là cung cấp cho sinh viên những kiến
thức liên quan đến XS – TK cũng như tạo cơ sở cho sinh viên học các bộ môn chuyên ngành khác
Tuy nhiên, trong nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam:
“Một nghiên cứu về dạy học xác suất trong đào tạo ngành Y”, các tác giả đã chỉ ra sự “thiếu sót” của chương trình dạy XS – TK trong các trường đào tạo ngành Y Nội dung chính của nghiên cứu trên bàn về việc dạy toán trong đào tạo ngành Y với nội dung xoay quanh mô hình ngưỡng P-K, một mô hình cho phép các bác sĩ quyết định xem bệnh nhân không cần điều trị, hay cần làm xét nghiệm, hay phải điều trị ngay Qua phân tích những kiểu nhiệm vụ liên quan đến mô hình ngưỡng được xem xét trong giáo trình XS – TK sử dụng ở trường Đại học Y-Dược thành phố Hồ Chí Minh, các tác giả nhận thấy:
“Kỹ thuật toán học cho phép giảm thiểu yếu tố chủ quan trong chẩn bệnh đã không được đưa vào trong giáo trình Hệ quả là sinh viên thiếu những kỹ thuật thỏa đáng để chẩn đoán và điều trị cho bệnh nhân tương lai của họ” (Lê Thị Hoài Châu - Đào Hồng Nam (2013))
Như vậy rõ ràng rằng, việc dạy học XS – TK trong trường đào tạo Y chưa thực sự cung cấp
đủ các công cụ toán cho hoạt động nghề nghiệp của các bác sĩ tương lai
Chính từ những kết quả nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam, chúng tôi đặt ra câu hỏi: Liệu trong các trường đào tạo nghề khác, chẳng hạn như trường
đào tạo kinh tế, thì XS – TK có cung cấp đủ kiến thức cho các môn chuyên ngành sử
d ụng hay không?
Trang 7Xuất phát từ câu hỏi này, chúng tôi đã tìm hiểu về việc dạy XS – TK trong các trường đào
tạo kinh tế Đối với các sinh viên ngành kinh tế, XS – TK thực sự là một công cụ nghiên
cứu rất hữu hiệu, giúp xử lý các thông tin kinh tế xã hội nhằm đưa ra các quyết định và dự báo đúng đắn, hợp lý Không những vậy, XS – TK còn cung cấp nền tảng khoa học cho sinh viên học các môn chuyên ngành Vì vậy, nếu xem xét giáo trình của nhiều môn học chuyên ngành kinh tế thì chúng ta sẽ thấy phương pháp và công cụ TK đã được vận dụng đan xen trong một số nội dung của những môn học này
Chẳng hạn, trong môn Phân tích và đầu tư chứng khoán, mức độ phân tán của lợi nhuận của một chứng khoán chính là mức độ rủi ro của chứng khoán đó Việc xem xét mức độ rủi ro của các chứng khoán có ý nghĩa rất quan trọng, giúp người đầu tư có thể đưa ra quyết định
có lợi nhất Chính vì vậy, để học tốt môn học này, sinh viên cần phải nắm bắt được khái niệm về tham số đo độ phân tán của tổng thể và cách so sánh độ phân tán của hai tổng thể ngay từ khi học môn XS – TK
Chúng tôi đã tiến hành khảo sát trên 118 sinh viên năm thứ hai Đại học Kinh tế TP.HCM Những sinh viên này đã học xong chương trình XS – TK và chuẩn bị thi phân ngành Câu hỏi khảo sát của chúng tôi như sau:
Bài 1: Một công ty sử dụng hai công nghệ khác nhau A và B để sản xuất Nhằm kiểm tra xem công nghệ nào cho sản lượng ổn định hơn, người ta ghi lại khối lượng sản phẩm (tấn) sản xuất ra sau mỗi ngày (khi sử dụng từng công nghệ trên) trong 60 ngày Số liệu thu được như sau:
Số ngày có cùng
sản lượng 1 4 16 13 12 5 7 2
Trang 8Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho kết luận của bạn
Thực chất, yêu cầu của bài toán chính là so sánh độ phân tán của hai tổng thể: tổng thể sản
lượng (thu được mỗi ngày) khi sử dụng công nghệ A và tổng thể sản lượng (thu được mỗi ngày) khi sử dụng công nghệ B Trong bài toán này chúng tôi đã cố ý chọn số liệu sao cho giá trị năng suất trung bình của công nghệ A lớn hơn năng suất trung bình công nghệ B và phương sai của công nghệ A lớn hơn phương sai của công nghệ B nhưng hệ số biến động của công nghệ A lại nhỏ hơn hệ số biến động của công nghệ B Như vậy, công nghệ A cho năng suất ổn định hơn
Tuy nhiên, kết quả khảo sát được thống kê trong bảng 1 khiến chúng tôi rất bất ngờ
Chiến lược
trả lời
Số sinh viên
Bảng 1 TK câu trả lời cho bài toán 1
Trong bảng 1, S1a là chiến lược giải sử dụng so sánh hai phương sai, cách giải này đưa ra
đáp án sai: “công nghệ B cho năng suất ổn định hơn” Trong khi đó, chiến lược giải cho đáp
án đúng là S1c và S1b thì có rất ít hoặc không có sinh viên nào sử dụng Từ kết quả điều tra
ban đầu này, chúng tôi thu hẹp câu hỏi nghiên cứu lại như sau: Môn SX – TK dạy ở Đại học
Kinh tế TP.HCM đã cung cấp đủ kiến thức cho sinh viên để học có thể giải quyết các vấn
đề của thực tiễn hay của chuyên ngành liên quan đến vấn đề so sánh các tham số của hai hay nhiều tổng thể chưa?
Từ những băn khoăn và nghi vấn trên, chúng tôi quyết định chọn đề tài: Vấn đề so sánh các
mẫu dữ liệu thống kê: Sự nối khớp giữa dạy học XS – TK với đào tạo cử nhân kinh tế
Trong khuôn khổ một luận văn thạc sỹ, chúng tôi giới hạn phạm vi nghiên cứu trên hai
phương diện Về phương diện các chuyên ngành kinh tế chúng tôi chọn môn Kinh tế lượng
và môn P hân tích và đầu tư chứng khoán để nghiên cứu Về phương diện khoa học XS - TK
Trang 9chúng tôi chọn đối tượng tri thức là “so sánh các mẫu dữ liệu TK” Ở đây, thuật ngữ “ so sánh các mẫu dữ liệu TK” được chúng tôi dùng theo nghĩa dự đoán về so sánh các tham số của các tổng thể dựa trên mẫu dữ liệu TK Những nghiên cứu của chúng tôi chỉ gói gọn trong phạm vi của thống kê mô tả mà không đi sâu vào thống kê suy diễn
Trong nghiên cứu của mình, chúng tôi sẽ tìm câu trả lời cho các câu hỏi sau:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý thuyết toán nào giải thích cho những phương pháp ấy?
Q2: Giáo trình XS – TK chu ẩn bị cho sinh viên ra sao để sinh viên có thể giải quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai giáo trình chuyên ngành đã đề cập tới?
Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần thiết cho chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu có thì sự khôngnối khớp đó ảnh hưởng đến sinh viên như thế nào?
2 Khung lý thuyết tham chiếu
Để tìm câu trả lời cho những câu hỏi trên, chúng tôi sẽ đặt nghiên cứu của mình trong phạm
vi của lý thuyết didactic toán, cụ thể là thuyết nhân học, khái niệm hợp đồng didactic, khái niệm qui tắc hành động Sau đây, chúng tôi sẽ chỉ ra sự lựa chọn của mình là hoàn toàn hợp
Chevallard đã dùng thuật ngữ quan hệ thể chế I với tri thức O, ký hiệu R(I,O), để chỉ tập
hợp các mối ràng buộc mà thể chế I có với tri thức O R(I,O) cho biết O xuất hiện ở đâu, bằng cách nào, tồn tại ra sao, đóng vai trò gì trong I, …
Trang 10Trong nghiên cứu của chúng tôi, đối tượng O ở đây là tri thức “so sánh các mẫu dữ liệu thống kê”, còn thể chế I mà chúng tôi quan tâm là thể chế dạy học các môn Kinh tế lượng,
Phân tích và đầu tư chứng khoán và Xác suất –Thống kê Việc nghiên cứu R(I,O) sẽ giúp chúng tôi hiểu rõ hơn những mối ràng buộc mà thể chế mang lại cho đối tượng tri thức O Như vậy, nghiên cứu R(I,O) sẽ giúp chúng tôi trả lời câu hỏi Q1 và Q2
2.1.2 Quan hệ cá nhân đối với một đối tượng tri thức
Một đối tượng là một cái gì đó tồn tại ít nhất đối với một cá nhân Quan hệ cá nhân của một
cá nhân X với một đối tượng tri thức O, ký hiệu R(X, O), là tập hợp những tác động qua lại
mà X có thể có với O R(X, O) cho biết X nghĩ gì về O, X hiểu như thế nào O, X có thể thao
tác O ra sao
Như vậy nghiên cứu R(X,O) sẽ giúp chúng tôi trả lời phần nào câu hỏi Q3 Ở đây O vẫn là đối tượng tri thức “so sánh các mẫu dữ liệu thống kê” còn X là sinh viên
2.1.3 Praxéologie
Vấn đề đặt ra là làm thế nào để vạch rõ quan hệ thể chế R(I,O) ?
Hoạt động nghiên cứu, dạy và học là một bộ phận của hoạt động xã hội Do đó, cũng cần thiết xây dựng một mô hình cho phép mô tả và nghiên cứu thực tế đó Xuất phát từ quan điểm này mà Chevallard (1998) đã đưa vào khái niệm praxéologie Khái niệm chính là “chìa khóa” giúp chúng ta làm rõ mối quan hệ I thể chế với tri thức O
Theo Chavallard, mỗi praxéologie là một bộ gồm 4 thành phần [T,τ ,θ,Θ], trong đó : T là một kiểu nhiệm vụ; τ là kỹ thuật cho phép giải quyết T; θ là công nghệ giải thích cho kỹ thuật τ ; Θ là lí thuyết giải thích cho θ
Nếu T là một kiểu nhiệm vụ toán học, thì praxéologie được gọi mà một tổ chức toán học và
viết là OM Trong trường hợp này, khối công nghệ - lí thuyết chỉ bao gồm những tri thức toán học
Việc xác định các praxéologie gắn với đối tượng O sẽ cho phép chúng tôi: vạch rõ các quan
hệ thể chế R (I,O), đồng thời tìm ra sự chênh lệch nếu có giữa những praxéologie cần dạy và được dạy Từ đó, chúng tôi sẽ tìm được câu trả lời cho Q1, Q2 và một phần Q3
2.2 Khái niệm qui tắc hành động và hợp đồng dạy học
Trang 11Để làm rõ những qui tắc ứng xử của học sinh đối với đối tượng tri thức “so sánh các mẫu dữ liệu thống kê”, chúng tôi sử dụng khái niệm qui tắc hành động và hợp đồng dạy học:
“Một qui tắc hành động là một mô hình được xây dựng nhằm giải thích và chỉ rõ những kiến thức mà học sinh đã sử dụng để đưa ra câu trả lời khi thực hiện một nhiệm vụ xác định.” (Bessot và các tác giả (2009), tr.81)
“Ta nói hợp đồng dạy học là tập hợp những qui tắc phân chia và hạn chế trách nhiệm của mỗi bên, học sinh và giáo viên, đối với mỗi tri thức toán được giảng dạy.” (Bessot và các tác giả (2009), tr.81)
Chính vì khái niệm hợp đồng và khái niệm qui tắc hành động cho phép ta “giải mã” các ứng
xử của sinh viên và tìm ra ý nghĩa thực sự của những hoạt động mà họ tiến hành nên chúng tôi cho rằng cần thiết phải làm rõ các quy tắc hành động hay quy tắc của hợp đồng (nếu có) liên quan đến so sánh các mẫu dữ liệu thống kê để trả lời cho những câu hỏi Q3 mà chúng tôi đưa
ra
3 P hương pháp nghiên cứu
Để tìm câu trả lời thỏa đáng cho những câu hỏi đã đặt ra, chúng tôi xác định phương pháp nghiên cứu như sau:
- Đối với câu hỏi Q1: Chúng tôi sẽ tham khảo hai giáo trình chuyên ngành được sử dụng trong các trường đào tạo cử nhân kinh tế nhằm tìm hiểu xem những vấn đề nào làm nảy sinh nhu cầu so sánh các mẫu dữ liệu thống kê Đồng thời, chúng tôi cũng chỉ ra các praxéologie
có liên quan đến so sánh các mẫu dữ liệu thống kê, nghiên cứu các kĩ thuật giải quyết cũng như công nghệ và lý thuyết giải thích cho kĩ thuật đó, trong đó chúng tôi chú ý đến các yếu
tố công nghệ thuộc về toán học Các praxeologie này sẽ giúp chúng tôi hiểu rõ hơn mối quan hệ thể chế (thể chế dạy học Phân tích và đầu tư chứng khoán và thể chế dạy học Kinh
tế lượng) với đối tượng tri thức so sánh các mẫu dữ liệu thống kê Toàn bộ phần nghiên cứu này sẽ được trình bày trong chương 1 của luận văn
- Tiếp theo, để trả lời cho câu hỏi Q2, chúng tôi sẽ tiến hành phân tích giáo trình XS – TK
để xem xét những đối tượng toán học liên quan đến các tổ chức toán học tìm được ở Q1 được trình bày như thế nào? Xoay quanh các đối tượng đó, có các praxéologie nào?
Trang 12Từ đó chúng tôi sẽ so sánh những gì nghiên cứu được ở Q1 và Q2 để tìm ra câu trả lời cho Q3
Trang 13CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
HAI GIÁO TRÌNH CHUYÊN NGÀNH
Nội dung chính của chương 1 xoay quanh vấn đề “so sánh các mẫu dữ liệu thống kê” được trình bày trong hai giáo trình chuyên ngành kinh tế Những phân tích thể chế dạy học hai môn chuyên ngành này sẽ giúp chúng tôi trả lời câu hỏi Q1:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý thuyết toán nào giải thích cho những phương pháp ấy?
1.1 So sánh các mẫu dữ liệu thống kê
“So sánh các mẫu dữ liệu thống kê” là thuật ngữ viết tắt chúng tôi dùng để chỉ việc so sánh
tham số của các tổng thể khác nhau dựa trên những mẫu thu được
Việc so sánh tham số của các tổng thể giúp người ta đưa ra những đánh giá về những tổng thể đó và từ đó có thể đưa ra được kế hoạch phù hợp cho công việc của họ
Chẳng hạn một công ty muốn mở thêm chi nhánh kinh doanh Công ty này đi khảo sát thị trường tại hai khu vực A và B về mức thu nhập của người dân Tại khu vực A họ thu được mẫu A1, tại khu vực B họ thu được mẫu B1 Từ hai mẫu này họ xem xét, đưa ra đánh giá về thu nhập bình quân của hai khu vực A và B xem bên nào cao hơn, sau đó kiểm định lại kết quả Khi đã có được kết luận với độ tin cậy cao, công ty sẽ đưa ra quyết định phù hợp là mở chi nhánh tại khu vực A hay B
Trên thực tế, chúng ta có thể thấy việc sử dụng tham số trung bình của các tổng thể để so sánh được sử dụng rất phổ biến như: so sánh nhiệt độ trung bình, lượng mưa trung bình giữa các vùng; so sánh lương trung bình của công nhân giữa các công xưởng; so sánh năng suất cây trồng giữa các vùng,…Tuy nhiên số trung bình không phải là tham số duy nhất của tổng thể mà ngoài ra còn có những tham số khác như số trung vị, mốt, phương sai, độ lệch chuẩn,
độ lệch tuyệt đối trung bình,…Các tham số này đều có tác dụng giúp người ta đánh giá tốt hơn về các tổng thể
Trang 141.2 So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế
Để trả lời cho câu hỏi Q1, chúng tôi sẽ chọn ra một số giáo trình chuyên ngành hoặc cơ sở ngành có ứng dụng nhiều công cụ và kiến thức của XS –TK để phân tích Bởi nếu chọn một giáo trình hoàn toàn không liên quan gì tới XS – TK để phân tích thì kết quả có được sẽ không có giá trị Thông qua tìm hiểu các giáo trình của trường Đại học Kinh tế TP.HCM cũng như tham khảo ý kiến của một số giảng viên, chúng tôi đã tìm ra một số giáo trình thỏa mãn yêu cầu Tuy nhiên do thời gian nghiên cứu có hạn, không cho phép phân tích hết những giáo trình tìm được nên chúng tôi quyết định chọn ra hai giáo trình sau để phân tích:
- Phân tích và đầu tư chứng khoán
- Giáo trình Kinh tế lượng
Chúng tôi xin trích dẫn một số nhận xét về hai bộ môn này:
“Kinh tế lượng cung cấp các phương pháp phân tích về mặt lượng mối quan hệ giữa các chỉ tiêu kinh tế cùng với sự tác động qua lại giữa chúng dựa trên cơ sở các số liệu thu thập từ thực tế nhằm củng cố thêm các giả thiết kinh tế từ đó đưa ra các quyết định đúng đắn hơn”
(Hoàng Ngọc Nhậm (2008), tr 3)
“Dù rằng thị trường chứng khoán là một đối tượng hết sức phức tạp, diễn biến tăng giảm của nó rất khó dự báo Nhưng các nhà kinh tế cùng với các nhà toán học đã cố gắng sử dụng các công cụ của toán học, đặc biệt là các công cụ của Xác suất – Thống kê để mô hình hóa thị trường chứng khoán Việc áp dụng các mô hình đó giúp các nhà đầu tư tối đa hóa
các cơ hội đạt lợi nhuận và tối thiểu hóa các nguy cơ rủi ro” (Đặng Hùng Thắng (2007))
Ý kiến trên cho thấy mối liên hệ mật thiết giữa XS-TK với hai môn chuyên ngành kinh tế
Do đó, chúng tôi mong đợi sẽ tìm thấy những vấn đề làm nảy sinh nhu cầu so sánh các mẫu
dữ liệu thống kê, trong hai giáo trình được sử dụng trong dạy học hai môn chuyên ngành mà chúng tôi quan tâm Đồng thời, chúng tôi sẽ chỉ ra những praxéologie có liên quan nhằm hiểu rõ hơn mối quan hệ thể chế đối với tri thức so sánh các mẫu dữ liệu thống kê: tri thức
so sánh các mẫu dữ liệu thống kê tồn tại như thế nào, có vai trò gì, chịu những ràng buộc nào của thể chế? Từ đó, chúng tôi sẽ tìm được những “yếu tố” toán thống kê mà thể chế dạy học hai môn chuyên ngành đưa ra để giải quyết các vấn đề liên quan đến so sánh các mẫu
dữ liệu thống kê Đó cũng chính là những “yếu tố” toán cần thiết phải được cung cấp trong môn học XS – TK
Trang 15Để trả lời câu hỏi Q1đã đặt ra, chúng tôi sẽ cố gắng tìm câu trả lời cho các câu hỏi sau:
- So sánh các mẫu dữ liệu thống kê được sử dụng trong những vấn đề nào?
- Có những praxéologie nào liên quan đến so sánh các mẫu dữ liệu TK? Kĩ thuật giải quyết chúng là gì? Yếu tố công nghệ và lý thuyết nào giải thích cho kĩ thuật đó?
1.2.1 Phân tích giáo trình Phân tích và đầu tư chứng khoán
Trong phần này chúng tôi sẽ tham khảo tài liệu sau:
[1] Bùi Kim Yến – Thân Thị Thu Thủy (2009), Phân tích và đầu tư chứng khoán, Nxb
Thống kê
Đây là giáo trình được sử dụng trong trường đại học kinh tế TP.HCM Để thuận tiện cho việc trình bày, chúng tôi sẽ ký hiệu giáo trình này là GT1
Trong giáo trình này, chúng tôi tập trung vào chương II: Mức sinh lời và rủi ro trong đầu
tư chứng khoán Trong chương này, các vấn đề chính đều xoay quanh việc sử dụng tham số
của đại lượng ngẫu nhiên (ĐLNN) cũng như so sánh các tham số này để tìm câu trả lời cho những câu hỏi có liên quan đến đầu tư chứng khoán
Đối với một thị trường đầu tư phức tạp và đầy biến động như thị trường chứng khoán, các nhà phân tích phải nắm được những kiến thức cơ bản về lợi nhuận và rủi ro Chương này cung cấp cho sinh viên các vấn đề xoay quanh mức sinh lời và rủi ro, đưa ra cách tính mức sinh lời, cách tính và đánh giá độ rủi ro của dự án
Trong mỗi dự án đầu tư chứng khoán, người ta thường phải dự đoán trước lợi nhuận, tức là ước lượng xem đầu tư vào dự án đó sẽ mang lại lợi nhuận là bao nhiêu phần trăm trên 1 đồng vốn đầu tư Khi đó, nhà phân tích sẽ phải tìm ra các mức sinh
lời0
1của mỗi loại chứng khoán - bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá
mua chứng khoán, cũng như xác suất của mỗi mức sinh lời để từ đó tính ra mức sinh lời kỳ
vọng Chính mức sinh lời kỳ vọng là lợi nhuận mà người ta dự tính sẽ thu được:
1
Mức sinh lời: bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá mua chứng khoán Còn tỷ lệ lợi tức năm là
Trang 16“Các dự án đầu tư khác nhau sẽ có mức sinh lời kỳ vọng khác nhau Chúng khác nhau vì hiệu quả kinh tế của từng dự án cụ thể, cũng như môi trường đầu tư Trong tương lai không thể biết chắc được nền kinh tế sẽ như thế nào, nên các nhà phân tích sẽ tìm ra một xác suất để xảy
ra một tình trạng kinh tế nào đó
Mức sinh lời kỳ vọng dựa trên xác suất của từng tình trạng kinh doanh
i i
k =∑Pk
Trong đó: ki: mức sinh lời; pi: xác suất xảy ra” (GT1, tr.58)
Trong khi đó, rủi ro:
“là khả năng mức sinh lời thực tế nhận được trong tương lai có thể khác với dự tính ban đầu
Độ dao động của lợi suất đầu tư1
2càng cao thì rủi ro càng cao” (GT1, tr.49)
Mức độ rủi ro của dự án được đo bằng phương sai, độ lệch chuẩn hoặc hệ số biến động:
“Để đo lường rủi ro trong mức sinh lời của một loại chứng khoán, đó là tính toán mức dao động trong mức sinh lời bằng cách sử dụng thước đo phương sai (variance) và độ lệch chuẩn (standard deviation)” (GT1, tr.60)
“Một cách đo lường mức độ rủi ro của các phương án khác nữa, là dùng hệ số biến động
Hệ số biến động được tính bằng cách lấy độ lệch tiêu chuẩn chia cho lãi suất mong đợi của phương án đầu tư
2 Lợi suất đầu tư: Là phần trăm (%) chênh lệch giữa thu nhập từ chứng khoán có được sau một khoảng thời gian
(thường là một năm) và khoản vốn đầu tư ban đầu Lợi suất của chứng khoán bắt nguồn từ hai nguồn thu nhập:
- Lãi định kỳ (cổ tức, trái tức)
- Lãi vốn (chênh lệch giá bán và giá mua)
Trang 17“Hệ số biến động chỉ mức độ rủi ro trên một đơn vị của lợi tức, nó cung cấp sự so sánh chính xác hơn trong trường hợp lãi suất mong đợi của hai phương án không như nhau.”
(GT1, tr.63)
Phương sai, độ lệch chuẩn và hệ số biến động đều là những tham số mô tả mức độ phân tán của các giá trị của một đại lượng ngẫu nhiên (tổng thể) quanh kỳ vọng (giá trị trung bình) Như vậy phương sai, độ lệch chuẩn hay hệ số biến động của các phương án đầu tư chứng khoán phản ánh mức độ phân tán của những giá trị lợi nhuận quanh lợi nhuận kỳ vọng Mức
độ phân tán này cho chúng ta biết mức độ chênh lệch có thể có giữa lợi nhuận thực tế với lợi nhuận mong đợi (lợi nhuận kỳ vọng) Cũng vì vậy mà những tham số này được sử dụng để
đo mức độ rủi ro của các phương án đầu tư chứng khoán
Để sinh viên hiểu rõ hơn về lợi nhuận và rủi ro, tác giả lấy hai ví dụ minh họa Đặc biệt, hai
ví dụ này có liên quan đến việc đánh giá rủi ro của các phương án đầu tư chứng khoán Việc đánh giá rủi ro thực sự rất cần thiết đối với mỗi nhà đầu tư Vì vậy, tác giả rất chú trọng tới vấn đề này trong giáo trình
Với ví dụ trang 58 của GT1, chúng tôi thấy xuất hiện một vấn đề liên quan đến so sánh các tham số của hai tổng thể:
“Ví dụ: Công ty Bưu Chính Viễn Thông hiện đang sử dụng mạng lưới “điện thoại tiêu chuẩn” Công ty đang nghiên cứu một đề án mạng lưới “điện thoại kiểu mới” Các chuyên viên tiếp thị của công ty cho rằng việc sử dụng mạng lưới mới sẽ mang lại lợi nhuận cao hơn trong các thời kỳ cao điểm và trung bình, nhưng trong thời kỳ khó khăn, khách hàng sẽ tiêu thụ ít hơn và mạng lưới mới dự đoán sẽ không mang lại lợi nhuận Trước khi quyết định đầu
tư, các nhà nghiên cứu thị trường của công ty cần xác định rủi ro và lợi nhuận của hai phương
Trang 18Phát đạt
Bình thường
Khó khăn
0,3 0,4 0,3 - 1,0
“Pilà khả năng xảy ra (xác suất) của các tình trạn kinh tế
kilà suất lợi nhuận dự đoán cho từng thời kỳ kinh tế
Thì k là tỷ lệ lãi suất mong đợi (trung bình)
1
n
i i i
k Pk
=
=∑ ” (GT1, tr.60)
Sau đó, lợi nhuận mong đợi của hai phương án được tính như sau:
“Đối với phương án mạng lưới điện thoại mới:
Trang 19%) 10 ( 3 0
%) 15 ( 4 0
%) 20 ( 3
Chúng ta có thể thấy k của hai phương án tính ra đều bằng nhau nên lợi nhuận mong đợi
của hai phương án là như nhau
Sau khi tính lợi nhuận kỳ vọng của hai phương án, tác giả nhắc lại cách tính phương sai, độ lệch chuẩn cho sinh viên:
“- Tính tỷ suất lãi mong đợi (k) […]
- Tính độ lệch giữa lãi suất của từng trường hợp và tỷ suất lãi mong đợi
(7725)(0,3)=2167,5 0.(0,4) = 0
(7725)(0,3)=2167,5 Phương sai δ2
=4435,0
Độ lệch tiêu chuẩn: δ =65,84%
**Mạng lưới điện thoại tiêu chuẩn:
Trang 20(25)(0,3) = 7,5 0.(0,4) = 0 (25)(0,3)= 7,5 Phương sai δ2=15,0
Độ lệch tiêu chuẩn: δ =3,87%” (GT1, tr.62)
Từ những kết quả tính toán lợi nhuận kỳ vọng và độ lệch chuẩn, tác giả kết luận:
“Phương án mạng lưới tiêu chuẩn với độ lệch tiêu chuẩn 3,87% nhỏ hơn nhiều so với độ lệch tiêu chuẩn của phương án đầu tư mới 65,84% Điều đó dẫn đến khả năng rủi ro của phương án mạng lưới tiêu chuẩn thấp hơn so với phương án mới, và có thể nói phương án mạng lưới tiêu chuẩn là rất ít có rủi ro” (GT1, tr.62)
chuẩn) lớn hơn sẽ có độ phân tán các giá trị quanh kỳ vọng lớn hơn
Trong ví dụ trên, hai phương án đầu tư có lợi nhuận kỳ vọng bằng nhau, tác giả so sánh hai
độ lệch chuẩn để kết luận về độ rủi ro của hai phương án Vậy đối với hai phương án mà lợi nhuận kỳ vọng khác nhau thì sao? Trong trường hợp này thì việc so sánh hai độ lệch chuẩn không còn phù hợp nữa, người ta phải sử dụng đến hệ số biến động CV:
“Sau đây chúng ta xét đến 2 dự án đầu tư khác A và B, cả 2 có lãi suất mong đợi khác nhau và
độ lệch tiêu chuẩn cũng khác nhau
chính xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B
Hợp lý hơn ta tính hệ số biến động (CV)
Trang 21Đối với các dự án có mức sinh lời khác nhau thì người ta phải sử dụng tới hệ số biến động
để đo mức độ rủi ro trên 1 % lãi suất mong đợi Ví dụ trên thực chất là một bài tập so sánh
độ phân tán của hai đại lượng ngẫu nhiên (hay hai tổng thể) khi giá trị kỳ vọng (trung bình) khác nhau Trong trường hợp này, so sánh trực tiếp bằng phương sai hay độ lệch chuẩn sẽ không mang lại cho chúng ta kết quả chính xác nữa Chúng ta có thể thấy tác giả đã nhấn mạnh:
“Nếu nhìn vào độ lệch tiêu chuẩn δB <δA và ta chọn phương án B là hoàn toàn không chính
xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B” (GT1, tr.64)
Như vậy, đối với trường hợp này, để xem xét mức độ chênh lệch các giá trị của mỗi ĐLNN quanh kỳ vọng ta phải sử dụng tới hệ số biến động CV Nếu so sánh bằng hai phương sai sẽ dẫn tới kết quả không chính xác
Thông qua hai ví dụ trên, tác giả tổng kết lại phương pháp giúp sinh viên so sánh rủi ro của các phương án đầu tư như sau:
“Tóm tắt:
Để đo lường mức độ rủi ro của các phương án đầu tư:
- So sánh hai phương án có cùng tỷ suất lãi mong đợi, phương án nào có độ lệch tiêu chuẩn (δ ) lớn hơn, phương án đó mang tính rủi ro cao hơn
- So sánh hai phương án có tỷ suất lãi mong đợi khác nhau, tính hai hệ số biến động Phương án nào có hệ số biến động cao hơn, phương án đó nhiều rủi ro hơn.” (GT1, tr.64)
Qua hai ví dụ và phần tóm tắt của giáo trình, một tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê đã xuất hiện:
Trang 22Kiểu nhiệm vụ TSSDLC&CV 2
3 : so sánh độ phân tán của hai đại lượng ngẫu nhiên (hay hai tổng thể)
Kĩ thuật τSSDLC& CV để giải quyết TSSDLC&CV
• B1: Tính mức sinh lời kỳ vọng của mỗi dự án:
1
n
i i i
k Pk
=
Pilà khả năng xảy ra (xác suất) của các tình trạng kinh tế
kilà suất lợi nhuận dự đoán cho từng thời kỳ kinh tế
* Nếu mức sinh lời kỳ vọng của các dự án bằng nhau, so sánh độ lệch chuẩn các dự
án, độ lệch chuẩn của dự án càng cao thì rủi ro càng cao
* Nếu mức sinh lời kỳ vọng của các dự án khác nhau:
- Tính hệ số biến động của mỗi dự án: CV=k
δ
- So sánh các hệ số biến động của các dự án, hệ số biến động càng cao thì rủi ro
càng cao
Vậy công nghệ θSSDLC& CV:
- Công thức tính kỳ vọng và độ lệch chuẩn của ĐLNN X (với X là lợi suất hay lãi suất)
- Ý nghĩa của độ lệch chuẩn
- Ý nghĩa của hệ số biến động
Trang 231.2.2 Phân tích giáo trình K inh tế lượng
Trong phần phân tích này chúng tôi sử dụng tài liệu sau: Hoàng Ngọc Nhậm (chủ biên)
(2008), Giáo trình kinh tế lượng, Nxb Lao động - Xã hội Trong phần tiếp theo chúng tôi sẽ
dung ký hiệu GT2 để chỉ tài liệu này
Kinh tế lượng là một bộ môn cung cấp cho sinh viên phương pháp phân tích về mặt lượng mối quan hệ giữa các chỉ tiêu kinh tế dựa trên những số liệu thu thập được Ngoài việc giới
thiệu các mô hình hồi qui cơ bản như hồi qui với hai biến, hồi qui bội, GT2 còn đưa vào một
số môt hình hồi qui khác bao gồm hồi qui với biến giả, đa cộng tuyến,… Trong những mô hình hồi qui đó, chúng tôi rất chú ý đến mô hình hồi qui với biến giả bởi vì mô hình này cho phép người ta xem xét mối liên hệ giữa các biến định tính với các biến định lượng Các biến định tính thường nhận các giá trị (phạm trù) là có tính chất nào đó hay không có, hoặc các mức độ khác nhau của một tiêu thức nào đó, chẳng hạn như biến định tính giới tính có 2 phạm trù là nam và nữ,…Trong khi đó, các mô hình hồi qui 2 biến cơ bản hay các mô hình hồi qui bội chỉ nghiên cứu trên các biến định lượng Chính vì vậy, người ta phải dùng tới mô hình hồi qui với biến giả Mô hình này được xây dựng bằng cách “lượng” hóa các biến định tính Chẳng hạn, nếu biến định tính là giới tính nhận hai giá trị (phạm trù) là nam và nữ thì người ta sẽ thay biến này bằng một biến rời rạc nhận hai giá trị là 0 và 1 với 0 là giới tính nam, 1 là giới tính nữ Khi đó, biến định tính đã được thay thế bằng biến định lượng, từ đó
có thể xây dựng được các mô hình giúp chúng ta xem xét mối liên hệ giữa biến định tính với các biến định lượng Điều đặc biệt nữa là, mô hình hồi qui với biến giả có thể được ứng dụng để giải quyết các bài toán liên quan đến so sánh các tham số của hai tổng thể
Chúng ta hãy quan sát ví dụ trang 109:
“Giả sử một công ty sử dụng 2 công nghệ sản xuất (kí hiệu là công nghệ A và công nghệ B) Năng suất của mỗi công nghệ là đại lượng ngẫu nhiên phân phối theo qui luật chuẩn có phương sai bằng nhau nhưng kì vọng toán học khác nhau Để nghiên cứu về năng suất của công ty này chúng ta có thể sử dụng mô hình hồi qui:
Y =β β+ D +U (5.1)
Trong đó : Y là năng suất; D là biến giả, D nhận một trong hai giá trị:0 hoặc 1:
Di = 1 nếu năng suất là của công nghệ A
Trang 24Di = 0 nếu năng suất là của công nghệ B
Mô hình (5.1) giống như mô hình hồi qui 2 biến mà chúng ta đã nghiên cứu ở phần trước, chỉ khác là biến số lượng X được thay bằng biến giả D”
(GT2, tr.109)
GT2 nhấn mạnh rằng:
“Dùng mô hình này chúng ta có thể biết được năng suất trung bình của công nghệ A có khác với năng suất trung bình của công nghệ B hay không” (GT2, tr.110)
Điều này được giải thích như sau:
Nếu sử dụng công nghệ sản xuất B thì E(Yi/Di = 0)= β1
Nếu sử dụng công nghệ sản xuất A thì E(Yi/Di =1)= β β1+ 2
Do đó, ý nghĩa của hệ số β2trong mô hình:
“β2 phản ánh mức chênh lệch về năng suất trung bình giữa công nghệ B và công nghệ A” (GT2, tr.110)
Cách tính các hệ số của mô hình này cũng giống như đối với mô hình hồi qui hai biến mà tác giả đã trình bày ở phần trước:
“Mô hình (5.1) giống như mô hình hồi qui hai biến mà chúng ta đã nghiên cứu ở phần trước, chỉ khác là biến số lượng X được thay bằng biến giả D” (GT2, tr.110)
Nhờ ý nghĩa của hệ số β2 mà mô hình hồi qui với biến giả có thể sử dụng để so sánh năng suất trung bình của hai công nghệ A và B
Tương tự như vậy, mô hình hồi qui với biến giả cũng được sử dụng để xem xét sự khác nhau giữa năng suất trung bình của 3 công nghệ A, B, C
“Trong trường hợp này ta sử dụng 2 biến giả D1 và D2và mô hình hồi qui sẽ là:
Trang 25D = 0 nếu năng suất của công nghệ khác
Khi D 1i =1 và D 2i = 0 thì (5.2) biểu thị năng suất của công nghệ A
Khi D 1i = 0 và D 2i = 1 thì (5.2) biểu thị năng suất của công nghệ B
Khi D 1i = 0 và D 2i = 0 thì (5.2) biểu thị năng suất của công nghệ C”
Hơn nữa, tác giả nhấn mạnh ý nghĩa của các hệ số trong mô hình hồi qui như sau:
“β2 biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ A
Trang 26Ta xét ví dụ trang 115 của GT2: Xem xét thu nhập hàng năm của giáo viên theo thâm niên
và nơi giảng dạy Biến thâm niên là biến định lượng còn biến nơi giảng dạy là biến định tính với 3 phạm trù: thành phố, đồng bằng, miền núi
Mô hình hồi qui được sử dụng:
D = 0 nếu giáo viên ở nơi khác
(người ta đã chọn giáo viên giảng ở miền núi làm phạm trù cơ sở)
Khi đó, thu nhập của giáo viên ở miền núi:
“Sau khi ước lượng hàm hồi qui (5.14), chúng ta sẽ biết được mức chênh lệch về thu nhập của giáo viên phổ thông trung học ở thành phố và đồng bằng so với giáo viên công tác ở miền núi” (GT2, tr.116)
Trang 27Đối với trường hợp biến phụ thuộc Y chịu ảnh hưởng của nhiều biến định tính thì khi đó số biến giả được đưa vào mô hình được tính bằng công thức tổng quát sau:
Trong đó: n là số biến giả được đưa vào mô hình; k là số biến định tính; ni là số mức độ (số phạm trù) của biến định tính thứ i” (GT2, tr.116)
Để minh họa cho mô hình hồi qui với nhiều biến định tính, tác giả đưa vào ví dụ xét thu nhập của giáo viên phổ thông dựa vào thâm niên giảng dạy; khu vực giảng dạy (đồng bằng, thành phố, miền núi) và môn giảng dạy (tự nhiên, xã hội, anh văn)
Dựa vào công thức trên, ta có số lượng biến giả đưa vào là n = (3-1) + (3-1) = 4
Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm)
X là thâm niên giảng dạy
D1i = 1 nếu giáo viên giảng dạy ở thành phố
D1i = 0 nếu giáo viên giảng dạy ở nơi khác
D2i = 1 nếu giáo viên giảng dạy ở đồng bằng
D2i = 0 nếu giáo viên giảng dạy ở nơi khác
D3i = 1 nếu giáo viên giảng dạy các môn tự nhiên
D3i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác
D4i = 1 nếu giáo viên giảng dạy các môn xã hội
D4i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác.” (GT2, tr.117)
Trong mô hình trên, GT2 đã chọn phạm trù khu vực miền núi và phạm trù môn giảng dạy là anh văn làm những phạm trù cơ sở
Mô hình trên cho phép ước lượng thu nhập của giáo viên khi biết thâm niên, khu vực và môn giảng dạy Chính vì vậy, dựa vào mô hình hồi qui trên chúng ta có thể so sánh được mức lương bình quân của một giáo viên có thâm niên Xi ở đồng bằng và thành phố so với miền núi, dạy môn tự nhiên và xã hội so với môn tiếng Anh
Qua một vài ví dụ về các mô hình hồi qui với biến giả mà giáo trình giới thiệu cho sinh viên, chúng ta có thể thấy mô hình hồi quy với biến giả có thể giúp xem xét sự khác nhau
Trang 28giữa năng suất trung bình của các công nghệ sản xuất, xem xét sự khác nhau giữa thu nhập của giáo viên giữa nhiều khu vực, hay giữa nhiều nhóm chuyên ngành với nhau Nói một cách khác, mô hình hồi qui với biến giả cho phép chúng ta so sánh tham số trung bình của các tổng thể từ những mẫu thu được Từ đó, chúng tôi đã chỉ ra được một praxéologie - trong đó các nhiệm vụ đều liên quan đến so sánh tham số trung bình của các tổng thể như sau:
1 Kiểu nhiệm vụ T SSTB1 : So sánh trung bình của hai tổng thể A, B
Kĩ thuật τ1SSTB:
- Tìm hàm hồi qui
E(Y/D) : Y i =β β1+ 2D i + (DU i i= 1 ứng với giá trị quan sát thuộc tổng thể A, Di
= 0 ứng với giá trị quan sát thuộc tổng thể B)
- Cách lượng hóa biến định tính bằng cách sử dụng biến giả Di
- Mô hình hồi qui với 1 biến định tính có 2 phạm trù :
E(Y/D) : Y i =β β1+ 2D i + trong đó DU i ilà biến giả
- β2 phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể
B
Lý thuyếtΘ1SSTB:
“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)
Trang 29Cụ thể hơn, dựa vào mô hình Y i =β β1+ 2D i + (trong đó DU i ilà biến giả xác định như trên)
ta tính được giá trị trung bình của hai tổng thể như sau :
Giá trị trung bình của tổng thể A
E(Y/D = 1) = β1 + β2
Giá trị trung bình của tổng thể B
E(Y/D = 1) = β1
Như vậy β2 phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể B
Ví dụ minh họa cho kiểu nhiệm vụ 1
b) Cho biết ý nghĩa của các hệ số hồi qui α1; α2” (GT2, tr.127-128)
Lời giải bài toán trên, chúng tôi tham khảo trong cuốn Bài tập Kinh tế lượng với sự trợ giúp của Eviews do tác giả Nguyễn Thị Ngọc Thanh chủ biên
“a) Hàm hồi qui tuyến tính mẫu của Y theo X:
Trang 30( ) ( )
)0000,0()
000,0()000,0(
81,33019
,1888
,50
9455,0
;9484,0
;534483,
167241,
R R
000,0()000,0(
81,330);
32,0()68,17(05,45
9427,0
;9487,0
;0973324,
0532805
,160562,
−
=
p
F t
R R
D X
b) α1 = − 1 , 532805cho biết khi giá bán tăng (hay giảm) 1 ngàn đ/kg thì lượng hàng bán được trung bình của mặt hàng này sẽ giảm (hoặc tăng) 1,533 tấn/tháng
097332 ,
0
α cho biết: Với giá bán như nhau, lượng hàng bán được trung bình ở thành
phố cao hơn ở nông thôn 0,09733 tấn/tháng.” (Nguyễn Thị Ngọc Thanh (2009), tr.88-89)
2 Kiểu nhiệm vụ 2
SSTB
T : So sánh trung bình của ba tổng thể A, B, C
Kĩ thuật τSSTB2 : (được tìm thấy thông qua thí dụ tr 110)
- Tìm hàm hồi qui E(Y/D) : Yi = β β1+ 2D1i +β3D2i + U i
(Trong đó D 1i = 1 nếu giá trị quan sát thuộc tổng thể A ; D 1i = 0 nếu giá trị quan sát thuộc tổng thể khác ; D 2i = 1 nếu giá trị quan sát thuộc tổng thể B ; D 2i = 0 nếu giá trị quan sát thuộc tổng thể khác)
Trang 31Công nghệ θSSTB2 :
- Cách lượng hóa biến định tính bằng cách sử dụng biến giả D1i và D2i
- Hàm hồi qui với biến định tính có 3 phạm trù:
E(Y/D) : Yi = β β1+ 2D1i +β3D2i + và các giá trị p tương ứng với các hệ số (Trong U i
đó D ; 1i D 2i là hai biến giả)
β2 biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể A
β3 biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể B
quả chính của chương 1:
• Đối với GT1
So sánh tham số của hai tổng thể xuất hiện trong bài toán so sánh rủi ro của hai phương án đầu tư chứng khoán Thực chất, đây chính là bài toán so sánh độ phân tán của hai tổng thể GT1 đưa ra kĩ thuật so sánh như sau:
- So sánh phương sai hoặc độ lệch chuẩn của hai tổng thể khi hai tổng thể đó có kỳ vọng (hay trung bình) bằng nhau
- So sánh hệ số biến động của hai tổng thể khi hai tổng thể đó có kỳ vọng (hay giá trị trung bình) khác nhau
Như vậy, để chuẩn bị cho sinh viên học tốt môn Phân tích và đầu tư chứng khoán, môn XS – TK cần thiết phải cung cấp cho sinh viên các khái niệm, đó là kỳ vọng, phương sai, độ lệch chuẩn và hệ số biến động Đặc biệt là các kĩ thuật giúp so sánh độ phân tán của hai tổng thể
• Đối với GT2
Trang 32So sánh giá trị trung bình của các tổng thể được giải quyết bằng cách sử dụng mô hình hồi quy với biến giả Dựa vào hệ số của các mô hình này, chúng ta có thể đưa ra kết luận về giá trị trung bình của các tổng thể hơn kém nhau như thế nào
Như vậy, mô hình hồi qui với biến giả là một khái niệm cần thiết phải đưa vào chương trình
XS –TK để giúp sinh viên có thể học tốt hơn môn Kinh tế lượng
Vậy, việc tiếp theo chúng tôi cần làm đó là:
- Tìm hiểu xem những khái niệm: kỳ vọng, trung bình, phương sai, độ lệch chuẩn, hệ
số biến động và mô hình hồi quy với biến giả được trình bày trong giáo trình Xác
suất – Thống kê như thế nào? Trong đó có những tổ chức toán học nào liên quan đến
so sánh các mẫu dữ liệu thống kê? Có sự chênh lệch nào giữa những khái niệm, lý
thuyết toán cần thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK không?
Đây cũng chính là nội dung của câu hỏi Q2 và Q3 mà chúng tôi sẽ tìm câu trả lời thông qua việc phân tích giáo trình Xác suất – Thống kê của trường Đại học Kinh tế TP.HCM Những vấn đề này sẽ được chúng tôi trình bày chi tiết trong chương 2 của luận văn
Trang 33CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
GIÁO TRÌNH XS – TK
Nội dung chính của chương 2 xoay quanh các câu hỏi sau:
Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể
giải quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai
g iáo trình chuyên ngành đã đề cập tới?
Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần
thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu
có thìsự khôngnối khớp đó ảnh hưởng đến sinh viên như thế nào?
Trên cơ sở phân tích ở chương 1, chúng tôi sẽ tìm hiểu xem vấn đề “so sánh các mẫu dữ liệu thống kê” được trình bày trong giáo trình XS-TK như thế nào, đặc biệt là chỉ ra các tổ chức toán học có liên quan đến vấn đề này Với phân tích ở chương trước, chúng tôi thấy ở
đây cần phải làm rõ sự tồn tại của những tổ chức toán học liên quan đến kỳ vọng, phương
sai, độ lệch chuẩn, hệ số biến động, trung bình và hàm hồi qui với biến giả
Giáo trình mà chúng tôi phân tích là cuốn giáo trình được sử dụng trong trường Đại học
Kinh tế TP.HCM, do tác giả Trần Gia Tùng viết, có tên là: Giáo trình lý thuyết xác suất &
thống kê toán học, Nxb Đại học Quốc gia TP Hồ Chí Minh
Đây là tài liệu được các giảng viên và sinh viên của trường Đại học Kinh tế TP.HCM tham khảo và sử dụng Trong luận văn này, chúng tôi sẽ ký hiệu đó là GT3
Trước khi đi vào chi tiết, chúng tôi xem xét đề cương môn học XS-TK, nhằm làm rõ những nội dung được đưa vào cũng như những vấn đề được ưu tiên giảng dạy
Đề cương chi tiết của môn học (do sinh viên cung cấp) :
Ngày
(số tiết)
Nội dung giảng dạy (tên chương, phần, phương pháp giảng dạy)
Tài liệu đọc (chương, phần)
Chuẩn bị của sinh viên (bài tập, …)
Ghi chú
Trang 34Chương 2: Đại lượng ngẫu
nhiên và qui luật phân phối xác
Chương 3: Các qui luật phân
phối xác suất thông dụng
1- Phân phối nhị thức 2- Phân phối Poisson 3- Phân phối siêu bội
Chương 3 Phần §1, §2,
§3
Giải các bài tập chương 2
Ngày
(4 tiết)
Chương 3: Các qui luật phân
phối xác suất thong dụng
4- Phân phối chuẩn 5- Phân phối χ26- Phân phối Student Sửa bài tập chương 1
Chương 3 Phần §4, §5
Giải các bài tập chương 3
Ngày
(4 tiết)
Chương 4: Đại lượng ngẫu
nhiên hai chiều – Hàm của các
đại lượng ngẫu nhiên
tập chương 3
Trang 35Ngày
(4 tiết)
Chương 6: Lý thuyết mẫu
- Sửa các bài tập chương 2 và
- Sửa các bài tập chương 4
10- Kiểm định giả thiết về tính độc lập
Trang 3645 tiết
Dựa vào đề cương này chúng tôi nhận thấy toàn bộ phần tương quan và hồi qui không được dạy trong chương trình XS – TK Điều này tác động đến sinh viên như thế nào, chúng tôi sẽ phân tích kĩ ở mục dưới đây
2.1 Phân tích GT3
2.1.1 Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN
Kỳ vọng
Tùy theo việc ĐLNN là rời rạc hay liên tục, tập giá trị của nó là hữu hạn hay vô hạn đếm
được mà công thức tính kỳ vọng khác nhau Cụ thể:
“• Đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất
i p x
1
• Trong trường hợp X(S) vô hạn đếm được (và tổng ∑+∞
=1
i i
ip x
• Đại lượng ngấu nhiên liên tục X có hàm mật độ xác suất là f(x) (và ∫−+∞∞xf(x)dxhội tụ tuyệt đối)
Kỳ vọng toán của X ký hiệu là E(X), xác định như sau:
E(X) = ∫−+∞∞xf(x)dx
” (GT3, tr.46)
Để minh họa cho các định nghĩa trên, GT3 đưa vào hai ví dụ minh họa Thông qua hai ví dụ
đó, tác giả muốn khẳng định ý nghĩa của kỳ vọng:
Trang 37“Nói chung kỳ vọng cho ta ý niệm về độ lớn trung bình của đại lượng ngẫu nhiên X Có khi
kỳ vọng còn được gọi là giá trị trung bình của X” (GT3, tr.47)
Đặc biệt, trong ví dụ 3.4, tác giả đưa ra bài toán so sánh kỳ vọng của hai đại lượng ngẫu nhiên Ví dụ được nêu như sau:
“Một công ty cần trang bị một số lượng lớn máy cho khu vực sản suất mới Có hai loại máy được xem xét là máy do công ty AP sản xuất và máy do công ty TB sản xuất với số liệu thống
kê như sau:
Trang 38Trong ví dụ trên, người mua chỉ quan tâm tới chi phí sửa chữa hàng năm Do đó, việc quyết định mua máy của công ty nào sẽ phụ thuộc vào chi phí kỳ vọng sửa chữa một máy của công ty đó có thấp hay không Để giải quyết bài toán này, tác giả cho xác suất để máy chạy tốt là 0,9 và xác suất để một máy hư là 0,1 (đối với cả hai loại máy của công ty AP và TB) rồi lập bảng phân phối xác suất của các đại lượng ngẫu nhiên: chi phí sửa chữa một máy của công ty AP và chi phí sửa một máy của công ty TB Do chi phí sửa chữa kỳ vọng (hay trung bình) nhỏ hơn nên máy của công ty AP đã được chọn Như vậy, việc so sánh giá trị trung bình của hai ĐLNN giúp người ta có thể đưa ra một quyết định hợp lý
Ngoài việc giới thiệu ý nghĩa của kỳ vọng cho sinh viên, GT3 cũng nêu một số tính chất thông dụng của kỳ vọng (có kèm theo chứng minh) như sau:
“(a) E(aX + b) = aE(X) + b
(b) E(X+Y) = E(X) + E(Y)
E(X1 + X2 + … + Xn)= E(X1)+ E(X2) + …+ E(Xn)
(c) Nếu X, Y độc thì E(X.Y) = E(X).E(Y)” (GT3, tr.49)
Mặc dù các khái niệm và tính chất liên quan đến kỳ vọng của một ĐLNN được đưa vào rất
chi tiết và đầy đủ nhưng những tính chất này không thể giải thích được cho những kĩ thuật
so sánh hai tham số trung bình bằng mô hình hồi qui với biến giả được trình bày trong giáo trình Kinh tế lượng
Phương sai và độ lệch chuẩn
Trước khi nêu ra định nghĩa, tác giả đã đặt ra vấn đề sau :
“Ta xem các đại lượng ngẫu nhiên rời rạc sau đây
Trang 39Mặc dù E(X) = E(Y) = E(Z) = 0 nhưng các ĐLNN này rất khác biệt nhau
Ta cần đưa ra một đặc trưng cho sự khác biệt đó.” (GT3, tr.52)
Từ vấn đề đặt ra, cần thiết phải đưa thêm vào một tham số mới giúp chúng ta chỉ ra sự khác nhau của các ĐLNN khi chúng có kỳ vọng như nhau Mặt khác, tác giả cũng nhận xét rằng :
“Nếu đại lượng ngẫu nhiên X có E(X) = m thì
E(X – m) = E(X) – m = 0” (GT3, tr.52)
Do đó, nếu sử dụng đại lượng E(X – m) sẽ không chỉ ra được sự khác biệt giữa các ĐLNN
Vì vậy, tham số cần đưa vào là phương sai, có định nghĩa như sau :
“Phương sai của đại lượng ngẫu nhiên X, kỳ hiệu là Var(X), được xác định như sau:
Var(X) = E[(X – E(X))2]” (GT3, tr.52) Một công thức khác để tính phương sai :
“Var(X) = E(X 2) – [E(X)]2” (GT3, tr.52) Tác giả cũng đặc biệt nhấn mạnh ý nghĩa của phương sai:
“Phương sai cho ta ý niệm về mức độ phân tán các giá trị của X xung quanh giá trị trung bình Phương sai càng lớn thì độ phân tán này càng lớn” (GT3, tr.52)
Với định nghĩa về phương sai nếu xem xét lại 3 đại lượng ngẫu nhiên X, Y, Z nêu trong ví
dụ ở trên, ta có :
Var(X) = 0,01 ; Var(Y) = 900 ; Var(Z) = 100000000
Như vậy, Var(Z) > Var(Y) > Var(X) hay độ phân tán của Z lớn nhất, kế tiếp là độ phân tán của Y và cuối cùng, độ phân tán của X bé nhất
Sau khi giới thiệu định nghĩa và ý nghĩa của phương sai, tác giả đưa vào 3 ví dụ, trong đó ví
dụ 3.6 và ví dụ 3.7 nhằm minh họa cho sinh viên cách tính phương sai khi biết bảng phân phối xác suất hoặc biết hàm mật độ xác suất của ĐLNN X Riêng ví dụ 3.8, ngoài việc tính toán các kỳ vọng và phương sai của các ĐLNN, tác giả còn yêu cầu sinh viên phải so sánh các giá trị tìm được :
“Một nhà đầu tư có 3 dự án Gọi Xi(i = 1, 2, 3) là lợi nhuận khi thực hiện dự án thứ i, còn giá trị âm chỉ số tiền bị thua lỗ Qua nghiên cứu và bằng kinh nghiệm, nhà đầu tư có ước lượng như sau :
Trang 40E(X 1 ) = 3 E(X 2 ) = 3 E(X 3 ) = 2,6
Var(X 1 ) = 32,8 Var(X 2 ) = 7 Var(X 3 )= 29,19
(Chú ý : Var(X) và E(X) không cùng đơn vị)
Nếu chọn một trong 3 dự án trên, theo bạn nên chọn dự án nào ?”
(GT3, tr.53-54)
Tác giả đưa ra câu hỏi mở đối với sinh viên và không nêu cách giải Trong ví dụ trên có 3 ĐLNN X1, X2, X3 lần lượt là lợi nhuận khi thực hiện dự án thứ 1, 2, 3 Ta thấy bài toán ví
dụ này chính là một bài toán so sánh lợi nhuận và rủi ro trong đầu tư Trong 3 dự án thì có 2
dự án cho lợi nhuận kỳ vọng bằng nhau còn dự án thứ 3 cho lợi nhuận kỳ vọng thấp hơn, đồng thời phương sai của 3 dự án này đều khác nhau Để quyết định chọn dự án nào thì sinh viên phải xem xét cả lợi nhuận kỳ vọng và độ phân tán của mỗi dự án Ở đây, sinh viên chưa được tiếp cận định nghĩa rủi ro của dự án nên có thể hiểu độ phân tán của mỗi dự án cho biết mức độ ổn định của lợi nhuận, nếu độ phân tán càng lớn thì khả năng lợi nhuận nhận được khác với lợi nhuận kỳ vọng càng cao Trong phần này, giáo trình mới chỉ giới thiệu khái niệm phương sai và chưa hề nhắc tới hệ số biến động của ĐLNN Chính vì vậy, việc so sánh độ phân tán của ba dự án trên có vẻ khó khăn Tuy nhiên, trong ví dụ này, tác giả đã cố ý cho đại lượng ngẫu nhiên X3 có kỳ vọng thấp hơn kỳ vọng của hai đại lượng X1
và X2 nhưng có phương sai rất lớn Trong khi đó, ĐLNN X1 vừa có kì vọng lớn hơn lại có phương sai nhỏ nhất trong 3 dự án Nếu sinh viên so sánh từng cặp dự án sẽ thấy ngay kết quả:
- So sánh dự án 1 và 2 : Lợi nhuận kỳ vọng bằng nhau nhưng Var(X1) > Var(X2) do đó dự
án 2 tối ưu hơn dự án 1