1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Một nghiên cứu didactic về bài toán chọn mẫu trong dạy học thống kê ở trường phổ thông

98 52 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 98
Dung lượng 2,93 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hiểu được tầm quan trọng của việc chọn mẫu cũng như mục tiêu dạy học thống kê giúp chúng tôi có những câu hỏi đầu tiên trong việc nghiên cứu của mình: Vấn đề chọn mẫu được

Trang 2

Lê Thị Nga

MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN

CHỌN MẪU TRONG DẠY HỌC THỐNG KÊ

Trang 3

Tôi xin cam đoan luận văn này là một công trình nghiên cứu khoa học dưới sự hướng dẫn của TS Đào Hồng Nam Tất cả những trích dẫn trong luận văn này đều hoàn toàn chính xác và trung thực

Trang 4

Tôi xin bày tỏ lòng biết ơn sâu sắc đến TS Đào Hồng Nam Hơn cả việc hướng dẫn, đưa ra những góp ý và giúp tôi hoàn thiện luận văn của mình, thầy đã rất kiên nhân và bao dung với tôi

Tôi xin cảm ơn các thầy cô khoa Toán trường Đại học Sư Phạm thành phố Hồ Chí Minh: PGS.TS Lê Thị Hoài Châu, PGS.TS Lê Văn Tiến, PGS.TS Lê Thái Bảo Thiên Trung, TS Vũ Như Thư Hương, TS Nguyễn Thị Nga, TS Tăng Minh Dũng vì đã tận tận giảng dạy cho chúng tôi những kiến thức về Didactic toán, cung cấp những công cụ cần thiết và hiệu quả cho việc nghiên cứu khoa học

Tôi xin cảm ơn những anh/chị/bạn lớp Phương pháp Toán Khóa 27 đã luôn đồng hành, động viên, khích lệ tinh thần và chia sẻ những niềm vui, nỗi buồn cùng nhau Cuối cùng, gia đình luôn là nguồn động lực to lớn giúp tôi có thể hoàn thành luận văn cũng như khóa học của mình Vì vậy, lời cảm ơn to lớn nhất xin được dành cho bố mẹ của tôi, những người luôn bên cạnh, ủng hộ tinh thần, vật chật để tôi có thể hoàn thành chương trình cao học

Lê Thị Nga

Trang 5

1.1 Lý do chọn đề tài 1

1.2 Tổng quan công trình nghiên cứu 3

2 Phạm vi lý thuyết tham chiếu 4

3 Đối tượng và phạm vi nghiên cứu 6

3.1 Đối tượng nghiên cứu 6

3.2 Phạm vi nghiên cứu 6

4 Mục tiêu và câu hỏi nghiên cứu 7

4.1 Mục tiêu nghiên cứu 7

4.2 Câu hỏi nghiên cứu 7

5 Phương pháp nghiên cứu và cấu trúc của luận văn 7

5.1 Phương pháp nghiên cứu 7

5.2 Cấu trúc của luận văn 9

Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê 11

1 Vai trò của chọn mẫu trong thống kê 11

2 Các phương pháp chọn mẫu 14

2.1 Một số nguyên tắc cơ bản 14

2.2 Các phương pháp chọn mẫu 15

3 Suy rộng kết quả điều tra chọn mẫu 19

3.1 Bài toán ước lượng 19

3.2 Bài toán kiểm định giả thuyết thống kê 20

3.3 Bài toán tính kích thước mẫu 22

Trang 6

Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ 25

1 Bài toán chọn mẫu trong dạy học thống kê ở Việt Nam 25

1.1 Phân tích chương trình 25

1.2 Phân tích SGK 27

1.2.1 Về lý thuyết 29

1.2.2 Các tổ chức toán học 32

2 Bài toán chọn mẫu trong dạy học thống kê ở Mỹ 40

2.1 Về các bài toán thể hiện được vai trò và điều kiện của việc chọn mẫu 41

2.2 Về các bài toán đề cập đến kĩ thuật chọn mẫu 45

2.3 Về các bài toán đề cập đến suy rộng cho quần thể 47

Tổng kết chương 2 49

Chương 3: Thực nghiệm 54

1 Đối tượng, thời điểm thực nghiệm 54

2 Mục đích thực nghiệm 54

3 Nội dung thực nghiệm 54

3.1 Dàn dựng kịch bản: 57

3.2 Phân tích tiên nghiệm 59

3.3 Phân tích hậu nghiệm 64

Kết luận 87

TÀI LIỆU THAM KHẢO 89

Trang 7

SGV : Sách giáo viên

S10NC : Sách giáo khoa Đại số lớp 10 nâng cao

KNV : Kiểu nhiệm vụ

XSTK : Xác suất thống kê

TK : Thống kê

Trang 8

DANH MỤC CÁC BẢNG

Bảng 2.1: Bảng tóm tắt nội dung các bài học trong chương V 28

Bảng 2.2: Thống kê số lượng bài tập theo từng KNV 34

Bảng 2.3: So sánh sự lựa chọn trình bày chọn mẫu trong chương tình dạy học ở Việt Nam và Mỹ 51

Bảng 3.1: Kết quả thống kê dựa trên chiến lược của học sinh 64

Bảng 3.2: Thống kê chiến lược ở bài toán 1 của các nhóm 73

Bảng 3.3: Thống kê lựa chọn tờ báo của các nhóm 74

Trang 9

có một cơ sở khoa học để đưa ra những dự đoán, quyết định trước một sự việc Các kiến thức và phương pháp của XSTK đã hỗ trợ hữu hiệu các nhà nghiên cứu trong các lĩnh vực khoa học khác như vật lý, hóa học, sinh y học, kinh tế học, xã hội học… Như vậy có thể nói, XSTK là một trong những ngành khoa học có tính ứng dụng thực tiễn và thường xuyên bắt gặp trong cuộc sống Nhận thấy tầm quan trọng cũng như tính ứng dụng rộng rãi này, XSTK đã được đưa vào chương trình giảng dạy ở rất nhiều nước, trong đó có Việt Nam Việc đưa XSTK vào chương trình giảng dạy không nằm ngoài mục tiêu giáo dục của Bộ Giáo Dục và Đào Tạo,

đó là: Đảm bảo cho học sinh có điều kiện phát huy năng lực cá nhân để lựa chọn hướng phát triển, tiếp tục học chương trình giáo dục đại học, giáo dục nghề nghiệp hoặc tham gia lao động, xây dựng và bảo vệ Tổ Quốc (Luật Giáo Dục năm 2019, điều 29)

Chọn mẫu là khâu đầu tiên trong một nghiên cứu thống kê và có vai trò vô cùng quan trọng, có ảnh hướng lớn đến kết quả nghiên cứu Trong thực tiễn, chúng ta gặp rất nhiều những tình huống đòi hỏi việc chọn mẫu cần phù hợp: Điều tra đặc trưng của dân số, điều tra chất lượng của các sản phẩm Dù có áp dụng đúng đắn các kiến thức về xử lý các số liệu nhưng khâu chọn mẫu không đúng cũng sẽ dẫn đến kết quả sai Lê Thị Hoài Châu (2012), đã đưa ra nhiệm vụ đầu tiên mà việc giảng dạy thống kê cần đạt được:

Trang 10

Mọi hoạt động thống kê đều diễn ra trên cơ sở mẫu dữ liệu ban đầu, do đó kết quả của quá trình phụ thuộc hoàn toàn vào nó Việc chọn mẫu đóng một vai trò quan trọng vì đằng sau nó là một hệ quả về tính biến động của các kết quả nhận được, là những nguy cơ có thể xảy ra khi suy rộng kết quả cho toàn thể Điều này là một tất yếu nhưng lại không sẵn có trong nhận thức của mỗi người chúng ta Nếu không ý thức được chúng ta sẽ dễ dàng bị đánh lừa trước những thông tin sai lệch, dễ đưa ra những nhận xét chủ quan, phiến diện về hiện tượng Do đó dạy học thống kê cần thiết phải làm cho học sinh nhận thức rõ những điều này Qua đó hình thành thái độ cẩn trọng, biết cân nhắc khi làm việc với các mẫu dữ liệu, biết nhận thức kết quả thu được từ mẫu nhận được có hợp lý và phản ánh chính xác hiện tượng cần quan sát hay không

Tuy nhiên, tìm hiểu sơ lược chương trình giảng dạy TK, chúng tôi nhận thấy vấn đề chọn mẫu chỉ được đề cập đến trong một bài giảng ở chương trình toán lớp 10 Hiểu được tầm quan trọng của việc chọn mẫu cũng như mục tiêu dạy học thống kê giúp chúng tôi có những câu hỏi đầu tiên trong việc nghiên cứu của mình: Vấn đề chọn mẫu được SGK trình bày như thế nào? Việc trình bày này đã đáp ứng được mục tiêu giảng dạy hay chưa? Học sinh có nắm được tầm quan trọng của việc chọn mẫu? SGK đã cung cấp những kiến thức hay kĩ thuật gì liên quan đến

chọn mẫu giúp học sinh “không dễ bị đánh lừa trước những thông tin sai lệch”?

Đồng thời trong quá trình tìm kiếm tài liệu tham khảo, chúng tôi được tiếp xúc với luận văn thạc sĩ của tác giả Quách Huỳnh Hạnh Trong luận văn này, tác giả đã

đưa ra một giả thuyết nghiên cứu: Học sinh không có nhiệm vụ kiểm tra tính hợp

lý của những kết quả tính được khi giải toán thống kê, tuy nhiên trong phạm vi

khuôn khổ của luận văn, tác giả chưa kiểm chứng được điều này Việc chọn sai mẫu cũng là một trong các lý do dẫn đến kết quả suy luận thống kê không hợp lý Chúng tôi quan tâm đến việc học sinh sẽ ứng xử như thế nào trước một kết quả

Trang 11

thu được từ mẫu? Vì vậy, chúng tôi sẽ xây dựng một tình huống dạy học vừa có thể kiểm chứng được giả thuyết nghiên cứu đặt ra, vừa khắc phục sự khiếm khuyết về kĩ thuật chọn mẫu trong dạy học thống kê ở trường phổ thông

Từ tất cả những ghi nhận trên, chúng tôi thực hiện nghiên cứu:

MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN CHỌN MẪU TRONG DẠY HỌC THỐNG KÊ Ở TRƯỜNG PHỔ THÔNG

Trong luận văn này, bài toán chọn mẫu mà chúng tôi chọn để nghiên cứu bao gồm các nội dung: Vai trò của chọn mẫu, các phương pháp chọn mẫu, cách suy rộng kết quả thu được từ mẫu cho tổng thể

1.2 Tổng quan công trình nghiên cứu

Với những câu hỏi đặt ra chúng tôi tiến hành thu thập tài liệu và tìm thấy những tài liệu liên quan sau đây:

Đào Hồng Nam (2014), Dạy học xác suất thống kê ở trường đại học Y, luận án tiến sĩ: Mặc dù bài toán chọn mẫu không phải là đối tượng nghiên cứu chính của tác giả, nhưng tác giả cũng đã có 2 kết quả nghiên cứu có liên quan đến bài toán chọn mẫu Tác giả đồng ý với việc chọn mẫu là quá trình quan trọng trong nghiên cứu:

Chọn mẫu là công việc rất quan trọng của một công trình nghiên cứu Nếu mẫu chọn không đại diện được cho quần thể thì nghiên cứu trên mẫu không cho phép đưa ra những dự đoán thỏa đáng cho mẫu

Đồng thời tác giả cũng đã chỉ ra việc không đảm bảo nguyên tắc lấy mẫu là một trong các nguyên nhân dẫn đến sự sai lầm trong các nghiên cứu

Lê Thị Hoài Châu (2012), Dạy học xác suất thống kê ở trường phổ thông: Trong tài liệu này, bên cạnh việc nhấn mạnh đến tầm quan trọng của bài toán chọn mẫu,

Trang 12

tác giả đã nêu ra 2 bài toán gắn với chọn mẫu: Bài toán ước lượng và kiểm định thống kê Chúng tôi sẽ sử dụng kết quả này để tìm kiếm các cơ sở lý thuyết liên quan đến bài toán chọn mẫu

Đinh Thị Mạnh (2012), Vấn đề chọn mẫu trong thống kê lớp 10, luận văn thạc sĩ giáo dục: Mặc dù cùng chọn một đối tượng nghiên cứu là chọn mẫu trong thống kê toán 10, tuy nhiên vấn đề mà tác giả Đinh Thị Mạnh tập trung nghiên cứu là vai trò của mẫu trong TK và quan tâm tới việc trong dạy học TK lớp 10 vai trò của mẫu được thể hiện ra sao, có những kiểu nhiệm vụ (KNV) nào giúp học sinh nhận

ra vai trò của mẫu Bên cạnh đó, tác giả đã cố gắng xây dựng một tình huống giúp học sinh ý thức được về những kết luận suy ra từ mẫu, từ đó thấy được sự cần thiết của việc chọn mẫu Tuy nhiên, tác giả chưa đưa ra những sai lầm trong việc chọn mẫu hay đề xuất những biện pháp, giới thiệu kĩ thuật chọn mẫu giúp học sinh có thể giải quyết các bài toán liên quan Đây cũng là những vấn đề mới mà chúng tôi

sẽ cố gắng tìm kiếm câu trả lời trong nghiên cứu của mình

2 Phạm vi lý thuyết tham chiếu

Để tìm kiếm công cụ cho phép trả lời những câu hỏi trong đề tài nghiên cứu của mình, chúng tôi đặt nghiên cứu trong khuôn khổ của lý thuyết Didactic toán, cụ thể chúng tôi sử dụng:

Công cụ lý thuyết của thuyết nhân học: Mối quan hệ thể chế với tri thức, mối quan

hệ của cá nhân với tri thức, tổ chức toán học Các công cụ này giúp chúng tôi có thể trả lời cho câu hỏi: Vấn đề chọn mẫu tồn tại như thế nào trong sách giáo khoa toán 10? Chương trình dạy học thống kê ở Việt Nam ưu tiên đến những kiểu nhiểm

vụ nào? Những ảnh hưởng, tác động đến học sinh từ sự lựa chọn của thể chế là gì?

Trang 13

Công cụ lý thuyết của lý thuyết tình huống: Chúng tôi sử dụng các khái niệm biến, chiến lược, các pha để tiến hành xây dựng một tình huống thực nghiệm nhằm đạt được mục đích nghiên cứu của mình

Các lý thuyết trên đã được trình bày trong cuốn giáo trình song ngữ Việt – Pháp của Bessot và các cộng sự (2009) Trong phần này, chúng tôi chỉ mô tả ngắn ngọn một số khái niệm cần tham chiếu của các lý thuyết trên

Quan hệ thể chế:

Quan hệ R (I, O) của một thể chế I đối với tri thức O là tập hợp các tác động giữa thể chế I đến tri thức O và ngược lại Mối quan hệ này cho biết O xuất hiện khi nào, ở đâu, như thế nào, nội dung và ý nghĩa như thế nào

Quan hệ cá nhân:

Quan hệ R (X, O) của một cá nhân X với đối tượng tri thức O là tập hợp các tác động qua lại giữa cá nhân X với tri thức O, nghĩa là X hiểu gì, nghĩ gì, hình dung

ra sao về O, có thể sử dụng O và thao tác O thế nào

Trong thuyết nhân học, ta công nhận một điều: Mỗi hoạt động của con người như là việc thực hiện một nhiệm vụ t thuộc kiểu nhiệm vụ T, nhờ một kĩ thuật 𝜏, được giải thích bằng một công nghệ 𝜃, và công nghệ lại được giải thích dựa vào lý thuyết Φ Ta gọi bộ (𝑇, 𝜏, 𝜃, Φ) là một tổ chức tri thức

Nhiệm vụ, kiểu nhiệm vụ:

Là câu trả lời cho câu hỏi dạng “làm thế nào?” Kiểu nhiệm vụ phải liên quan đến một đối tượng O đã được xác định rõ và được thể chế xây dựng

Kỹ thuật:

Trang 14

Là cách làm, cách giải quyết T Trong thể chế I, đối với mỗi kiểu nhiệm vụ T, chỉ tồn tại một 𝜏 hay cùng lắm là một số ít kỹ thuật 𝜏 được I thừa nhận

Công nghệ: Mọi kỹ thuật đều cần một công nghệ giải thích nó Trong thể chế I,

việc tồn tại công nghệ là một điều kiện sinh thái chủ yếu cho sự tồn tại kỹ thuật Công nghệ có thể khác nhau tùy vào từng thể chế

Lý thuyết: Là yếu tố giải thích cho công nghệ, hay nói cách khác, lý thuyết là “công

nghệ của công nghệ”

Nếu một tổ chức tri thức gắn với toán học, nghĩa là các thành phần của nó mang bản chất toán học, ta gọi là Tổ chức toán học Như vậy, để phân tích mối quan hệ thể chế đối với đối tượng tri thức O, ta có thể chỉ ra tất cả các tổ chức tri thức hay

tổ chức toán học liên quan đến O trong I, đồng thời phân loại, đánh giá chúng

Biến:

Một biến Didactic là một tham số, có thể nhận nhiều giá trị Sự thay đổi giá trị của biến didactic sẽ dẫn đến sự thay đổi thứ tự các chiến lược giải của học sinh Như vậy, thông qua sự lựa chọn giá trị của biến didactic, nhà nghiên cứu có thể tạo ra những thích nghi và những điều chỉnh mong muốn, tức là tạo ra việc học tập Cụ thể hơn, giá trị của biến phải được chọn sao cho chiến lược cũ trở nên đắt giá, quá tốn kém, quá phức tạp hoặc thậm chí dẫn đến sai lầm

3 Đối tượng và phạm vi nghiên cứu

3.1 Đối tượng nghiên cứu

Bài toán chọn mẫu trong thống kê

3.2 Phạm vi nghiên cứu

Dạy học thống kê ở trường phổ thông

Trang 15

4 Mục tiêu và câu hỏi nghiên cứu

4.1 Mục tiêu nghiên cứu

Nghiên cứu bài toán chọn mẫu trong dạy học thống kê ở trường phổ thông

4.2 Câu hỏi nghiên cứu

Trong khuôn khổ của phạm vi lý thuyết tham chiếu đã lựa chọn, các câu hỏi tạo thành mục đích nghiên cứu của chúng tôi được trình bày lại như sau:

Q1: Các cơ sở lý thuyết liên quan đến chọn mẫu? Có những bài toán liên quan nào? Có các kĩ thuật chọn mẫu nào? Vai trò của việc chọn mẫu là gì?

Q2: Bài toán chọn mẫu tồn tại như thế nào trong chương trình thống kê ở Việt Nam? Nhìn sang chương trình giảng dạy khác (chương trình giảng dạy thống kê của Mỹ), bài toán chọn mẫu được trình bày ra sao? Có sự khác biệt nào trong việc lựa chọn của những chương trình này?

Q3: Làm thế nào để xây dựng một tình huống dạy học có nội dung về chọn mẫu

để khắc phục những thiếu hụt về kỹ thuật chọn mẫu trong dạy học thống kê ở trường phổ thông?

5 Phương pháp nghiên cứu và cấu trúc của luận văn

5.1 Phương pháp nghiên cứu

Để có thể đạt được mục tiêu nghiên cứu của mình, chúng tôi áp dụng các phương pháp nghiên cứu sau:

Phương pháp nghiên cứu lý luận: Chúng tôi sử dụng phương pháp nghiên cứu này

để tìm hiểu cơ sở lý thuyết của bài toán chọn mẫu Trước hết, chúng tôi nghiên cứu các cơ sở khoa học của chọn mẫu trong các giáo trình toán XSTK ở bậc đại học Cụ thể, chúng tôi nghiên cứu về các kiến thức: Vai trò của chọn mẫu trong

Trang 16

thống kê, các phương pháp chọn mẫu và các bài toán có liên quan đến chọn mẫu

Sau đó, chúng tôi nghiên cứu sự tồn tại của bài toán chọn mẫu trong chương trình

giảng dạy xác suất thông kê ở Việt Nam và Mỹ Từ sự phân tích này, chúng tôi rút

ra những điểm giống và khác nhau trong sự lựa chọn của hai chương trình, tìm ra

các KNV mới xuất hiện trong thể chế dạy học ở Mỹ nhưng lại không xuất hiện

trong thể chế dạy học ở Việt Nam Cuối cùng dựa trên kết quả thu được, chúng tôi

tiến hành thực nghiệm nhằm mục đích trả lời cho câu hỏi: Làm thế nào để đưa

KNV này vào trong việc giảng dạy bài toán chọn mẫu?

Phương pháp nghiên cứu thực tiễn: Phương pháp này giúp chúng tôi nhận ra những

quan niệm, sự hiểu biết và cách ứng xử của học sinh đối với bài toán chọn mẫu và

kiểm chứng được giả thuyết đã nêu ra Từ đó, chúng tôi tiến hành xây dựng tiểu

đồ án để bổ sung một KNV mới bị thiếu vắng trong SGK và cung cấp các kĩ thuật

chọn mẫu cho học sinh

Chúng tôi tóm tắt phương pháp nghiên cứu của mình như sau:

NGHIÊN CỨU TRI THỨC KHOA HỌC TRONG CÁC GIÁO

TRÌNH ĐẠI HỌC

NGHIÊN CỨU SỰ TỒN TẠI CỦA BÀI TOÁN

CHỌN MẪU TRONG CHƯƠNG TRÌNH

GIẢNG DẠY THÔNG KÊ Ở VIỆT NAM

NGHIÊN CỨU SỰ TỒN TẠI CỦA BÀI TOÁN CHỌN MẪU TRONG CHƯƠNG TRÌNH GIẢNG DẠY THỐNG KÊ Ở MỸ

XÂY DỰNG THỰC NGHIỆM:

Trang 17

5.2 Cấu trúc của luận văn

Luận văn này bao gồm: Phần mở đầu, 3 chương chính và phần kết luận Cụ thể: Phần mở đầu: Chúng tôi dành phần này để giới thiệu về lý do chọn đề tài, tổng quan các công trình nghiên cứu, mục đích nghiên cứu, khung lý thuyết tham chiếu, mục tiêu và câu hỏi nghiên cứu, cuối cùng là phương pháp nghiên cứu và cấu trúc của luận văn

Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê

Trong chương này chúng tôi sẽ tổng kết lại những kết quả nghiên cứu đã được công bố có nội dung liên quan về chọn mẫu Cụ thể, chúng tôi quan tâm đến những bài toán liên quan đến chọn mẫu, các kĩ thuật chọn mẫu, vai trò của việc chọn mẫu Thực hiện chương 1 cũng chính là việc trả lời cho câu hỏi Q1 mà chúng tôi đã nêu

ra

Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ

Bên cạnh việc phân tích sự tồn tại của bài toán chọn mẫu trong chương trình dạy học ở Việt Nam - bằng việc phân tích chương trình giảng dạy và SGK toán 10 nâng cao, chúng tôi còn phân tích sự tồn tại của bài toán chọn mẫu trong một chương trình khác, cụ thể là chương trình dạy học ở Mỹ - bằng việc phân tích giáo trình Mathematics in Context của tác giả Hold, Rinehart và Winston Từ việc xem xét sự tồn tại của bài toán chọn mẫu trong các chương trình khác nhau, chúng tôi

sẽ thấy được mối quan tâm của các thể chế dành cho bài toán chọn mẫu là gì, từ

đó có những so sánh cần thiết phục vụ cho nghiên cứu của mình

Kết quả nghiên cứu của chương 2 cũng chính là câu trả lời cho câu Q2

Chương 3: Thực nghiệm

Trang 18

Chúng tôi sẽ xây dựng một tình huống dạy học mà ở đó việc chọn mẫu không phù hợp đặt người học phải kiểm tra tính đúng đắn của kết quả Thực hiện thành công việc này đồng nghĩa với việc trả lời cho câu hỏi Q4 - Kiểm chứng giả thuyết được nêu ra ở chương 2 Đồng thời, chúng tôi xây dựng một tình huống để bổ sung các tổ chức toán học về chọn mẫu đã bị thiếu vắng trong thể chế dạy học XSTK bậc phổ thông Việt Nam

Phần kết luận: Chúng tôi tổng kết lại những kết quả mà luận văn đã đạt được bằng việc trả lời 4 câu hỏi nghiên cứu đã được nêu ra trong phần mở đầu

Trang 19

Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê

Việc thực hiện chương 1 đồng nghĩa với việc chúng tôi đi tìm kiếm câu trả lời cho câu hỏi:

Q1: Các cơ sở lý thuyết liên quan đến chọn mẫu? Có những bài toán liên quan nào? Có các kĩ thuật chọn mẫu nào? Vai trò của việc chọn mẫu là gì?

Chúng tôi tìm kiếm câu trả lời cho câu hỏi này bằng việc tham khảo các giáo trình về XSTK ở các trường đại học và các luận văn đã bảo vệ thành công trước đó Cụ thể, chúng tôi đã lựa chọn các tài liệu tham khảo sau:

Lê Thị Hoài Châu (2005), Dạy học xác suất thống kê ở trường trung học phổ

thông, nhà xuất bản đại học Sư Phạm

Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất bản Khoa Học và Kĩ Thuật Đinh Thị Mạnh (2013), Nghiên cứu về bài toán chọn mẫu ở thống kê lớp 10, luận

văn thạc sĩ, trường Đại học Sư Phạm TPHCM

Hoàng Ngọc Nhậm (2007), Lý thuyết xác suất và thống kê toán, nhà xuất bản thành phố Hồ Chí Minh

1 Vai trò của chọn mẫu trong thống kê

Trong quá trình nghiên cứu về vai trò của mẫu, chúng tôi tìm được luận văn của tác giả Đinh Thị Mạnh đã trình bày về nội dung này Chúng tôi sẽ tổng kết lại những kết quả nghiên cứu của tác giả dựa trên sự chọn lọc của mình như sau: Khi thống kê chỉ đơn giản là việc thu thập và biểu diễn số liệu, chúng ta không cần đến khái niệm mẫu hay mẫu số liệu Tuy nhiên khi cuộc sống xã hội nảy sinh những vấn đề mới như: Dân số ở các quốc gia ngày càng gia tăng, phạm vi lãnh thổ được mở rộng thì kích thước tổng thể, quy mô của các cuộc điều tra cũng ngày

Trang 20

một lớn; thêm nữa, sự phát triển của nhiều lĩnh vực khoa học kĩ thuật, công nghệ sản xuất kéo theo sự đa dạng, phong phú của nhiều chủng loại hàng hóa cung cấp

ra thị trường Vấn đề chất lượng sản phẩm đòi hỏi phải có những công cuộc kiểm tra nghiêm ngặt, nhưng với những cuộc kiểm nghiệm như vậy các sản phẩm lại vô tình bị phá hủy Lúc này, việc thu thập và xử lý mẫu số liệu bắt đầu gặp nhiều khó khăn và không còn phù hợp Điều tra toàn bộ bắt đầu bộc lộ nhiều điểm hạn chế

do không phải lúc nào cũng có tính khả thi trong thực tế, chẳng hạn như: Các trường hợp tổng thể điều tra quá rộng dẫn đến khi điều tra tốn kém nhiều về nhân lực, các trường hợp không thể xác định được hết các đơn vị của tổng thể, các trường hợp điều tra dẫn đến phá hủy các đơn vị điều tra…Với những nỗ lực khắc phục những hạn chế này của điều tra toàn bộ, vào thế kỷ 17 phương pháp điều tra chọn mẫu ra đời Mầm mống nảy sinh từ những ý đồ ngoại suy đầu tiên của nhà kinh tế học người Anh William Petty (1623 – 1687), sau đó được phát triển và hoàn thiện cơ sở lý luận Nội dung của phương pháp chọn mẫu đã được nhiều tác

giải trình bày Theo Hoàng Ngọc Nhậm (2010), Lý thuyết xác suất và thống kê

toán:

“Từ tổng thể ta chọn ra n phần tử và tiến hành thu thập thông tin trên chúng, n phần tử này lập nên một mẫu Số phần tử của mẫu được gọi là kích thước mẫu Thông thường kích thước mẫu nhỏ hơn nhiều so với kích thước của tổng thể nên việc tổ chức thu thập và xử lý thông tin trên mẫu dễ dàng và nhanh chóng Kết quả thu được sau đó sẽ được dùng để suy rộng cho tổng thể nhờ vào các phương pháp toán học (đặc biệt là lý thuyết xác suất).”

Trong một giáo trình khác, Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất

bản Khoa học và Giáo Dục, nội dung cơ bản của chọn mẫu được mô tả:

Trang 21

“Giả sử cần nghiên cứu sự vận động của một hiện tượng, người ta có thể mô hình hóa hiện tượng này nhờ một biến ngẫu nhiên X (một chiều hay nhiều chiều) Với một mẫu ngẫu nhiên W(X) lập từ biến ngẫu nhiên gốc X, thiết lập các mô hình nhờ các thống kê – các hàm của thành phần mẫu – thích hợp Với các thống kê này có thể tiến hành các ước lượng, kiểm định, dự báo và các phân tích khác đối với X theo các yêu cầu cho trước.”

Sự ra đời của phương pháp mẫu là một thành tựu lớn trong lịch sử phát triển của khoa học TK, giúp cho các cuộc điều tra trên tổng thể lớn hay thậm chí không thể xác định được số lượng điều tra trở nên dễ thực hiện hơn, tiết kiệm được nhân lực và ít tốn kém hơn Không những thế, bằng việc áp dụng lý thuyết Xác Suất, chúng

ta còn có thể suy rộng kết quả thu được trên mẫu cho toàn bộ tổng thể với một mức độ tin cậy và mức độ chính xác có thể chấp nhận được Chính vì những lợi ích và ý nghĩa to lớn mà phương pháp chọn mẫu mang lại, ngày nay phương pháp này càng trở nên phổ biến và được áp dụng rộng rãi Ngô Văn Thứ (2005), cũng

đã ra các lý do khiến việc sử dụng phương pháp chọn mẫu trở nên phổ biến: Thứ nhất: Các vấn đề cần nghiên cứu, đặc biệt là trong các lĩnh vực kinh tế xã hội thường tồn tại ở các tổng thể lớn, động Khả năng nghiên cứu toàn bộ không hiện thực, do thời gian và kinh phí không cho phép Trong rất nhiều trường hợp người

ta cũng không thể biết chính xác kích cỡ của tổng thể

Thứ hai: Thông tin dựa trên các biểu hiện hay sự hiểu biết của con người về một vấn đề hay một nhóm nghiên cứu tại một thời điểm hay trong khoảng thời gian là hữu hạn Về mặt thông tin người ta thấy rằng lượng tin thực tế không tuyến tính với số lượng đối tượng cấp tin Có thể thấy rằng lượng tin tăng thêm khi số quan sát đã đủ lớn hầu như không đáng kể Như vậy, không nhất thiết phải khảo sát toàn bộ tổng thể

Trang 22

Thứ ba: Với những thành tựu của lý thuyết xác suất và thống kê toán, người ta có

đủ các công cụ, các mô hình mà nhờ đó những thông tin từ mẫu có thể suy diễn cho tổng thể với độ chính xác ước lượng được Điều đó cho phép chúng ta đặt trước các yêu cầu về độ chính xác trong các ước lượng làm căn cứ cho việc xác định độ lớn của mẫu

Một mẫu sau khi được chọn sẽ là một bộ phận của tổng thể nên ta có thể chọn được rất nhiều mẫu khác nhau Vì vậy kết quả thu được sau khi phân tích dựa trên các mẫu là khác nhau Hệ quả của sự thay đổi thông tin trên mẫu là những rủi ro, những sai lầm có thể gặp phải khi đưa ra những kết luận cho tổng thể dựa vào quan sát mẫu Hiển nhiên những rủi ro và sai lầm này không thể loại bỏ, nhưng có thể khắc phục đến một mức nào đó Điều này đòi hỏi mẫu phải đại diện được cho quần thể Vì vậy các nhà TK cần tìm cách xây dựng và phát triển các nguyên tắc cũng như các phương pháp chọn mẫu nhằm đạt được mục tiêu chọn mẫu đại diện tốt cho quần thể để có thể suy rộng ra cho toàn bộ

2 Các phương pháp chọn mẫu

2.1 Một số nguyên tắc cơ bản

Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy rộng cho quần thể với mức rủi ro thấp nhất thì việc chọn mẫu cần phải dựa trên các điều kiện, tiêu chuẩn sau:

Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất, đảm

bảo tính chất không chệch của suy diễn thống kê, cũng như các mô tả thống kê Một cách đơn giản, tính chất này đòi hỏi khả năng mỗi cá thể trong tổng thể hay trong một bộ phận của tổng thể có thể được chọn như nhau Trong một số phương

Trang 23

pháp chọn mẫu cụ thể, tính chất này có thể phụ thuộc rất nhiều vào mục đích, phạm vi sử dụng số liệu mẫu cho phân tích và dự báo thống kê

Tính đại diện: Tính đại diện thường được xác định trên cơ sở yêu cầu về mức tin

cậy của các phân tích thống kê như ước lượng, kiểm định… Với những tổng thể lớn có phân thành những bộ phận khác nhau và phân tích thống kê ở nhiều cấp thì tính đại diện cần được lưu ý từ cấp thấp nhất

Tính đồng nhất: Vì mỗi đối tượng cung cấp thông tin là một tác nhân xã hội nên

ngoài những gì làm cho đối tượng này trở thành cá thể thống kê thì còn khá nhiều thuộc tính riêng Các thuộc tính riêng nói chung có ảnh hưởng đến đối tượng Đặc điểm này đòi hỏi khi chọn mẫu phải chú ý đến tính thuần nhất về môi trường kinh

tế xã hội của cá thể

Tính phổ biến: Trong nhiều trường hợp người điều tra có cảm giác rằng một số cá

thể thống kê có những tính chất ngoại lệ so với phần đông các cá thể khác Các cá thể này có thể thuộc đối tượng chọn mẫu hoặc loại khỏi đối tượng chọn mẫu tùy thuộc vào tính đồng nhất của chúng với tổng thể Tuy nhiên, hầu hết các trường hợp cần có những xử lý riêng biệt cho chúng Đảm bảo tính phổ biến, nhằm làm cho phân tích thống kê nhận biết dễ dàng hơn bản chất của tổng thể về một mặt hay một phương diện đang nghiên cứu

2.2 Các phương pháp chọn mẫu

Mục đích của tất cả các phương pháp lấy mẫu là đạt được mẫu đại diện cho cả quần thể nghiên cứu Khi chọn phương pháp lấy mẫu thì cần tìm hiểu rõ các đặc tính của quần thể nghiên cứu để xác định cỡ mẫu quan sát đại diện và đánh giá tương đối chính xác quần thể Có 2 phương pháp chọn mẫu: (1) chọn mẫu không xác suất (không chú ý tới độ đồng đều, nghĩa là mỗi cá thể trong tổng thể không

Trang 24

có cơ hội được chọn như nhau) và (2) chọn mẫu xác suất (đề cập đến độ đồng đều,

nghĩa là mỗi cá thể trong tổng thể có cơ hội được chọn như nhau)

 Chọn mẫu không xác suất

Phương pháp chọn mẫu không xác suất là cách lấy mẫu trong đó các cá thể của mẫu được chọn không ngẫu nhiên hay không có xác suất lựa chọn giống nhau Điều này thể hiện trong cách chọn mẫu như sau:

- Các đơn vị mẫu được tự lựa chọn mà không có phương pháp

- Các đơn vị mẫu rất dễ dàng đạt được hoặc dễ dàng tiếp cận Ví dụ: chọn những hộ trên những con đường dễ đi

- Các đơn vị mẫu được chọn theo lý thuyết do kinh tế Ví dụ: trả tiền cho sự tham dự

- Các đơn vị mẫu được quan tâm bởi người nghiên cứu trong danh sách điển hình của quần thể mục tiêu Ví dụ: người nghiên cứu chỉ quan tâm đến các nhân vật điển hình trong quần thể nghiên cứu, để so sánh với các nhân vật khác

- Các đơn vị mẫu được chọn mà không có sự thiết kế rõ ràng Ví dụ: chọn 50 người đầu tiên đến buổi sáng

Phương pháp chọn mẫu không xác suất thường có độ tin cậy thấp Mức độ chính xác của cách chọn mẫu không xác suất tùy thuộc vào sự phán đoán, cách nhìn, kinh nghiệm của người nghiên cứu, sự may mắn hoặc dễ dàng và không có cơ sở thống kê trong việc chọn mẫu

 Chọn mẫu xác suất

Cơ bản của việc chọn mẫu xác suất là cách lấy mẫu trong đó việc chọn các cá thể của mẫu có cơ hội như nhau, nếu như có một số cá thể có cơ hội xuất hiện nhiều

Trang 25

hơn thì sự lựa chọn không phải là ngẫu nhiên Để tối ưu hóa mức độ chính xác, người nghiên cứu thường sử dụng phương pháp lấy mẫu ngẫu nhiên

 Các phương pháp chọn mẫu ngẫu nhiên

- Chọn mẫu ngẫu nhiên đơn giản

Cách đơn giản nhất của việc chọn các cá thể của mẫu trong cách chọn mẫu ngẫu nhiên là sử dụng xác suất Việc lựa chọn n các cá thể từ một quần thể sao cho các cá thể có cơ hội bằng nhau hay một xác suất bằng nhau trong phương pháp này Ví dụ : Một trường học có 1000 sinh viên, người nghiên cứu muốn chọn ra 100 sinh viên để nghiên cứu về tính trạng sức khỏe trong số 1000 sinh viên Theo cách chọn mẫu đơn giản thì chỉ cần viết tên 1000 sinh viên vào trong mẫu giấy nhỏ, sau

đó bỏ tất cả vào môt cái thùng và rút ngẫu nhiên ra 100 mẫu giấy Như vậy, mỗi sinh viên có một cơ hội lựa chọn như nhau và xác suất chọn ngẫu nhiên một sinh viên trên dễ dàng được tính bằng công thức 100

100×1000= 10%

Một cách chọn ngẫu nhiên khác là sử dụng bảng số ngẫu nhiên trong sách thống kê phép thí nghiệm hoặc cách chọn số ngẫu nhiên bằng cách chương trình thống kê trên máy tính

- Chọn mẫu phân lớp

Chọn mẫu phân lớp : Chọn mẫu phân lớp được thực hiện khi quần thể mục tiêu được chia thành các nhóm hay phân lớp Trong phương pháp lấy mẫu phân lớp, tổng thể (N) đầu tiên được chia ra thành L lớp của các quần thể phụ N1, N2, … ,

NL, như vậy:

𝑁 = 𝑁1+ 𝑁2+ 𝑁3… + 𝑁𝐿

Để áp dụng kỹ thuật chọn mẫu phân lớp thì trước tiên người nghiên cứu cần nắm các thông tin và số liệu nghiên cứu trước đây có liên quan đến cách lấy mẫu có

Trang 26

phân lớp Sau đó, người nghiên cứu xác định cỡ mẫu và chọn ngẫu nhiên các cá thể trong mỗi lớp

- Chọn mẫu hệ thống :

Đôi khi các đơn vị ngẫu nhiên không tốt hơn cách chọn mẫu hệ thống Trong chọn mẫu hệ thống, cỡ mẫu n được chọn (có phương pháp tính xác suất tương tự) từ một tổng thể N Cách lấy mẫu hệ thống là khung mẫu giống như là 1 hàng của các đơn vị mẫu, và mẫu như là một chuỗi liên tiếp của các điểm số có khoảng cách bằng nhau theo hàng dọc Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách; sau đó cứ cách đều k đơn vị lại chọn ra 1 đơn vị vào mẫu, cứ như thế cho đến khi chọn đủ số đơn vị của mẫu Ví dụ: Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của tên chủ hộ, bao gồm 240.000 hộ Ta muốn chọn ra một mẫu có 2000 hộ Vậy khoảng cách chọn là: k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu

- Chọn mẫu chỉ tiêu :

Trong cách chọn mẫu chỉ tiêu, quần thể nghiên cứu được phân nhóm hoặc phân lớp như cách chọn mẫu phân lớp Các đối tượng nghiên cứu trong mỗi nhóm được lấy mẫu theo tỷ lệ đã biết và sau đó tiến hành phương pháp chọn mẫu không xác suất Để thiết lập mẫu chỉ tiêu, người nghiên cứu cần phải biết ít nhất các số liệu, thông tin trong quần thể mục tiêu để phân chia các chỉ tiêu muốn kiểm soát Thuận lợi của việc lấy mẫu chỉ tiêu áp dụng trong một vài nghiên cứu là chi phí thực hiện nghiên cứu tương đối thấp và dễ thực hiện Bất lợi của việc lấy mẫu chỉ tiêu là không đại diện toàn bộ quần thể, do lấy mẫu không xác suất như chọn ưu tiên phỏng vấn khách du lịch đến trước, chọn nơi có nhiều khách lui tới, khách ở khách

Trang 27

sạn, … và vì vậy mức độ tin cậy phụ thuộc vào kinh nghiệm hay sự phán đoán của người nghiên cứu và sự nhiệt tình của người trả lời phỏng vấn Để tăng mức độ tin cậy, người nghiên cứu cần thực hiện cuộc phỏng vấn bước đầu để kiểm tra người trả lời có rơi vào các chỉ tiêu hay không Chọn mẫu chỉ tiêu ít được áp dụng trong các nghiên cứu phát triển, nhưng đôi khi được sử dụng trong một vài nghiên cứu nhỏ mang các đặc tính quan sát

- Chọn mẫu không gian

Người nghiên cứu có thể sử dụng cách lấy mẫu này khi hiện tượng, sự vật được quan sát có sự phân bố mẫu theo không gian (các đối tượng khảo sát trong khung mẫu có vị trí không gian 2 hoặc 3 chiều) Ví dụ lấy mẫu nước sông, đất ở sườn đồi, hoặc không khí trong phòng Cách chọn mẫu như vậy thường gặp trong các nghiên cứu sinh học, địa chất, địa lý Lấy mẫu theo sự phân bố này yêu cầu có sự giống nhau về không gian qua các phương pháp ngẫu nhiên, hệ thống và phân lớp Kết quả của một mẫu chọn có thể được biểu diễn như một loạt các điểm trong trong không gian hai chiều, giống như là bản đồ

3 Suy rộng kết quả điều tra chọn mẫu

Các công cụ được sử dụng trong suy rộng kết quả từ mẫu cho quần thể :

3.1 Bài toán ước lượng

Điều tra toàn bộ bộc lộ những hạn chế khi tổng thể trở nên quá rộng lớn hoặc khó xác định chính xác các đơn vị điều tra Khi đó để tìm hiểu một dấu hiệu nào đó của tổng thể, người ta căn cứ trên một mẫu nhỏ rồi dùng các phương pháp toán học để suy rộng kết quả đó cho tổng thể Bài toán như thế được gọi là bài toán ước lượng

Trang 28

Khi muốn nghiên cứu về một dấu hiệu 𝑋∗ của một tổng thể bằng cách ước lượng, người ta mô hình hóa dấu hiệu 𝑋∗ bằng một đại lượng ngẫu nhiên X (X là giá trị của 𝑋∗đo được trên một phần tử) Bài toán ước lượng theo Hoàng Ngọc Nhậm

(2007), tr.178 được phát biểu như sau:

Cho đại lượng ngẫu nhiên X có thể đã biết hoặc chưa biết quy luật phân phối xác suất và chưa biết tham số 𝜃 nào đó của nó Hãy ước lượng 𝜃 bằng phương pháp mẫu

Giá trị của 𝜃 có thể được ước lượng bằng một trong hai cách:

Ước lượng điểm: Chỉ ra một con số cụ thể làm giá trị ước lượng của 𝜃 (con số này là giá trị của hàm ước lượng tính được trên một mẫu cụ thể nào đó được chọn ra

từ hệ thống) Để đánh giá chất lượng của ước lượng điểm, người ta đưa ra nhiều tiêu chuẩn lựa chọn hàm ước lượng, trong đó có thể kể đến một số tiêu chuẩn phổ biến như ước lượng không chệch, ước lượng hiệu quả, ước lượng vững…

Ước lượng khoảng: Không đưa ra một số cụ thể như ước lượng điểm, nhưng chỉ

ra một khoảng (gọi là khoảng tin cậy) chứa giá trị cần ước lượng Với phương pháp này, ta có thể xác định được độ tin cậy cũng như độ chính xác của ước lượng bằng cách chọn một mẫu có kích thước đảm bảo đạt được độ tin cậy và độ chính xác cho trước Tuy nhiên, khi ta nói rằng ước lượng này có độ tin cậy là 1 − 𝛼 thì cũng đồng nghĩa với khẳng định ước lượng này có độ rủi ro là 𝛼

3.2 Bài toán kiểm định giả thuyết thống kê

Hàng ngày chúng ta tiếp nhận rất nhiều các thông tin, tuy nhiên không phải thông tin nào cũng chính xác và đáng tin cậy Để có thể sàng lọc thông tin, trả lời cho câu hỏi đúng hay không chúng ta cần thực hiện các kiểm chứng Khi đó, các nhận định được đưa ra và cần kiểm chứng được gọi là các giả thuyết; còn việc kiểm tra xem có thể chấp nhận hay bác bỏ các nhận định đó được gọi là kiểm chứng giả

Trang 29

thuyết Nếu giả thuyết liên quan đến các số đặc trưng của tổng thể hay quy luật phân phối xác suất của các tham số này thì ta có khái niệm giả thuyết thống kê (còn được gọi là giả thuyết không và thường được kí hiệu là 𝐻0) và kiểm định khi

đó được gọi là kiểm định giả thuyết thống kê

Nội dung trong phần này được chúng tôi tổng hợp lại từ kết quả nghiên cứu của

tác giả Lê Thị Hoài Châu đã được công bố trong “Dạy học xác suất – thống kê ở

trường phổ thông” và luận văn thạc sĩ của tác giả Đinh Thị Mạnh (2013):

Bài toán kiểm định giả thuyết TK được phát biểu như sau: Cho biến ngẫu nhiên X và giả thuyết 𝐻0 về phân phối xác suất của X 𝐻0 được gọi là giả thuyết không Một mệnh đề 𝐻1 đối ngược với 𝐻0 được gọi là đối thuyết Cần kiểm định xem

𝐻0 đúng hay sai trên cơ sở mẫu lấy được là (𝑥1, 𝑥2, … , 𝑥𝑛 )

Muốn vậy, người ta lập không gian mẫu (𝑋1, 𝑋2, … , 𝑋𝑛) và trên không gian mẫu

ta xác định một miền W gọi là miền bác bỏ giả thuyết 𝐻0, phần bù của W, kí hiệu

𝑊̅ , được gọi là miền chấp nhận giả thuyết 𝐻0 Nếu điểm (𝑥1, 𝑥2, … , 𝑥𝑛 ) thuộc W thì ta coi như giả thuyết 𝐻0là sai và bác bỏ giả thuyết đó Nếu điểm (𝑥1, 𝑥2, … , 𝑥𝑛 ) thuộc 𝑊̅ thì ta coi giả thuyết là đúng và chấp nhận nó

Tương tự như ước lượng, ta không thể khẳng định kết quả của việc kiểm định giả thuyết là chính xác 100% Việc kiểm định này chỉ cho kết quả với một độ tin cậy nào đó và có thể xảy ra sai lầm Các sai lầm này được phân thành 2 loại:

Sai lầm loại 1: Giả thuyết 𝐻0 đúng nhưng ta lại bác bỏ nó

Sai lầm loại 2: Chấp nhận giả thuyết 𝐻0 khi giả thuyết 𝐻0 là sai

Hai loại sai lầm trên đều có thể gây ra những tác hại nghiêm trọng, nhưng nếu ta

cố tìm cách giảm thiểu sai lầm loại này cũng đồng nghĩa làm tăng sai lầm loại còn lại Tuy nhiên các nhà TK nhận định rằng sai lầm loại 1 nghiêm trọng hơn sai lầm

Trang 30

loại 2 Vì vậy, các kiểm định giả thuyết TK thông dụng đều xác định ngay từ đầu giá trị 𝛼 để hạn chế sai lầm loại 1

3.3 Bài toán tính kích thước mẫu

Một trong các nội dung quan trọng của mỗi cuộc điều tra TK là xác định kích

thước mẫu điều tra Đào Hồng Nam (2014), Dạy học xác suất - thống kê ở trường

đại học Y, luận án tiến sĩ khoa học giáo dục, trang 52 tác giả đã viết:

Trong chọn mẫu, xác định cỡ mẫu là một trong những việc cần thực hiện đầu tiên Cỡ mẫu nhỏ thì mẫu sẽ không phản ánh đầy đủ thông tin của quần thể nghiên cứu, dẫn đến những kết luận không đáng tin cậy Ngược lại, cỡ mẫu lớn sẽ làm hao tốn tài nguyên, kinh phí, thậm chí làm hư hại quần thể Đối với mỗi bài toán

TK, cách chọn mẫu cũng khác nhau tùy theo mục đích nghiên cứu và tính chất của biến ngẫu nhiên Việc tính cỡ mẫu phải dựa vào những thông tin đã biết về quần thể (qua các công trình đã thực hiện) hoặc phải tiến hành nghiên cứu mô phỏng để thu thập các thông tin cần thiết

Như vậy, trên cơ sở kích thước mẫu (n), người ta sẽ xác định các cá thể mẫu tùy theo điều kiện cụ thể của mỗi cuộc điều tra Chúng tôi quan tâm đến việc xác định

cỡ mẫu với mẫu ngẫu nhiên đơn giản, vì vậy đối với các phương pháp chọn mẫu khác chúng tôi sẽ không trình bày trong luận văn này

Nếu X là biến sử dụng làm căn cứ chọn mẫu, ta có:

𝑉𝑎𝑟(𝑋̅) = 𝛿2𝑋̅ =

𝛿2

𝑛 (𝑁 − 𝑛)(𝑁 − 1)

Từ đó: 𝑛 = (𝑁𝛿2)

((𝑁−1)𝛿2𝑋̅ +𝛿2)

Trang 31

Trong công thức trên, phương sai tổng thể chưa biết, trong trường hợp này chúng

ta có thể ước lượng giá trị này qua phương sai mẫu Có thể ước lượng trội cho n nhờ công thức sau:

𝑛 = 𝑁

1 + 𝑡(𝑁 − 1)

Trong đó: 𝑡 = 𝛿2𝑋 ̅

𝛿 2 là tỷ lệ của phương sai trung bình mẫu với phương sai tổng thể,

tỉ lệ t do người nghiên cứu lựa chọn Công thức này có thể sử dụng trong trường hợp chúng ta quan tâm đến các ước lượng điểm, đặc biệt là ước lượng điểm của trung bình tổng thể

3.4 Suy rộng kết quả điều tra chọn mẫu

Sau khi đã thu thập được đầy đủ tài liệu ở các đơn vị của tổng thể mẫu, căn cứ vào

đó để tiến hành tính toán và suy rộng (ước lượng) ra các đặc điểm của tổng thể chung Có hai phương pháp suy rộng: suy rộng trực tiếp và suy rộng khoảng Suy rộng trực tiếp: Coi các mức độ của mẫu cũng là các mức độ của tổng thể chung Chẳng hạn, coi số bình quân mẫu, tỷ lệ của mẫu cũng là số bình quân, tỷ

Trang 32

toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu

để tiến hành điều tra thực tế Các đơn vị này sẽ được chọn theo nguyên tắc nhất định đảm bảo tính đại diện Kết quả của điều tra chọn mẫu được dùng để suy rộng cho toàn bộ tổng thể Do đó để hạn chế những rủi ro và sai lầm thì đòi hỏi mẫu phải đại diện tốt cho quần thể, tức là mẫu phải có cấu trúc tương tự như quần thể chứa nó

Có nhiều phương pháp tổ chức chọn mẫu khác nhau tùy theo đặc điểm của đối tượng điều tra Một trong các phương pháp chọn mẫu được sử dụng đó là chọn mẫu ngẫu nhiên Để thực hiện tốt các cuộc điều tra chọn mẫu, cần phải tiến hành theo đúng trình tự nhất định như xác định mục đích nghiên cứu, xác định tổng thể nghiên cứu, xác định nội dung điều tra, xác định số lượng đơn vị tổng thể mẫu và phương pháp tổ chức chọn mẫu, thu thập số liệu ở mẫu, suy rộng kết quả mẫu và rút ra kết luận cho toàn bộ tổng thể

Hầu hết các cuộc điều tra đều phải tiến hành sau quá trình chọn mẫu Do vậy nếu người thực hiện thống kê không có cơ sở lý luận vững chắc về chọn mẫu sẽ dẫn đến rủi ro và sai lầm cao khi suy rộng cho toàn bộ tổng thể Bằng việc tìm hiểu vai trò, nguồn gốc nảy sinh của chọn mẫu cho phép chúng tôi khẳng định tầm quan trọng và phổ biến của nó trong cuộc sống Chính vì tầm quan trọng và tính phổ biến này khiến chúng tôi đặt ra nhu cầu cần thiết phải truyền đạt các kiến thức về chọn mẫu đến học sinh THPT, khi mà mục tiêu giáo dục được đề ra là giúp học sinh sử dụng các kiến thức được học để ứng dụng giải quyết các bài toán thực tế

Trang 33

Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ

Thực hiện chương 2 cũng chính là việc chúng tôi đưa ra câu trả lời cho Q2:

Q2: Bài toán chọn mẫu tồn tại như thế nào trong chương trình thống kê ở Việt Nam? Nhìn sang chương trình giảng dạy khác (chương trình giảng dạy thống kê của Mỹ), bài toán chọn mẫu được trình bày ra sao? Có sự khác biệt nào trong việc lựa chọn của những chương trình này?

Để trả lời cho câu hỏi này, chúng tôi sẽ phân tích chương trình giảng dạy TK trong thể chế dạy học ở Việt Nam để làm rõ những vấn đề sau: Chọn mẫu xuất hiện trong chương trình học lớp mấy? Trước khi được đưa vào dạy học thì đối tượng

có được xuất hiện ngầm ẩn hay không? Chọn mẫu dành được sự quan tâm như thế nào trong toàn bộ chương trình giảng dạy TK ở các cấp học? Đồng thời để làm rõ hơn sự tồn tại của chọn mẫu trong chương trình dạy học, chúng tôi lựa chọn phân tích SGK toán 10 nâng cao (S10NC) để tìm hiểu xem đối tượng đã được xuất hiện như thế nào, có các KNV nào về chọn mẫu?

1 Bài toán chọn mẫu trong dạy học thống kê ở Việt Nam

1.1 Phân tích chương trình

Thống kê được đưa vào giảng dạy xuyên suốt trong các cấp học, từ tiểu học đến trung học phổ thông Ở chương trình tiểu học, tới học kì II lớp 3, yếu tố TK mới chính thức được đưa vào chương trình, học sinh sẽ được giới thiệu và làm quen với dãy số liệu, bảng số liệu: Thứ tự của dãy số, cách đọc và phân tích số liệu, thực hành lập bảng số liệu đơn giản, đọc số liệu trong bảng Tiếp theo, ở chương trình

TK lớp 4 và lớp 5, học sinh được học về cách tìm số trung bình cộng và làm quen với các dạng biểu đồ: Biểu đồ tranh, biểu đồ cột, biểu đồ quạt Sự phân phối TK như vậy hoàn toàn phù hợp với mục tiêu của dạy học thống kê ở tiểu học là cung

Trang 34

cấp những hiểu biết ban đầu về thống kê mô tả, rèn luyện một số ứng dụng toán học vào thực tiễn, hình thành tư duy “thống kê” cho học sinh Như vậy bài toán chọn mẫu hoàn toàn chưa được đề cập trong bậc tiểu học

Ở bậc trung học cơ sở, TK chỉ được đưa vào giảng dạy ở chương trình toán lớp 7 SGK dành toàn bộ thời lượng quan tâm đến vấn đề thu thập số liệu thống kê (dấu hiệu, tần số, bảng tần số, mốt, trung bình cộng) và cách biểu diễn số liệu thống kê (thông qua biểu đồ đoạn thẳng và biểu đồ hình chữ nhật) So với chương trình ở bậc tiểu học thì lượng kiến thức ở bậc trung học có tăng lên, học sinh làm quen với các khái niệm mới Tuy nhiên học sinh chỉ mới dừng lại ở việc vận dụng công thức để tính toán hoặc nhìn vào bảng số liệu để trả lời những câu hỏi đơn giản Trong phần ôn tập chương III, SGK toán lớp 7, tập hai có xuất hiện câu hỏi:

Muốn thu thập các số liệu về một vấn đề mà mình quan tâm chẳng hạn như màu sắc mà mỗi bạn trong lớp ưa thích thì em phải làm những việc gì và trình bày kết quả thu được theo mẫu bảng nào?

(SGK toán lớp 7, tr.22)

Với câu hỏi này, sách hướng dẫn giải bài tập toán 7, có đưa ra gợi ý như sau:

Muốn thu thập số liệu của một dấu hiệu nào đó (kí hiệu là X) ta cần phân chia đối tượng thành các phần có thể nghiên cứu, tức là phân thành các đơn vị diều tra Đánh số hay đặt tên các đơn vị điều tra Định ra một thứ tự cho các đơn vị điều tra, xác định giá trị của dấu hiệu

Có thể thấy, việc chọn mẫu đã được xuất hiện ngầm ẩn trong hướng dẫn giải: “Ta

cần phân chia đối tượng thành các phần có thể nghiên cứu, tức là phân thành các đơn vị điều tra”

Trang 35

Ở bậc trung học phổ thông, TK tiếp tục được giới thiệu trong chương trình toán lớp 10 bao gồm 3 bài và được dự kiến giảng dạy trong 9 tiết Yêu cầu và mục đích của việc đưa TK vào giảng dạy ở chương trình lớp 10 được SGV viết như sau: Về việc trình bày một mẫu số liệu, yêu cầu học sinh:

- Hiểu và biết cách lập bảng phân bố tần số, bảng phân bố tần suất (nếu là bảng phân bố tần số - tần suất ghép lớp thì phải cho trước cách chia lớp)

- Dựa vào bảng phân bố tần số (tần suất) ghép lớp, vẽ được biểu đồ tần

số (tần suất) hình cột; biết cách vẽ đường gấp khúc tần số (tần suất) và biểu đồ tần suất hình quạt

Về các số đặc trưng của mẫu số liệu, yêu cầu học sinh:

- Hiểu ý nghĩa và biết cách tính số trung bình, số trung vị, mốt, phương sai và độ lệch chuẩn của một mẫu số liệu

- Trong trường hợp mẫu số liệu được cho bởi bảng phân bố tần số ghép lớp, biết tính xấp xỉ số trung bình, phương sai và độ lệch chuẩn Các khái niệm mẫu số liệu, điều tra mẫu lần đầu được đề cập Tuy nhiên trong những yêu cầu mà chương đặt ra lại hoàn toàn không có yêu cầu nào đòi hỏi học sinh phải hiểu vai trò của chọn mẫu hay biết các kĩ thuật về chọn mẫu Vì đây là nội dung có liên quan trực tiếp đến đối tượng nghiên cứu nên chúng tôi sẽ phân tích chi tiết hơn trong phần phân tích SGK toán 10 nâng cao

1.2 Phân tích SGK

Thống kê ở chương trình toán lớp 10 bao gồm 3 bài, được giảng dạy trong 9 tiết

Chúng tôi sử dụng “Bảng tóm tắt nội dung các bài học trong chương V” đã được

Đinh Thị Mạnh trình bày trong luận văn tốt nghiệp cao học của mình để đưa ra

Trang 36

tổng quan các kiến thức thống kê được xuất hiện trong chương trình toán 10 nâng cao như sau:

Bảng 2.1: Bảng tóm tắt nội dung các bài học trong chương V

STT Tên bài Nội dung

1 Một vài khái niệm mở

3 Các loại biểu đồ :

- Biểu đồ tần số, tần suất hình cột

- Đường gấp khúc tần số, tần suất

- Biểu đồ tần suất hình quạt

3 Các số đặc trưng của

mẫu số liệu

1 Số trung bình

2 Số trung vị

3 Mốt

4 Phương sai và độ lệch chuẩn

Dựa vào bảng tóm tắt nội dung trên, có thể nhận thấy khái niệm mẫu, điều tra mẫu được trực tiếp xuất hiện trong bài 1 – Một vài khái niệm mở đầu Phần lớn thời lượng chương trình tập trung vào việc trình bày một mẫu dữ liệu và các số đặc trưng của mẫu số liệu Do đó chúng tôi sẽ tập trung phân tích Bài 1 để thấy vấn đề chọn mẫu được xuất hiện như thế nào ? Đối với Bài 2 và Bài 3, chúng tôi quan tâm đến việc mẫu và vấn đề chọn mẫu được vận dụng để xây dựng kiến thức mới

Trang 37

ra sao, việc xây dựng kiến thức mới như vậy có làm nổi bật được ý nghĩa, vai trò của chọn mẫu hay không ?

1.2.1 Về lý thuyết

Bài 1 : Một vài khái niệm mở đầu

SGK dành phần đầu tiên để giới thiệu khái niệm TK và vai trò của TK Mở đầu bài học bằng câu hỏi “Thống kê là gì ?” Sau đó, câu hỏi này đã được SGK đưa ra câu trả lời như sau :

Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân tích và xử lý số liệu (SGK Toán đại số lớp 10 nâng cao, trang 159)

Như để giải thích cho việc tại sao cần phải học TK, SGK đã đưa ra nhận xét :

Thống kê giúp ta phân tích các số liệu một cách khách quan và rút ra các tri thức, thông tin chứa đựng trong các số liệu đó Trên cơ sở này, chúng ta mới

có thể đưa ra những dự báo và quyết định đúng đắn Vì thế thống kê cần thiết cho mọi lực lượng lao động… (SGK Toán đại số lớp 10 nâng cao, trang 159)

SGK đã nêu lên vai trò của TK và một trong các vai trò đó là qua phân tích số liệu thống kê, chúng ta có thể đưa ra những dự báo và quyết định đúng đắn Điều mà chúng tôi băn khoăn là thông qua những tiết học về TK, học sinh có thật sự thấy được vai trò này hay không ?

Trong mục tiếp theo của bài học SGK giới thiệu về khái niệm mẫu số liệu

Để học sinh nhớ lại các khái niệm dấu hiệu, đơn vị điều tra, giá trị của dấu hiệu

SGK đưa ra một ví dụ Sau đó đưa ra “bài giải” dấu hiệu là gì, đơn vị điều tra là gì mà không yêu cầu thêm bất cứ hoạt động nào :

Trang 38

Việc nhắc lại các khái niệm của thống kê lớp 7 nhằm tạo điều kiện thuận lợi cho việc định nghĩa các khái niệm tiếp theo của SGK

Một tập con hữu hạn các đơn vị điều tra được gọi là một mẫu Số phần tử của một mẫu được gọi là kích thước mẫu Các giá trị của dấu hiệu thu được trên mẫu được gọi là một mẫu số liệu (mỗi giá trị như thế còn gọi là một số liệu mẫu) (SGK toán lớp 10 nâng cao, tr.160)

Mặc dù mẫu được định nghĩa một cách tường minh Tuy nhiên sự xuất hiện của mẫu chỉ có ý nghĩa như một tên gọi Nếu như ở thống kê lớp 7, đề bài cho “Kết

Trang 39

quả điều tra về số con của 30 gia đình…”, thì khi khái niệm mẫu xuất hiện đề bài

sẽ được viết dưới dạng “Cho mẫu số liệu sau…” Như vậy vai trò của mẫu chưa được SGK đề cập đến, chúng tôi cho rằng, đối với học sinh việc học thêm một khái niệm mà không có ý nghĩa tồn tại thì sẽ dễ bị lãng quên

Sau khái niệm mẫu dữ liệu, SGK tiếp tục giới thiệu thêm 2 khái niệm mới là điều

tra toàn bộ và điều tra mẫu:

Nếu thực hiện điều tra trên mọi đơn vị điều tra thì đó là điều tra toàn bộ Nếu chỉ điều tra trên một mẫu thì đó là điều tra mẫu (SGK toán lớp 10 nâng cao, tr.160)

2 khái niệm này xuất hiện một cách tường minh và dễ hiểu Tiếp đến SGK đưa ra mối liên hệ giữa hai loại điều tra trên:

Điều tra toàn bộ đôi khi không khả thi vì số lượng các đơn vị điều tra quá lớn hoặc vì muốn điều tra thì phải phá hủy đơn vị điều tra Chúng ta thường chỉ điều tra mẫu và phân tích xử lý mẫu số liệu thu được (SGK toán 10 nâng cao, tr.160)

Với cách lựa chọn giới thiệu của SGK, điều tra mẫu được hiểu là sự thay thế của điều tra toàn bộ khi điều tra toàn bộ không khả thi trong trường hợp số lượng đơn

vị điều tra quá lớn hoặc phải phá hủy đơn vị điều tra SGK đã làm rõ được ý nghĩa của điều tra mẫu Tuy nhiên vấn đề đặt ra là điều tra mẫu như thế nào? SGK đã không lựa chọn làm rõ bài toán chọn mẫu, các kĩ thuật cũng như vai trò của chọn mẫu trong việc điều tra mẫu

Trong 2 bài học tiếp theo của chương TK, SGK quan tâm đến việc làm thế nào để

xử lý số liệu sau khi đã chọn được một mẫu Vấn đề chọn mẫu được SGK coi như

đã được thực hiện, do đó không có thêm các nội dung nào nói về chọn mẫu Trong

Trang 40

bài 2 – Trình bày một số liệu thống kê, SGK tập trung vào xây dựng các khái niệm bảng phân bố tần số – tần suất ghép lớp và chú trọng đến việc hình thành kĩ thuật giúp học sinh có thể vẽ được các biểu đồ tần số, tần suất Trong bài 3 – Các số đặc trưng của mẫu số liệu, SGK giới thiệu cho học sinh các tham số thống kê như: Số trung bình, số trung vị, mốt, phương sai độ lệch chuẩn… Do đây đều không phải đối tượng nghiên cứu chính của luận văn nên chúng tôi không lựa chọn phân tích

sự xuất hiện của chúng trong SGK Chúng tôi cho rằng sau khi học xong hai bài thống kê 2 và 3, học sinh có khả năng xử lý và biểu diễn các số liệu thống kê đơn giản, đây là cơ sở kiến thức phục vụ cho việc suy rộng kết quả thống kê cho quần thể

1.2.2 Các tổ chức toán học

Bài 1 – Một vài khái niệm mở đầu: Sau khi giới thiệu các khái niệm cơ bản, bao gồm cả mẫu số liệu, thì phần bài tập về nội dung không có sự thay đổi so với với nội dung kiến thức thống kê lớp 7 Chỉ khác ở sự thay đổi cách đặt câu hỏi: “Có bao nhiêu giá trị của dấu hiệu?” thành “kích thước của mẫu là bao nhiêu?”

Trong 2 bài tiếp theo xuất hiện các kiểu nhiệm vụ mới Chúng tôi sẽ sử dụng lại

số liệu thống kê các KNV có trong SGK và SBT đã được tác giả Đinh Thị Mạnh chỉ ra như sau:

TXD.DHDT: Xác định dấu hiệu điều tra

TXD.DVDT: Xác định đơn vị điều tra

TXD.GT: Xác định giá trị khác nhau của mẫu số liệu

TT.TSU: Tính tần suất của các giá trị

TLB.TSO: Lập bảng tần số

Ngày đăng: 01/12/2020, 21:10

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w