1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Đề cương bài giảng xác suất thống kê trong kinh tế

141 334 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 141
Dung lượng 2,31 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường Thống kê là một hệ thống các phương pháp bao gồm thu thập, tổng hợp, trình bày số liệu, tính toán các đặc trưng củ

Trang 1

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT HƯNG YÊN

KHOA KINH TẾ

ĐỀ CƯƠNG BÀI GIẢNG

XÁC SUẤT VÀ THỐNG KÊ TRONG KINH TẾ HOC (Tài liệu lưu hành nội bộ)

Hưng Yên

Trang 2

MỤC LỤC Trang

CHƯƠNG 1 GIỚI THIỆU MÔN HỌC……….3

1.1 Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường……… … 3

1.2 Các phương pháp thống kê kinh tế……… 3

1.3 Những khái niệm thường dùng trong thống kê……… 4

1.4 Thang đo trong thống kê……….6

1.5 Thu thập thông tin trong thống kê……… 7

CHƯƠNG 2 XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT……… ………11

2.1 Biến cố ngẫu nhiên và xác suất……….11

2.2 Biến ngẫu nhiên và quy luật phân phối xác suất……… 16

CHƯƠNG 3 THỐNG KÊ MÔ TẢ……… …………20

3.1.Tổng hợp và trình bày số liệu thống kê……… ………20

3.2 Phân tổ số liệu thống kê……… …… 28

3.3 Đồ thị mô tả tập thống kê……… ………32

3.4 Chỉ số đặc trưng của tập thống kê……….34

3.5 Phương pháp chỉ số……… ……….37

CHƯƠNG 4 THỐNG KÊ SUY LUẬN……… ………55

4.1 Phân phối xác suất đại lượng ngẫu nhiên……….……….55

4.2 Ước lượng khoảng tin cậy……….56

4.3 Kiểm định giả thiết……… ……… 64

4.4.Tương quan và hồi quy tuyến tính………66

4.5 Dãy số thời gian……….74

CHƯƠNG 5 THỐNG KÊ KẾT QUẢ HOẠT ĐỘNG SẢN XUẤT, KINH DOANH CỦA ĐƠN VỊ CƠ SỞ……….…78

5.1 Một số khái niệm cơ bản về kết quả sản xuất, kinh doanh……… 78

5.2 Hệ thống chỉ tiêu đo lường kết quả hoạt động sản xuất, kinh doanh của đơn vị cơ sở….…80 5.3 Thống kê chất lượng sản phẩm……… …87

5.4 Dự báo thống kê trong các đơn vị sản xuất, kinh doanh……….89

5.5 Phương pháp phân tích thống kê kết quả sản xuất, kinh doanh của đơn vị cơ sở 90

CHƯƠNG 6 THỐNG KÊ KẾT QUẢ HOẠT ĐỘNG KINH DOANH DỊCH VỤ CỦA ĐƠN VỊ CƠ SỞ……….………92

6.1 Một số đặc điểm của hoạt động dịch vụ 92

6.2 Thống kê kết quả hoạt động dịch vụ thương mại của các đơn vị cơ sở sản xuất vật chất 92

6.3 Thống kê kết quả hoạt động dịch vụ vận tải của các đơn vị cơ sở hoạt động vật chất 95

6.4 Thống kê kết quả sửa chữa và xây lắp các công trình kiến trúc 96

CHƯƠNG 7 THỐNG KÊ GIÁ THÀNH SẢN XUẤT VÀ HIỆU QUẢ SẢN XUẤT KINH DOANH CỦA ĐƠN VỊ CƠ SỞ……….……… 98

7.1 Khái niệm, ý nghĩa của các loại chỉ tiêu giá thành và tác dụng của nó đối với công tác quản lý đơn vị cơ sở 98

7.2 Nội dung kinh tế của chỉ tiêu giá thành 99

7.3 Phương pháp phân tích tài liệu thống kê giá thành……… …….100

7.4 Thống kê hiệu quả sản xuất, kinh doanh của đơn vị……….104

Trang 3

7.5 Thống kê ảnh hưởng của sản xuất đến môi trường của các đơn vị cơ sở……….107 CHƯƠNG 8 THỐNG KÊ LAO ĐỘNG CỦA ĐƠN VỊ CƠ SỞ……….……109 8.1 Thống kê số lượng và sự biến động lao động của đơn vị cơ sở………109 8.2 Thống kê tình hình sử dụng số lượng và thời gian lao động của đơn vị cơ sở………….112 8.3 Thống kê năng suất lao động trong đơn vị cơ sở……… …114 8.4 Thống kê thu nhập của lao động trong đơn vị cơ sở……….119 CHƯƠNG 9 THỐNG KÊ TÀI SẢN CỐ ĐỊNH VÀ ĐẦU TƯ DÀI HẠN CỦA ĐƠN VỊ CƠ SỞ……… ………126 9.1 Thống kê tài sản cố định của đơn vị cơ sở………126 9.2 Thống kê đầu tư dài hạn của đơn vị cơ sở……….130 CHƯƠNG 10 THỐNG KÊ VỐN VÀ HOẠT ĐỘNG TÀI CHÍNH CỦA ĐƠN VỊ CƠ SỞ……… 133 10.1 Thống kê vốn đầu tư của đơn vị cơ sở……… ………133 10.2 Phân loại vốn đầutư của đơn vị cơ sở……… ……….135

Trang 4

CHƯƠNG 1 GIỚI THIỆU MÔN HỌC 1.1 Định nghĩa, chức năng của thống kê trong quản lý nền kinh tế thị trường

Thống kê là một hệ thống các phương pháp bao gồm thu thập, tổng hợp, trình bày số liệu, tính toán các đặc trưng của đối tượng nghiên cứu nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định

Chức năng của thống kê Thống kê thường được phân thành 2 lĩnh vực:

- Thống kê mô tả (Descriptive statistics): là các phương pháp có liên quan đến việc thu thập số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng khác nhau để phản ánh một cách tổng quát đối tượng nghiên cứu

- Thống kê suy luận (Inferential statistics): là bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát mẫu

1.2 Các phương pháp thống kê kinh tế

- Thu thập và xử lý số liệu: Số liệu thu thập thường rất nhiều và hỗn độn, các dữ liệu đó chưa đáp ứng cho quá trình nghiên cứu Để có hình ảnh tổng quát về tổng thể nghiên cứu, số liệu thu thập phải được xử lý tổng hợp, trình bày, tính toán các số đo; kết quả có được sẽ giúp khái quát được đặc trưng của tổng thể

- Nghiên cứu các hiện tượng trong hoàn cảnh không chắc chắn: Trong thực tế, có nhiều hiện tượng mà thông tin liên quan đến đối tượng nghiên cứu không đầy đủ mặc dù người nghiên cứu đã có sự cố gắng Ví dụ như nghiên cứu về nhu cầu của thị trường về một sản phẩm ở mức độ nào, tình trạng của nền kinh tế ra sao, để nắm được các thông tin này một cách rõ ràng quả là một điều không chắc chắn

- Điều tra chọn mẫu: Trong một số trường hợp để nghiên cứu toàn bộ tất cả các quan sát của tổng thể là một điều không hiệu quả, xét cả về tính kinh tế (chi phí, thời gian) và tính kịp thời, hoặc không thực hiện được Chính điều này đã đặt ra cho thống kê xây dựng các phương pháp chỉ cần nghiên cứu một bộ phận của tổng thể mà có thể suy luận cho hiện tượng tổng quát mà vẫn đảm bảo độ tin cậy cho phép, đó là phương pháp điều tra chọn mẫu

- Nghiên cứu mối liên hệ giữa các hiện tượng: Giữa các hiện tượng nghiên cứu thường

có mối liên hệ với nhau Ví dụ như mối liên hệ giữa chi tiêu và thu nhập; mối liên hệ giữa lượng vốn vay và các yếu tố tác động đến lượng vốn vay như chi tiêu, thu nhập,

Trang 5

trình độ học vấn; mối liên hệ giữa tốc độ phát triển với tốc độ phát triển của các ngành, lạm phát, tốc độ phát triển dân số,…Sự hiểu biết về mối liên hệ giữa các hiện tượng rất

có ý nghĩa, phục vụ cho quá trình dự đoán

- Dự đoán: Dự đoán là một công việc cần thiết trong tất cả các lĩnh vực hoạt động Trong hoạt động dự đoán người ta có thể chia ra thành nhiều loại:

(1) Dự đoán dựa vào định lượng và dựa vào định tính Tuy nhiên, trong thống kê chúng

ta chủ yếu xem xét về mặt định lượng với mục đích cung cấp cho những nhà quản lý có cái nhìn mang tính khoa học hơn và cụ thể hơn trước khi ra quyết định phù hợp

(2) Dự đoán dựa vào nội suy và dựa vào ngoại suy

- Dự đoán nội suy là chúng ta dựa vào bản chất của hiện tượng để suy luận, ví dụ như chúng ta xem xét một liên hệ giữa lượng sản phẩm sản xuất ra phụ thuộc các yếu tố đầu vào như vốn, lao động và trình độ khoa học kỹ thuật

- Dự đoán dựa vào ngoại suy là chúng ta chỉ quan sát sự biến động của hiện tượng trong thực tế, tổng hợp lại thành qui luật và sử dụng qui luật này để suy luận, dự đoán sự phát triển của hiện tượng Ví dụ như để đánh giá kết quả hoạt động của một công ty người ta xem xét kết quả hoạt động kinh doanh của họ qua nhiều năm Ngoài ra, người ta còn có thể phân chia dự báo thống kê ra thành nhiều loại khác

1.3 Những khái niệm thường dùng trong thống kê

1.3.1 Tổng thể thống kê

Tổng thể thống kê là tập hợp các đơn vị cá biệt về sự vật, hiện tượng trên cơ sở một đặc điểm chung nào đó cần được quan sát, phân tích mặt lượng của chúng Các đơn vị, phần tử tạo nên hiện tượng được gọi là các đơn vị tổng thể

Như vậy, muốn xác định được tổng thể thống kê ta cần xác định được tất cả các đơn vị của tổng thể đó

Dựa vào việc xác định tổng thể, tổng thể chia làm hai loại:

Tổng thể bộc lộ: Các đơn vị của tổng thể được biểu hiện một cách rõ ràng, dễ xác định Tổng thể tiềm ẩn: Các đơn vị của nó không được nhận diện một cách trực tiếp, ranh

giới của nó không rõ ràng

Theo mục đích nghiên cứu:

Tổng thể đồng chất: những đơn vị có cùng chung những đặc điểm chủ yếu có liên quan

đến mục đích nghiên cứu

Trang 6

Tổng thể không đồng chất: bao gồm những đơn vị khác nhau về loại hình, khác nhau

về những đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu

1.3.2 Mẫu

Mẫu (Samples) là một bộ phận của tổng thể, đảm bảo được tính đại diện và được chọn ra

để quan sát và dùng để suy diễn cho toàn bộ tổng thể Như vậy, tất cả các phần tử của mẫu phải thuộc tổng thể, nhưng ngược lại các phần tử của tổng thể thì chưa chắc thuộc mẫu Điều này tưởng chừng là đơn giản, tuy nhiên trong một số trường hợp việc xác định mẫu cũng có thể dẫn đến nhầm lẫn, đặc biệt là trong trường hợp tổng thể ta nghiên cứu là tổng thể tiềm ẩn Ngoài ra, chọn mẫu như thế nào để làm cơ sở suy diễn cho tổng thể, tức là mẫu phải mang tính đại diện cho tổng thể Điều này thực sự không dễ dàng, ta chỉ cố gắng hạn chế tối đa sự sai biệt này mà thôi chứ không thể khắc phục được hoàn toàn

Tiêu thức thống kê được chia thành hai loại:

Tiêu thức thuộc tính: là loại tiêu thức không được biểu hiện trực tiếp bằng con số, mà

các biểu hiện của nó được dùng để phản ánh loại hoặc tính chất của các đơn vị tổng thể

Tiêu thức số lượng: là loại tiêu thức có biểu hiện trực tiếp bằng con số Đấy là những

con số phản ánh đặc trưng có thể cân, đo, đong, đếm được của từng đơn vị tổng thể

Tiêu thức số lượng được chia làm 2 loại:

Loại rời rạc: là loại các giá trị có thể của nó là hữu hạn hay vô hạn và có thể đếm đ c

Loại liên tục: là loại mà giá trị của nó có thể nhận bất kỳ một trị số nào đó trong

một khoảng nào đó

1.3.5 Chỉ tiêu thống kê

Chỉ tiêu thống kê là những con số chỉ mặt lượng gắn với mặt chất của hiện số lớn trong

điều kiện thời gian, không gian cụ thể

Trang 7

Chỉ tiêu thống kê có khái niệm và mức độ Khái niệm có tên gọi, điều kiện thời gian và không gian Mức độ phản ánh quy mô hoặc cường độ của hiện tượng với các loại thang

đo khác nhau

1.3.6 Tham số tổng thể

Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng nghiên cứu Trong xác suất thống kê toán chúng ta đã biết các tham số tổng thể như trung bình tổng thể (µ), tỷ lệ tổng thể (p), phương sai tổng thể (σ2 ) Ngoài ra, trong quá trình nghiên cứu sâu môn thống kê chúng ta còn có thêm nhiều tham số tổng thể nữa như: tương quan tổng thể (ρ), hồi qui tuyến tính tổng thể,…

), hệ số tương quan mẫu (r),…

1.4 Thang đo trong thống kê

1.4.1 Thang đo định danh

Thang đo định danh là loại thang đo sử dụng cho các tiêu thức thuộc tính, mà các biểu

hiện của dữ liệu không có sự hơn kém, khác biệt về thứ bậc, không theo một trật tự xác định nào

1.4.2 Thang đo thứ bậc

Loại thang đo này cũng sử dụng cho các tiêu thức thuộc tính, mà các biểu hiện của dữ liệu có sự hơn kém, khác biệt về thứ bậc

1.4.3 Thang đo khoảng

Thang đo khoảng là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0

1.4.4 Thang đo tỷ lệ

Thang đo tỷ lệ là thang đo khoảng với giá trị 0 tuyệt đối (một trị số thật) được coi như điểm xuất phát của độ dài đo lường trên thang

Trang 8

Đây là loại thang đo định lượng chặt chẽ nhất

1.5 Thu thập thông tin trong thống kê

1.5.1 Xác định nội dung thông tin

Nói chung, tuỳ thuộc vào mục đích nghiên cứu để xác định những nội dung thông tin cần thu thập Thông tin sử dụng cho quá trình nghiên cứu phải đảm bảo các yêu cầu

cơ bản sau:

Thích đáng: Số liệu thu thập phải phù hợp, đáp ứng được mục đích nghiên cứu Số

liệu đáp ứng được mục tiêu nghiên cứu có tính chất trực tiếp hoặc gián tiếp Đối với những thông tin dễ tiếp cận thường thì ta sử dụng số liệu trực tiếp, ví dụ muốn biết được nhu cầu của khách hàng chúng ta có thể hỏi trực tiếp khách hàng Tuy nhiên, một

số nội dung nghiên cứu mang tính chất nhạy cảm hoặc khó thu thập thì chúng ta có thể thu nhập những số liên gián tiếp có liên quan, ví dụ để thu thập thu nhập của cá nhân chúng ta có thể thu thập những nội dung có liên quan như nghề nghiệp, đơn vị công tác, chức vụ, nhà ở, phương tiện đi lại

Chính xác: Các thông tin trong quá trình nghiên cứu phải có giá trị, đáng tin cậy để các

phân tích kết luận phản ánh được đặc điểm bản chất của hiện tượng

Kịp thời: Yêu cầu thông tin không những đáp ứng yêu cầu phù hợp, chính xác mà giá

trị thông tin còn thể hiện ở chỗ nó có phục vụ kịp thời cho công tác quản lý và tiến trình ra các quyết định hay không

Khách quan: Tức là số liệu thu thập được không bị ảnh hưởng vào tính chủ quan của

người thu thập cũng như người cung cấp số liệu và ngay cả trong thiết kế bảng câu hỏi Yếu tố khách quan tưởng chừng thực hiện rất dễ dàng nhưng thực tế thì chúng ta khó

có thể khắc phục vấn đề này một cách trọn vẹn, chúng ta chỉ có thể hạn chế yếu tố chủ quan một cách tối đa Ví dụ chỉ cần một hành động đơn giản là tiếp cận với đáp viên là

ít nhiều cũng ảnh hưởng đến kết quả trả lời của họ

1.5.2 Nguồn số liệu

1.5.2.1 Dữ liệu thứ cấp (Secondary data)

Dữ liệu thứ cấp là các thông tin đã có sẵn và đã qua tổng hợp, xử lý Loại dữ kiện này

có thể thu thập từ các nguồn sau:

Số liệu nội bộ: là loại số liệu đã được ghi chép cập nhật trong đơn vị hoặc được thu thập

từ các cuộc điều tra trước đây

Trang 9

(1) Số liệu từ các ấn phẩm của nhà nước: Các dữ liệu do các cơ quan thống kê nhà nước phát hành định kỳ như niên giám thống kê, các thông tin cập nhật hàng năm

về tình hình dân số lao động, kết quả sản xuất của các ngành trong nền kinh tế, số liệu

về văn hoá xã hội

(2) Báo, tạp chí chuyên ngành: Các báo và tạp chí đề cập đến vấn đề có tính chất chuyên ngành như tạp chí thống kê, giá cả thị trường,

(3) Thông tin của các tổ chức, hiệp hội nghề nghiệp: Viên nghiên cứu kinh tế, phòng thương mại

(4) Các công ty chuyên tổ chức thu thập thông tin, nghiên cứu và cung cấp thông tin theo yêu cầu

Số liệu thứ cấp có ưu điểm là có thể chia sẻ chi phí, do đó nó có tính kinh tế hơn, số liệu được cung cấp kịp thời hơn Tuy nhiên, dữ liệu thứ cấp thường là các thông tin cơ bản, số liệu đã được tổng hợp đã qua xử lý cho nên không đầy đủ hoặc không phù hợp cho quá trình nghiên cứu Số liệu thứ cấp thường ít được sử dụng để dự báo trong thống kê, số liệu này thường được sử dụng trong trình bày tổng quan nội dung nghiên cứu, là cơ sở để phát hiện ra vấn đề nghiên cứu Ngoài ra, số liệu thứ cấp còn được sử dụng để đối chiếu lại kết quả nghiên cứu để nhằm kiểm tra lại tính đúng đắn hoặc phát hiện ra những vấn đề mới để có hướng nghiên cứu tiếp

1.5.2.2 Dữ liệu sơ cấp (Primary data)

a) Điều tra toàn bộ: Là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc

tử đại diện để nghiên cứu và từ đó suy ra kết quả cho tổng thể bằng các phương pháp

Trang 10

thống kê

Điều tra chọn mẫu thường được sử dụng vì các lý do sau:

- Tiết kiệm chi phí

- Cung cấp thông tin kịp thời cho quá trình nghiên cứu

- Đáng tin cậy Đây là yếu tố rất quan trọng, nó làm cho điều tra chọn mẫu trở nên có hiệu quả và được chấp nhận Tuy nhiên, để có sự đáng tin cậy này chúng ta phải có phương pháp khoa học để đảm bảo tính chính xác để chỉ cần chọn ra một số quan sát mà có thể suy luận cho cả tổng thể rộng lớn – đó là nhờ vào các lý thuyết thống kê

Việc sử dụng điều tra toàn bộ hay điều tra chọn mẫu phụ thuộc vào nhiều yếu tố

có liên quan: kích thước tổng thể, thời gian nghiên cứu cứu, khả năng về tài chính và nguồn lực, đặc điểm của nội dung nghiên cứu

1.5.3 Các phương pháp thu thập thông tin

a) Quan sát: Là phương pháp thu thập dữ liệu bằng cách quan sát hành động, hành vi thái độ của đối tượng được điều tra Ví dụ, nghiên cứu trẻ con yêu thích màu sắc nào, quan sát thái độ khách hàng khi dùng thử loại sản phẩm Phương pháp này tỏ

ra hiệu quả đối với các trường hợp đối tượng khó tiếp cận và tăng tính khách quan của đối tượng Tuy nhiên, phương pháp này tỏ ra khá tốn kém nhưng lượng thông tin thu thập được ít

b) Phương pháp gửi thư: Theo phương pháp này nhân viên điều tra gởi bảng câu hỏi đến đối tượng cung cấp thông tin qua đường bưu điện Phương pháp gởi thư có thể thu thập thông tin với khối lượng lớn, tiết kiệm chi phí so với các phương pháp khác Tuy nhiên tỷ lệ trả lời bằng phương pháp này tương đối thấp, đây là một nhược điểm rất lớn của phương pháp này

c) Phỏng vấn bằng điện thoại: Phương pháp thu thập thông tin bằng cách phỏng vấn qua điện thoại Phương pháp này thu thập được thông tin một cách nhanh chóng, tuy nhiên phương pháp này có nhược điểm: tốn kém, nội dung thu thập thông tin bị hạn chế

d) Phỏng vấn trực tiếp:

Phương pháp phỏng vấn trực tiếp thích hợp cho những cuộc điều tra cần thu thập nhiều thông tin, nội dung của thông tin tương đối phức tạp cần thu thập một cách

Trang 11

chi tiết Phương pháp phỏng vấn trực tiếp cho 2 hình thức:

(1) Phỏng vấn cá nhân Nhân viên điều tra tiếp xúc với đối tượng cung cấp thông tin thường tại nhà riêng hoặc nơi làm việc Thông thường phỏng vấn trực tiếp được áp dụng khi chúng ta cho tiến hành điều tra chính thức

(2) Phỏng vấn nhóm Nhân viên điều tra phỏng vấn từng nhóm để thảo luận về một vấn đề nào đó Trường hợp này người ta thường sử dụng khi điều tra thử để kiểm tra lại nội dung của bảng câu hỏi được hoàn chỉnh chưa hoặc nhằm tìm hiểu một vấn

đề phức tạp mà bản thân người nghiên cứu chưa nắm được một cách đầy đủ mà cần phải có ý kiến cụ thể từ những người am hiểu

Trang 12

CHƯƠNG 2 XÁC SUẤT VÀ PHÂN PHỐI XÁC SUẤT 2.1 Biến cố ngẫu nhiên và xác xuất

2.1.1 Phép thử và các loại biến cố

Trong tự nhiên và xã hội, mỗi hiện tượng đều gắn liền với một nhóm các điều kiện

cơ bản và các hiện tượng đó chỉ có thể xảy ra khi nhóm các điều kiện cơ bản gắn liền với

nó được thực hiện Do đó, khi muốn nghiên cứu một hiện tượng, ta cần thực hiện nhóm các điều kiện cơ bản ấy Chẳng hạn, nếu muốn quan sát việc xuất hiện mặt sấp hay mặt ngửa của một đồng xu, ta phải tung đồng xu xuống đất; còn để xem xét việc viên đạn trúng bia hay trượt, ta phải bắn các viên đạn; khi muốn nghiên cứu chất lượng của một lô sản phẩm,

ta lấy ngẫu nhiên một hoặc một số sản phẩm của lô sản phẩm đó,…

Việc thực hiện một nhóm các điều kiện cơ bản để quan sát một hiện tượng nào đó có xảy ra hay không được gọi là thực hiện một phép thử, còn hiện tượng có thể xảy ra trong kết quả của phép thử đó được gọi là biến cố

Thí dụ 1, tung một con xúc xắc xuống đất là một phép thử, còn việc lật lên một mặt nào đó

2.1.2 Xác suất của biến cố

Như trên đã thấy, việc biến cố ngẫu nhiên xảy ra hay không xảy ra trong kết quả của phép thử là điều không thể đoán trước được Tuy nhiên, bằng trực quan ta có thể nhận thấy các biến cố ngẫu nhiên khác nhau có những khả năng xảy ra khác nhau Chẳng hạn biến cố

“xuất hiện mặt sấp” khi tung một đồng xu sẽ có khả năng xảy ra lớn hơn nhiều so với biến

Trang 13

cố “ xuất hiện mặt một chăm” khi tung một con xúc xắc Hơn nữa, khi lặp đi lặp lại nhiều lần cùng một phép thử trong những điều kiện như nhau, người ta thấy tính chất ngẫu nhiên của biến cố mất dần đi và khả năng xả ra của biến cố sẽ được thể hiện theo những quy luật nhất định Từ đó ta thấy có khả năng định lượng (đo lường), khả năng khách quan xuất hiện một biến cố nào đó

Xác suất của một biến cố là một con số đặc trưng khả năng khách quan xuất hiện biến cố đó khi thực hiện phép thử

Ta chú ý rằng đây là khả năng khách quan, do những điều kiện xảy ra của phép thử quy định chứ không tùy thuộc vào ý muốn chủ quan của con người

Như vậy, bản chất của xác suất của một biến cố là một con số xác định Để tính xác suất của một biến cố, người ta xây dựng một số định nghĩa và định lý sau

2.1.3 Một số định nghĩa về xác suất

2.1.3.1 Định nghĩa cổ điển về xác suất

Xác suất xuất hiện biến cố A trong phép thử là tỉ số giữa số kết cục thuận lợi cho A

và tổng số các kết cục duy nhất đồng khả năng có thể xảy ra khi thực hiện phép thử đó

Nếu ký hiệu P(A) là xác suất của biến cố A, m là số kết cục thuận lợi cho biến cố A, n là số kết cục duy nhất đồng khả năng của phép thử, ta có công thức sau:

( ) =

- Các tính chất của xác suất:

+ Xác suất của biên có ngẫu nhiên là một số dương nằm trong khoảng giữa 0 và 1

+ Xác suất của biến cố chắc chắn bằng 1

+ Xác suất của biến cố không thể có bằng 0

- Các phương pháp tính xác suất bằng định nghĩa cổ điển:

+ Phương pháp suy luận trực tiếp: nếu sô các kết cục trong phép thử là khá nhỏ, và việc suy đoán là khá đơn giản thì có thể sử dụng phương pháp suy luận trực tiếp

+ Phương pháp dung sơ đồ Venn: khi số kết cục là khá lớn và việc suy đoán phức tạp hơn thì có thể dung sơ đồ Venn, tức là mô tả các kết cục của phép thử dưới dạng sơ đồ để dễ nhận biết

+ Phương pháp dung các công thức của giải tích tổ hợp: nếu số kết cục của phép thử là rất lớn mà không thể suy đoán trực tiếp được thì có thể dung các công thức của giải tích tổ hợp, chủ yếu là các công thức chỉnh hợp, chỉnh hợp lặp, hoán vị, và tổ hợp để tính toán

2.1.3.2 Định nghĩa thống kê về xác suất

Trang 14

Tần suất xuất hiện biến cố trong n phép thử là tỷ số giữa số phép thử trong đó biến cố xuất hiện và tổng số phép thử được thực hiện

Như vậy, nếu ký hiệu số phép thử là n, số lần xuất hiện biến cố A là k, tần suất xuất hiện biến cố A là f(A) thì:

- Định nghĩa tiên đề về xác suất: Vào những năm 30 của thế kỷ 20, nhà toán học người Nga

là Kolmogorov đã xây dựng hệ tiên đề làm cơ sở cho việc định nghĩa một cạch hoàn chỉnh khái niệm xác suất về mặt lý thuyết

2.1.4 Định lý cộng và nhân xác suất

2.1.4.1 Định lý cộng xác suất

Định nghĩa cộng xác suất:

Định nghĩa 1 Biến cố C được gọi là tổng của hai biến cố A và B, ký hiệu C = A + B nếu C

chỉ xảy ra khi có ít nhất một trong hai biến cố A và B xảy ra

Thí dụ, hai người cùng bắn vào một bia Gọi A là biến cố “Người thứ nhất bắn trúng”, B là biến cố “Người thứ 2 bắn trúng”, C là biến cố “Bia bị trúng đạn” Rõ ràng là biến cố C sẽ xảy ra khi có ít nhất một trong hai biến cố A và B xảy ra Vậy C = A + B

Định nghĩa 2 Biến cố A được gọi là tổng của n biến cố A1, A2, A3,….nếu A xảy ra khi có ít nhất một trong n biến cố ấy xảy ra

Định nghĩa 3 Hai biến cố A và B gọi là xung khắc với nhau nếu chúng không thể đồng thời xảy ra trong một phép thử Trường hợp ngược lại, nếu hai biến cố có thể cùng xảy ra trong một phép thử thì được gọi là không xung khắc

Khi áp dụng khái niệm xung khắc cho nhóm gồm n biến cố, ta có khái niệm xung khắc từng đôi

Trang 15

Định nghĩa 4 Nhóm n biến cố A1, A2, A3, …được gọi là xung khắc từng đôi nếu bất kỳ hai biến cố nào trong nhóm này cũng xung khắc với nhau

Định lý cộng xác suất:

Xác suất của tổng hai biến cố xung khắc bằng tổng xác suất của các biến cố đó

Như vậy, nếu A và B là hai biến cố xung khắc với nhau thì:

P(A+B) = P(A) + P(B)

2.1.4.2 Định lý nhân xác suất

Bây giờ ta chuyển qua nghiên cứu trường hợp khi một biến cố có thể xem như tích của các biến cố khác

Định nghĩa 1 Biến cố C được gọi là tích của hai biến cố A và B nếu C xảy ra khi và chỉ khi

cả hai biến cố A và B đồng thời xyar ra Ký hiệu C = A*B

Định nghĩa 2 Biến cố A được gọi là tích của n biến cố A1, A2, …An nếu A xảy ra khi và chỉ khi cả n biến cố nói trên đồng thời xảy ra

Định nghĩa 3 Hai biến cố A và B gọi là độc lập với nhau nếu việc xảy ra hay không xảy ra của biến cố này không làm thay đổi xác suất xảy ra của biến cố kia và ngược lại Trong trường hợp nếu việc xảy ra hay không xảy ra của biến cố làm cho xác suất xảy ra của biến

có kia thay đổi thì hai biến cố đó gọi là phụ thuộc nhau

Định nghĩa 4 Các biến cố A1, A2, …, An được gọi là độc lập từng đôi với nhau nếu mỗi cặp hai trong n biến cố độc lập với nhau

Định nghĩa 5: Các biến cố A1, A2, …, An gọi là độc lập toàn phần với nhau nếu mỗi biến độc lập với một tổ hợp bất kỳ của các biến còn lại

Định nghĩa 6 Xác suất của biến cố A được tính với điều kiện biến cố B đã xảy ra gọi là xác suất có điều kiện của A và ký hiệu là P(A/B)

P(A.B) = P(A).P(B/A) = P(B).P(A/B)

2.1.4.3 Các hệ quả của định lý cộng và định lý nhân xác suất

Định lý 1: Xác suất của tổng hai biến cố không xung khắc bằng tổng xác suất các biến cố

đó trừ đi xác suất của tích các biến cố đó

P(A+B) = P(A) + P(B) – P(A.B)

Trang 16

Định lý 2: Xác suất của tổng n biến cố không xung khắc và độc lập toàn phần với nhau bằng một trừ đi tích xác suất của các biến cố đối lập với các biến cố đó

Công thức Bernoulli

Định nghĩa: Ta tiến hành n phép thử độc lập Giả sử trong mỗi phép thử chỉ xảy ra hai

trường hợp: Hoặc biến cố A xảy ra với xác suất p hoặc biến cố A không xảy ra với xác suất

q = 1 – p

Các bài toán thỏa mãn các điều kiện trên thì được gọi là tuân theo lược đồ Bernoulli Khi

đó xác suất để trong n phép thử độc lập biến cố A xuất hiện k lần được ký hiệu: Pn(k)

Ví dụ 1: Hộp có 10 viên bi, trong đó có 6 viên bi màu đỏ Lần lượt rút có hoàn lại 5 viên

bi Gọi A là biến cố rút được viên bi màu đỏ trong mỗi lần rút, ta được một lược đồ Bernoulli với:

* Số phép thử độc lập là n = 5

* P(A) = 6/15

Ví dụ 2: Trong một phân xưởng có 5 máy hoạt động độc lập, xác suất để một máy bị hư

trong một ca sản xuất là bằng nhau và bằng p = 0,1 Tính xác suất để trong 1 ca có hai máy bị hư

Ta thấy 5 máy hoạt động độc lập cho nên ta có thể coi như tiến hành 5 phép thử độc lập và mỗi phép thử chỉ có hai kết cục máy hoạt động tốt hoặc máy bị hư với xác suất p = 0,1 Khi đó bài toán tuân theo lược đồ Bernoulli

2.1.4.4 Công thức xác suất toàn phần và công thức Bayes

Giả sử A là biến cố bất kỳ và lập thành hệ đầy đủ các biến cố và

Trang 17

P(A) = P(B1) P(A/B1) + P(B2) P(A/B2) +… + P(Bn) P(A/Bn)

c) Theo công thức xác suất tính ta có:

P(BkA) = P(Bk) P(A/Bk) = P(A) P(Bk/A)

2.2 Biến ngẫu nhiên và quy luật phân phối xác suất

2.2.1 Định nghĩa và phân loại biến ngẫu nhiên

Định nghĩa

Một biến số gọi là biến ngẫu nhiên nếu trong kết quả của phép thử nó sẽ nhận một và chỉ một trong các giá trị có thể có của nó tùy thuộc vào sự tác động của các nhân tố ngẫu nhiên

Các biến ngẫu nhiên được ký hiệu là X, Y, Z hoặc X1, X2, …; Y1, Y2,…còn các giá trị có thể có của nó được ký hiệu là x1, x2, x3,…y1, y2, y3,…

Ta chú ý rằng sở dĩ biến X nào đó gọi là ngẫu nhiên vì trước khi tiến hành phép thử ta chưa

có thể nói một cách chắc chắn nó sẽ nhận giá trị bằng bao nhiêu, mà chỉ có thể dự đoán điều đó với một xác suất nhất định Nói cách khác, việc X nhận một giá trị nào đó (X = x1) hoặc (X=x2) về thực chất là các biến cố ngẫu nhiên Hơn nữa, vì trong kết quả của phép thử biến X nhất định sẽ nhận một và chỉ một trong các giá trị có thể có của nó, do đó các biến

cố (X=x1), (X=x2),….(X=xn) tạo nên một nhóm đầy đủ các biến cố

Thí dụ, gọi X là “số con trai trong 100 trẻ sắp được sinh ra tại một nhà hộ sinh” X cũng là một biến ngẫu nhiên

Phân loại biến ngẫu nhiên

Biến ngẫu nhiên có thể là rời rạc hoặc lien tục

Trang 18

Biến ngẫu nhiên gọi là rời rạc nếu các giá trị có thể có của nó lập nên một tập hợp hữu hạn hoặc đếm được

Nói cách khác, biến ngẫu nhiên sẽ là rời rạc nếu ta có thể liệt kê được tất cả các giá trị có thể có của nó

Thí dụ, trong phép thử về tung con xúc xắc, nếu ta gọi X là “số điểm thu được” thì X là biến ngẫu nhiên rời rạc vì các giá trị có thể có của nó là một tập hợp hữu hạn

Biến ngẫu nhiên gọi là lien tục nếu các giá trị có thể có của nó lấp đầy một khoảng trên trục số

Đối với biến ngẫu nhiên liên tục ta không thể liệt kê được tất cả các giá trị có thể có của nó Thí dụ, bắn một phát súng vào bia Nếu gọi X là “khoảng cách từ điểm chạm của viên đạn đến tâm bia” thì X là biến ngẫu nhiên liên tục vì ta không thể kể ra được tất cả các giá trị có thể có của nó Ta chỉ có thể nói rằng các giá trị có thể có của nó của X nằm trong khoảng (a, b) nào đó

Có thể nói rằng gần như tất cả các đại lượng mà ta gặp trong thực tế đều là các biến ngẫu nhiên và chúng sẽ thuộc về một trong hai loại biến ngẫu nhiên đã kể trên

2.2.2 Quy luật phân phối xác suất của biến ngẫu nhiên

Ta có thể nghĩ rằng chỉ cần xác định các giá trị có thể có của một biến ngẫu nhiên là

đủ để xác định biến ngẫu nhiên ấy Tuy nhiên điều này chưa đủ Trong thực tế có những đại lượng rất khác nhau mà các giá trị có thể có của chúng lại giống nhau Hơn nữa việc các biến ngẫu nhiên nhận một giá trị nào đó trong kết quả của phép thử chỉ là một biến cố ngẫu nhiên, do đó nếu chỉ mới biết được các giá trị có thể có của nó thì ta mới nắm được rất ít thông tin về biến ngẫu nhiên ấy

Bảng phân phối xác suất

Bảng phân phối xác suất chỉ dùng để mô tả quy luật phân phối xác suất của biến ngẫu nhiên rời rạc

Trang 19

Giả sử biến ngẫu nhiên rời rạc X có thể nhận một trong các giá trị có thể có x1, x2, x3,…,

xn với các xác suất tương ứng là p1, p2, p3,…pn Bảng phân phối xác suất của biến ngẫu nhiên rời rạc X có dạng:

Khái niệm hàm phân bố xác suất áp dụng được đối với cả biến ngẫu nhiên rời rạc và liên

tục Giả sử X là biến ngẫu nhiên bất kỳ, x là một số thực nào đó Xét biến cố “ biến ngẫu nhiên X nhận giá trị nhỏ hơn x”, ký hiệu (X<x) Hiển nhiên là x thay đổi thì xác suất P(X<x) cũng thay đổi theo Như vậy, xác suất này là một hàm số của x

Định nghĩa Hàm phân phối xác suất của biến ngẫu nhiên X, ký hiệu F(x), là xác suất để biến ngẫu nhiên X nhận giá trị nhỏ hơn x, với x là một số thực bất kỳ

F(x) = P(X<x)

Ta chú ý rằng đây chỉ là định nghĩa tổng quát của hàm phân bố xác suất Đối với từng loại biến ngẫu nhiên hàm phân bố xác suất được tính theo những công thức riêng

Các tính chất của hàm phân bố xác suất

Tính chất 1 Hàm phân bố xác suất luôn nhận giá trị trong đoạn [0,1]

Tính chất này trực tiếp sinh ra từ định nghĩa của hàm phân bố xác suất, vì nó là một xác suất nên giá trị của nó nằ trong đoạn [0, 1]

Tính chất 2 Hàm phân bố xác suất là hàm không giảm, tức là với x2>x1 thì:

F(x2)>F(x1)

Từ tính chất thứ 2 có thể suy ra một hệ quả sau đây:

Hệ quả 1: Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng [a, b) bằng hiệu số của hàm phân bố xác suất tại hai đầu khoảng đó

Hệ quả 2: Xác suất để biến ngẫu nhiên liên tục X nhận một giá trị xác định bằng 0

P(X= x) = 0

Hệ quả 3: Đối với biến ngẫu nhiên liên tục X ta có các đẳng thức sau:

Trang 20

Từ đó:

P(a≤x≤b) = P(a ≤x<b) = P (a <x<b)

Tính chất 3 Ta có biểu thức giới hạn sau:

F(-∞) = 0; F (+∞) = 1

Ý nghĩa của hàm phân bố xác suất

Từ định nghĩa của hàm phân bố xác suất F(x) = P(X< x) ta thấy hàm phân bố xác suất phản ánh mức độ tập trung xác suất ở về phía bên trái một số thực x nào đó Như đã biết toàn bộ xác suất của biến ngẫu nhiên bằng 1, do đó giá trị của hàm phân bố xác suất tại mỗi điểm x cho biết có bao nhiêu phần của một đơn vị xác suất phân bố trong đoạn (-∞,x)

Hàm mật độ xác suất

Đối với biến ngẫu nhiên liên tục X có thể dùng làm phân bố xác suất để mô tả quy luật phân phối xác suất của nó Tuy nhiên phương pháp này cũng hạn chế Hàm phân bố xác suất không thể đặc trưng được xác suất để biến ngẫu nhiên liên tục X nhận một giá trị nhất định Vì thế, đối với các biến ngẫu nhiên liên tục, người ta thường dung hàm mật độ xác suất để mô tả quy luật phân phối xác suất của nó

Định nghĩa: Hàm mật độ xác suất của biến ngẫu nhiên liên tục X (ký hiệu là f(X)) là đạo

hàm bậc nhất của hàm phân bố xác suất của biến ngẫu nhiên đó

Tính chất 1: Hàm mật độ xác suất luôn không âm

Tính chất 2: Xác suất để biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (a, b) bằng tích phân xác định của hàm mật độ xác suất trong khoảng đó

Tính chất 3: Hàm phân bố xác suất F(x) của biến ngẫu nhiên liên tục X bằng tích phân suy rộng của hamg mật độ xác suất trong khoảng (-∞, ∞)

Tính chất 4: Tích phân suy rộng trong khoảng (-∞, +∞) của hàm mật độ xác suất bằng 1

Ý nghĩa của hàm mật độ xác suất

Hàm mật độ xác suất của biến ngẫu nhiên X tại mỗi điểm x cho biết mức độ tập trung xác suất tại điểm đó

Trang 21

CHƯƠNG 3 THỐNG KÊ MÔ TẢ 3.1 Bảng thống kê và đồ thị thống kê

3.1.1 Bảng thống kê

3.1.1.1 Khái niệm

Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng nghiên cứu Đặc điểm chung của tất cả các bảng thống kê là bao giờ cũng có những con số của từng bộ phận và có mối liên hệ mật thiết với nhau

b Phần nội dung: Bảng thống kê gồm 2 phần: Phần chủ đề và phần giải thích

Phần chủ đề nói lên tổng thể được trình bày trong bảng thống kê, tổng thể này được phân thành những đơn vị, bộ phận Nó giải đáp: đối tượng nghiên cứu là những đơn vị nào, những loại hình gì Có khi phần chủ đề phản ánh các địa phương hoặc các thời gian nghiên cứu khác nhau của một hiện tượng

Phần giải thích gồm các chỉ tiêu giải thích các đặc điểm của đối tượng nghiên cứu, tức là giải thích phần chủ đề của bảng

Phần chủ đề thường được đặt bên trái của bảng thống kê, còn phần giải thích được đặt ở phía trên của bảng Cũng có trường hợp ta thay đổi vị trí

Trang 22

Cấu thành của bảng thống kê có thể biểu hiện bằng sơ đồ sau:

Phần chủ đề Phần giải thích Các chỉ tiêu giải thích (tên cột)

Tên chủ đề

3.1.1.3 Các yêu cầu và qui ước xây dựng bảng thống kê

Qui mô của bảng thống kê: không nên quá lớn, tức là quá nhiều hàng, cột và nhiều

phân tổ kết hợp Một bảng thống kê ngắn, gọn một cách hợp lý sẽ tạo điều kiện dễ dàng cho việc phân tích Nếu thấy cần thiết nên xây dựng hai, ba, bảng thống kê nhỏ thay cho một bảng thống kê quá lớn

Số hiệu bảng: nhằm giúp cho người đọc dễ dàng xác định vị trí của bảng khi tham

khảo, đặc biệt là đối với các tài liệu nghiên cứu người ta thường lập mục lục biểu bảng

để người đọc dễ tham khảo và người trình bày dễ dàng hơn Nếu số biểu bảng không nhiều thì chúng ta chỉ cần đánh số theo thứ tự xuất hiện của biểu bảng, nếu tài liệu được chia thành nhiều chương và số liệu biểu bảng nhiều thì ta có thể đánh số theo chương

và theo số thứ tự xuất hiện của biểu bảng trong chương Ví dụ, Bảng 2.5 tức là bảng ở chương 2 và là bảng thứ 5

Tên bảng: yêu cầu ngắn gọn, đầy đủ, rõ ràng, đặt trên đầu bảng và phải chứa đựng nội

dung, thời gian, không gian mà số liệu được biểu hiện trong bảng Tuy nhiên yêu cầu này chỉ mang tính chất tương đối không có tiêu chuẩn rõ ràng nhưng thông thường người ta cố gắng trình bày trong một hàng hoặc tối đa là hai hàng

Đơn vị tính:

Đơn vị tính dùng chung cho toàn bộ số liệu trong bảng thống kê, trường hợp này

đơn vị tính được ghi bên góc phải của bảng

Đơn vị tính theo từng chỉ tiêu trong cột, trong trường hợp này đơn vị tính sẽ được đặt dưới chỉ tiêu của cột

Trang 23

Đơn vị tính theo từng chỉ tiêu trong hàng, trong trường hợp này đơn vị tính sẽ được đặt sau chỉ tiêu theo mỗi hàng hoặc tạo thêm một cột ghi đơn vị tính

Cách ghi số liệu trong bảng:

Số liệu trong từng hàng (cột) có đơn vị tính phải nhận cùng một số lẻ, số liệu ở các hàng (cột) khác nhau không nhất thiết có cùng số lẻ với hàng (cột) tương ứng

- Một số ký hiệu qui ước:

+ Nếu không có tài liệu thì trong ô ghi dấu gạch ngang “-“

+ Nếu số liệu còn thiếu, sau này sẽ bổ sung sau thì trong ô ghi dấu ba chấm “ ”

+ Ký hiệu gạch chéo “x” trong ô nào đó thì nói lên hiện tượng không có liên quan đến chỉ tiêu đó, nếu ghi số liệu vào đó sẽ vô nghĩa hoặc thừa

Phần ghi chú ở cuối bảng: được dùng để giải thích rõ các nội dung chỉ tiêu trong

bảng, nói rõ nguồn tài liệu đã sử dụng hoặc các chỉ tiêu cần thiết khác Đối với tài liệu khoa học, việc ghi rõ nguồn số liệu được coi là bắt buộc không thể thiếu được trong biểu bảng

3.1.2 ĐỒ THỊ THỐNG KÊ

3.1.2.1 Biểu đồ hình cột

Biểu đồ hình cột là loại biểu đồ biểu hiện các tài liệu thống kê bằng các hình chữ nhật hay khối chữ nhật thẳng đứng hoặc nằm ngang có chiều rộng và chiều sâu bằng nhau, còn chiều cao tương ứng với các đại lượng cần biểu hiện

Biểu đồ hình cột được dùng để biểu hiện quá trình phát triển, phản ánh cơ cấu và thay đổi cơ cấu hoặc so sánh cũng như biểu hiện mối liên hệ giữa các hiện tượng

Trang 24

S : 

quạt phản ánh cơ cấu và biến động cơ cấu, còn diện tích toàn hình tròn phản ánh quy

mô của hiện tượng

Khi vẽ đồ thị ta tiến hành như sau:

- Lấy giá trị của từng bộ phận chia cho giá trị chung của chỉ tiêu nghiên cứu để xác

định tỷ trọng (%)của từng bộ phận đó Tiếp tục lấy 360 (3600) chia cho 100 rồi nhân với tỷ trọng của từng bộ phận sẽ xác định được góc độ tương ứng với cơ cấu của từng

bộ phận

Xác định bán kính của mỗi hình tròn có diện tích tương ứng là S: R = vì diện

tích hình tròn: S = π R2 Khi có độ dài của bán kính mỗi hình tròn, ta sẽ dễ dàng vẽ được các hình tròn đó

Ví dụ : Có số lượng về học sinh phổ thông phân theo cấp học 3 năm 2005, 2006 và

2007 của địa phương X như bảng 1.3:

Bảng 3.1: Học sinh phổ thông phân theo cấp học của địa phương X, 2005 - 2007

Số lượng (Người)

Cơ cấu (%)

Số lượng (Người)

Cơ cấu (%)

Số lượng (Người)

Cơ cấu (%)

Nếu năm 2005 lấy R = 1,00

Thì năm 2006 có R = 19,05 : 17,84 = 1,067

Năm 2007 có R = 20,42 : 17,84 = 1,144

Kết quả 3 hình tròn được vẽ phản ánh cả quy mô học sinh phổ thông lẫn cơ cấu và biến động cơ cấu theo cấp học của học sinh qua các năm 2005, 2006 và 2007

Trang 25

tuyên truyền, phổ biến thông tin trên các phương tiện sử dụng rộng rãi Biểu đồ hìnhtượng có nhiều cách vẽ khác nhau, tuỳ theo sáng kiến của người trình bày mà lựa chọn loại hình vẽ tượng hình cho phù hợp và hấp dẫn

Tuy nhiên khi sử dụng loại biểu đồ này phải theo nguyên tắc: cùng một chỉ tiêu phải được biểu hiện bằng cùng một loại hình vẽ, còn chỉ tiêu đó ở các trường hợp nào

có trị số lớn nhỏ khác nhau thì sẽ biểu hiện bằng hình vẽ có kích thước lớn nhỏ khác nhau theo tỷ lệ tương ứng

Trở lại ví dụ trên số lượng học sinh phổ thông được biểu diễn như sau:

19

27,5

19

28

Trang 26

Biểu đồ 3.3: Biểu đồ cơ cấu học sinh phổ thông địa phương X từ 2005 – 2007

Trong một đồ thị đường gấp khúc, trục hoành thường được biểu thị thời gian, trục tung biểu thị mức độ của chỉ tiêu nghiên cứu Cũng có khi các trục này biểu thị hai chỉ tiêu có liên hệ với nhau hoặc lượng biến và các tần số (hay tần suất) tương ứng Độ phân chia trên các trục cần được xác định cho thích hợp vì có ảnh hưởng trực tiếp đến

độ dốc của đồ thị Mặt khác, cần chú ý là trên mỗi trục toạ độ chiều dài của các khoảng phân chia tương ứng với sự thay đổi về lượng của chỉ tiêu nghiên cứu phải bằng nhau

Ví dụ : Sản lượng cà phê xuất khẩu của quốc gia X qua các năm từ 2000 - 2007 (ngàn

tấn) có kết quả như sau:

Sản lượng (ngàn tấn) 283,3 391,6 382,0 482,0 733,9 931,0 722,0 749,0

Số liệu trên được biểu diễn qua đồ thị đường gấp khúc sau

Trang 27

đa giác đều nội tiếp đường tròn Đó là giới hạn phạm vi của đồ thị Độ dài đo từ tâm đường tròn đến các điểm xác định theo các đường phân chia đường tròn nói trên chính

là các đại lượng cần biểu hiện của hiện tượng tương ứng với mỗi thời kỳ Nối các

Trang 28

điểm xác định sẽ được hình vẽ của đồ thị hình màng nhện

VD: có số liệu về giá trị xuất, nhập khẩu hải sản của tỉnh X năm 2006 và 2003 như sau:

Bảng 3.2 Giá trị xuất khẩu hải sản trong 12 tháng tỉnh X năm 2006 - 2007

Đồ thị 3.5: Đồ thị Giá trị xuất khẩu hải sản trong 12 tháng tỉnh X năm 2006 - 2007

Trang 29

3.2 PHÂN TỔ THỐNG KÊ

3.2.1 Khái niệm chung về phân tổ thống kê

3.2.1.1 Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê

Phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để phân chia các đơn vị

của tổng thể thánh các tổ có tính chất khác nhau

Kết quả của phân tổ được một dãy số biểu thị sự phân bố của các đơn vị tổng thể dọi là dãy

số phân phối, số lượng đơn vị từng tổ được gọi là tần số phân phối, tỷ số đơn vị của từng tổ trong tổng thể gọi là tần số

Ý nghĩa: là phương pháp cơ bản để tổng hợp tài liệu điều tra thống kê Tài liệu và kết quả

của tổng hợp thống kê là cơ sở tính toán các chỉ tiêu phân tích thống kê phục vụ cho giai đoạn phân tích thống kê

Dựa vào kết quả cảu phân tổ thống kê chúng ta có thể nhận xét sơ bộ có tính phân tích so sánh hơn kém giữa các nhóm tổ, qua đó nhận thấy vai trò quan trọng của từng tổ

Nhiệm vụ: là phân chia các loại hình kinh tế-xã hội của hiện tượng nghiên cứu, biểu hiện

kết cấu của hiện tượng nghiên cứu và biểu hiện mối liên hệ giữa các tiêu thức

3.2.1.2.Các loại phân tổ thống kê

Căn cứ vào nhiệm vụ của phân tổ thống kê;

 Phân tổ phân loại:

 Phân tổ kết cấu

 Phân tổ liên hệ

Căn cứ vào số lượng của tiêu thức phân bổ

 Phân tổ theo một tiêu thức

 Phân tổ theo nhiều tiêu thức

3.2.1.3 Tiêu thức phân tổ và chỉ tiêu giải thích

Tiêu thức phân tổ là những tiêu thức nêu lên đặc tính, đặc trưng cơ bản của hiện tượng

nghiên cứu được chọn làm căn cứ để tiến hành phân tổ hiện tượng nghiên cứu

Trang 30

Mỗi đơn vị tổng thể có nhiều tiêu thức khác nhau, tiêu thức naaof cũng có thể chọn để làm cẳn cứ phân tổ Tuy nhiên, mỗi tiêu thức có ý nghĩa khác nhau, cho nên kết quả phân tổ theo chúng cũng có ý nghĩa khác nhau Có tiêu thức khi phân tổ theo nó giúp ta hiểu bản chất của hiện tượng nghiên cứu, có tiêu thức chỉ giúp ta hiểu một phần Vì vậy, khi tiến hành phân tổ trước hết cần phải lựa chọn tiêu thức phân tổ chính xác

Ví dụ: phân tổ cá cửa hàng bán lẻ theo doanh thu tháng 10 năm 2005 trên địa bàn quận A, đơn vị tính theo triệu đồng

3.2.2 Các bước phân tổ thống kê

3.2.2.1 Lựa chọn tiêu thức phân tổ

Lựa chọn tiêu thức phân tổ là bước đầu tiên làm cơ sở để tiến hành phân tổ Lựa chọn tiêu thức chính xác, phù hợp với mục đích nghiên cứu thì kết quả phân tổ mới thực

sự có ích cho việc phân tích đặc điểm và bản chất của hiện tượng

3.2.2.2 Xác định số tổ và khoảng cách tổ

a Phân tổ theo tiêu thức thuộc tính

Tiêu thức thuộc tính có 3 biểu hiện cụ thể:

Trường hợp có 2 biểu hiện (tiêu thức thay phiên), phân chia hiện tượng nghiên cứu thành 2 tổ

Trang 31

Ví dụ: phân tổ doanh nghiệp công nghiệp, phân tổ sản phẩm công nghiệp theo tiêu thức nhóm A và nhóm B hoặc theo tiêu thức khu vực Quốc doanh và khu vực ngoài Quốc doanh

Trường hợp có một số biểu hiện cố định, môi biểu hiện hình thành một tổ, có bao nhiêu biểu hiện sẽ phân chia hiện tượng thành bấy nhiêu tổ

Ví dụ: phân tổ dân số theo thành phần giai cấp hay theo tiêu thức dân tộc

Trường hợp có nhiều biểu hiện như tiêu thức tên sản phẩm, rất nhiều tên sản phẩm, không thể dựa trên mỗi biểu hiện hình thành một tổ Như vậy số tổ quá nhiều, và cac đơn vị trong các tổ sẽ không khác nhau về tình chất, đặc trưng cơ bản, không có ý nghĩa nghiên cứu Trường hợp này phải thực hiện nguyên tắc ghép tổ:các đơn vị các tổ nhỏ được ghép thành một tổ phải đảm bảo giống nhau hoặc gần giống nhau về tính chất hoặc đặc trưng cơ bản nào đó theo tiêu thức phân tổ, phù hợp với mục đích, yêu cầu nghiên cứu

b Phân tổ theo tiêu thức số lượng

Tiêu thức lượng biến có 3 trường hợp sau đây:

Trường hợp tiêu thức thay phiên – lượng biến của tiêu thức phân tổ chỉ có hai biểu hiện: mức trên hoặc mức dưới một trị số lượng biến nào đó

Ví dụ: phân tổ của doanh nghiệp thủ công mỹ nghệ để nghiên cứu quy mô doanh nghiệp theo hai biểu hiện của tiêu thức số công nhân: dưới 200 công nhân và trên 200 công nhân Do đó hình thành 2 tổ: tổ dưới 200 công nhân và tổ trên 200 công nhân

Trường hợp có một số hữu hạn tương đối cố định lượng biến rời rạc không liên tục thì mỗi lượng biến hình thành một tổ Số tổ bằng số hạn lượng biến

Ví dụ: phân tổ hộ gia đình theo số con có trong gia đình Phân tổ không có khoảng cách tổ

Trường hợp tiêu thức lượng biến liên tục hoặc không liên tục (rời rạc) có rất nhiều biểu hiện về mặt lượng

Ví dụ: tiêu thức tuổi đời của dân số Trong trường hợp này không thể căn cứ vào mỗi biểu hiện về mặt lượng để hình thành một tổ Vì như vậy số tổ được phân chia sẽ rất

Trang 32

nhiều mà điều quan trọng giữa các tổ không khác biệt nhau về chất, đặc trưng cơ bản của hiện tượng, do đó không đáp ứng được yêu cầu phân tích Vì vậy phải thực hiện ghép tổ

để có được một số tổ thích hợp cần thiết Nguyên tắc cơ bản thực hiện ghép tổ là dựa vào quy luật vận động nghiên cứu trong triết học “ lượng biến dẫn đến chất biến” Phải phân tích sâu sắc về mặt lý luận khoa học kết hợp với phân tích đầy đủ thực tiễn tồn tại và xem xét đến mục đích yêu cầu nghiên cứu đê xác định lượng biến được tích tụ đến một mức độ nào đó thì sẽ tạo ra một chất mới và phải được hình thành một tổ khác Trên cơ

sở phân tích như vậy sẽ xác định số tổ cần chia

Ví dụ phân tuổi dân cư theo độ tuổi lao động sẽ hình thành được 3 tổ: tổ dân cư chưa đến tuổi lao động, tổ dân cư trong độ tuổi lao động, tổ dân cư ngoài tuổi lao động

- Trường hợp phân tổ không có khoảng cách tổ bằng nhau: các đơn vị tổng thể có sự khác nhau nhiều về chất và sự biến đổi về lượng diễn ra không đều nhau Do đó, việc xác định khoảng cách tổ dựa vào phương pháp phân tích về lý luận khoa học bản chất của hiện tượng và phân tích sâu sắc thực tế tồn tại của hiện tượng nghiên cứu để xem xét lượng biến dao động đến mức độ nào thì các đơn vị tổng thể hiện tượng nghiên cứu sẽ có cùng hoặc gần giống nhau về tính chất đặc trưng cơ bản từ đó sẽ xếp vào cùng một tổ

-Trường hợp phân tổ có khoảng cách tổ bằng nhau: các đơn vị tổng thể hiện tượng nghiên cứu không có sự khác biệt lớn về chất và đặc trưng cơ bản, hay nói cách khác có

sự đồng nhất về chất; sự biến đổi về lượng trong các đơn vị tổng thể nhìn chung diễn ra khá đồng đều, không có sự cách biệt lớn

Do đó phương pháp xác định khoảng cách tổ dựa trên công thức:

d:Khoảng cách tổ

xmax: lượng biến lớn nhất của tiêu thức phân tổ

xmin: Lượng biến nhỏ nhất của tiêu thức phân tổ

n:Số tổ dự định chia

3.2.2.3 Phân phối các đơn vị vào từng tổ

Trang 33

Sau khi xác định số tổ và khoảng cách tổ, bước cuối cùng là phân phối các đơn vị vào từng tổ và tính toán trị số cảu các chỉ tiêu giải thích nếu có

3.2.3 Dãy số phân phối

3.2.3.1 Khái niệm và các loại dãy số phân phối

Dãy số phân phối theo tiêu thức thuộc tính: phản ánh kết cấu của tổng thể theo một tiêu thức thuộc tính nào đó

Ví dụ: dãy số phân phối giá trị sản xuất công nghiệp theo thành phần kinh tế

Dãy số phân phối theo tiêu thức số lượng: phản ánh kết cấu của tổng thể theo một tiêu thức số lượng nào đó

Ví dụ: dãy số phân phối một tổng thể lao động theo mức lương

3.2.3.2 Dãy số lượng biến

Dãy số lượng biến là kết quả của việc phân tổ theo tiêu thức số lượng Một dãy số lượng biến có các thành phần chu yếu sau:

- Thành phần thứ nhất là lượng biến: lượng biến là các trị số nói lên biểu hiện cụ thể của tiêu thức số lượng, thường được ký hiệu là xi Lượng biến của tiêu thức được chia làm 2 loại: lượng biến liên tục và lượng biến rời rạc

-Thành phần thứ 2 của lượng biến là tần số Tần số là số đơn vị được phân phối vào mỗi

tổ, tức là số lần một lượng biến nhận một trị số nhất định trong một tổng thể

Ngoài 2 thành phần nói trên người ta còn thường tính tần số (tần suất) tích lũy tức cộng dồn tần số Tần số tích lũy (Si) cho biết số đơn vị có lượng biến lớn hơn hoặc nhỏ hơn một lượng biến cụ thể nào đó và là cơ sở để xác định một đơn vị đứng ở vị trí nào đó trong dãy số lượng biến là bao nhiêu

3.3 SỐ TUYỆT ĐỐI TRONG THỐNG KÊ

3.3.1 Khái niệm và ý nghĩa số tuyệt đối

Số tuyệt đối trong thống kê là chỉ tiêu thể hiện quy mô, khối lượng cảu hiện tượng kinh

tế xã hội trong điều kiện và thời gian cụ thể

Số tuyệt đối biểu hiện số đơn vị của tổng thể hay bộ phận của tổng thể

Trang 34

Ví dụ: số doanh nghiệp của công ty A

Số tuyệt đối biểu hiện tổng trị số của một tiêu thức, một chỉ tiêu kinh tế xã hội

Ví dụ:tổng giá trị sản suất của một quốc gia

Số tuyệt đối có ý nghĩa trong công tác quản lý kinh tế xã hội Bởi vị qua số tuyệt đối có thể nhận thức rõ ràng cụ thể, có sức thuyệt phục không thể phủ nhận được về khối lượng quy mô, kết quả sản xuất thực tế

Số tuyệt đối là cơ sở đầu tiên thực hiện phân tích thống kê, đồng thời còn làm cở sở để tính các chỉ tiêu mức độ khối lượng tăng trưởng, số bình quân, chỉ tiêu tốc độ phát triển

Số tuyệt đối trong thống kê là căn cứ không thể thiếu được trong việc xậy dựng các dự

án, kế hoạch phát triển kinh tế xã hội, tổ chức chỉ đạo thực hiện và kiểm tra kết quả tình hình thực hiện kế hoạch phát triển kinh tế xã hội

3.3.2 Đặc điểm của số tuyệt đối

Số tuyệt đối trong thống kê luôn gắn liền với một hiện tượng kinh tế xã hội nhất định Mỗi trị số của số tuyệt đối đều mang trong nó một nội dung kinh tế nhất định ở từng thời gian và địa điểmb cụ thể, do đó chúng khác hoàn toàn với số tuyệt đối trong toán học Muốn xác định đúng đắn số tuyệt đối, vấn đề quan trong trước hết là phải xác định nội dung kinh tế mà nó phản ánh

Số tuyệt đối trong thống kê không phải là số tuyệt đối trong toán học được lựa chọn một cách tùy ý, mà những con số thu được thông qua phương pháp thống kê cụ thể

3.3.3 Đơn vị tính số tuyệt đối

Tùy theo tính chất và đối tượng nghiên cứu, số tuyệt đối bao giờ cũng có đơn vị đo phù hợp bao gồm: đơn vị hiện vật tự nhiên (con, cái, chiếc), hay đợn vị đo lường (m, kg, lít), đơn vị tiền tệ, đơn vị thời gian lao động…

3.3.4 Các loại số tuyệt đối

Có thể phân biệt hai loại số tuyệt đối sau:

Số tuyệt đối thời kỳ: là chỉ tiêu phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong một khoảng thời gian nhất định Chúng được hình thành thông qua sự tích lũy (cộng đồn) về lượng trong suốt thời gian nghiên cứu

Trang 35

Ví dụ: giá trị sản xuất công nghiệp trong một năm

Số tuyệt đối thời kỳ của cùng một chỉ tiêu có thể cộng được với nhau để có trị số của thời kỳ dài hơn Nều thời kỳ tính toán càng dài thù trị số của chỉ tiêu càng lớn

Số tuyệt đối thời điểm là chỉ tiêu phản ánh quy mô, khối lượng của hiện tượng trong một thời điểm nhất định

Ví dụ: tổng dân số Việt Nam lúc 0 giờ, ngày 4 tháng 1 năm 1999

Số tuyệt đối thời điểm chỉ hiện trạng của sự vật tại thời điểm cụ thể, trước và sau thời điểm nghiên cứu, mức độ khối lượng tuyệt đối có thể bị biến đổi khác đi về trạng thái, quy mô

3.4 SỐ TƯƠNG ĐỐI TRONG THỐNG KÊ

3.4.1.Khái niệm và ý nghĩa số tương đối

Số tương đối trong thống kê là chỉ tiêu biểu hiện quan hệ so sánh giữa hai mức độ của

hiện tượng nghiên cứu

Từ khái niệm trên ta thấy có hai trường hợp so sánh sau:

So sánh hai mức độ cùng loại nhưng khác nhau về điều kiện thời gian và không gian

Số tương đối còn sử dụng để công bố khi muốn giữ bí mật số tuyệt đối

Số tương đối giúp ta nghiên cứu, phân tích các hiện tượng mà nhiều khi chỉ số tuyệt đối không nêu rõ được

Trang 36

Ví dụ: so sánh mức sống dan cư năm 2004 và năm 2003 có được nâng cao hay không

Ta có thể so sánh mức chỉ tiêu bình quân đầu người năm 2004 với năm 2003, qua đó ta biết được tốc độ phát triển của mức sống dân cư là tăng lên hay giảm đi

3.4.2 Đặc điểm và hình thức biểu hiện số tương đối

Số tương đối không phải là số liệu trực tiếp thu thập từ tài liệu, có sẵn trong thực

tế mà chúng được hình thành dựa vào việc tính toán từ các số tuyệt đối, số bình quân…

Bất kỳ số tương đối nào cũng có gốc để so sánh, tùy thuộc vào mục đích nghiên cứu khác nhau mà chọn gốc so sánh phù hợp

Đơn vị tính số tuyệt đối là: lần, %, phần ngàn, hoặc đơn vị kép (người/km2…)

3.4.3 Các loại số tương đối

a.Số tương đối động thái (tốc độ phát triển) là kết quả so sánh giữa hai mức độ của

cùng một hiện tượng nhưng khác nhau về thời gian

Công thức: t =

t: số tuyệt đối động thái (lần hoặc %)

y0: mức độ của hiện tượng kỳ gốc

y1: mức độ hiện tượng nghiên cứu kỳ báo cáo

Ví dụ: có số liệu sản phẩm A đượcsản xuất trong hai năm như sau: năm 2004 sản xuất

b.Số tương đối kế hoạch: là kết quả so sánh giữa hai mức độ kế hoạch với mức độ thực

tế của chỉ tiêu ấy ở kỳ gốc

Trang 37

Số tương đối nhiệm vụ kế hoạch:

d.Số tương đối cường độ: biểu hiện trình độ phổ biến của hiện tượng nghiên cứu trong

một điều kiện lịch sử nhất định Số tương đối này được tính bằng cách so sánh chỉ tiêu của hai hiện tượng khác nhau nhưng có liên quan với nhau

e.Số tương đối không gian: là loại số tương đối biểu hiện sự so sánh về mức độ giữa hai

bộ phận trong một tổng thể, hoặc giữa hai hiện tượng cùng loại nhưng khác nhau về điều kiện không gian

3.4.4 Một số vấn đề vận dụng chung số tương đối và số tuyệt đối

Khi sử dụng số tương đối và số tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho đúng

Phải vận dụng một cách kết hợp số tương đối và số tuyệt đối

Trang 38

3.5 SỐ BÌNH QUÂN TRONG THỐNG KÊ

3.5.1.Khái niệm, ý nghĩa số bình quân trong thống kê

Số bình quân trong thống kê là mức độ biểu hiện trị số đại biểu theo một tiêu thức nào

đó của một tổng thể bao gồm nhiều đơn vị cùng loại

Nghiên cứu số bình quân có thể biết được xu hướng phát triển của tông thể

Có thể sử dụng số bình quân để so sánh các đại lượng không có cùng quy mô và trình độ đồng đều của tổng thể

Số bình quân rất thông dụng trong lĩnh vực nghiên cứu kinh tế, xã hội

*.Tính số bình quân từ một dãy số lượng biến có khoảng cách tổ Người ta thường lấy trị

số giữa làm đại diện cho từng tổ

Công thức:

Trị số giữa của mỗi tổ =

Trong đó: xmax, xmin là giới hạn trên và giới hạn dưới của tổ có khoảng cách tổ

*.TÍnh số bình quân chung từ các số bình quân tổ

Trang 39

Công thức:

̅ = ∑

b.Số bình quân điều hòa

Số bình quân điều hòa cũng có nội dung kinh tế như số bình quân cộng, tính được bằng cách đem chia tổng các lượng biến của tiêu thức cho số đơn vị tổng thể Nhưng ở đây vì không có sẵn tài liệu về số đơn vị tổng thể, nên phải dựa vào các tài liệu khác để tính ra

Dãy số lượng biến không có khoảng cách tổ: mốt là lượng biến có tần số lớn nhất

Dãy số lượng biến có khoảng cách tổ

Bước 1 xác định tổ chứa mốt

Tổ có khoảng cách tổ đều nhau Tổ có khoảng cách không đều nhau

Trang 40

Tổ nào có tần số lớn nhất thì tổ đó chứa

mốt

Tính mật độ phân bố (fi/hi)

Tổ nào có mật độ phân bố lớn nhất tổ đó chứ mốt

Bước 2 tính Mốt

Công thức tính:

Mốt là chỉ tiêu nói lên mức độ phổ biến rộng rãi chung của tổng thể hiện tượng nghiên cứu Do đó có thể sử dụng bổ sung cho mức độ bình quân, trong trường hợp tính toán số bình quân gặp khó khăn

Mốt không chịu ảnh hưởng của các lượng biến đột xuất, không có tính săn bằng bù trừ chênh lệch giữa các lượng biến trong dãy số phân phối Nhưng cũng chính điều này làm cho mốt kém nhạy bén đối với sự biến thiên của tiêu thức

Trong thực tế người ta sử dụng mốt để nghiên cứu nhu cầu thị trường về một loại kích

cỡ sản phẩm nào đó như giày dép…ngoài ra mốt còn cho biết đa số, thể hiện khuynh hướng phong trào

3.5.4 Trung vị

Số trung vị (Me) là lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy số lượng biến đã được sắp xếp theo thứ tự tăng dần Số trung vị chia dãy số lượng biến thành 2 phần bằng nhau

Cách xác định số trung vị:

+.Dãy số lượng biến không có khoảng cách tổ

-.Trường hợp n là số chẵn: số trung vị sẽ là lượng biến đứng ở vị tri giữa dãy số Tức là đứng ở vị trí thứ (n+1)/2

-Trường hợp n là số chẵn: số trung vị là kết quả trung bình cộng của hai lượng biến đứng

ở vị trí chính giữa, nghĩa là trung bình cộng của hai lượng biến đứng ở vị trí n/2 và (n+2)/2

+Dãy số lượng biến có khoảng cách tổ

Bước 1.xác định tổ chưá trung vị

Ngày đăng: 24/10/2017, 13:46

TỪ KHÓA LIÊN QUAN

w