1. Trang chủ
  2. » Giáo án - Bài giảng

Thống kê trong kinh doanh và quản lý nguyễn văn dung

427 1,4K 1
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 427
Dung lượng 8,16 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong lĩnh vực kinh doanh và quản trị, các chuyên viên, nhà quản lý luôn phải thực hiện các phán đoán định tính hay định lượng Qualitative or Quantilative để lựa chọn giữa các phương án

Trang 2

THONG HE TRONG HANH DCAM

Trang 3

Trong lĩnh vực kinh doanh và quản trị, các chuyên viên, nhà quản lý luôn phải thực hiện các phán đoán

định tính hay định lượng (Qualitative or Quantilative) để lựa chọn giữa các phương án (Alternatives), các dự án

(Projecl), các hợp đồng cam kết (contracls), đông thời phải hoạch định các chiến lược (Sirategy), kế hoạch

(Plans) và chiến thuật (Tactics) kinh tế và kinh doanh,

trong một thời kỳ tương lai luôn bị biến động bởi môi trường phúc hợp các yếu tố rất khó dự báo (Forecasting)

Do vậy các chuyên viên, nhà quản lý thuộc mọi cấp độ

(level) mong muốn có dược các phương tiện để có thể

đánh giá xác đáng và kịp thời nhất có thể được, về các

tình huống kinh doanh và quản trị, đặc biệt dựa trên các

phương pháp khoa học, nhận định được các con số xếp xi

về doanh thu, lợi nhuận để ra quyết định đúng đến (proper decision}

Quyển sách này kỳ vọng giúp các nhà quản lý và

chuyên viên các công cụ thống kê mang tính phán đoán

và định lượng:

._ Thống kê mô tả (Descriptive) về tình huống

_ Thống kê suy diễn (Inference) vé tinh huéng

._ Các phương pháp chọn mẫu để khảo sát

Các phương pháp kiếm định (Testing) để chọn

phương ún đúng

Tính toán các trị trung bình, phương sai, độ lệch

chuẩn là các đặc trưng về xu hướng và mức độ biến động so với vị trí trung tâm

Phân tích chuỗi thời gian (Time Series Analysis)

Trang 4

Đặc biệt quyển sách tích hợp các yếu tố:

- Ly thuyét co bản

‹Ổ Bài toán tình huống đa dạng về kinh doanh và quản lý trong thực tiền

„ Đáp ún cúc bài toán

Quyển sách kỳ vọng trợ giúp các sinh viên khối kinh

tế - quản trị, các nhà quản lý, các chuyên viên có được

phương tiện phán đoán và ra quyết định đúng đắn, kịp

thời, dẫn đến lợi thế cạnh tranh

MBA Nguyễn Văn Dung

Trang 6

1.2 CAC KHAI NIEM THONG KE THEN CHOT

Ba vấn dé then chốt hiện điện khi giải bất kỳ bài toán thống kê nào: tổng thể, mẫu và suy diễn thống kê

a Tổng thể (population) đề cập tập hợp các số đo quan tâm trong một bài toán thống kê Thí dụ: lương của toàn bộ nhân viên trong một công ty Một đặc tính của tổng thể như

mức lương trung bình được gọi là tham số (parameter) của

tổng thể Giả sử bài toán là ước lượng giá trị của tham số

tổng thể đó Thì ước lượng này được gọi là một suy diễn

(inferenee), hay kết luận về tham số tổng thé

b Mẫu: Một ước lượng (estimate) có thể đạt được bằng cách lấy các mức lương của một nhóm nhân viên được chọn thích hợp (gọi là mẫu — sample)) ti tong thé Mau này là một tiểu tập hợp của toàn bộ tổng thể Lương trung bình của nhóm nhân viên gọi là trị thống kê mẫu

(sample statistic): một số đo mô tả của mẫu

Trang 7

Bởi vì luôn có sai số ước lượng, nên sẽ có một số đo

thống kê về độ tin cậy (reliability) của hoạt động suy diễn và ta có thể nói: có thể tin cậy 95% rằng mức lương bình quân của tổng thể dao động trong phạm

vi $500 so với số ước lượng từ mẫu

c Théng ké mé ta (Descriptive Statistics)

Thống kê mô tả có thể được định nghĩa như các

phương pháp liên quan thu thập, trình bày và xác định các

đặc tính của một tập đữ liệu, để mô tả đúng các đặc điểm

khác nhau của tập dữ liệu đó

Tuy các phương pháp thống kê mô tả quan trọng để trình bày và tìm các đặc điểm của thông tin, nhưng sự

phát triển của các phương pháp thống kê suy diễn

(inferential statisties) phát triển từ lý thuyết xác suất, dẫn đến các ứng dụng thống kê trong nhiều lĩnh vực

nghiên cứu ngày nay

d Thống ké suy dién (Inferential Statistics)

Thống kê suy điễn là các phương pháp ước lượng

các đặc điểm của một tổng, thể hay thực biện quyết định liên quan tổng thể căn cứ trên các kết quả mẫu:

Tổng thể (population, universe) là toàn bộ các

phần tử hay sự việc đang xem xét

Mẫu (Sample) là phần của tổng thể được lựa chọn để

phân tích

Thông số (Parameter) là số đo tóm lược tính toán để

mô tả một đặc điểm của toàn bộ tổng thể

Số thống kê (Statistie) là số đo tóm lược tính toán

để mô tả một đặc điểm từ một mẫu của tổng thể

Như vậy, đặc điểm quan trọng của thống kê suy diễn là quá trình dùng các trị thống kê mẫu, để rút ra các kết luận về các thông số thực của tổng thể

Trang 8

Sử dụng các phương pháp thống kê suy diễn là do yêu câu cần lấy mẫu Khi tổng thể quá lớn, thường quá tốn kém chỉ phí và thời gian, và khối lượng công việc sẽ rất lớn để tìm thông tin về toàn bộ tổng thể, do đó sẽ tìm các trị thống kê của mẫu để dùng thống kê suy diễn, tính ra các thông số của tổng thể

Các quyết định liên quan các đặc điểm tổng thể sẽ được căn cứ trên thông tin chứa trong mẫu của tổng thể đó Lý thuyết xác suất cung cấp cho chúng ta liên kết này, bằng việc xác định khả năng các kết quả có được từ mẫu, sẽ phản ánh mức độ nào các kết quả từ tổng thể

Thí dụ: Nếu muốn ước lượng phần trăm số phiếu bầu

cho một ứng cử viên trong một khu vực nào đó, không thể

phỏng vấn tổng thể hàng triệu người Do đó, sẽ chọn một mẫu các cử tri, căn cứ trên kết quả có được từ mẫu, sẽ rút

ra các kết luận liên quan tổng thể các cử tri

Từ các kết luận này sẽ có thể xác định khả năng

(likelihood) hay niém tin (confidence), vé việc các kết

quả có được từ mẫu phản ánh hành vi bổ phiếu thực sự

trong tổng thể như thế nào

Nếu chúng ta dùng lương bình quân của nhóm nhân viên (chẳng han 14 $500) như mức ước lượng của lương

bình quân tổng thể, thì chúng ta đang thực hiện suy

diễn thống kê, hay kết luận về tổng thể, dựa trên thông tin cung cấp bởi một mẫu lấy từ tổng thể

1.3 HAI LOẠI NGHIÊN Cứu THỐNG KÊ:

Từ khái niệm về thống kê suy diễn ta cần phân biệt hai loại nghiên cứu thống kê:

Nghiên cứu mô tả (enumerative studies) liên quan việc

ra quyết định liên quan một tổng thể và các đặc điểm của nó

Trang 9

Thí dụ: Thăm dò bỏ phiếu là một nghiên cứu mô tả, vì mục tiêu là cung cấp ước lượng các đặc điểm của tổng thể,

và thực hiện tác động nào đó trên tổng thể

Danh sách các phần tử (như các cử trị) thuộc về tổng thể đó gọi là khung mẫu (sample frame) Nhu vay trong

tâm của nghiên cứu mô tả là việc đếm (hay đo lường) các kết quả (outeomes) có từ khung mẫu

* Nghiên cứu phân tích (analytical studies) bao

gồm các tác động trên quá trình để cải thiện thành quả

trong tương lai

Thí dụ: Việc khảo sát các kết quả của một quá trình sản xuất theo thời gian là một thí dụ về nghiên cứu

phân tích, như vậy trọng điểm của nghiên cứu phân tích

là đự báo về hành vi của quá trình tương lai, để hiểu và cải thiện quá trình

Trong nghiên cứu phân tích không có tổng thể rõ rệt

như trong nghiên cứu mô tả, và vì vậy không có khung mẫu

Hình 1.1: Sẽ mô tả sự khác biệt giữa các nghiên cứu mô tả và nghiên cứu phân tích

Nghiên cứu mô tả: Trong tô chứa gì?

„: ® Trong nghiên ,qứu mộ tả, cái tô thể hiện tổng thể, vấn

đề quan tâm Ja: “Trong | tô chứa dựng gi?”

Trang 10

e Trong nghiên cứu phân tích, thường có một số giai đoạn tạo thành quá trình Vấn để quan tâm xoay quanh việc đữ liệu đã thu thập (thường trên một thời kỳ) có thể được sử dụng để dự báo tương lai thế nào,

Hình 1.2 sẽ thể hiện hình ảnh về nghiên cứu mô tả và

nghiên cứu phân tích

Hình 1.2 (a): Nghiên cứu mô tả

(b): Nghiên cứu phân tích

- Nghiên cứu phân t tích là phim gồm các tấm ảnh,

khảo sát một quá trình theo các thời kỳ kế tiếp

Việc phân biệt giữa nghiên cứu mô tả và nghiên cứu phân tích thì quan trọng, vì các phương pháp được áp dụng

chủ yếu cho nghiên cứu mô tả, có thể không thích hợp hay

không chính xác chờ nghiên cứu phân tích Có một số phương pháp thích hợp cho cả hai loại nghiên cứu; một số phướng pháp thích hợp chủ yếu cho nghiên cứu mô tả hay

Trang 11

1.4 QUA TRÌNH RA QUYẾT ĐỊNH (DECISION- MAKING PROCESS):

Thí dụ: Nhà đâu tư tiểm nang (potential investor)

muốn xác định doanh nghiệp nào trong ngành nào, có khả

năng tăng tốc độ tăng trưởng trong thời kỳ hồi phục kinh

tế (eeonomic recovery)

Nhà đâu tư cần tiến hành khảo sát (survey) hoặc tiến

hành thực nghiệm để hỗ trợ việc ra quyết định, việc xác định mục tiêu cần cân nhắc các phương án hoạt động khác nhau, nhà quyết định cần tìm cách đánh giá mọi thông tin có được,

để chọn phương án hoạt động tối đa hóa các mục tiêu

Nhà thống kê hay nhà nghiên cứu sẽ cần thông tin hay

dữ liệu liên quan (data) Để việc phân tích thống kê hữu ích trong quá trình ra quyết định, dữ liệu đầu vào

(input data) phai thích hợp Nếu dữ liệu bị sai lệch,

không rõ ràng, có các loại sai số (error), thì việc sử dụng các công cụ phần mềm phân tích thống kê mạnh cũng không hiệu quả

1.5 CAC LOAI D@ LIEU (TYPES OF DATA):

* Dinh tinh (qualitative) va dinh lugng (quantitative)

Các hiện tượng hay đặc điểm (phenomena or

characteristics) cần khảo sát là các biến ngẫu nhiên

Dữ ligu 1a các kết quả “quan sát được (observed

outcomes) tit các biến ngẫu nhiên, có thể khác biệt trong

Tiến ngẫu nhiên định tính (qualitative random variables) cho các kết quả hồi dap (responses) theo, loai

(categorical) Biến ngẫu nhiên định lượng (quantitative

random variables) cho kết quả hồi đáp số lượng (numerical)

Trang 12

Thí dụ:

1) Bạn có mua chứng khoán A không?

Câu trả lời là “có hay không”, nên đây là dữ liệu phân loại (categorical)

2) Hiện bạn đăng ký bao nhiêu tạp chí?

Đây là một biến ngẫu nhiên định lượng và, câu trả lời

sẽ là dữ liệu định lượng rời rạc (diserete)

3) Bạn cao bao nhiêu? là một biến ngẫu nhiên định lượng liên tực (continuous)

Binh tinh khoán A không? Không L1

Dữ liệu định lượng rời rạc là các kết quả hồi đáp từ

một quá trình tính, đếm

Dữ liệu định lượng liên tục là các kết quả hồi đáp bằng

số có từ một quá trình: đo lường

1.6 CAP DO DO LUGNG (LEVELS OF MEASUREMENT) Mọi dữ liệu đều được “đo lường” theo dạng nào đó Thí

dụ: Dữ liệu định tính rời rạc có thể xem như xuất hiện do

một quá trình “đo lường bằng việc đếm”

cấp độ mạnh nhất gồm các thang đo (scales)

- Định danh (nominal)

- Thứ tự (ordinal)

Trang 13

- Khoảng (interval)

- Tỉ lệ (ratio)

Thang đo Định đanh và Thứ tự:

Dữ liệu có được từ biến định tính sẽ được đo theo

thang đo định danh hay thang đo thứ tự

Nếu đữ liệu quan sát chỉ được phân loại vào các loại

khác nhau không có.hàm ý thứ tự, ta có thang do định

danh (nominal)

Nếu đữ liệu quan sát được phân loại vào các loại khác nhau có hàm ý thứ tự, ta có thang đo thứ tự (ordinal) _(1) Thang đo định danh là dạng đo lường yếu nhất,

vì không thể hiện sự khác biệt trong một loại nào đó, hoặc không xác định thứ tự hay chiều hướng giữa các loại khác nhau

(2) Thang do thứ tự là dạng đo lường mạnh hơn đôi chút, vì một giá trị quan sát được phân loại vào một loại,

sẽ có một đặc điểm đo lường nào đó khác với đặc điểm một

giá trị quan sát nào đó được phân loại vào một loại khác

Tuy nhiên tháng đo này không thể hiện được sự khác

biệt giữa các giá trị phân loại trong một loại nào đó, ngoài

ra không thể gán các giá trị bằng số về sự khác biệt giữa

các loại Thứ tự chỉ hàm ý loại nào thì “tốt hơn”, “lớn

hơn”, hay “được wa thích hơn”, nhưng không thể hiện

“tốt hơn bao nhiêu”

(3) Thang do khoảng là thang đo thứ tự mà sự khác

nhau giữa các số ‘do cổ ý nghĩa về lượng (quantity) :

Thí dụ: Người cao 1,7m sẽ cao hơn người, cao 1,65m

là 0, 05m

(4) Thang do ti lệ là thang đo ngoài sự khác biệt só ý

nghĩa về lượng giữa các số đo, còn có” ‘tri aero thực (true

zero), để có thể nói về tỉ lệ các số đo

Trang 14

-Thí dụ: người cao 1,7m sẽ cao gấp đôi người cao 0,8ðm

Nên số đo chiều cao là thang đo tỉ lệ

Nhưng nhiệt độ C không phải thang đo tỉ lệ, vì không

Biến định tính Thang do dink anh (phân loại)

Sở hữu xe hơi Gó Không

Trình độ học vấn Đại học Trung cấp Trung học Tiểu học Không biết chữ

Phân lúp sinh viên Năm 1 Năm 2 Năm 3 Năm 4

Sự thổa mãn đối với sản | Rất không Không phẩm X thôa mãn - thỏa mãn Trung bình Khá thỏa mãn Rất thỏa man : x ñ

Standard & Poor's

Thời gian theo lịch Khoảng

Trong lugng (kg) Tỉ lệ

theo thang đo khoảng hay tỉ lệ Các thang đo này ở cấp

đo lường cao nhất, mạnh hơn thang đo thứ tự, vì ta không

chỉ xác định giá trị quan sát nào lớn nhất, mà còn xác

định lớn bao nhiêu

Trang 15

1.7 CÁC LOẠI MẪU:

Có hai loại mẫu cơ bản:

a) Mẫu xác suất (probability sample): là mẫu trong

đó các chủ thể của mẫu được chọn trên cơ sở đã biết các

xác suất Có bốn loại mẫu xác suất thường sử dụng là:

* Mẫu ngẫu nhiên đơn (simple random sample): Trong đó mỗi chủ thể đều có cùng cơ hội được lựa chọn như nhau, và việc chọn một chủ thể này không ảnh hưởng cơ

hội lựa chọn của các chủ thể khác

Lấy mẫu ngẫu nhiên đơn tuy không phải là thủ tục lấy mẫu xác suất kinh tế hay hiệu quả nhất, nhưng nó là cơ sở

để thực hiện các thủ tục lấy mẫu phức tạp hơn

“Điều thiết yếu để chọn mẫu là có được danh sách mọi

chủ thể từ đó lấy mẫu, danh sách này được gọi là khung

tổng thể (population frame), Tổng thể được liệt kê là tổng thể mục tiêu (target population), từ đó rút các

mẫu xác suất khác nhau, kỳ vọng mỗi mẫu sẽ đại diện

một phần nhỏ của tổng thể, và cho ước lượng hợp lý về các đặc tính tổng thể, nếu đanh sách không thích hợp do

các nhóm chủ thể nào đó không được đưa vào tổng thể một cách thích hợp, các mẫu xác suất ngẫu nhiên sẽ chỉ cung cấp các ước lượng về đặc tính của tổng thể mục tiêu, không phải tổng thể thực tế (actual population),

và làm sai lệch (biases) các kết quả

Ta có thể dùng bảng số ngẫu nhién (table of random

numbers) để chọn mẫu ngẫu nhiên

Trang 16

Bảng 1.3: Bốn phương pháp lấy mẫu xác suất

rằng mỗi thành viên của tổng thể trong khung mẫu có một cơ hội như nhau khí

được lựa chọn vào mẫu

Lay mau hé théng (Systematic Sampling)

Sử dụng một khung mẫu liệt kẽ những phẩn tử của tổng thể, nhà nghiến cứu chọn một điểm bắt đầu ngẫu nhiên đối với phần tử của mẫu đẩu tiên Một

“khoảng nhảy” (skip interval) không đổi được tính bằng cách chia số thành viên

của tổng thể trong khung mẫu cho quy mô mẫu, được sử dụng để chọn từng

thành viên mẫu kế tiếp từ khung mẫu Khoảng nhây phải được sử dụng để bao phủ toàn bộ danh sách, không kể điểm bắt đầu Thực tiễn này đạt cùng mục tiêu như lấy mẫu ngẫu nhiên đơn giản, và hiệu quả hơn

Lay mau theo cum (Cluster Sampling)

Khung mẫu được chia thành những nhóm được gọi là “cụm_elusters”, mỗi cụm phải được xem như rất giống với những cụm khác Nhà nghiên cứu sau đó

có thể lựa chọn một cách ngẫu nhiên vài cụm, và thực hiện một khảo sát thống

kê ở mỗi cụm Hoặc nhà nghiên cứu có thể chọn một cách ngẫu nhiên nhiều cụm hơn và lấy mẫu từ mỗi cụm Phương pháp này được ưa thích khi có thể xác

định một cách dễ dàng các cụm tương đồng cao

Lấy mẫu phân tầng (Stratified Sampling)

Nếu tin rằng tổng thể có một phân bố lệch (skewed) đối với một hoặc nhiều

nhân tố riệng biệt của nó (ví dụ, thu nhập hoặc sở hữu sắn phẩm), nhà nghiên

cứu sẽ xác định những tổng thể nhỏ trong khung mẫu được gọi là “các tầng _strata" Một mẫu ngẫu nhiên đơn giản sẽ được lấy từ mỗi tầng, Có thể áp dụng các quy trình gán trọng số để ước lượng giá trị của tổng thể, như giá trị

trung bình (mean) Phương pháp này phù hợp hơn những phương pháp lấy mẫu xác suất khác, khi các tổng thể không có phân phối dạng hình chuông (ball- shaped) (Phân phối chuẩn (normal) thuộc dạng hình chuông)

Trang 17

b) Mẫu phi xác suất (non-probability sample):

Bảng 1.4: Bốn loại phương pháp lấy mẫu phi

xác suất

Lấy mẫu thuận tiện (Convenience Sampling)

Nhà nghiên cứu hoặc người phỏng vấn sử dụng một khu vực có mật độ giao thông cao, như khu vực khách bộ hành đông đúc, hoặc khu mua sắm, siêu thị làm khung mẫu, từ đó tìm những người trả lời tiểm năng Sai số khung mẫu xây ra theo dạng có các thành vién trong tổng thể không thường xuyên ở khu

vực đó Những sai số khác có thể xây ra do người phỏng vấn (interviewer) lựa

chọn tùy tiện những người trả lời (respondent) từ khung mẫu

Lấy mẫu phan dodn (Judgement Sampling)

Nhà nghiên cứu sử dụng phán đoán bản thân hoặc của người có kiến thức

nào đó, để xác định ai sẽ ở trong mẫu Tính chủ quan xuất hiện, và những

thành viên nào đó của tổng thể sế có cơ hội được chọn thấp hơn những thành viên khác

Lấy mẫu tham khảo (Referral Sampling)

Những người trả lời được hỏi tên hoặc đặc điểm của những người khác giống bản thân họ, những người đủ điệu kiện tham gia vào cuộc khảo sát

Những thành viên của tổng thể ít được biết đến, không được ưa thích, hoặc ý

kiến của những người này mâu thuẩn với ý kiến của những người trả lời đã

chọn, sẽ có xác suất được lựa chọn thấp

Lấy mẫu han mifc (Quota Sampling)

Nhà nghiên cứu xác định các đặc điểm của mỗi hạn mức như những nhân

tố về nhân khẩu học hay sử dụng sản phẩm, và sử dụng những đặc điểm này

để thiết lập hạn mức cho mỗi lốp người trả lời Kích thước của hạn mức được

xác định bởi phán: đoán của nhà nghiên cứu về kích thước tương đối của mỗi

lớp người trả tời trong tổng thể Lấy mẫu hạn mức thường được sử dụng như phương tiện đâm bảo những mẫu thuận tiện sẽ có tỷ lệ mong muốn đối với

Trang 18

Hình 1.8: Các loại mẫu

Các loại mẫu

Mẫu phi xác suất Mẫu xác suất

tiện đoán mức khảo đơn giản thống tầng cụm

Thí dụ 1.1: Một cuộc bỏ phiếu bầu cử, căn cứ trên kết quả khảo sát một mẫu gôm 400 cử tri bỏ phiếu, một tờ báo

đã báo cáo tỷ lệ cử tri ủng hộ ông A

1) Hãy xác định tổng thể và tham số (parameter) tổng thể

2) Xác định mẫu và các trị thống kê (statistic) mẫu 3) Suy diễn về kết quả trong tình huống trên

Đáp án:

Tổng thể là toàn bộ các cư dân của thành phố đi bổ phiếu

Tham số tổng thể là tỷ lệ các cử tri bổ phiếu cho ông

A Số suy điễn là số ước lượng (báo cáo bởi báo chí) về tỷ

lệ các cử tri hợp lệ bỏ phiếu cho ông A

Số suy diễn này được kèm theo số đo về độ tin cậy của

giá trị suy diễn

Thi du 1.9: Theo số thống kê, giả sử quy mô trung

bình của hộ gia đình đã giảm từ 2,66 người/gia đình năm

1987 xuống còn 1,8 người/ gia đình vào năm 2007

1) Số 1,8 vào năm 2007 được cho là giá trị của tham số

tổng thể Hãy xác định tổng thể và tham số là gì?

Trang 19

2) Cần thực hiện quy trình nào để chắc chấn 100% rằng giá trị của tham số tổng thể chính xác là 1,8?

3) Thủ tục gì có thể được dùng để có con số 1,8? Dùng

số thống kê mẫu và thống kê suy diễn để trả lời

Đáp án:

1) Vấn đề là xác định số người sống trong mỗi căn hộ

trong nước Tập hợp hàng triệu hộ gia đình là tổng thể

đang nghiên cứu Số người bình quân của mỗi hộ trong tổng thể là tham số quan tâm, là 1,8

2) Bạn phải thu thập số người trong mỗi hộ gia đình trong tổng thể (gọi là điều tra thống kê) và tính số bình quân 8) Chỉ có khả năng chọn được một tập hợp tương đối nhỏ trong toàn bộ số hộ gia đình toàn quốc, và số người sống trong mỗi hộ gia đình này

Tập hợp số người sống trong nhóm hộ gia đình là một

mẫu được rút từ tổng thể Số bình quân các giá trị mẫu

được gọi là số thống kê mẫu, được tính ra là 1,8 Phát biểu

rằng: “quy mô bình quân của toàn bộ gia dinh trong nước

la 1,8”, 1A mdt sé suy diễn cho thông số tổng thể, có thể chính xác hoặc không

Hình 1.4 và Hình 1.5 là các biểu đồ Thống Kê Mô tả về

một mẫu đữ liệu (data sample)

Trang 20

Hình 1.4: Biểu đồ thanh (Bar Chart)

Trang 21

My

BÀI TẬP

1.1 Hàng ngàn khách hàng có tài khoản ở của hiệu

bách hóa lớn Một kế toán uiên nhận định rằng số dư bình

quân chưa thanh toán của các tài khoản này là 475, số này

có được bằng cách tính số bình quân của các số dư chưa

thanh toán cho ỗð0 tài khoản

1) Xác định tổng thể và thông số của tổng thể, mẫu

và số thống kê mẫu, và suy diễn (inferenee) cần thiết 2) Kế toán viên có thể cải thiện độ tin cay (reliability) của giá trị suy điễn như thế nào?

1.9 Một nhà tâm lý đã phỏng uấn 250 học sinh trong toàn thổ tiểu bang Neu York, uà khám phá có 80% học sinh xem TV ít nhất 25 giờ tuân

1) Hãy xác định thông số tổng thể và số thống kê mẫu cần quan tâm

2) Nhận định suy diễn sau đây dựa trên kết quả các cuộc phỏng vấn của nhà tâm lý học: “Tám mươi phần trăm

học sinh Mỹ xem TV ít nhất 25 giờ một tuần”

Trang 22

THỐNG KÊ MÔ TẢ

2.1 MUC TIÊU

Các phương pháp đồ thị và số học được sử dụng để tóm tắt và mê tả các tập dữ liệu, bạn sẽ thông suốt về:

1) Cách tổng hợp một tập dữ liệu khoảng (interval) (định lượng) bằng biểu đồ phân phối tần số (frequency distribution), biểu đồ tần số (histogram),

da giác tần số tương đối (relative frequency

polygon), sơ đồ nhánh và lá (stem and leaf)

2) Cách tổng hợp một tập hợp dữ liệu định danh (nomimal) (định tính) bằng phương Liện biểu đồ quạt (pie chart) va biéu dé thanh (bar chart)

3) Phương pháp tính các số đo cơ bản về xu hướng

trung tâm (central loeation) và độ phân tan (dispersion) 4) Phương thức dùng Định lý Chebyshev và Quy tác Thực nghiệm (Empirical Rule), va sy khác biệt giữa hai phương thức trên

5) Cách tính xấp xỉ trị trung bình (mean) và độ

lệch chuẩn (standard deviation) của một tập đữ liệu

ghép nhóm

2.2 MÔ TẢ Dữ LIỆU

kê không theo dạng thức (pattern) rõ ràng nào

Trang 23

mm

2.3 PHAN PHOI TAN SO (FREQUENCY DISTRIBUTION)

Các phương pháp cơ bản của thống kê mô tả sử dụng

để sắp xếp một tập đữ liệu số học theo dạng biểu bảng (tabular form) và trình bày dạng đề thị Tổng hợp dữ

liệu theo phương thức này trước tiên đòi hỏi ghép nhóm các dữ liệu vào các lớp (classes)

Cần có sự phán đoán liên quan việc sử dụng số lớp và

quy mô lớp Điểm quan trọng khi phán đoán là việc trình

bày dữ liệu ghép nhóm (grouped đata) sẽ giúp nắm bắt

nhanh dạng thức tổng quát (general shape) của sự phân bố đữ liệu

Bạn cần có khả năng tổng hợp một tập dữ liệu số theo

các phương thức sau:

1) Sắp xếp đữ liệu theo một phân phối tần số

2) Xây dựng một biểu đô tần số

3) Xây dựng một đa giác tần số 4) Xây dựng tần số tương đối cho điểm 1 /2 /3 ở trên 5) Xây dựng một đồ thị phân phối tần số tương đối

Trang 24

1) Vẽ sơ để nhánh và lá cho các đữ liệu này

2) Vẽ phân bố tần số cho các dữ liệu này

Đáp án: Bước đầu tiên khi thiết lập sơ đỗ nhánh và lá

là quyết định cách phân chia mỗi quan sát (trọng lượng) thành hai phần: một nhánh và một lá

1) Thí dụ, chúng ta sẽ định nghĩa hai chữ số đầu tiên của một quan sát là nhánh của nó và chữ số thứ ba

là lá Như vậy hai trọng lượng trong bảng được phân tách thành:

Trọng lượng Nhánh Lá

Xem xét cdc trong lugng con lai, chung ta thấy có năm

bên dưới Tiếp theo, chúng ta lần lượt xem xét mỗi quan

sát, và đặt lá của nó vào cùng đòng với nhánh

Trang 25

Trong thí dụ này, so dé ở trên thể hiện sẽ dùng năm lớp, mỗi lớp có bề rộng 10 pounđs (1 pound = 0,45 kg) Số (hay tan số) các trọng lượng thuộc mỗi lớp được ghi trong

bảng dưới

Cân chú ý khi xác định các lớp theo cách mỗi số do

thuộc về đúng một lớp Chúng ta sẽ quy ước rằng một lớp (như từ 140 đến 150) chứa mọi số đo từ giới hạn dưới (140) lên đến dưới giới hạn trên (150)

188, nên khoảng cách (phạm vi-range) của các số đo là:

1) Thiết lập biểu đỗ tần số tương đối cho đữ liệu

2) Thiết lập đa giác tần số tương đối cho đữ liệu

Trang 26

3) Thiết lập đô thị phân phối tần số tương đối tích lũy

Hình 9.1: Biểu đề tần số tương đối

Trang 27

cách đưa thêm một lớp (với tần số zero) vào mỗi đầu của phân

bố, và kéo dài đường thẳng tới điểm giữa của mỗi lớp này

Hình 9.3: Da giác tần số tương đối

Trong lugng (pounds)

3) Tân số tương đối tích lũy thể hiện trong Bảng 2.1 ở trên Tần số tương đối tích lũy của một lớp nào đó là tỷ lệ các số đo nằm dưới giới bạn trên của lớp đó Để vẽ đồ thị

phân bố tần số tương đối tích lũy của mỗi lớp, ta vẽ giới

hạn trên của lớp đó, và nối thành đường thẳng các điểm

thể hiện cho tân số tích lũy

Hình 9.3: Đồ thị phân bố tần số tương đối tích lũy

‘ ' 1 1 :

9

140 150 160 170 180 190

Trọng lượng (pounds}

Trang 28

Thí dụ 2.3: Có Bảng phân phối tân số sau đây, hay vẽ Biểu để tân số tương đối tích lũy

Trang 29

2.4 CÁC BIỂU DIỄN ĐỒ THỊ KHÁC (GRAPHICAL

PRESENTATIONS)

Các phương pháp mô tả ở mục trên thích hợp để tổng

hợp đữ liệu có thang đo khoảng (interval seale), nghĩa

là dữ liệu có số đo định lượng (quantitative) hay số

học (numerical) Nhưng ta còn cần mô tả dữ liệu có

thang đo định danh (nominal seale), nghĩa là dữ liệu định tính (quaHtative) hay phân loại (categorical)

3ác đữ liệu này chứa các thuộc tính (attributes), là

tên của các loại đùng để xếp loại các quan sát Thang đo thứ tự (ordinal) là một loại thang đo định danh đặc biệt,

trong đó các loại xác định thang đo có thể được sắp thứ tự

(ordered) hay xếp hạng (ranked)

Một biểu đồ quạt (pie chart) là một phương pháp hữu „ ích để thể hiện phần trăm các quan sát thuộc vào mỗi loại của một thang đo định danh, trong khi một biểu đồ thanh (bar chart) có thể được sử dụng để thể hiện tần số quan sát thuộc vào mỗi loại Nếu các loại bao gồm các thời điểm, và

mục tiêu là tập trung vào xu hướng của tần số theo thời gian,

sẽ hữu ích khi sử dụng biểu đồ đường (line chart)

Bạn cần nắm vững:

1) Xác định bộ đữ liệu có thang do khoảng, thứ tự hay dinh danh (interval, ordinal, nominal)

2) Thiét lap biéu dé quat (pie chart)

3) Thiết lập biểu đồ thanh (bar chart)

4) Thiết lập biểu đồ đường (line chart)

Thí dụ 2.3: Với mỗi dữ liệu sau đây, xác định thang đo

dữ liệu là khoảng (interval), thứ tự (ordinal), hay

định danh (nominal)

1) Mức lãi suất cơ bản hàng tuần trong năm ngoái

Trang 30

2) Nhãn hiệu xe của một mẫu gồm các giám đốc

3) Số cuộc tiếp xúc mỗi nhân viên bán hàng của công ty thực hiện trong một tuần

4) Xếp hạng (xuất sắc, tốt, trung bình, kém) của một chương trình TV, được đánh giá bởi một mẫu khán giả 5) Số cổ phiếu giao dịch trên sở giao dịch chứng khoán TP.HCM mỗi tuần trong năm 2008

Đáp án:

1) Thang đo khoảng, nếu mức lãi suất được diễn ta theo phần trăm Nếu mức lãi suất chỉ quan sát như cao, trung bình hay thấp, là thang do thứ tự

2) Định danh

3) Khoảng

4) Thứ tự, vì các loại có thể được xếp hạng

5) Khoảng

Thi du 2.4: Mức thất nghiệp ở nước X trong năm năm

qua như sau

1) Vẽ biểu đề thanh mô tả các dữ liệu này

2) Vẽ biểu đồ đường (line chart) mô tả các dữ liệu này

Đáp án:

1) Năm năm, hay năm loại, được thể hiện bởi các khoảng có bề rộng bằng nhau trên trục hoành Chiều cao

Trang 31

của thanh thẳng đứng ở trị trung vị mỗi năm tỷ lệ với tần

số (số thất nghiệp) tương ứng cho năm đó

Hình 9.5: Biểu đồ thanh (Bar Chart)

điểm này bằng các đoạn này

Hình 9.6: Biểu đồ đường (Line Chart)

Trang 32

Thí dụ 3.5: Thị phần của ba công ty A, B, C trên thị trường sắt xây dựng như sau:

Dùng biểu đồ quạt để mô tả đữ liệu này

Đáp án: Ta tính tỷ lệ phần trăm thị phần của mỗi

Trang 33

(interpretation) nào, có nhiều số đo mô tả đại điện cho

các tính chất về xu hướng trung tâm, mức độ phân tán,

và hình dạng, có thể được sử dụng để tính toán và tóm

lược các đặc điểm chính của nhóm dữ liệu, các số đo mô

tả (tóm tắt) này được tính từ một mẫu dữ liệu, các số đo này được gọi là số thống kê (statisties), nếu các số đo được tính từ toàn bộ tổng thể đữ liệu, chúng được gọi là các thông số (parameters)

* Biểu đồ Pareto: Ngoài các biểu đồ trên, biểu đổ Pareto thể hiện các yếu tố nào có tầm quan trọng nhất, nhì trong Hình 2.8, ta thấy yếu tố 1 có tầm quan trọng lớn nhất (chiếm 38%)

Hình 2.8: Biểu đổ Pareto: Thể hiện tầm quan trọng của các yếu tố từ cao xuống thấp

20

Phan tram tich

sol lũy của các yếu tố

Trang 34

2.5 DO LUGNG Xd HUGNG TRữNG TAM (MEASURES

OF CENTRAL TENDENCY)

Ba số đo số học thường được dùng để do giá trị trung

tâm hay trung bình của một bộ dữ liệu: trị trung bình (mean), số trung vị (median), và mode Bạn sẽ biết

cách để tính mỗi số đo này đối với mỗi bộ dữ liệu Ngoài

ra bạn sẽ biết các điểm lợi và bất lợi của mỗi số đo này, cũng như thang đo dữ liệu phù hợp mỗi số đo này

Nhiều nhóm dữ liệu thể hiện một xu hướng tạo nhóm

hay kết cụm (eluster) rõ ràng xung quanh điểm “trung

tâm” nào đó Với mỗi nhóm đữ liệu, thường có thể chọn giá trị, điển hình nào đó, hay trị trung bình để mô tá toàn

bộ nhóm đữ liệu

Giá trị mô tả điển hình như vậy là một số đo về xu

hướng trung tâm hay “trị trung vị - loeation”

e Tri trung bình số học (trị trung bình - mean) là

số đo xu hướng trung tâm được dùng phổ biến nhất

X: là trị trung bình (số học)

n = cỡ mẫu (sample s1ze)

xị = quan sát thứ ¡ của biến ngẫu nhiên x

ø Số trung vị (The median): 86 trung vị là trị ở giữa (middle value) trong một chuỗi dữ liệu n trị số sắp thứ

tự Có một nửa các quan sát nhỏ hơn trị này, và một nửa các quan sát lớn hơn

Để tính trị trung vị từ một nhóm đữ liệu thu thập

Trang 35

theo dạng thô, đầu tiên ta phải sắp các dữ liệu theo thứ

tự số học

Trị trung vị tương ứng với trị trung vị:

n+l

+ Nếu cỡ mẫu chẵn, là trị trung bình của hai giá trị số

tương ứng với hai quan sát chính giữa

Mode Là giá trị xuất hiện thường xuyên nhất trong

một nhóm đữ liệu Trị mode không bị ảnh hưởng bởi sự xuất hiện của các giá trị cực biên (extreme), và trị mode

chỉ được dùng với mục đích mô tả, vì nó biến thiên theo

các mẫu nhiều hơn các số đo xu hướng trung tâm Khi mô

tả hay tóm lược một nhóm đữ liệu, đôi khi trị mode được

dùng để đo xu hướng trung tâm

Trang 36

«e Trị giữa khoảng (midrange) là trị trung bình

cộng của trị quan sát nhỏ nhất và lớn nhất trong một

Trang 37

2) Tìm số trung vị của các trọng lượng

3) Tìm lớp mode (mode class) của phân bố tân số các

trọng lượng lập được trong đáp án của Thí dụ 2.1

Trang 38

2) Giá trị giữa của 2B trọng lượng tìm được dễ dàng bằng cách dùng biểu đổ thân và lá thiết lập trong đáp án

Thí dụ 2.1, tìm được trị trung vị là 169 pounds

3) Lớp mode là lớp có tần số lớn nhất, là “160 tới 170” Trị số mode có thể lấy điểm giữa của lớp này, là 165 pounds

Đáp án:

1) Bách phân vị thứ 25 hay tứ phân vị dưới (ower

quartile), la giá trị mà tối đa có 0,25 x 25 = 6,25 số trọng lượng nhỏ hơn trị này, và tối đa 0,75 x 25 = 18,75 số trọng lượng lớn hơn Đó là trị số có tối đa 6 trọng lượng nhỏ hơn, và tối đa 18 trọng lượng lớn hơn Như vậy bách phân

vị phân thứ 2ð là trọng lượng nhỏ nhất thứ 7 Ta tìm được bằng cách sắp xếp 25 trọng lượng theo thứ tự tăng dần, hay bằng cách đọc từ biểu đỗ thân và lá trong đáp Thí dụ

2.1 Bách phân vị thứ 2ð là 162 pounds

2) Bách phân vị thứ 50 của các trọng lượng chính là số

trung vị trong Thí dụ 3.8 là 169 pounds

3) Bách phân vị thứ 7ð, hay tứ phân vị trên (upper quartile), la gid tri cé toi da 0,75 x 25 = 18,75 các trọng lượng nhỏ hơn, và 0,25 x 25 = 6,25 các trọng lượng lớn

hơn, chính là trọng lượng lớn nhất thứ 7 (hay nhỏ nhất

thứ 19)

Tính được là 177 pounds

Trang 39

2.6 ĐO LƯỜNG VE DO PHAN TAN (MEASURES OF

DISPERSION)

Dù là một tổng thể hay một mẫu các số đo, bạn có thể

tính phạm vi (khoảng — range), bách phân vị (percentiles), phương sai (variance) và độ lệch chuẩn (standard

deviation) Day 1A các số đo thông dụng nhất về độ phân tán, hay độ biến động của một tập số đo

* Phương sai và độ lệch chuẩn (Variance and Standard Deviation)

Hai số đo về độ phân tán xem xét cách thức các giá trị

đữ liệu phân bố thế nào, là phương sai và độ lệch chuẩn

Các số đo này đánh giá các giá trị dữ liệu dao động

xung quanh trị trung bình như thế nào

* Phương sai mẫu (sample varianee) là trị trung bình của các bình phương hiệu số, giữa các giá trị quan sát

va trị trung bình của nhóm dữ liệu

Với mẫu gồm n trị quan sát Xị, xu

Phương sai mẫu là:

xj = giá trị thứ ¡ của biến ngẫu nhiên x

* Độ lệch chuẩn mẫu là căn bậc hai của phương

sai mau

Trang 40

§ = VS? = 186 = 13,648

Phương sai và độ lệch chuẩn do lường mức phân tán

“hình quân” xung quanh trị trung bình (mean), nghĩa là các giá trị quan sát dao động (phân bố) mức độ như thế nào xung quanh trị trung bình

« Hệ số biến thiên (Coefficient of Variation):

Hệ số biến thiên là số đo tương đối (relative measure) của độ phân tán, được diễn tả theo phần trăm Hệ số biến thiên đặc biệt hữu ích khi so sánh sự biến thiên của hai hay nhiều nhóm dữ liệu thể hiện theo các đơn vị đo lường khác nhau

Hệ số biến thiên (CV) đo lường độ phân tán của dữ liệu

so với trị trung bình

CV = (3) 100%

X

S8 = độ lệch chuẩn của tập đữ liệu

%= trị trung bình của tập dữ liệu

Ngày đăng: 27/08/2016, 09:02

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w