Thủ thuật excel các hàm thống kê trong excel (phần 3)

Các hàm thống kê trong Excel phần 3 Tìm hiểu các hàm thống kê trong Excel phần 3: Hàm EXPONDIST Tính phân phối mũ: trả về xác suất của phân phối xác suất mũ.. Thường được dùng để mô ph

Trang 3

Học Excel - Thủ Thuật Excel

Trang 4

Các hàm thống kê trong Excel (phần 3)

Tìm hiểu các hàm thống kê trong Excel (phần 3):

Hàm EXPONDIST()

Tính phân phối mũ: trả về xác suất của phân phối xác suất mũ

Thường được dùng để mô phỏng khoảng thời gian giữa các biến cố, như máy ATM

sẽ mất khoảng bao lâu để xìa tiền ra; hay là tìm xác suất sao cho tiến trình đó chỉ tốn tối đa là 30 giây…

Cú pháp: = EXPONDIST(x, lambda, cumulative)

x : Giá trị của hàm mũ

Lambda : Tham số lambda

Cumulative : Một giá trị logic, cho biết dạng nào của hàm số mũ sẽ được sử dụng:

= 1 (TRUE) : EXPONDIST() trả về hàm phân phối tích lũy

= 0 (FALSE) : EXPONDIST() trả về hàm mật độ xác suất

Trang 5

Lưu ý:

· Nếu x hay lambda không phải là số, EXPONDIST() trả về giá trị lỗi #VALUE!

· Nếu x < 0, EXPONDIST() trả về giá trị lỗi #NUM!

· Nếu lambda < 0, EXPONDIST() trả về giá trị lỗi #NUM!

Tính phân phối xác suất F

Thường được dùng để tìm xem giữa hai tập số liệu có nhiều mức độ khác biệt hay không Ví dụ, dùng để khảo sát điểm thi của nam sinh và của nữ sinh thi tuyển vào một trường trung học, rồi xác định xem độ biến thiên điểm của nam sinh có khác với độ biến thiên điểm của nam sinh hay không…

Cú pháp: = FDIST(x, degrees_freedom1, degrees_freedom2)

x : Giá trị để ước lượng hàm

Trang 6

· Nếu x < 0, FDIST() trả về giá trị lỗi #NUM!

· Nếu degrees_freedom1 hay degrees_freedom2 không phải là số nguyên, phần

thập phân của nó sẽ bị cắt bỏ để trở thành số nguyên

· Nếu degrees_freedom1 < 1 hay degrees_freedom1 ≥ 10^10, FDIST() trả về giá trị

lỗi #NUM!

· FDIST() được tính ở dạng FDIST = P(F < x), với F là biến ngẫu nhiên có phân

phối F với hai bậc tự do degrees_freedom1 và degrees_freedom2

Ví dụ:

Với x = 15.20675 và bậc tự do ở tử số là 6, bậc tự do ở mẫu số là 4, ta có:

FDIST(15.20675, 6, 4) = 0.010000141

Hàm FINV()

Tính nghịch đảo của phân phối xác suất F

Nghĩa là, nếu xác suất = FDIST(x, …) thì x = FINV(xác suất, …)

Cú pháp: = FINV(probability, degrees_freedom1, degrees_freedom2)

Probability : Xác suất kết hợp với phân phối tích lũy F

Trang 7

· Nếu probability < 0 hay probability > 1, FINV() trả về giá trị lỗi #NUM!

· Nếu degrees_freedom1 hay degrees_freedom2 không phải là số nguyên, phần

thập phân của nó sẽ bị cắt bỏ để trở thành số nguyên

nghĩa này (0.05) làm đối số probabiltycho hàm FINV()

· FINV() sử dụng phương pháp lặp để tính hàm Với probability cho trước, FINV()

sẽ lặp cho tới khi kết quả chính xác trong khoảng ±0.0000003 Nếu FINV() không hội tụ sau 100 lần lặp, nó sẽ trả về giá trị lỗi #NA!

Ví dụ:

Với probability = 0.01 và bậc tự do ở tử số là 6, bậc tự do ở mẫu số là 4, ta có:

FINV(0.01, 6, 4) = 15.20675

Hàm FISHER()

Trả về phép biến đổi Fisher tại x

Phép biến đổi này tạo ra hàm phân phối hơn là đối xứng lệch Thường được dùng trong việc kiểm tra giả thuyết dựa trên hệ số tương quan

Cú pháp: = FISHER(x)

x : Giá trị muốn chuyển đổi

Lưu ý:

Trang 8

· Nếu x khôing phải là số, FISHER() trả về giá trị lỗi #VALUE!

· Nếu x ≤ -1 hay x > 1, FISHER() trả về giá trị lỗi #NUM!

· Phương trình của phép biến đổi FISHER là:

Ví dụ:

FISHER(0.75) = 0.972955

Hàm FISHERINV()

Trả về nghịch đảo của phép biến đổi Fisher

Nghĩa là, nếu y = FISHER(x) thì x = FISHERINV(y)

Cú pháp: = FISHERINV(y)

y : Giá trị để thực hiện phép biến đổi

Lưu ý:

· Nếu y không phải là số, FISHERINV() trả về giá trị lỗi #VALUE!

· Phương trình của phép biến đổi FISHERINV là:

Trang 9

hồi quy tuyến tính Có thể dùng hàm này để dự đoán mức bán hàng trong tương lai, nhu cầu đầu tư, hay khuynh hướng tiêu thụ

Cú pháp: = FORECAST(x, known_y’s, known_x’s)

x : Điểm dữ liệu dùng để dự đoán giá trị mới

known_y’s : Mảng hay dữ liệu phụ thuộc

known_x’s : Mảng hay dữ liệu độc lập

Lưu ý:

· Nếu x không phải là số, FORECAST() trả về giá trị lỗi #VALUE!

· Nếu known_y’s, known_x’s là rỗng hay chứa số điểm dữ liệu khác nhau,

FORECAST() trả về giá trị lỗi #NA!

· Nếu known_x’s = 0, FORECAST() trả về giá trị lỗi #DIV/0!

· Phương trình của FORECAST là:

Với:

Ví dụ:

Dựa vào bảng phân tích lợi nhuận dựa theo giá thành ở bảng sau Hãy ước lượng mức lợi nhuận khi giá thành = $270,000 ?

Trang 10

Mức lợi nhuận tương ứng với giá thành = $270,000 sẽ là:

A11 = FORECAST(B11, A2:A10, B2:B10) = $288,811

Hàm FTEST()

Trả về kết quả của một phép thử F FTEST() trả về xác suất một phía, trong đó

phương sai củaarray1 và array2 khác nhau không đáng kể Hàm này thường được

dùng để xác định xem hai mẫu có các phương sai khác nhau hay không Ví dụ, khi

đã biết điểm kiểm tra của các trường công và của các trường tư, chúng ta có thể kiểm tra xem giữa hai loại trường này có nhiều cấp độ khác nhau về sự đa dạng của điểm thi hay không

Trang 11

· Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính

· Nếu số lượng các điểm dữ liệu trong các array nhỏ hơn 2, hay phương sai của

chúng là zero (0), FTEST() trả về giá trị lỗi #DIV/0!

Cú pháp: = GAMMADIST(x, alpha, beta, cummulative)

x : Giá trị để tính phân phối

Alpha và Beta : Tham số cho phân phối Nếu beta = 0, GAMMADIST() trả về xác

suất của phân phối gamma chuẩn

Cumulative : Giá trị logic xác định dạng hàm Nếu cumulative là TRUE (1),

GAMMADIST() trả về hàm tính phân phối tích lũy của phân phối gamma;

nếu cumulative là FALSE (0), GAMMADIST() trả về hàm mật độ xác suất của phân phối gamma

Lưu ý:

Trang 12

· Nếu x, alpha hay beta không phải là số, GAMMADIST() trả về giá trị lỗi

#VALUE!

· Nếu x < 0, GAMMADIST() trả về giá trị lỗi #NUM!

· Nếu alpha ≤ 0 hay beta ≤ 0, GAMMADIST() trả về giá trị lỗi #NUM!

· Phương trình của GAMMADIST() là:

· Phương trình của phân phối gamma chuẩn (beta = 0)

· Khi alpha = 1, GAMMADIST() trả về xác suất của phân phối mũ, với:

· Với số nguyên dương n, khi alpha = n/2, beta = 2, và cumulative = 1 (TRUE), GAMMADIST() trả về [1 - CHIDIST(x)] với n là bậc tự do

Trang 13

Cú pháp: = GAMMAINV(probability, alpha, beta)

Probability : Xác suất kết hợp với phân phối gamma

Alpha và Beta : Tham số cho phân phối Nếu beta = 0, GAMMAINV() trả về phân

phối gammachuẩn

Lưu ý:

· Nếu có bất kỳ đối số nào không phải là số, GAMMAINV() trả về giá trị lỗi

#VALUE!

· Nếu probability < 0 hay probability > 1, GAMMAINV() trả về giá trị lỗi #NUM!

· Nếu alpha ≤ 0 hay beta ≤ 0, GAMMAINV() trả về giá trị lỗi #NUM!

· GAMMAINV() sử dụng phương pháp lặp để tính hàm Với probability cho trước,

GAMMAINV() sẽ lặp cho tới khi kết quả chính xác trong khoảng ±0.0000003 Nếu GAMMAINV() không hội tụ sau 100 lần lặp, nó sẽ trả về giá trị lỗi #NA!

· Nếu x không phải là số, GAMMALN() trả về giá trị lỗi #VALUE!

· Nếu x ≤ 0, GAMMALN() trả về giá trị lỗi #NUM!

Trang 14

· Số e lũy thừa GAMMALN(i), với i là số nguyên, trả về cùng kết quả như (i-1)!

· GAMMALN được tính với công thức sau:

Number1, number2 … : Có thể có từ 1 đến 255 đối số dùng để tính trung bình

Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số

Lưu ý:

· Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số

Trang 15

· Nếu có bất kỳ đối số nào không phải là số dương, GEOMEAN() sẽ trả về giá trị lỗi #VALUE!

· GEOMEAN được tính bằng phương trình sau:

Ví dụ:

GEOMEAN({4, 5, 8, 7, 11, 4, 3}) = 5.476987

Hàm GROWTH()

Tính toán sự tăng trưởng dự kiến theo hàm mũ bằng cách sử dụng dữ kiện hiện có

GROWTH() trả về các giá trị y từ các giá trị x được chỉ định bằng cách sử dụng các giá trị x hiện có

GROWTH() là một hàm cho ra kết quả là một mảng, do đó nó phải được nhập ở dạng công thức mảng

Cú pháp: = GROWTH(known_y’s, known_x’s, new_x’s, const)

Known_y’s : Một tập hợp các giá trị y đã biết, trong mối quan hệ y = b*m^x

- Nếu mảng known_y’s nằm trong một cột, thì mỗi cột của known_x’s được hiểu

như là một biến độc lập

- Nếu mảng known_y’s nằm trong một dòng, thì mỗi dòng của known_x’s được

hiểu như là một biến độc lập

- Nếu có bất kỳ số nào trong known_y’s là 0 hay là số âm, GROWTH() sẽ trả về

giá trị lỗi #NUM!

Known_x’s : Một tập hợp tùy chọn các giá trị x đã biết, trong mối quan hệ y =

b*m^x

Trang 16

- Mảng known_x’s có thể bao gồm một hay nhiều tập biến Nếu chỉ một biến được

sử dụng,known_x’s và known_y’s có thể có hình dạng bất kỳ, miễn là chúng có kích thước bằng nhau Nếu có nhiều biến được sử dụng, known_y’s phải là

một vectơ (là một dãy, với chiều cao là một dòng, hay với độ rộng là một cột)

- Nếu bỏ qua known_x’s, known_x’s sẽ được giả sử là một mảng {1, 2, 3, …} với kích thước bằng với known_y’s

New_x’s : Là các giá trị x mới, dùng để GROWTH() trả về các giá trị y tương ứng

- New_x’s phải gồm một cột (hay một dòng) cho mỗi biến độc lập, giống

như known_x’s Vì thế, nếu known_y’s nằm trong một cột đơn,

thì known_x’s và new_x’s phải có cùng số lượng các cột; nếu known_y’s nằm trên một dòng đơn, thì known_x’s và new_x’s phải có cùng số lượng các dòng

- Nếu bỏ qua new_x’s, new_x’s sẽ được giả sử giả sử là giống như known_x’s

- Nếu bỏ qua cả known_x’s và new_x’s sẽ được giả sử là mảng {1, 2, 3, …} với kích thước bằng với known_y’s

Const : Là một giá trị logic cho biết có nên ép hằng số b để nó bằng 1 hay không

(trong mối quan hệ y = b*m^x)

- Nếu const là TRUE (1) hoặc bỏ qua, b được tính bình thường

- Nếu const là FALSE (0), v được gán bằng 1, khi đó các giá trị m sẽ được điều chỉnh để y = m*x

Lưu ý:

· Khi nhập hằng mảng cho đối số, như hằng mảng cho known_y’s chẳng hạn, dùng

dấu phẩy để phân cách các trị trên cùng dòng, và dấu chấm phẩy để phân cách các dòng

Ví dụ:

Trang 17

Đây mà một bảng mô tả mức tăng trưởng doanh thu của một đơn vị từ tháng thứ 11 đến tháng thứ 16

Dựa theo mức tăng trưởng này, dự đoán doanh thu của tháng thứ 17 và 18 ?

Chọn cả hai ô B9:B10, nhập công thức mảng:

{= GROWTH(B2:B7, A2:A7, A9:A10)}

Ta sẽ có kết quả doanh thu dự đoán của tháng thứ 17 (B9) = 320,197 và tháng thứ

18 (B10) = 468,536

Hàm HARMEAN()

Trả về trung bình điều hòa của một dãy các số dương Trung bình điều hòa là

nghịch đảo của trung bình cộng

Cú pháp: = HARMEAN(number1, number2, …)

Number1, number2 … : Có thể có từ 1 đến 255 đối số dùng để tính trung bình điều

hòa Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số

Lưu ý:

· Trung bình điều hòa luôn nhỏ hơn trung bình nhân, mà trung bình nhân là một số luôn nhỏ hơn trung bình cộng

Trang 18

· Những đối số là giá trị lỗi hay giá trị text mà không thể chuyển đổi thành giá trị

số sẽ gây ra lỗi

· Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số

· Nếu có bất kỳ đối số nào không phải là số dương, HARMEAN() sẽ trả về giá trị lỗi #VALUE!

· HARMEAN được tính bằng phương trình sau:

Cú pháp:

= HYPGEOMDIST(sample_s, number_sample, population_s,number_populatio

n)

sample_s : Số lần thành công trong mẫu

number_sample : Kích thước mẫu

Trang 19

population_s : Số lần thành công trong tập hợp chính

· Nếu sample_s < 0 hoặc lớn hơn giá trị nhỏ nhất

giữa number_sample và population_s, HYPGEOMDIST() trả về giá trị lỗi #NUM!

· Nếu sample_s nhỏ lớn hơn giá trị lớn nhất giữa 0 và (number_sample –

number_population +population_s), HYPGEOMDIST() trả về giá trị lỗi #NUM!

· Nếu number_sample ≤ 0 hay number_sample > number_population,

HYPGEOMDIST() trả về giá trị lỗi #NUM!

· Nếu population_s ≤ 0 hay population_s > number_population,

HYPGEOMDIST() trả về giá trị lỗi #NUM!

· Nếu number_population ≤ 0, HYPGEOMDIST() trả về giá trị lỗi #NUM!

· Phương trình của HYPGEOMDIST() là:

Với:

x = sample_s

n = number_sample

Trang 20

HYPGEOMDIST(1, 4, 8, 20) = 0.363261

Hàm LOGINV()

Trả về nghịch đảo của phân phối tích lũy lognormal của x, trong đó ln(x) thường được phân phối với các tham số mean và standard_dev Nếu probability =

LOGNORMDIST(x, …) thì x = LOGINV(probability, …) Dùng phân

phối lognormal để phân tích số liệu được chuyển đổi theo dạng logarite

Cú pháp: = LOGINV(probability, mean, standard_dev)

Probability : Xác suất kết hợp với phân phối lognormal

Mean : Trung bình của ln(x)

Standard_dev : Độ lệch chuẩn của ln(x)

Lưu ý:

· Nếu có bất kỳ đối số nào không phải là số, LOGINV() trả về giá trị lỗi #VALUE!

· Nếu probability < 0 hay probability > 1, LOGINV() trả về giá trị lỗi #NUM!

· Nếu standard_dev ≤ 0, LOGINV() trả về giá trị lỗi #NUM!

· Nghịch đảo của hàm phân phối lognormal là:

Trang 21

Ví dụ:

Tính x khi biết xác suất đối với phân phối lognormal của x là 0.039084, trung bình

của ln(x) là 3.5 và độ lệch chuẩn của ln(x) là 1.2 ?:

LOGINV(0.039084, 3.5, 1.2) = 4.000025

Hàm LOGNORMDIST()

Trả về xác suất của phân phối tích lũy lognormal của x, trong đó ln(x) thường được phân phối với các tham số mean và standard_dev Dùng phân phối lognormal để phân tích số liệu được chuyển đổi theo dạng logarite

Cú pháp: = LOGNORMDIST(x, mean, standard_dev)

x : Giá trị để tính hàm

Mean : Trung bình của ln(x)

Standard_dev : Độ lệch chuẩn của ln(x)

Lưu ý:

· Nếu có bất kỳ đối số nào không phải là số, LOGNORMDIST() trả về giá trị lỗi

#VALUE!

· Nếu x ≤ 0 hay standard_dev ≤ 0, LOGNORMDIST() trả về giá trị lỗi #NUM!

· Phương trình của hàm phân phối tích lũy lognormal là:

Ví dụ:

Trang 22

Tính xác suất của phân phối lognormal tại 4, biết trung bình của ln(4) là 3.5 và độ

lệch chuẩn của ln(4) là 1.2 ?:

LOGNORMDIST(4, 3.5, 1.2) = 0.039084

Hàm POISSON()

Trả về xác suất của phân phối Poisson Ứng dụng phổ biến của phân

phối Poisson là đoán số lượng biến cố sẽ xảy ra trong một thời gian xác định Ví

dụ: Số lượng xe hơi đi ngang qua 1 điểm trên con đường trong một khoảng thời gian cho trước; số lần gõ bị sai của khi đánh máy một trang giấy, số lần truy cập vào một máy chủ web trong mỗi phút…

Cú pháp: = POISSON(x, mean, cumulative)

x : Số lượng các biến cố

Mean : Giá trị kỳ vọng

Cumulative : Một giá trị logic xác định dạng phân phối xác suất được trả về:

- Nếu cumulative là TRUE (1), POISSON() trả về xác suất tích lũy Poisson, đây là

số biến cố ngẫu nhiên xảy ra trong khoảng thời gian từ 0 đến x, kể cả x; và

POISSON() được tính theo công thức:

- Nếu cumulative là FALSE (0), POISSON() trả về hàm khối lượng xác

suất Poisson, trong đó số biến cố xảy ra chính là x; và POISSON() được tính theo

công thức:

Trang 23

Lưu ý:

· Nếu x không nguyên, phần lẻ của nó sẽ được cắt bỏ để trở thành số nguyên

· Nếu x hay mean không phải là số, POISSON() trả về giá trị lỗi #VALUE!

· Nếu x < 0, POISSON() trả về giá trị lỗi #NUM!

· Nếu mean < 0, POISSON() trả về giá trị lỗi #NUM!

Ví dụ:

Tính xác suất tích lũy và hàm khối lượng xác suất của phân phối Poisson nếu số

lượng các biến cố là 2 và trung bình kỳ vọng là 5 ?:

Xác suất tích lũy Poisson:

POISSON(2, 5, 1) = 0.124652

Hàm khối lượng xác suất Poisson:

POISSON(2, 5, 0) = 0.084224

Hàm PROB()

Tính xác suất xuất hiện của nhóm các biến cố (x_range) nằm giữa hai giới hạn

(upper_limit vàlower_limit) Nếu bỏ qua giới hạn trên (upper_limit) thì xem như nhóm các biến cố là bằng với giới hạn dưới (lower_limit)

Cú pháp: = PROB(x_range, prob_range, lower_limit, upper_limit)

x_range : Dãy các giá trị

Định dạng
Số trang	26
Dung lượng	259,18 KB