Các hàm thống kê trong Excel phần 3 Tìm hiểu các hàm thống kê trong Excel phần 3: Hàm EXPONDIST Tính phân phối mũ: trả về xác suất của phân phối xác suất mũ.. Thường được dùng để mô ph
Trang 3Học Excel - Thủ Thuật Excel
Trang 4Các hàm thống kê trong Excel (phần 3)
Tìm hiểu các hàm thống kê trong Excel (phần 3):
Hàm EXPONDIST()
Tính phân phối mũ: trả về xác suất của phân phối xác suất mũ
Thường được dùng để mô phỏng khoảng thời gian giữa các biến cố, như máy ATM
sẽ mất khoảng bao lâu để xìa tiền ra; hay là tìm xác suất sao cho tiến trình đó chỉ tốn tối đa là 30 giây…
Cú pháp: = EXPONDIST(x, lambda, cumulative)
x : Giá trị của hàm mũ
Lambda : Tham số lambda
Cumulative : Một giá trị logic, cho biết dạng nào của hàm số mũ sẽ được sử dụng:
= 1 (TRUE) : EXPONDIST() trả về hàm phân phối tích lũy
= 0 (FALSE) : EXPONDIST() trả về hàm mật độ xác suất
Trang 5Lưu ý:
· Nếu x hay lambda không phải là số, EXPONDIST() trả về giá trị lỗi #VALUE!
· Nếu x < 0, EXPONDIST() trả về giá trị lỗi #NUM!
· Nếu lambda < 0, EXPONDIST() trả về giá trị lỗi #NUM!
Tính phân phối xác suất F
Thường được dùng để tìm xem giữa hai tập số liệu có nhiều mức độ khác biệt hay không Ví dụ, dùng để khảo sát điểm thi của nam sinh và của nữ sinh thi tuyển vào một trường trung học, rồi xác định xem độ biến thiên điểm của nam sinh có khác với độ biến thiên điểm của nam sinh hay không…
Cú pháp: = FDIST(x, degrees_freedom1, degrees_freedom2)
x : Giá trị để ước lượng hàm
Trang 6· Nếu x < 0, FDIST() trả về giá trị lỗi #NUM!
· Nếu degrees_freedom1 hay degrees_freedom2 không phải là số nguyên, phần
thập phân của nó sẽ bị cắt bỏ để trở thành số nguyên
· Nếu degrees_freedom1 < 1 hay degrees_freedom1 ≥ 10^10, FDIST() trả về giá trị
lỗi #NUM!
· Nếu degrees_freedom2 < 1 hay degrees_freedom2 ≥ 10^10, FDIST() trả về giá trị
lỗi #NUM!
· FDIST() được tính ở dạng FDIST = P(F < x), với F là biến ngẫu nhiên có phân
phối F với hai bậc tự do degrees_freedom1 và degrees_freedom2
Ví dụ:
Với x = 15.20675 và bậc tự do ở tử số là 6, bậc tự do ở mẫu số là 4, ta có:
FDIST(15.20675, 6, 4) = 0.010000141
Hàm FINV()
Tính nghịch đảo của phân phối xác suất F
Nghĩa là, nếu xác suất = FDIST(x, …) thì x = FINV(xác suất, …)
Cú pháp: = FINV(probability, degrees_freedom1, degrees_freedom2)
Probability : Xác suất kết hợp với phân phối tích lũy F
Trang 7· Nếu probability < 0 hay probability > 1, FINV() trả về giá trị lỗi #NUM!
· Nếu degrees_freedom1 hay degrees_freedom2 không phải là số nguyên, phần
thập phân của nó sẽ bị cắt bỏ để trở thành số nguyên
· Nếu degrees_freedom1 < 1 hay degrees_freedom1 ≥ 10^10, FDIST() trả về giá trị
nghĩa này (0.05) làm đối số probabiltycho hàm FINV()
· FINV() sử dụng phương pháp lặp để tính hàm Với probability cho trước, FINV()
sẽ lặp cho tới khi kết quả chính xác trong khoảng ±0.0000003 Nếu FINV() không hội tụ sau 100 lần lặp, nó sẽ trả về giá trị lỗi #NA!
Ví dụ:
Với probability = 0.01 và bậc tự do ở tử số là 6, bậc tự do ở mẫu số là 4, ta có:
FINV(0.01, 6, 4) = 15.20675
Hàm FISHER()
Trả về phép biến đổi Fisher tại x
Phép biến đổi này tạo ra hàm phân phối hơn là đối xứng lệch Thường được dùng trong việc kiểm tra giả thuyết dựa trên hệ số tương quan
Cú pháp: = FISHER(x)
x : Giá trị muốn chuyển đổi
Lưu ý:
Trang 8· Nếu x khôing phải là số, FISHER() trả về giá trị lỗi #VALUE!
· Nếu x ≤ -1 hay x > 1, FISHER() trả về giá trị lỗi #NUM!
· Phương trình của phép biến đổi FISHER là:
Ví dụ:
FISHER(0.75) = 0.972955
Hàm FISHERINV()
Trả về nghịch đảo của phép biến đổi Fisher
Nghĩa là, nếu y = FISHER(x) thì x = FISHERINV(y)
Cú pháp: = FISHERINV(y)
y : Giá trị để thực hiện phép biến đổi
Lưu ý:
· Nếu y không phải là số, FISHERINV() trả về giá trị lỗi #VALUE!
· Phương trình của phép biến đổi FISHERINV là:
Trang 9hồi quy tuyến tính Có thể dùng hàm này để dự đoán mức bán hàng trong tương lai, nhu cầu đầu tư, hay khuynh hướng tiêu thụ
Cú pháp: = FORECAST(x, known_y’s, known_x’s)
x : Điểm dữ liệu dùng để dự đoán giá trị mới
known_y’s : Mảng hay dữ liệu phụ thuộc
known_x’s : Mảng hay dữ liệu độc lập
Lưu ý:
· Nếu x không phải là số, FORECAST() trả về giá trị lỗi #VALUE!
· Nếu known_y’s, known_x’s là rỗng hay chứa số điểm dữ liệu khác nhau,
FORECAST() trả về giá trị lỗi #NA!
· Nếu known_x’s = 0, FORECAST() trả về giá trị lỗi #DIV/0!
· Phương trình của FORECAST là:
Với:
Ví dụ:
Dựa vào bảng phân tích lợi nhuận dựa theo giá thành ở bảng sau Hãy ước lượng mức lợi nhuận khi giá thành = $270,000 ?
Trang 10Mức lợi nhuận tương ứng với giá thành = $270,000 sẽ là:
A11 = FORECAST(B11, A2:A10, B2:B10) = $288,811
Hàm FTEST()
Trả về kết quả của một phép thử F FTEST() trả về xác suất một phía, trong đó
phương sai củaarray1 và array2 khác nhau không đáng kể Hàm này thường được
dùng để xác định xem hai mẫu có các phương sai khác nhau hay không Ví dụ, khi
đã biết điểm kiểm tra của các trường công và của các trường tư, chúng ta có thể kiểm tra xem giữa hai loại trường này có nhiều cấp độ khác nhau về sự đa dạng của điểm thi hay không
Trang 11· Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính
· Nếu số lượng các điểm dữ liệu trong các array nhỏ hơn 2, hay phương sai của
chúng là zero (0), FTEST() trả về giá trị lỗi #DIV/0!
Cú pháp: = GAMMADIST(x, alpha, beta, cummulative)
x : Giá trị để tính phân phối
Alpha và Beta : Tham số cho phân phối Nếu beta = 0, GAMMADIST() trả về xác
suất của phân phối gamma chuẩn
Cumulative : Giá trị logic xác định dạng hàm Nếu cumulative là TRUE (1),
GAMMADIST() trả về hàm tính phân phối tích lũy của phân phối gamma;
nếu cumulative là FALSE (0), GAMMADIST() trả về hàm mật độ xác suất của phân phối gamma
Lưu ý:
Trang 12· Nếu x, alpha hay beta không phải là số, GAMMADIST() trả về giá trị lỗi
#VALUE!
· Nếu x < 0, GAMMADIST() trả về giá trị lỗi #NUM!
· Nếu alpha ≤ 0 hay beta ≤ 0, GAMMADIST() trả về giá trị lỗi #NUM!
· Phương trình của GAMMADIST() là:
· Phương trình của phân phối gamma chuẩn (beta = 0)
· Khi alpha = 1, GAMMADIST() trả về xác suất của phân phối mũ, với:
· Với số nguyên dương n, khi alpha = n/2, beta = 2, và cumulative = 1 (TRUE), GAMMADIST() trả về [1 - CHIDIST(x)] với n là bậc tự do
Trang 13Cú pháp: = GAMMAINV(probability, alpha, beta)
Probability : Xác suất kết hợp với phân phối gamma
Alpha và Beta : Tham số cho phân phối Nếu beta = 0, GAMMAINV() trả về phân
phối gammachuẩn
Lưu ý:
· Nếu có bất kỳ đối số nào không phải là số, GAMMAINV() trả về giá trị lỗi
#VALUE!
· Nếu probability < 0 hay probability > 1, GAMMAINV() trả về giá trị lỗi #NUM!
· Nếu alpha ≤ 0 hay beta ≤ 0, GAMMAINV() trả về giá trị lỗi #NUM!
· GAMMAINV() sử dụng phương pháp lặp để tính hàm Với probability cho trước,
GAMMAINV() sẽ lặp cho tới khi kết quả chính xác trong khoảng ±0.0000003 Nếu GAMMAINV() không hội tụ sau 100 lần lặp, nó sẽ trả về giá trị lỗi #NA!
· Nếu x không phải là số, GAMMALN() trả về giá trị lỗi #VALUE!
· Nếu x ≤ 0, GAMMALN() trả về giá trị lỗi #NUM!
Trang 14· Số e lũy thừa GAMMALN(i), với i là số nguyên, trả về cùng kết quả như (i-1)!
· GAMMALN được tính với công thức sau:
Number1, number2 … : Có thể có từ 1 đến 255 đối số dùng để tính trung bình
Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số
Lưu ý:
· Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số
· Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính
Trang 15· Nếu có bất kỳ đối số nào không phải là số dương, GEOMEAN() sẽ trả về giá trị lỗi #VALUE!
· GEOMEAN được tính bằng phương trình sau:
Ví dụ:
GEOMEAN({4, 5, 8, 7, 11, 4, 3}) = 5.476987
Hàm GROWTH()
Tính toán sự tăng trưởng dự kiến theo hàm mũ bằng cách sử dụng dữ kiện hiện có
GROWTH() trả về các giá trị y từ các giá trị x được chỉ định bằng cách sử dụng các giá trị x hiện có
GROWTH() là một hàm cho ra kết quả là một mảng, do đó nó phải được nhập ở dạng công thức mảng
Cú pháp: = GROWTH(known_y’s, known_x’s, new_x’s, const)
Known_y’s : Một tập hợp các giá trị y đã biết, trong mối quan hệ y = b*m^x
- Nếu mảng known_y’s nằm trong một cột, thì mỗi cột của known_x’s được hiểu
như là một biến độc lập
- Nếu mảng known_y’s nằm trong một dòng, thì mỗi dòng của known_x’s được
hiểu như là một biến độc lập
- Nếu có bất kỳ số nào trong known_y’s là 0 hay là số âm, GROWTH() sẽ trả về
giá trị lỗi #NUM!
Known_x’s : Một tập hợp tùy chọn các giá trị x đã biết, trong mối quan hệ y =
b*m^x
Trang 16- Mảng known_x’s có thể bao gồm một hay nhiều tập biến Nếu chỉ một biến được
sử dụng,known_x’s và known_y’s có thể có hình dạng bất kỳ, miễn là chúng có kích thước bằng nhau Nếu có nhiều biến được sử dụng, known_y’s phải là
một vectơ (là một dãy, với chiều cao là một dòng, hay với độ rộng là một cột)
- Nếu bỏ qua known_x’s, known_x’s sẽ được giả sử là một mảng {1, 2, 3, …} với kích thước bằng với known_y’s
New_x’s : Là các giá trị x mới, dùng để GROWTH() trả về các giá trị y tương ứng
- New_x’s phải gồm một cột (hay một dòng) cho mỗi biến độc lập, giống
như known_x’s Vì thế, nếu known_y’s nằm trong một cột đơn,
thì known_x’s và new_x’s phải có cùng số lượng các cột; nếu known_y’s nằm trên một dòng đơn, thì known_x’s và new_x’s phải có cùng số lượng các dòng
- Nếu bỏ qua new_x’s, new_x’s sẽ được giả sử giả sử là giống như known_x’s
- Nếu bỏ qua cả known_x’s và new_x’s sẽ được giả sử là mảng {1, 2, 3, …} với kích thước bằng với known_y’s
Const : Là một giá trị logic cho biết có nên ép hằng số b để nó bằng 1 hay không
(trong mối quan hệ y = b*m^x)
- Nếu const là TRUE (1) hoặc bỏ qua, b được tính bình thường
- Nếu const là FALSE (0), v được gán bằng 1, khi đó các giá trị m sẽ được điều chỉnh để y = m*x
Lưu ý:
· Khi nhập hằng mảng cho đối số, như hằng mảng cho known_y’s chẳng hạn, dùng
dấu phẩy để phân cách các trị trên cùng dòng, và dấu chấm phẩy để phân cách các dòng
Ví dụ:
Trang 17Đây mà một bảng mô tả mức tăng trưởng doanh thu của một đơn vị từ tháng thứ 11 đến tháng thứ 16
Dựa theo mức tăng trưởng này, dự đoán doanh thu của tháng thứ 17 và 18 ?
Chọn cả hai ô B9:B10, nhập công thức mảng:
{= GROWTH(B2:B7, A2:A7, A9:A10)}
Ta sẽ có kết quả doanh thu dự đoán của tháng thứ 17 (B9) = 320,197 và tháng thứ
18 (B10) = 468,536
Hàm HARMEAN()
Trả về trung bình điều hòa của một dãy các số dương Trung bình điều hòa là
nghịch đảo của trung bình cộng
Cú pháp: = HARMEAN(number1, number2, …)
Number1, number2 … : Có thể có từ 1 đến 255 đối số dùng để tính trung bình điều
hòa Cũng có thể dùng một mảng đơn hay một tham chiếu đến các ô chứa số
Lưu ý:
· Trung bình điều hòa luôn nhỏ hơn trung bình nhân, mà trung bình nhân là một số luôn nhỏ hơn trung bình cộng
Trang 18· Những đối số là giá trị lỗi hay giá trị text mà không thể chuyển đổi thành giá trị
số sẽ gây ra lỗi
· Các đối số phải là số, tên, mảng, hay tham chiếu tới các ô chứa số
· Nếu các đối số là mảng hay tham chiếu có chứa các giá trị text, logic, hay ô rỗng, thì các giá trị đó sẽ được bỏ qua; tuy nhiên, ô chứa giá trị zero (0) thì vẫn được tính
· Nếu có bất kỳ đối số nào không phải là số dương, HARMEAN() sẽ trả về giá trị lỗi #VALUE!
· HARMEAN được tính bằng phương trình sau:
Cú pháp:
= HYPGEOMDIST(sample_s, number_sample, population_s,number_populatio
n)
sample_s : Số lần thành công trong mẫu
number_sample : Kích thước mẫu
Trang 19population_s : Số lần thành công trong tập hợp chính
· Nếu sample_s < 0 hoặc lớn hơn giá trị nhỏ nhất
giữa number_sample và population_s, HYPGEOMDIST() trả về giá trị lỗi #NUM!
· Nếu sample_s nhỏ lớn hơn giá trị lớn nhất giữa 0 và (number_sample –
number_population +population_s), HYPGEOMDIST() trả về giá trị lỗi #NUM!
· Nếu number_sample ≤ 0 hay number_sample > number_population,
HYPGEOMDIST() trả về giá trị lỗi #NUM!
· Nếu population_s ≤ 0 hay population_s > number_population,
HYPGEOMDIST() trả về giá trị lỗi #NUM!
· Nếu number_population ≤ 0, HYPGEOMDIST() trả về giá trị lỗi #NUM!
· Phương trình của HYPGEOMDIST() là:
Với:
x = sample_s
n = number_sample
Trang 20HYPGEOMDIST(1, 4, 8, 20) = 0.363261
Hàm LOGINV()
Trả về nghịch đảo của phân phối tích lũy lognormal của x, trong đó ln(x) thường được phân phối với các tham số mean và standard_dev Nếu probability =
LOGNORMDIST(x, …) thì x = LOGINV(probability, …) Dùng phân
phối lognormal để phân tích số liệu được chuyển đổi theo dạng logarite
Cú pháp: = LOGINV(probability, mean, standard_dev)
Probability : Xác suất kết hợp với phân phối lognormal
Mean : Trung bình của ln(x)
Standard_dev : Độ lệch chuẩn của ln(x)
Lưu ý:
· Nếu có bất kỳ đối số nào không phải là số, LOGINV() trả về giá trị lỗi #VALUE!
· Nếu probability < 0 hay probability > 1, LOGINV() trả về giá trị lỗi #NUM!
· Nếu standard_dev ≤ 0, LOGINV() trả về giá trị lỗi #NUM!
· Nghịch đảo của hàm phân phối lognormal là:
Trang 21Ví dụ:
Tính x khi biết xác suất đối với phân phối lognormal của x là 0.039084, trung bình
của ln(x) là 3.5 và độ lệch chuẩn của ln(x) là 1.2 ?:
LOGINV(0.039084, 3.5, 1.2) = 4.000025
Hàm LOGNORMDIST()
Trả về xác suất của phân phối tích lũy lognormal của x, trong đó ln(x) thường được phân phối với các tham số mean và standard_dev Dùng phân phối lognormal để phân tích số liệu được chuyển đổi theo dạng logarite
Cú pháp: = LOGNORMDIST(x, mean, standard_dev)
x : Giá trị để tính hàm
Mean : Trung bình của ln(x)
Standard_dev : Độ lệch chuẩn của ln(x)
Lưu ý:
· Nếu có bất kỳ đối số nào không phải là số, LOGNORMDIST() trả về giá trị lỗi
#VALUE!
· Nếu x ≤ 0 hay standard_dev ≤ 0, LOGNORMDIST() trả về giá trị lỗi #NUM!
· Phương trình của hàm phân phối tích lũy lognormal là:
Ví dụ:
Trang 22Tính xác suất của phân phối lognormal tại 4, biết trung bình của ln(4) là 3.5 và độ
lệch chuẩn của ln(4) là 1.2 ?:
LOGNORMDIST(4, 3.5, 1.2) = 0.039084
Hàm POISSON()
Trả về xác suất của phân phối Poisson Ứng dụng phổ biến của phân
phối Poisson là đoán số lượng biến cố sẽ xảy ra trong một thời gian xác định Ví
dụ: Số lượng xe hơi đi ngang qua 1 điểm trên con đường trong một khoảng thời gian cho trước; số lần gõ bị sai của khi đánh máy một trang giấy, số lần truy cập vào một máy chủ web trong mỗi phút…
Cú pháp: = POISSON(x, mean, cumulative)
x : Số lượng các biến cố
Mean : Giá trị kỳ vọng
Cumulative : Một giá trị logic xác định dạng phân phối xác suất được trả về:
- Nếu cumulative là TRUE (1), POISSON() trả về xác suất tích lũy Poisson, đây là
số biến cố ngẫu nhiên xảy ra trong khoảng thời gian từ 0 đến x, kể cả x; và
POISSON() được tính theo công thức:
- Nếu cumulative là FALSE (0), POISSON() trả về hàm khối lượng xác
suất Poisson, trong đó số biến cố xảy ra chính là x; và POISSON() được tính theo
công thức:
Trang 23Lưu ý:
· Nếu x không nguyên, phần lẻ của nó sẽ được cắt bỏ để trở thành số nguyên
· Nếu x hay mean không phải là số, POISSON() trả về giá trị lỗi #VALUE!
· Nếu x < 0, POISSON() trả về giá trị lỗi #NUM!
· Nếu mean < 0, POISSON() trả về giá trị lỗi #NUM!
Ví dụ:
Tính xác suất tích lũy và hàm khối lượng xác suất của phân phối Poisson nếu số
lượng các biến cố là 2 và trung bình kỳ vọng là 5 ?:
Xác suất tích lũy Poisson:
POISSON(2, 5, 1) = 0.124652
Hàm khối lượng xác suất Poisson:
POISSON(2, 5, 0) = 0.084224
Hàm PROB()
Tính xác suất xuất hiện của nhóm các biến cố (x_range) nằm giữa hai giới hạn
(upper_limit vàlower_limit) Nếu bỏ qua giới hạn trên (upper_limit) thì xem như nhóm các biến cố là bằng với giới hạn dưới (lower_limit)
Cú pháp: = PROB(x_range, prob_range, lower_limit, upper_limit)
x_range : Dãy các giá trị