1- Nếu Roger muốn sử dụng một hàm hồi quy tuyến tính đơn giản để ước lượng giá bán của một chiếc xe, biến X nào bạn đề nghị Roger nên sử dụng.. Giới thiệu: Lập trình tuyến tính LP, hay t
Trang 1BÀI TẬP THỐNG KÊ TRONG KINH DOANH – TỐI ƯU TUYẾN TÍNH
Đề Bài:
CÂU 1: TỐI ƯU TUYẾN TÍNH (LP)
Công ty hoá dầu Riverside Oil ở bang Kentcky, Hoa kỳ, sản xuất hai loại xăng dùng cho động cơ là xăng thường (regular-A90) và xăng cao cấp (supreme-A97) Mỗi thùng xăng A90 được bán với giá $21 và phải đạt chỉ số octane tối thiểu là 90 Mỗi thùng xăng A97 được bán với giá $25 và phải có chỉ số octane tối thiểu là 97 Mỗi loại xăng này được sản xuất bằng cách trộn ba nguyên liệu sau đây theo các số lượng khác nhau
Bảng sau cung cấp các thong tin liên quan đến nguyên liệu phối trộn:
Nguyên liệu Đơn Giá
($/thùng)
Chỉ số Octane Số thùng sẵn có
(1000 thùng)
Riverside có các đơn đặt hàng cho 300.000 thùng xăng A90 và 450.000 thùng A97 Công ty nên phân bổ các nguyên liệu sẵn có của mình như thế nào để sản xuất hai loại xăng A90 và A97 nếu nó muốn tối đa hoá lợi nhuận?
1 Hãy xây dựng một mô hình LP cho bài toán này
2 Tạo một mô hình trên bảng tính cho bài toán này và giải nó bằng Solver
3 Phương án tối ưu của bài toán là gì?
4 Có các phương án thay thế cho bài toán này không?
5 Chỉ số octane cao nhất có thể được cho xăng thường A90 là bao nhiêu, biết rằng công ty này muốn tối đa hoá lợi nhuận Trong trường hợp này chỉ số octane của xăng cao cấp A97 là bao nhiêu?
6 Chỉ số octane cao nhất có thể được cho xăng cao cấp A97 là bao nhiêu, biết rằng công ty này muốn tối đa hoá lợi nhuận Trong trường hợp này chỉ số octane của xăng thường A90 là bao nhiêu?
Trang 27 Với hai phương án tối ưu đã được xác định trong câu (5) và (6), bạn sẽ đề nghị công ty thực hiện phương án nào? Tại sao?
8 Nếu công ty có thể mua them 150 thùng nguyên liệu 2, với mức giá là $17/thùng Học nên mua không, tại sao?
CÂU 3: PHÂN TÍCH HỒI QUY (Regression Analysis)
Roger Gallagher sở hữu một salon ô tô cũ chuyên về mẫu xe thể thao Corvettes Anh
ta muốn xây dựng một mô hình hồi quy giúp dự đoán về giá bán của các chiếc xe anh ta sở hữu Anh ấy thu thập dữ liệu về các chiếc xe và trình bày nó trong Bảng Dat9-8.xls Dữ liệu bao gồm: số mile mà chiếc xe đã đi (mileage), năm SX (model year), có hay không có T-top trên xe (T-top), và giá bán của một số chiếc xe mà anh
ấy đã bán trong những tháng gần đây Hãy đặt Y là giá bán của chiếc xe, X1 là số mile chiếc xe đã đi, X2 là năm SX, và X3 là sự hiện diện của T-top trên chiếc xe (1=có, 0=không)
1- Nếu Roger muốn sử dụng một hàm hồi quy tuyến tính đơn giản để ước lượng giá bán của một chiếc xe, biến X nào bạn đề nghị Roger nên sử dụng? Giải thích tại sao,
và nêu kỳ vọng về dấu của các hệ số ước lượng
2- Hãy ước lượng các tham số trong hàm hồi quy sau:
Yi^ = b0 + b1X1 i + b2 X2 i (MH1)
Hàm hồi quy ước lượng là gì? Biến X2 có giải thích giá bán của xe không nếu X1 cũng có trong mô hình? Lý do có thể có của vấn đề này là gì?
3- Thiết lập biến nhị phân (dummy) (X3) cho biết chiếc xe có hay không có T-top Hãy ước lượng các tham số của mô hình:
Yi^ = b0 + b1X1 i + b3 X3 i (MH2)
Biến X3 có giúp giải thích cho giá bán của một chiếc xe không nếu X1 cũng có trong mô hình? Giải thích
4- Theo mô hình trên, trung bình một bộ kit T-top làm tăng thêm giá trị của chiếc xe bao nhiêu?
5- Hãy ước lượng các tham số của mô hình sau:
Yi^ = b0 + b1X1 i + b2 X2 i + b3X3i (MH3)
Viết phương trình hàm hồi quy trên
6- Trong số tất cả các hàm hồi quy trên, bạn đề nghị Roger nên sử dụng hàm nào?
Trang 37- Vẽ đồ thị Scatter Plot của Y lần lượt với các biến X1 và X2
8- Dựa vào các đồ thị phân bố rãi trên, hãy nhận xét về mối quan hệ giữa Y với X1 và X2, tuyến tính hay không tuyến tính
9- Hãy ước lượng mô hình sau:
Yi^ = Yi^ = b0 + b1X1 i + b2 X2 i + b3X3i + b4 X4 i (MH4)
Trong đó X4i = X2i2
Viết phương trình đường hồi quy cho mô hình này
10- Hãy xem xét p-value cho mỗi bi trong (MH4) Các giá trị này có chỉ ra biến độc lập nào nên được loại bỏ ra khỏi mô hình không?
Nội dung bài làm:
CÂU 1: TỐI ƯU TUYẾN TÍNH (LP)
1. Giới thiệu:
Lập trình tuyến tính (LP, hay tối ưu tuyến tính) là một phương pháp toán học để xác định cách đạt được một kết quả tốt nhất (như tối đa lợi nhuận hay chi phí thấp nhất) bằng một mô hình toán học được đưa ra từ một số yêu cầu được thể hiện dưới dạng những mối quan hệ tuyến tính Lập trình tuyến tính là một trường hợp cụ thể của lập trình toán học (sự tối ưu toán học)
Nói một cách chính thức hơn, lập trình tuyến tính là một kỹ thuật cho việc tối ưu hóa của một hàm số tuyến tính có mục tiêu, mục tiêu cho đẳng thức tuyến tính và bất đẳng thức tuyến tính Vùng khả thi của nó là một đa giác lồi, nó được định nghĩa như sự giao nhau của nhiều nữa khoảng cách có giới hạn, mỗi sự giao nhau đó được định nghĩa như một bất phuong trình tuyến tính Hàm số mục tiêu là một hàm số mô phỏng giá trị thực được định nghĩa dựa trên đa giác này Thuật toán lập trình tuyến tính xác định một điểm trong đa giác lồi nơi mà hàm số này có giá trị nhỏ nhất (hay lớn nhất) khi có nhiều điểm cùng tồn tại
Lập trình tuyến tính là những bài toán có thể được biểu hiện dưới dạng công thức kinh điển:
Trang 4Trong đó X đại diện cho vector của các biến (được xác định), c và b là nhữnng vector hệ số (được biết đến), A là một ma trận (được biết đến) của các hệ số, và là
ma trận chuyển vị Các biểu hiện được tối đa hóa hay giảm thiểu được gọi là hàm mục tiêu (cTx trong trường hợp này) Sự bất bình đẳng Ax ≤ b là những khó khăn trong đó xác định một hàm mục tiêu lồi nhiều vùng là để được tối ưu hóa Trong nội dung này, có thể so sánh hai vector khi chúng cùng kích thước Nếu tất cả các mục tiêu trong lần đầu tiên là ít hơn hoặc bằng các mục tiêu tương ứng trong lần thứ hai sau đó, chúng ta có thể nói rằng các vector đầu tiên là ít hơn hoặc bằng các vector đầu tiên
Lập trình tuyến tính có thể được áp dụng cho các lĩnh vực nghiên cứu Nó được sử dụng trong kinh doanh và kinh tế, nhưng cũng có thể được sử dụng trong một số lĩnh vực kỹ thuật Các ngành công nghiệp sử dụng các mô hình lập trình tuyến tính bao gồm giao thông vận tải, năng lượng, viễn thông và sản xuất Nó đã chứng tỏ được tính hữu ích trong việc mô hình hóa trong việc lập kế hoạch, lập tuyến, lập lịch trình, phân công và thiết kế
2 Áp dụng cho việc giải quyết vấn đề:
2.1 Đặt các ẩn số:
Nguyên liệu được sử dụng để sản xuất A90: A, B, C
Nguyên liệu được sử dụng để sản xuất A97: X, Y, Z
2.2 Hàm mục tiêu
Để tối đa hóa lợi nhuận, chúng ta cần tối thiểu hóa chi phí khi chúng ta trộn các nguyên liệu để sản xuất ra những sản phẩm, nói cách khác, hàm mục tiêu là:
Min: 17.25 (A+ X) + 15.75 (B+ Y) + 17.75 (C+ Z)
2.3 Các điều kiện khống chế như là một hệ thống bất đẳng thức:
a Ràng buộc về nguồn lực
Nguyên liệu mà chúng ta sẽ sử dụng cho sản xuất ra sản phẩm cho mỗi loại không nhiều hơn nguyên liệu sẳn có
Cho chỉ số Octane 100: A+X <= 150 (1)
Trang 5Cho chỉ số Octane 87: B+Y <= 350 (2)
Cho chỉ số Octane 110: C+Z <= 300 (3)
b Ràng buộc về nhu cầu kinh doanh
Chúng ta cần sản xuất số lượng đủ để cung cấp cho nhu cầu kinh doanh, do đó,
chúng ta có những hạn chế như bên dưới:
Cho A90: A+B+C = 300.000 (4)
Cho A97: X+Y+Z = 400.000 (5)
c Ràng buộc kỹ thuật
Việc trộn ba loại nguyên liệu nên thỏa yêu cầu về kỹ thuật, sau đó chúng ta có
(100A+87B+110C) /( A+B+C) >= 90
Khi chúng ta có hạn chế thứ 4 100A+87B+110C > = 27 000.000
(100X+87Y+110Z)/(X+Y+Z) >= 97
Khi chúng ta có hạn chế thứ 5 100X+87Y+110Z > = 38.800.000
d Sau đó có những ràng buộc A, B, C, X, Y, Z > 0
2.4 Áp dụng những thông tin này vào những công cụ Solver như dưới đây
a Thiết lập hàm mục tiêu trong Excel
Ro
ws Column B Col C Column D Column E Column F Column G
5 Petrol with octane e 87 260869.565 89130.4348 $15.75
6 Petrol with octane e 110
39130.434
8 210869.565 $17.75 $12,537,500.00
Hàm mục tiêu sẽ là: =(D4+E4)*F4+(D5+E5)*F5+(D6+E6)*F6
b Thiết lập các ràng buộc
Những ràng buộc đã được thiết lập trong công cụ Solver như bên dưới
Constraints
14 * Demand
Trang 617 * Octane e e number
20 * None negative
27
2.5 Kết quả khi chúng ta chạy Solver, sau đó chúng ta có hai báo cáo như
sau:
a Báo cáo trả lời (kết quả):
Objective Cell (Min)
Original Value Final Value
$F$5
Petrol with octane 110
Total cost
$12,537,50 0.00
$12,537,50
0.00 Variable Cells
Original Value Final Value Integer
Trang 73
Petrol with octane 100
A90: A
69230.7692
3 150000 Contin
$D$
3
Petrol with octane 100
A97: X
80769.2307
$C$
4 Petrol with octane 87 A90: B 230769.2308 150000 Contin
$D$
4
Petrol with octane 87
A97: Y
119230.769
2 200000 Contin
$C$
5
Petrol with octane 110
$D$
5
Petrol with octane 110
Constraints
$E$
10
Petrol with octane 87
$E$10<=$F
$E$
$E$16>=$F
$16
Not
$E$1
1
Petrol with octane 110
$E$11<=$F
$11
Not Binding 50000
$E$
$E$21>=$F
$E$
$E$19>=$F
$19
Not Binding 150000
$E$
$E$20>=$F
$20
Not Binding 150000
$E$
14 Barrel of A97 Usage 450000 $E$14>=$F$14 Binding 0
$E$
$E$22>=$F
$E$
$E$23>=$F
$23
Not Binding 200000
$E$
17 A97 Usage
99.7777777
8
$E$17>=$F
$17
Not Binding
2.777777 778
$E$
$E$24>=$F
$24
Not Binding 250000
$E$
13 Barrel of A90 Usage 300000
$E$13>=$F
$E$
9
Petrol with octane 100
$E$9<=$F$
Các giải pháp tối ưu để có LP có giá trị 12.537.500 Usd Sau đó chúng ta có
thể nhìn vào bảng variables cell để thấy giá trị A, B, C, X, Y, Z và những ràng buộc và không ràng buộc trong bản Constraints Cell
b Báo cáo về độ nhạy
Variable
Cells
Final
Reduc ed
Objecti ve
Allowabl e
Allowabl e
Trang 8e ent e
$C$3
Petrol with octane e
100 A90: A
1500
4.44089E
$D$3
Petrol with octane e
4.44089E -16
$C$4
Petrol with octane e 87 A90: B
1500
8.88178E -16
4.44089E -16
$D$4
Petrol with octane e 87 A97: Y
2000
4.44089E -16
8.88178E -16
$C$5
Petrol with octane e
8.88178E -16
$D$5
Petrol with octane e
110 A97: Z
2500
8.88178E
Constraints
Final Shadow
Constr aint
Allowabl e
Allowabl e
R.H.
Side Increase
Decreas e
$E$
10
Petrol with octane e e
54347.82
$E$
14 Barrel of A97 Usage 450000 17.75 450000 50000
11363.63 636
$E$
$E$
11
Petrol with octane e
$E$
9
Petrol with octane e
54347.82
$E$
17 A97 Usage
99.77777
2.777777
$E$
$E$
$E$
8.88178
54347.82 609
45652.17 391
$E$
$E$
4.44089
80769.23 077
96153.84 615
$E$
13 Barrel of A90 Usage 300000 17.75 300000 50000
12068.96 552
$E$
Báo cáo về độ nhạy cung cấp cho chúng ta những thông tin liên quan đến
* Thay đổi hàm mục tiêu cho một biến
Để minh họa điều này, giả sử chúng ta thay đổi hàm hệ số A, B, Y, Z trong hàm mục tiêu Giải pháp tối ưu trong LP sẽ thay đổi như thế nào?
Trang 9Giá trị giải pháp hiện tại cho A là 150.000 trong ô C3 và hệ số hàm mục tiêu cho A
là 17.25 Cột tăng/ giảm cho phép chúng ta biết điều đó, với hệ số A trong hàm mục tiêu nằm giữa 17.25 + 0 = 17.25 và không có giới hạn cho giảm, giá trị của các biến trong giải pháp tối ưu LP sẽ không thay đổi Có thể rút ra các kết luận tương tự về B,
Y, và Z
* Thay đổi phía bên tay phải của một ràng buộc
Để hạn chế cột đầu Shadow Price cho chúng ta biết chính xác hàm mục tiêu sẽ thay đổi như thế nào nếu chúng ta thay đổi phía bên phải của các ràng buột tương ứng trong những giới hạn cho phép được đưa ra trong cột Tăng/ Giảm cho phép
Ví dụ cho các Barrel A97, cách sử dụng ràng buột ở $E$1, cung cấp bên tay phải của ràng buộc đó vẫn còn giữa 450.000 + 50.000 = 500.000 và 450.000 - 11.363,64
= 438.636,36, sự thay đổi hàm mục tiêu sẽ chính xác 17.75 [sự thay đổi bên tay phải
từ 450.000]
CÂU 3:
1 Nếu Roger muốn sử dụng một hàm hồi quy tuyến tính đơn giản để ước lượng
giá bán của một chiếc xe, biến X nào bạn đề nghị Roger nên sử dụng? Giải thích tại sao, và nêu kỳ vọng về dấu của các hệ số ước lượng.
- Xét trên góc độ tuổi thọ (khả năng sử dụng) còn lại của xe, chúng ta thấy rõ là biến X1 (quãng đường đã chạy, có thể được hiểu như thời gian đã sử dụng thực tế) là biến ảnh hưởng lớn nhất tới giá bán của xe, bởi vì xét về mặt công năng, chiếc xe được mua để chạy, mà khả năng chạy của nó phụ thuộc vào độ bền còn lại của các chi tiết máy hay toàn bộ chiếc xe (một cách tổng thể) Độ bền này lại được tính bằng thời gian sử dụng và về mặt lý thuyết có thể coi là cố định đối với mỗi loại vật liệu được sử dụng và công nghệ, kỹ thuật chế tạo ra chúng Cho nên, một khi đã được chạy (sử dụng thực tế) cang nhiều bao nhiêu thì thời gian còn lại để có thể sử dụng chúng còn ít bấy nhiêu, cho nên giá trị của chúng – và từ đó là giá trị cả chiếc xe –
sẽ giảm dần theo thời gian sử dụng thực tế
- Biến X2 (năm sản xuất) lại có chiều ảnh hưởng ngược lại và cũng thể hiện mối tương quan nhất định so với biến X1 nói trên: xe càng mới (X2 càng lớn) thì khả năng thời gian đã sử dụng của nó càng ít (trong điều kiện cường độ sử dụng xe không thay đổi), cho nên xe càng mới thì giá càng cao Tuy nhiên, trên thực tế, mức
Trang 10độ sử dụng xe hoàn toàn tùy thuộc vào mỗi chủ sử dụng, nên năm sản xuất không phản ánh được chính xác mức độ đã sử dụng của xe do đó, sẽ không thuyết phục nếu chỉ sử dụng một yếu tố (biến) này để xác định giá bán xe Hơn nữa, năm sản xuất còn liên quan tới dòng xe với các ứng dụng khác nhau về công nghệ, kỹ thuật, kiểu dáng thiết kế, v.v…, do đó “biến” X2 (năm sản xuất) về thực chất lại bao hàm nhiều biến khác có ảnh hưởng tới giá xe Chính vì vậy mà nếu cần lựa chọn 1 biến thì việc
sử dụng biến X1 sẽ thuyết phục hơn
- Với biến X3 (mối tương quan của các trang bị phụ trợ T-top lên giá xe), về nguyên tắc, sự ảnh hưởng của biến này lên xe là có, nhưng xét trên tổng thể về giá trị của một chiếc xe, như một phương tiện giao thông, thì mức độ ảnh hưởng của T-top lên giá bán của xe sẽ phải thấp hơn so với mức độ ảnh hưởng của biến phản ánh khả năng sử dụng còn lại của xe (X1)
- Bên cạnh đó, dựa vào số liệu thống kê, ta có thể xây dựng đồ thị Scatter của giá xe (Y) theo số dặm đã chạy (X1) và năm sản xuất (X2) như sau:
Nhìn vào đổ thị, ta có thể dự đoán sự phụ thuộc của Y theo X1 và Y theo X2 đều
có dạng tuyến tính – trong đó, khi X1 tăng thì Y giảm và khi X2 tăng thì Y tăng
Trang 11Tóm lại, dựa trên những phân tích trên, kết hợp với biểu đồ kèm theo, chúng tôi
sẽ đề nghị Roger sử dụng biến X1
Hệ số ước lượng của b1 sẽ là âm, do khi X1 tăng thì Y (giá) sẽ giảm
Hệ số ước lượng của b2 là dương, do khi X2 tăng thì Y tăng
Kiểm chứng bằng cách lập mô hình của Y theo X1 và Y theo X2:
* Mô hình của Y theo X1:
Y ^ = bo+b1 X1
Xác định bo, b1, kỳ vọng b1 <0 vì đối với xe cũ, xe càng sử dụng nhiều (X1 lớn) thì giá bán càng thấp Nhìn đồ thị thì đường thẳng có dạng dốc xuống, cũng chứng tỏ hệ
số góc <0
Dùng phương pháp phân tích Regression cho ra kết quả như sau:
Regression Statistics
Adjusted R Square 0.828238352
Standard Error 2696.148841
Intercept 30237.23544 1886.846913 16.02527223 5.67E-09
X Variable 1 -178.8654873 23.31313696 -7.672304571 9.7E-06
Từ kết quả trên cho thấy:
bo = 30237.23544, giá trị tuyệt đối của t Stat >2 nên hệ số bo có ý nghĩa và được chấp nhậntrong mô hình
b1 = -178.8654873 giá trị tuyệt đối của t Stat >2 nên hệ số b1 có ý nghĩa và được chấp nhận trong mô hình
Vậy phương trình hồi quy: MH (x1): Yt = b0 + b1x1
* Mô hình của Y theo X2:
Y ^ = bo+b2 X2
Xác định bo, b2, kỳ vọng b2>0 vì đối với xe, năm sản xuất càng gần hiện tại thì xe càng giá trị, giá bán sẽ tăng Trên đồ thị thì đường thẳng có dạng đi lên, cũng chứng
tỏ hệ số góc >0
Dùng phương pháp phân tích Regression cho ra kết quả như sau: