Chương 1 Giới thiệu luật kết hợp, luật kết hợp mẫu âm1.1 Lời mở đầu Trong các giao dịch mua bán, chúng ta nhận thấy rằng chủng loại các mặt hàng làrất lớn và số lượng giao dịch có chứa đ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-NGUYỄN HỮU HOÀNG
LUẬT KẾT HỢP ÂM DƯƠNG VÀ ỨNG DỤNG TRONG
CÔNG TÁC BÌNH ỔN GIÁ
LUẬN VĂN THẠC SĨ
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-o0o -NGUYỄN HỮU HOÀNG
LUẬT KẾT HỢP ÂM DƯƠNG VÀ ỨNG DỤNG TRONG
CÔNG TÁC BÌNH ỔN GIÁ
Ngành: Công nghệ Thông tin
Chuyên ngành: Hệ thống thông tin
Mã số:
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS TS ĐỖ VĂN THÀNH
Trang 3Chương 1 Giới thiệu lu
1.1 Lời mở đầu
1.2 Tổng quan về luật kết hợp
1.2.1 Khái niệm luật kết hợp
1.2.2 Giải thuật Apriori để sinh các luật kết hợp 1.3 Luật kết hợp mẫu âm
1.3.1 Khái niệm luật kết hợp mẫu âm
1.3.2 Các giai đoạn phát hiện luật kết hợp mẫu âm
1.3.3 Thuật toán phát hiện luật kết hợp âm
1.4 Kết luận chương
Chương 2 Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm
2.1 Bài toán
2.2 Quá trình thu thập số liệu
2.2.1 Nhóm dân sinh:
2.2.2 Nhóm nhập khẩu
2.2.3 Nhóm xuất khẩu
2.2.4 Nhóm các mặt hàng cơ bản trên thế giới
2.3 Phần mềm sử dụng để phát hiện luật kết hợp - phần mềm CBA 2.3.1 Giới thiệu phần mềm CBA
2.3.2 Xử lý file dữ liệu để xác định luật kết hợp trong CBA
2.3.3 Xác định luật kết hợp trong CBA
Trang 42.4 Kết luận chương
Chương 3 Phát hiện mối quan hệ về sự biến động giá của các mặt hàng dân sinh
3.1 Mở đầu chương
3.2 Chuyển đổi biểu diễn dữ liệu
3.2.1 Bước 1: đánh ký hiệu từng mặt hàng
3.2.2 Bước 2: đánh ký hiệu từng sự biến đổi giá của các mặt hàng
3.2.3 Bước 3: chuyển toàn bộ dữ liệu đã đánh vào file *.tra
3.3 Thực hiện chạy phần mềm CBA để phát hiện luật kết hợp 3.4 Xác định mối quan hệ giá bằng phát hiện luật kết hợp. 3.4.1 Luật kết hợp của 120 mặt hàng với đầy đủ các trạng thái : tăng giá, giảm giá, giữ nguyên giá
3.4.2 Luật kết hợp của 120 mặt hàng khi không tính đến trạng thái giữ nguyên giá ……… 54
3.4.3 Luật kết hợp theo cho nhóm mặt hàng dân sinh
3.4.4 Luật kết hợp cho các mặt hàng dân sinh trong nước và các mặt hàng nhập khẩu : ……… 58
3.4.5 Luật kết hợp cho các mặt hàng nhập khẩu, xuất khẩu và một số mặt hàng trên thế giới
3.5 Kết luận chương
Kết luận
Tài liệu tham khảo
Phụ lục
Phụ lục 1: Danh sách mặt hàng
Phụ lục 2: Kết quả các luật phát hiện được
Trang 6MỞ ĐẦU
Trong những năm gần đây đã chứng kiến giá cả nhiều mặt hàng thiết yếu của đờisống dân sinh, nhiều mặt hàng xuất, nhập khẩu chủ đạo của nền kinh tế tăng rất cao.Việc biến động giá và lạm phát xẩy ra do rất nhiều nguyên nhân, có thể cung khôngđáp ứng đủ cầu; cũng có thể là do chi phí sản xuất của các doanh nghiệp bị đẩy lên;cũng có thể do đầu cơ, lợi dụng những kẽ hở, các cơ hội để tăng giá kiếm lời cao; cũng
có thể do giá nhập khẩu của một số nguyên liệu quan trọng của nền kinh tế tăng cao;cũng có thể thiên tai, bão lụt, dịch bệnh gây ra; cũng có thể do yêu cầu tiêu dùng hànghoá và dịch vụ của xã hội đã thay đổi hay do tác động của môi trường kinh tế, chính trịquốc tế… và sự biến động ấy có thể thay đổi rất nhanh, thậm chí hàng ngày; và ởnhững địa bàn khác nhau có thể cũng có mức độ thay đổi khác nhau
Thời gian qua Chính phủ đã thực hiện nhiều giải pháp để bình ổn giá và kìm chếlạm phát, các giải pháp này là rất đúng về lý thuyết kinh tế, tuy nhiên tác động củachúng lại không đạt được như mong muốn Một trong những nguyên nhân của tìnhtrạng này là chưa định lượng được tác động thực sự của các mặt hàng, mỗi khi có sựbiến đổi giá cả
Đề tài này nằm trong hướng góp phần xác định nguyên nhân nhằm phục vụ đềxuất giải pháp bình ổn giá và kìm chế lạm phát đang tăng cao ở nước ta Cụ thể đề tàitập trung nghiên cứu quan hệ nhân quả và tình hình biến động giá cả của các mặt hàngxuất, nhập khẩu chủ đạo và những sản phẩm thiết yếu của đời sống dân sinh ở nước ta.Đồng thời kết quả của luận văn làm có thể làm nền tàng để xây dựng mô hình dự báogiá đã và đang được áp dụng tại bộ công thương
Đề tài được nghiên cứu dựa trên luật kết hợp (một trong những những kỹ thuậtrất quan trọng của khai phá dữ liệu - data mining)
Nội dung chính của luận văn được chia thành ba chương như sau:
Trang 7Chương 1: Giới thiệu luật kết hợp, luật kết hợp mẫu âm.
Chương 2: Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm
Chương 3: Phát hiện luật kết hợp mẫu âm
Cuối cùng, phần kết luận trình bày một số kết quả đạt được của luận văn và hướng nghiên cứu tiếp theo trong tương lai
Trang 8Chương 1 Giới thiệu luật kết hợp, luật kết hợp mẫu âm
1.1 Lời mở đầu
Trong các giao dịch mua bán, chúng ta nhận thấy rằng chủng loại các mặt hàng làrất lớn và số lượng giao dịch có chứa đồng thời một số mặt hàng xác định chiếm một tỉ
lệ đáng quan tâm Trên thực tế chúng ta không biết người mua là ai, do đó vấn đề đặt
ra là sự trùng lặp đó có ngẫu nhiên hay có một qui luật cũng như một căn cứ nào haykhông? Đó là tiền đề cho sự ra đời của luật kết hợp
Cấu trúc của luật như sau: A=>B (sup, conf) Có nghĩa là luật có A thì kéo theo B với
độ hỗ trợ sup và độ tin cậy conf
Trang 9Cho một tập I = { I1, I2,…, Im } các tập m mục, một giao dịch T được định nghĩa nhưmột tập con của các khoản mục trong I (T I).
Gọi D là CSDL của n giao dịch và mỗi giao dịch được đánh nhãn với một định danhduy nhất
Nói rằng, một giao dịch T D hỗ trợ một tập X I nếu nó chứa tất cả các mục của tập X,điều này có nghĩa là X T, trong một số trường hợp người ta dùng ký hiệu T(X) để chỉtập các giao dịch hỗ trợ cho X Kí hiệu support(X) (hoặc sup(X), s(X)) là tỷ lệ phầntrăm của các giao dịch hỗ trợ X trên tổng các giao dịch trong D, nghĩa là:
sup(X)=
Độ hỗ trợ tối thiểu minsup là một giá trị cho trước bởi người sử dụng Nếu tập mục X
có sup(X) minsup thì ta nói X là một tập các mục phổ biến Các phần sau sẽ sử dụngnhững cụm từ khác như “X có độ hỗ trợ tối thiểu”, hay “X không có độ hỗ trợ tốithiểu” cũng để nói lên rằng X thỏa mãn hay không thỏa mãn support(X) minsup
Một luật kết hợp có dạng R: X => Y, trong đó X, Y là tập các mục; X, Y I và X Y
= Luật X => Y tồn tại một độ tin cậy c Độ tin cậy c được định nghĩa là khả năng
giao dịch T hỗ trợ X thì cũng hỗ trợ Y Công thức để xác định độ tin cậy c như sau:
conf(X =>Y) = p(Y I | X I ) =
Qua định nghĩa trên cho thấy quá trình khai phá luật kết hợp phải được thực hiện thôngqua hai bước:
Trang 10Bước 1: Tìm tất cả các tập mục mà có độ hỗ trợ lớn hơn độ hỗ trợ tối thiểu do
người dùng xác định Các tập mục thoả mãn độ hỗ trợ tối thiểu được gọi là các tậpmục phổ biến
Bước 2: Dùng các tập mục phổ biến để sinh ra các luật mong muốn Ý tưởng
chung là nếu gọi ABCD và AB là các tập mục phổ biến, thì chúng ta có thể xác địnhluật nếu AB => CD giữ lại với tỷ lệ độ tin cậy:
Thực tế, trong mỗi lần mua hàng tại siêu thị nếu khách hàng mua bánh mì, thường thì
họ sẽ mua sữa Hoặc trong những lần người mua hàng mua máy tính xách tay thì sẽkhông mua máy tính để bàn…Thông tin như thế có thể chỉ dẫn người bán lựa chọn mặthàng để sắp xếp chúng trên giá hàng, người bán có thể đặt sữa và bánh mì trong phạm
vi gần kề để gây tác động tích cực tới việc mua của khách cho cả hai mặt hàng này.Việc nhận ra những mặt hàng nào thường được mua cùng nhau, còn những mặt hàngnào thường không được mua cùng nhau giúp người bán hàng có thể bán được nhiều hàng hơn do đó tăng doanh thu
Khai thác luật kết hợp nhằm tìm ra những mối liên kết đáng quan tâm hoặc những quan hệ tương quan trong một tập lớn các đối tượng Trong giao dịch thương mại
Trang 11khám phá mối quan hệ trong số lượng lớn các giao dịch có thể giúp nhiều nhà kinh doanh xử lí giải quyết các vấn đề như: thiết kế catalog để quảng cáo như thế nào?
1.2.2 Giải thuật Apriori để sinh các luật kết hợp.
Để hình dung rõ hơn các giai đoạn trong quá trình phát hiện luật kết hợp, chúng ta sẽ xem xét giải thuật Apriori phát hiện luật kết hợp từ cơ sở dữ liệu tác vụ
a Tìm tất cả các tập phổ biến (frequent itemsets):
- k-itemset (itemsets gồm k items) được dùng để tìm (k+1)- itemset
- Đầu tiên tìm 1-itemset (ký hiệu L1) L1 được dùng để tìm L2 (2-itemsets)
L2 được dùng để tìm L3 (3-itemset) và tiếp tục cho đến khi không có k-itemsetđược tìm thấy
b Từ tất cả các tập phổ biến sinh ra các luật kết hợp mạnh (các luật kết hợp thỏa mãn 2 tham số min_sup và min_conf)
a Duyệt (Scan) toàn bộ cơ sở dữ liệu giao dịch để có được độ hỗ trợ
Trang 1211
Trang 13d Lặp lại từ bước 2 cho đến khi Candidate set (C) trống (không tìm thấy tập
phổ biến)
e Với mỗi tập phổ biến I, sinh tất cả các tập con s không rỗng của I
f Với mỗi tập con s không rỗng của I, sinh ra các luật s => (I-s) nếu độ tin
cậy (Confidence) của nó > =min_conf
Giả sử có cơ sở dữ liệu giao dịch bán hàng gồm 5 giao dịch như sau:
Tid
1 Beer, Diaper, Baby Powder, Bread, Umbrella
Thuật toán Apriori tìm các luật kết hợp trong giao dịch bán hàng trên như sau:
Bước 1:
min-sup = 40% (2/5) C1
Trang 14Coca-Cola
Trang 15Bước 2:
C2
Itemsets
Beer, DiaperBeer, Baby PowderBeer, Milk
Diaper, BabyPowderDiaper, MilkBaby Powder, MilkBước 3:
L2 Itemsets
Beer, DiaperBeer, MilkDiaper, Baby Powder
C3 (min-sup =40%)
Beer, Diaper, MilkBeer, Diaper, Baby PowderDiaper, Milk, Baby PowderBear, Milk, Baby Powder
L3 Itemsets Support
Diaper, Baby Powder
Baby Powder, Diaper
Kết quả ta có các luật kết hợp sau (với min_sup= 40%, min_conf=70%)
R1: Beer => Diaper (support =60%, confidence = 75%)
Trang 16R2: Diaper =>Beer (support =60%,confidence = 75%)
R3: Milk =>Beer (support =40%, confidence = 100%)
R4: Baby Powder => Diaper (support =40%,confidence = 100%)
Từ kết quả các luật được sinh ra bởi giao dịch bán hàng trên, ta thấy rằng có luật có thểtin được (hợp lý) như Baby Powder => Diaper, có luật cần phải phân tích thêm như Milk
=>Beer và có luật có vẻ khó tin như Diaper =>Beer
Ví dụ này sinh ra các luật có thể không thực tế vì dữ liệu dùng để phân tích(transaction database) hay còn gọi là tranining data rất nhỏ
1.3 Luật kết hợp mẫu âm
1.3.1 Khái niệm luật kết hợp mẫu âm
Trang 17- Với giả thiết :
o Giả thiết 1 : độ hỗ trợ tối thiểu (minsup) là 30%, độ tin cậy (minconf) là 70%
o Giả thiết 2 : thuộc tính tuổi được phân ra làm 2 nhóm trên 30 và dưới 30 tuổi
- Với thông tin và hai giả thiết trên ta có được các tập phổ biến :
Trang 18- Qua bảng trên cho thấy :
o Luật „Age<30 Coupe‟ có độ tin cậy là 75%
o Tuy nhiên nếu chúng ta xem xét dưới góc độ khác thì luật „Age>30
Tuy nhiên việc sinh luật kết hợp mẫu âm gặp hai vấn đề khó khăn :
- Thứ nhất : chúng ta không dễ dàng chọn được giá trị ngưỡng minsup và minconf để đảm bảo phù hợp cho cả luật kết hợp âm và luật kết hợp dương
- Thứ hai : trong một cơ sở dữ liệu thực tế có hàng ngàn mục Mà trong các giao dịch nhiều mục lại không xuất hiện hoặc xuất hiện rất ít
Trang 191.3.1.2 Định nghĩa luật kết hợp mẫu âm
Chúng ta định nghĩa một cách tổng quát các luật kết hợp mẫu âm, là một luật mà chứamột phủ định của một mục (tức là một luật mà nguồn gốc hay kết quả của nó có thểđược thành lập bởi sự kết hợp giữa sự có mặt và vắng mặt của các điều kiện) Một ví
dụ cho sự kết hợp này như sau:
Cụ thể hơn, chúng ta có thể xem xét khái niệm luật kết hợp mẫu âm dưới hình thức tậphợp như sau :
Giả sử I = i1, i2,…, ij, , in , một giao dịch T được định nghĩa như một tập con của cáckhoản mục trong I (T I)
Gọi D là CSDL của n giao dịch và mỗi giao dịch được đánh nhãn với một định danhduy nhất Nói rằng, một giao dịch T D hỗ trợ một tập X I và một tập Y I nếu nó chứatất cả các item của X và Y
Với luật kết hợp dương có dạng R: X
Y, trong đó X, Y là tập các mục, X, Y I và
X Y = X được gọi là tiên đề và Y được gọi là hệ quả của luật
Với luật kết hợp mẫu âm sẽ có dạng R‟: X
Trang 20Tương tự như cách tính độ tin cậy trong luật kết hợp dương, độ tin cậy trong luật kếthợp âm có thể được tính như sau:
Conf(X
¬Y)=P(X ¬Y)/P(X)
Trong phần trước, chúng ta đã xem xét giải thuật xác định luật kết hợp dương, bằngcách tính toán các mục xuất hiện trong các giao dịch Tuy nhiên với luật kết hợp âm,rất khó để xác định các mục không xuất hiện trong các giao dịch
Bởi vậy, thay vì xác định các mục không xuất hiện trong các giao dịch, chúng ta tínhtoán các mục xuất hiện trong các giao dịch, hay chính là chúng ta xác định luật kết hợp
âm thông qua luật kết hợp dương
Với mỗi luật X
Do việc xác định luật kết hợp mẫu âm phải thông qua luật kết hợp dương, nếu chúng ta
để độ hỗ trợ và độ tin cậy nhỏ thì sẽ rất khó để xác định các luật kết hợp dương mongmuốn, bởi vậy chúng ta phải chấp nhận để độ hỗ trợ và độ tin cậy dương đủ lớn để dễcho việc xác định luật kết hợp dương và khi đó các luật kết hợp âm tìm thấy sẽ có độ
hỗ trợ và độ tin cậy thấp Lúc này chúng ta phải chấp nhận một số kết quả tìm kiếmđược sẽ không như mong muốn Việc loại bỏ các luật không như mong muốn này
Trang 21chúng ta chỉ có thể sử dụng những miền tri thức trong kho dữ liệu để dự đoán và loại
bỏ chúng để cuối cùng có tập các luật kết hợp mẫu âm khả thi
Chúng ta xem xét sự phân loại sau:
Giả sử T là tập các loại mặt hàng như hình trên, gồm các đỉnh và các cạnh Mỗi đỉnhbiểu diễn một lớp (Hardware, Computers, Electronics, ), đỉnh mà không có đỉnhcon(hay có độ sâu bằng 0) thì được coi là các mặt hàng Hai đỉnh được kết nối vớinhau thông qua một cạnh Các đỉnh, cành này sẽ tạo ra một miền tri thức (domainKnowledge)
Trong sự phân loại trên, có hai mối quan hệ quan trọng đó là quan hệ theo chiều dọc vàquan hệ theo chiểu ngang Mối quan hệ theo chiều dọc là mối quan hệ cha – con, mốiquan hệ theo chiều ngang là mối quan hệ anh – em
Chúng ta gọi mối quan hệ anh – em là mối quan hệ địa phương (Locality Of Similarity– LOS) Các mục cùng LOS sẽ có xu hướng tham gia vào cùng một luật kết hợp Ví dụtrong một cơ sở dữ liệu bán lẻ, các mục cùng LOS sẽ có nhiều khả năng cùng đượctham gia vào các giao dịch của khách hàng Do vậy trong quá trình bán hàng, ngườibán hàng không đưa ra những tham khảo hợp lý thì người mua hàng rất khó có thể
Trang 22chọn một món hàng mà họ muốn.Thay vào đó chúng ta có thể đưa ra một tham khảotheo LOS, để khách hàng có thể chọn một số món hàng mà họ muốn.
Trong hình ví dụ trên, chúng ta để „IBM Aptiva‟ và „Compaq Deskpro‟ cùng cấp vàcùng thuộc dòng máy tính để bàn, khi đó khách hàng muốn mua máy tính để bàn cóthể xem máy IBM Aptive hay Compaq Deskpro, thay vì khách hàng phải loay hoayvới các loại như Notebook, Parks, Electronics…
Như vậy LOS có thể được hiểu như là quan hệ anh – em, được biểu diễn như sau[„IBM Aptiva‟,„Compaq Deskpro‟] Tuy nhiên LOS cũng có thể mở rộng trên cấp,chẳng hạn chúng ta có thể đặt „IBM Aptiva‟, „Compaq Deskpro‟, Notebook, Parksvào cùng một LOS khi chúng ta nhìn cơ sở dữ liệu ở tầm cao hơn (Computers)
Bây giờ chúng ta xem xét các luật liên quan tới LOS
Với giả thiết:
a) Các tập X = { i1, i2,…, ih,…, im }, Y = { j1, j2,…, jl } và X, Y I, X Y = b)
h I, ik X, thỏa mãn [ih , ik] và supp(ih) ≥ minsup, supp(ik) ≥ minsup
Nếu (r: X
Y) (luật r, tiền đề X, kết quả Y) thỏa mãn Supp(X
Y) ≥minsup, Conf(X
Trang 231.3.2.2 Quá trình phát hiện luật kết hợp mẫu âm
LOS sẽ cung cấp một số khả năng để xác định luật âm, giả sử ih,ik I, đều là thành viêncủa một LOS, thỏa mãn [ih,ik] Nếu luật r: XY đúng và ih X, khi đó sẽ sinh
được luật anh em r‟: X‟
Y, tuy nhiên nếu luật này không hỗ trợ, tức là Y không cómối quan hệ với X‟ thì sự kết hợp âm có thể tồn tại
Để phát hiện luật kết hợp mẫu âm, trước hết chúng ta xác định độ lệch giữa cácđội tin cậy như sau:
Trong đó conf(r’) là độ tin cậy của r‟ được tính toán theo công thức (4).
E(conf(r’)) là dự báo độ tin cậy của r‟, được định nghĩa bằng độ tin cậy của r dựa trên
các giả thiết tương tự
Nếu giá trị SM lớn thì khi đó luật X‟
Y là sai, và khi đó luật X‟
¬Y đúng.
Từ cách lập luận trên cho thấy, với giá trị SM càng lớn thì càng cho thấy lượng thôngtin lớn Đồng thời các ứng viên luật kết hợp âm tạo ra cũng phải đáp ứng cả hai tiêuchí về độ hỗ trợ và độ tin cậy thì sẽ được giữ lại
Trên thực tế để đủ điều kiện là một luật kết hợp âm thì phải thỏa mãn hai điều kiện:
- Có độ lệch lớn giữa độ tin cậy thực tế và độ tin cậy dự báo
- Có độ hỗ trợ và độ tin cậy lớn hơn cực tiểu
Trang 24Như vậy trong quá trình khai phá luật kết hợp mẫu âm, chúng ta có sử dụng quá trình
dự đoán, nên khi khai phá luật kết hợp mẫu âm sẽ có có một số luật không mongmuốn, và một trong những công việc quan trọng trong quá trình phát hiện luật kết hợpmẫu âm là loại bỏ một số luật không mong muốn
Một ví dụ về sự loại bỏ luật dư thừa, giả sử chúng ta có hai luật “Female
Buy Hat”
và luật “¬Male
Buy Hat” Trong miền thuộc tính về giới tính, giả sử chỉ có hai giá
trị Male và Female, như vậy ¬Male cũng là Female Như vậy trong hai luật trên chỉ có
một luật được giữ lại
Như vậy, quá trình khai phá luật kết hợp mẫu âm có thể chia làm 3 giai đoạn:
1 Xác định một tập các luật kết hợp dương
2 Sinh các luật kết hợp âm dựa vào luật kết hợp dương đã có ở bước 1 và miền tri thức đã có
3 Loại các luật dư thừa
1.3.3 Thuật toán phát hiện luật kết hợp âm
Từ việc phân tích các giai đoạn trong quá trình phát hiện luật kết hợp âm ở trên, chúng
ta có thể xem xét giải thuật tìm kiếm luật kết hợp âm cụ thể như sau:
Trang 25CandidateSet1 = subset (CandidateSetk , g);
for all candidates c CandidateSet1
//Sinh các luật âm:
Delete all items t from the taxonomy, t FreqSet1
For all rules r postiveRule
tmpRuleSets = genNegCand(r);
for all rules tr tmpRuleSets
if SM(tr.conf, t.conf) > confDeviate
Trang 26Rule = {Rule, Neg(tr) | Neg(tr).supp>minsup, Neg(tr).conf
> minconf};
endif
endfor
endfor
// Loại bỏ các luật dư thừa:
If all members of LOS have common itemset that form {r1, r2,…, rn} Rule
delete rk, where rk falls in the categories
endif
1.4 Kết luận chương
Như vậy qua chương đầu tiên, luận văn đã đưa ra được những vấn đề cơ bản của luậtkết hợp, luật kết hợp mẫu âm Ý nghĩa thực tế của việc khai phá luật kết hợp mẫu âm
Và cũng đã phân tích được các bước cơ bản để phát hiện luật kết hợp, luật kết hợp mẫu
âm Một số thuật toán phổ biến trong khai phá luật kết hợp, luật kết hợp mẫu âm cũng
đã được trình bày trong chương này
Với những vấn đề cơ bản của luật kết hợp, luật kết hợp mẫu âm như vậy, trong chươngtiếp theo, luận văn sẽ đi vào xem xét bài toán cụ thể cần phải giải quyết đó là dựa vàoluật kết hợp mẫu âm để xác định sự biến động giá cả dựa trên thông tin về giá cả hànghóa trong 2 năm qua
Trang 27Chương 2 Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm.
2.1 Bài toán
Những năm gần đây, trong công tác điều hành các hoạt động thương mại cho thấytrong rất nhiều trường hợp nhà nước cho phép nhập khẩu nhóm mặt hàng này, thì đồngthời phải cấm nhập khẩu nhóm mặt hàng khác; hoặc khi xây dựng các dòng thuế chocác nhóm ngành hàng, vẫn thường xẩy ra trường hợp việc cho phép tăng, giảm thuếmột số mặt hàng trong nhóm phải được gắn liền với việc không cho phép tăng, giảmthuế của một số mặt hàng khác
Trong y học thì những tình huống như vậy là khá phổ biến, ở đó khi người bệnh cómột số triệu chứng biểu hiện của một căn bệnh nào đó thì chắc chắn người đó khôngthể có một số triệu chứng biểu hiện cho một số căn bệnh khác, …
Đặc biệt sự biến động giá cả của các mặt hàng cho thấy trong rất nhiều trường hợp,nhóm mặt hàng này tăng thì sẽ có một số mặt hàng khác tăng, và cũng có thể sẽ kéotheo một số mặt hàng khác giảm Tuy nhiên để xác định được mối quan hệ này thìtrước hết phải thu thập được dữ liệu chính xác và đầy đủ về giá cả của các mặt hàngcần quan tâm và đây chính là vấn đề mà chương 2 của luận văn sẽ đề cập tới
Với nền kinh tế lạm phát cao, giá cả mặt hàng biến động liên tục Bài toán đặt ra làtrong sự biến động của các mặt hàng phải chăng có sự liên quan giữa các mặt hàng haykhông? Và làm cách nào để xác định sự liên quan này? Đây là nội dung cơ bản màluận văn sẽ phải làm rõ
Theo kinh nghiệm của Viện Nghiên cứu giá cả thị trường Bộ Tài Chính và Trung tâmThông tin Công nghiệp và Thương mại Bộ Công Thương, các cơ quan này thường
Trang 28theo dõi biến động giá cả của những mặt hàng thuộc các nhóm: hàng hóa nhập khẩu,hàng hóa xuất khẩu, hàng hóa dân sinh, giá của một số mặt hàng trên thế giới và chỉ sốgiá tiêu dùng(CPI) Mặc dụ trên thị trường có hàng nghìn mặt hàng được lưu thông,tuy nhiên các mặt hàng được lựa chọn này đã chiếm tỉ trọng lớn, trên 90% tổng sốlượng mặt hàng lưu thông Do vậy kết quả của việc nghiên cứu biến động giá cả trêncác mặt hàng này cũng đảm bảo tương đối chính xác cho tình hình biến động giá cảtrên toàn thị trường Giá cả của những mặt hàng này được thu thập theo tất cả các tuầntrong 2 năm 2008, 2009 và quý 1 năm 2010 Chi tiết được thể hiện trong phụ lục 1.
Giá cả của các sản phẩm xuất, nhập khẩu chủ yếu được thu thập từ Tổng cục Hải quan
và tính trung bình theo tuần, trong khi giá cả của các sản phẩm thiết yếu của đời sốngdân sinh được thu thập từ 3/1/2008 đến hết ngày 31/03/2010 ở địa bàn Hà Nội vào thứhai, thứ tư, thứ sáu và giá trung bình của 3 ngày này được lấy làm giá cả của sản phẩm
đó trong tuần
Khi phân tích dữ liệu thu thập nếu nhận thấy biên độ giao động của giá cả một số mặthàng rất nhỏ hoặc thay đổi vài tháng một lần (bao gồm 14 mặt hàng Chính phủ thựchiện bình ổn giá), luận văn sẽ loại bỏ những mặt hàng này ra khỏi phạm vi nghiên cứu.Với các mặt hàng không thể thu thập được dữ liệu đầy đủ cho thời giàn nghiên cứu(3/1/2008 – 31/3/2010) thì sẽ xử lý như sau:
- Với những mặt hàng không thu thập được giá cả cho ít nhất ¾ của 120 tuần trởlên, tức là trên 90 tuần, sẽ bị loại bỏ
- Với những mặt hàng còn lại, với những tuần không thu thập được dữ liệu thì sẽ
sử dụng phương pháp trung bình trượt (bậc 4 hoặc bậc 5) hoặc phương pháp phân tíchtương tự để bổ sung dữ liệu khuyết thiếu
Trang 292.2 Quá trình thu thập số liệu
Mục tiêu của luận là văn tập trung nghiên cứu làm rõ mối quan hệ về biến động giá cả,tạo điều kiện thuận lợi hơn cho việc nhận diện được một số yếu tố tác động đến biếnđộng giá cả Bởi vậy luận văn sẽ khảo sát giá cả của những mặt hàng thiết yếu của đờisống dân sinh, những sản phẩm xuất, nhập khẩu chủ đạo của nền kinh tế
Số liệu thống kê về giá cả hàng hóa được thu thập thống nhất theo kỳ thời gian theotuần, cụ thể như sau:
2.2.1 Nhóm dân sinh:
Với những mặt hàng thiết yếu của đời sống dân sinh như gạo tẻ thường, gạo tẻ ngon,gạo nếp,…được thu thập theo từng ngày một trên địa bàn Hà Nội Bắt đầu từ ngày3/1/2008 và kết thúc là ngày 31/3/2010 Với số liệu của bài toán đặt ra cần phải quantâm theo tuần (120 tuần), do vậy sau khi có số liệu giá cả các mặt hàng dân sinh theongày sẽ được tình giá trung bình của tuần, từ đó có số liệu theo tuần Số liệu cụ thểđược thể hiện trong phụ lục 1
2.2.1.1 Nhóm lương thực
Đây là nhóm mặt hàng quan trọng bậc nhất trong nền kinh tế của nước ta Bây giờchúng ta sẽ đi phân tích số liệu cụ thể của các loại mặt hàng thuộc nhóm mặt hànglương thực này
Qua số liệu cho thấy, với nhóm gạo, ngô,… đại diện cho nhóm lương thực cụ thể làgạo tẻ thường, gạo tẻ ngon trong khoảng 10 tuần đầu tiên của năm 2008 (từ tuần 1 đếntuần 11) gần như không có sự biến động về giá, tuy nhiên khoảng 40 tuần tiếp theo ( từtuần 12 đến tuần 52) giá của các mặt hàng này liên tục có sự thay đổi theo chiều hướngtăng giá, nhưng vẫn ở mức độ tăng chậm chỉ từ 7.500đ/Kg tăng lên 8.500đ/Kg với gạo
tẻ thường, từ 11.500đ/Kg đến 11.500 đ/Kg với gạo tẻ ngon
Trang 30Bắt đầu từ năm 2009 (tuần 53 với khoảng thời gian thực hiện thu thập số liệu), giá củanhững mặt hàng lương thực có sự biến động với biên độ tăng cao, cụ thể từ 8.500 đ/Kgtăng lên 11.000đ/Kg với gạo tẻ thường Tuy nhiên mức giá này chỉ cao ổn định trongkhoản 24 tuần đầu của năm 2009 (từ tuần 53 đến tuần 76), sau đó bắt đầu giảm và đivào ổn định ở mức giá 10.000đ/Kg đối với gạo tẻ thường và 12.500đ/Kg với gạo tẻngon.
Đến đầu năm 2010 (tuần 105 đến tuần 120), giá của các mặt hàng lương thực tăngmạnh từ 10.500 đ/Kg lên 13.000 đ/Kg với gạo tẻ thường và 12.500 đ/Kg lên 16.800đ/Kg với gạo tẻ ngon Và trong cả 15 tuần đầu của năm 2010 này thì mức giá này luôncao “ổn định” Quá trình tăng giá đều của nhóm mặt hàng gạo cũng gần như đại diệncho các mặt hàng lương thực: gạo, bột mì, ngô, mì ăn liền
2.2.1.2 Nhóm mặt hàng liên quan tới thịt, trứng, cá
Với nhóm nhóm mặt hàng liên quan tới thịt, trứng thì sự biến động giá có đôi chútkhác so với các mặt hàng lương thực, trong khi thịt lợn mông sấn trong năm 2008 daođộng ở mức giá 63.000 đ/Kg tuy nhiên thịt bò loại 1 dao động từ 90.000 đ/Kg ở trongkhoảng 10 tuần đầu lên tới 115.000 đ/Kg trong những tuần cuối năm 2008 Và đặc biệtbước sang năm 2009, thị lợn có sự giảm giá và ổn định ở mức giá 55.000 đ/Kg thì thị
bò đã tăng giá một cách phi mã lên tới 130.000 đ/Kg rồi 140.000 đ/Kg vào những tuầncuối quý 1/2010 Sự biến động giá của nhóm mặt hàng thịt, trứng, tôm, cá,… cũng thểhiện không giống nhau như thịt lơn và thịt bò loại 1 mà đã phân tích ở trên
Trang 31biến Cụ thể: rau bắp cải từ 5.000 đ/Kg lên đến 15.000 đ/Kg có tuần lên đến 18.000đ/Kg, rau muống tăng từ 3.500 đ/mớ lên đến 14.000 đ/mớ và có tuần lên đến 18.000đ/mớ, điều này cũng dễ hiểu bởi tại thời điểm này Hà Nội gặp trận mưa lụt lịch sử nên
đã đẩy giá cả của các mặt hàng rau củ quả lên cao trong mấy tuần này, các mặt hàngthực phẩm như bột ngọt, muối, đường vẫn được giữ ổn định Tuy nhiên ngay sau đócác mặt hàng rau, củ quả đã được điều chỉnh giảm ở mức ổn định rau bắp cải 7.000đ/Kg, rau muống 6.000 đ/Kg
Sang đến năm 2009, trong khoảng hơn 20 tuần đầu tiên của năm 2009 các mặt hàngrau, củ, quả có sự điều chỉnh giá theo chiều hướng giảm Cụ thể rau bắp cải từ 7.000đ/Kg xuống còn khoảng 4.000 đ/Kg, xoài từ khoảng 30.000 đ/Kg xuống còn 23.500đ/Kg Đến cuối năm 2009, trong khi các loại rau tăng giá thì các loại củ, quả giá ổnđịnh, cụ thể: rau bắp cải tăng từ 4.000 đ/Kg lại tăng giá lên đến 7.000 đ/Kg, còn xoàithì vẫn giữ giá ở mức 23.000 đ/Kg
Sang đến quý 1/2010 tình hình giá của các mặt hàng rau, củ, quả bắt đầu có hiện tượnggiảm giá và đi vào ổn định
2.2.1.4 Nhóm mặt hàng đường, sữa, cafe
Tiếp đến chúng ta đi phân tích giá các mặt hàng liên quan tới đường, sữa, café
Tại thời điểm năm 2008, trong khi café luôn ổn định ở mức giá 76.000 đ/Kg thì sữaloại 900g lại có giá tăng dần đều từ 118.000 đ/Kg trong những tuần đầu năm 2008 tănglên 121.000 đ/Kg rồi tăng lên 127.000 đ/Kg vào những tuần cuối năm 2008 Khác vớicafé và sữa thì đường trắng nội lại có sự thay đổi giá không ổn đinh, có những tuầntăng giá và có những tuần giảm giá, tựu chung lại quá trình thay đổi giá diễn ra chậmchỉ từ mức 10.500 đ/Kg tại thời điểm đầu năm lên mức 11.000 đ/Kg vào thời điểmcuối năm 2008
Sang đến năm 2009, giống như sự thay đổi giả của đường trắng nội năm 2008, trongnăm 2009 sự thay đổi giá của café cũng có sự không ổn định, đầu năm tăng lên 85.000
Trang 32đ/Kg sau đó lại giảm giá xuống 80.000 đ/Kg và vào giai đoạn cuối năm lại có sự thay đổi giá theo chiều hướng tăng dần và kết thúc ở mức 104.800 đ/Kg vào thời điểm tuần
104 Cũng như năm 2008, năm 2009 sữa loại 900g cũng lại tiếp tục có sự tăng giá đều
đặn từ 127.000 đ/Kg lên đến 142.000 đ/Kg Tương tự vậy đường trắng nội cũng có sựtăng đều từ 11.000 đ/Kg đến 19.600 đ/Kg vào cuối năm
Sang đến những tuần đầu năm 2010, các loại mặt hàng này đều có sự tăng giá đều đặn
2.2.1.5 Nhóm mặt hàng rượu, bia, thuốc lá
Mặc dù đây được coi là nhóm mặt hàng xa sỉ, nhưng trên thị trường các thành phố lớnđặc biệt là Hà Nội thì số lượng của những mặt hàng này lại được tiêu thụ với số lượngrất lớn
Và nhìn vào số liệu thu thập được qua phụ lục 1, chúng ta có thể thấy giá của các mặthàng này thường rất ổn định trong từng năm đặc biệt là rượu vodka và thuốc lá.Thường tăng giá vào đầu mỗi năm và ít thấy có sự giảm giá, chỉ riêng bia tigger trongnăm 2009 một số tuần có sự giảm giá
2.2.1.6 Nhóm mặt hàng vải bông, vải tổng hợp
Đây cũng là nhóm mặt hàng có thế mạnh xuất khẩu của cả nước, các mặt hàng vảibông, vải tổng hợp có sự ổn định giá trong năm 2008 Cụ thể trong cả năm 2008 giávải bông luôn là 48.000 đ/m, vải tổng hợp luôn là 30.000 đ/m Tuy nhiên sang đến năm
2009 vải bông vẫn giữ được sự ổn định giá, mặc dù cũng có vài tuần thay đổi giảmnhưng hầu hết các tuần trong năm 2009 giá cũng vẫn ở mức 48.000 đ/m, trong khi vảitổng hợp giảm giá từ 30.000 đ/m cuối năm 2008 xuống còn 20.000 đ/m vào thời điểmcuối năm 2009
Sang đến quý 1 năm 2010 thì tình hình lại ngược lại, trong khi vải tổng hợp tăng giálên 22.000 đ/m thì vải bông lại giảm giá xuống còn 45.000 đ/m
Trang 332.2.1.7 Nhóm mặt hàng liên quan tới vật liệu xây dựng
Đó là các mặt hàng như xi măng, gạch, sắt, thép,…Trong thời kỳ từ năm 2008 đến hếtquý 1 năm 2010, các loại mặt hàng này có sự thay đổi giá không ổn định và khônggiống nhau
Cụ thể trong năm 2008, trong khi gạch và thép có sự tăng giá đều đặn thì xi măng chỉtăng giá từ tuần 9 đến tuần 44 còn lại là ổn định giá Sang đến năm 2009 thì cả 3 loạimặt hàng xi măng, gạch, thép đều có sự thay đổi giá không ổn định có những tuần tănggiá, có những tuần giảm giá
Đến quý 1 năm 2010 thì ba mặt hàng này bắt đầu đồng loạt tăng giá đều đặn
2.2.1.8 Nhóm mặt hàng điện, nước, gas
Đây là nhóm các mặt hàng cơ bản và khá nhạy cảm, vì trên thực tế khi giá của các mặthàng này thay đổi sẽ dẫn tới hàng loạt các mặt hàng khác thay đổi Trong chương sauchúng ta sẽ kiểm nghiệm thực tế này trên số liệu thực tế và luật kết hợp
Năm 2008, trong khi nước tăng giá đều từ 3.316 đ/m3 lên 3.400 đ/m3 thì giá gas lạitheo chiều ngược lại giảm giá từ 250.000 đ/bình xuống còn 185.000 đ/bình Khác vớihai loại mặt hằng trên, điện thì có sự giảm giá trong 30 tuần đầu năm 2008 từ 1.135đ/Kwh xuống còn 1.085 đ/Kwh, và sau đó lại tăng dần trong hơn 20 tuần cuối năm
2008 lên tới 1.145 đ/Kwh
Sang năm 2009, nước và gas tăng với biên độ khá lớn, cụ thể nước tăng từ 3.420 đ/m3lên tới 7.500 đ/m3, gas tăng từ 177.500 đ/bình lên tới 288.000 đ/bình Trong khi đóđiện tăng trong những tuần đầu năm và lại giảm trong những tuần cuối năm
Đến quý 1 năm 2010, nước và điện thì giảm mạnh, cụ thể điện giảm xuống còn 600đ/Kwh trong khi nước giảm xuống còn 4.000 đ/m3 Ngược lại thì gas tăng giá mạnhlên tới 300.000 đ/bình
Trang 342.2.1.9 Nhóm mặt hàng đồ điện dân dụng
Tiếp theo chúng ta sẽ xem sét giá của một số mặt hàng đồ điện dân dụng như máy điềuhòa, tủ lanh, đèn điện,…Năm 2008, trong 44 tuần đầu giá đèn điện luôn ở giá 10.500đ/bóng và 7 tuần cuối năm thì tăng lên 11.000 đ/bóng Còn máy giặt thì tăng từ2.817.000 đ/cái lên 2.913.000 đ/cái sau đó lại giảm về 2.813.000 đ/cái Trong khi đó tủlạnh 39 tuần đầu ổn định ở mức giá 2.260.000 đ/cái sau đó giảm xuống còn 2.133.000đ/cái và cuối năm 2008 tiếp tục giảm xuống còn 2.033.000 đ/cái
Và từ năm 2009 cho đến tiếp tục quý 1/2010 cả 3 thiết bị này đều tăng giá, cụ thể đèntăng giá lên 13.800 đ/bóng, máy giặt tăng lên 4.850.000 đ/cái, tủ lạnh tăng lên4.580.000 đ/cái
2.2.1.10 Nhóm mặt hàng đồ nội thất
Bao gồm một số mặt hàng như đồng hồ, giường, tủ gỗ,… Trong 9 tuần đầu của năm
2008, giá đồng hồ là 45.000 đ/cái, 41 tuần còn lại của năm 2008 giá là 50.000 đ/cái.Đối với tủ gỗ trong 26 tuần đầu giá là 1.917.000 đ/cái, sau đó tăng nhẹ lên mức
2.000.000 đ/cái cho đến cuối năm 2008 Với đồng hồ và tủ gỗ trong năm 2008 chỉ cómột lần tăng giá, tuy nhiên với mặt hàng giường ngủ thì có tới 3 lần tăng giá từ
2.135.000 lên 2.300.000, sau đó tăng lên 2.400.000 và cuối năm 2008 tăng lên2.500.000 đ/cái Trong năm 2008 cả 3 mặt hàng này đều không có sự giảm giá
Sang năm 2009 đến hết quý 1 năm 2010, đà tăng giá lại tiếp tục cho cả 3 mặt hàng Cụthể cuối quý 1/2010 tủ gỗ giá 3.100.000 đ/cái, giường là 2.400.000 đ/cái và đồng hồ là119.000 đ/cái cho đến tiếp tục quý 1/2010 cả 3 thiết bị này đều tăng giá, cụ thể đèntăng giá lên 13.800 đ/bóng, máy giặt tăng lên 4.850.000 đ/cái, tủ lạnh tăng lên4.580.000 đ/cái
Trang 35Giá của một số loại thuốc tay phổ biến đã được thu thập như sau: thuốc ampi đầu năm
2008 là 8.300 đ/vỉ sau đó tăng lên 8.500 đ/vỉ sang đầu năm 2009 tiếp tục giữ ổn định ởmức 8.500 đ/vỉ sau đó từ tuần 77 có sự giảm giá xuống còn 7.500 đ/vỉ, sau đó giảmtiếp xuống 7.000 đ/vỉ, sang quý 1/2010 tiếp tục giảm xuống còn 6.000 đ/vỉ
Thuốc vitamin B3 và paracitamol cũng biến động tương tự như thuốc ampi, ban đầu
ổn định ở mức 1.800 đ/vỉ với Vitamin B3 và 1.700 đ/vỉ với thuốc paracitamol , sau đóvitamin tăng liên tục với mức giá 2.300 đ/vỉ và 2.500 đ/vỉ trong khi thuốc paracitamolthì vẫn ổn định với mức giá 1.700 đ/vỉ
Bắt đầu từ giữa năm 2009 cả hai loại thuốc này bắt đầu giảm giá, trong khi vitamingiảm giá về mức 2.000 đ/vỉ, còn paracitamol giảm giá về mức 1.500 đ/vỉ
2.2.1.12 Nhóm mặt hàng vàng, đô la Mỹ
ỞViệt Nam, Vàng và Đô la mỹ luôn được coi là thước đo cho thay đổi của giá cả Khigiá cả của các mặt hàng thay đổi thường dẫn đến giá vàng và đô la thay đổi và ngườilại Cũng bởi lý do này giá vàng, đô la mỹ thay đổi hàng tuần theo số liệu thu thập.Trên thực tế giá của hai loại mặt hàng đặc biệt này thay đổi theo ngày, có thể là giờ
Theo số liệu thu thập được thì giá đô la trong nước trong 12 tuần đầu năm 2008 thì có
sự giảm giá, tuy nhiên sau đó có xu hướng tăng đều từ tuần 13 cho đến tuần cuối cùng(tuần 120), giá đô la Mỹ ở tuần cuối cùng là 19.100 đ/USD
Ngược lại với đô la, giá vàng thay đổi tăng, giảm rất thất thường Theo kết quả thuthập được thì cứ vài tuần tăng thì lại có một tuần giảm Giá vàng ở tuần cuối cùng là
Trang 362.647.000 đ/chỉ, khoảng cách tăng là khá lớn bởi giá vàng đầu năm 2008 chỉ ở mức1.626.000 đ/chỉ.
Qua quá trình phân tích giá của các mặt hàng dân sinh, chúng ta đã hình được phầnnào tình hình giá của các mặt hàng ảnh hưởng trực tiếp tới đời sống, kinh tế, xã hỗi.Tuy nhiên trong bức tranh toàn cảnh của nền kinh tế ngoài các mặt hàng dân sinh, còn
có một số nhóm mặt hàng cũng quan trọng không kém đó là các mặt hàng nhập khấu,xuất khẩu và giá một số mặt hàng trên thế giới Từ khi Việt Nam gia nhập WTO thì cácnhóm mặt hàng này càng trở nên quan trọng và ảnh hưởng nhiều đến tình hình biếnđộng giá của Việt Nam Tiếp theo, chúng ta sẽ xem xét giá của một số mặt hàng cơ bảnthuộc nhóm này mà tôi đã thu thập được trong quá trình thực hiện luận văn
2.2.2.1 Nhóm sắt, thép
Đầu năm 2008, giá phôi thép trung quốc ở mức 655USD/tấn, quá trình tăng giá diễn rakhá đều đặn và có thời điểm lên mức 975USD/tấn (tuần 45), tuy nhiên ngay sau đó giácủa mặt hàng này lại giảm Và cuối năm 2008 quay trở lại gần như giá đầu năm, ở mức657USD/tấn (tuần 52)
Ngay đầu năm 2009, giá phôi thép này đã tăng lên 812USD/tấn, không dừng lại ở đógiá của phối thép đã tăng lên mức 1.404 USD/tấn Tuy nhiên từ giữa năm 2009 cho
Trang 37đến đầu năm 2010 giá phôi thép này bắt đầu giảm nhiệt một cách mạnh mẽ, tuần 120giá ở mức 433USD/tấn.
Đối với sắt TQ Ø 6 thì quá trình biến động giá diễn ra phức tạp hơn phôi thép, kết quảthu thập cho thấy, hầu như vài tuần tăng giá thì lại có tuần giảm giá và ngược lại
2.2.2.2 Nhóm xăng, dầu
Do chúng ta mới chỉ sản xuất được dầu thô, còn xăng, dầu sử dụng cho các thiết bịchúng ta phải nhập khẩu hoàn toàn Bởi vậy giá xăng, dầu nhập khẩu sẽ ảnh hưởngtrực tiếp tới giá xăng, dầu bán ra trong nước
Trong kết quả thu thập được thì giá xăng RON 92, dầu DO và dầu FO thay đổi liên tục
và gần như không có tuần nào mà giá nhập khẩu 3 mặt hàng này không thay đổi Đặcbiệt trong giá của xăng RON 92 thì thấy có 7 tuần tăng liên tiếp từ thứ 4 cho đến tuầnthứ 10 và sau đó cũng có 7 tuần giảm liên tiếp từ tuần 75 đến tuần 81
2.2.2.3 Nhóm nhựa
Mặt hàng nhựa nhập khẩu điển hình đó là mặt nhựa PVC TQ, kết quả khảo sát thu thậpđược cho thấy trong 120 tuần thì có tới 64 tuần giảm giá, 54 tuần tăng giá và có duynhật 1 tuần không thay đổi giá (tuần 104)
Còn đối với mặt hàng nhựa DOP Malaysia thì cũng có tới 64 giảm giá,53 tuần tăng giá
và 2 tuần giá không đổi
Qua việc khảo sát hai mặt hàng nhựa nhập khẩu thuộc nhóm hàng nhựa cho thấy haimặt hàng này biến động giá liên tục trong hơn 2 năm từ 2008 đến quý 1 năm 2010
2.2.2.4 Nhóm nguyên liệu
Nhóm nguyên liệu này bao gồm một số loại mặt hàng cơ bản sữa bột loại 1, bộtAmoxycilline, bột Ampicilin, bột Vitamin B1
Trang 38Trong các tuần từ 2008 đến quý 1/2010 đã chứng kiến sữa bột tăng giá 54 tuần, giảmgiá 24 tuần và không thay đổi 41 tuần Trong khi các loại bột khác B1, Amoxycilline,Ampicilin thì chỉ có khoảng 10 tuần giá không thay đổi còn lại hơn 100 tuần biến độnggiá.
2.2.3 Nhóm xuất khẩu
2.2.3.1 Nhóm dầu thô, than
Trong 120 tuần được khảo sát và thu thập số liệu, các mặt hàng xuất khẩu dầu thô, thancục 3A thì thấy hầu hết các tuần tăng giá khoảng 70 tuần tăng giá, trong khi đó chỉ cókhoảng 20 tuần giảm giá còn lại là giá không thay đổi
2.2.3.2 Nhóm gạo
Đây là loại mặt hàng xuất khẩu thế mạnh của Việt Nam, là nguồn thu lớn của ngườidân Bởi vậy, việc biến động giá xuất khẩu cũng ảnh hưởng nhiều tới cuộc sống củangười dân
Thu thập số liệu trong hơn 2 năm từ 2008 đến quý 1 năm 2010, thì thấy cả gạo tẻ 5%
và gạo tẻ 25% đều chỉ có 40 tuần tăng giá, trong khi cũng có tới khoảng 40 tuần giảmgiá Kết thúc quý 1/2010 giá hai loại gạo này cũng không biến động nhiều so với giáđầu năm 2008, cụ thể gạo tẻ 5% giảm từ 420$/tấn xuống còn 403$/tấn, gạo tẻ 25% thìtăng từ 330$/tấn lên 383$/tấn
2.2.3.3 Nhóm café, cao su
Trong các nước xuất khẩu café thì Việt Nam là một trong những nước xuất khẩu cafélớn nhất trên thế giới, và ở Việt Nam café là mặt hàng xuất khẩu chiếm tỉ trọng lớn.Bởi vậy sự thay đổi giá xuất khẩu café cũng có ý nghĩa quan trọng trong nền kinh tếkinh dân
Kết quả thu thập được trong quá trình xuất khẩu café cho thấy có tới 53 tuần tăng giá,nhưng cũng có tớ 48 tuần giảm giá và 18 tuần giá café xuất khẩu không thay đổi
Trang 392.2.3.4 Nhóm thủy sản
Trong 2 năm trở lại đây, lượng xuất khẩu thủy sản của Việt Nam liên tục tăng, càng có
ý nghĩa hơn khi có đến 57/120 tuần loại tôm thẻ tăng giá Cụ thể giá của những tuầncuối cùng tăng liên tục từ 6$/Kg lên đến 10$/Kg
2.2.4 Nhóm các mặt hàng cơ bản trên thế giới
Việt Nam là một nước đang phát triển, nên trong rất nhiều trường hợp sự biến động giácủa các mặt hàng trong nước phụ thuộc vào sự biến động của một số mặt hàng cơ bảntrên thế giới Trong phần này, chúng ta sẽ đi phân tích một số kết quả biến động giácủa một số mặt hàng trên thế giới đã thu thập được phục vụ cho mục định xác địnhmối quan hệ biến động giá cả của các mặt hàng trong chương 3
2.2.4.1 Nhóm dầu thô, gas
Như phân tích trong các phần trên thì dầu thô, gas có mặt trong cả nhóm mặt hàng dânsinh, xuất khẩu, nhập khẩu Bởi vậy giá dầu thô và gas trên thế giới cũng tác độngnhiều đến giá dầu thôi, gas trong quá trình xuất, nhập khẩu ở nước ta
Cụ thể dầu thô Brent IPE tại London, trong năm 2008 đã có sự tăng giá đều đặn từ96$/thùng lên tới 127$/thùng Tuy nhiên sang đến năm 2009 và đầu 2010 thì lại giảmmạnh xuống còn hơn 80$/thùng
Trong khi đó dầu thô nhẹ tại New York ngay trong năm 2008 đã có quá trình tăng giá
từ 96$/thùng lên đến 140$/thùng nhưng cuối năm 2008 lại băt đầu giảm xuống còn38$/thùng, đến năm 2009 mặt hàng này tăng giá trở lại cho đến quý 1/2010 giá đạtmức 85$/thùng
2.2.4.2 Nhóm gạo, lúa, ngô
Gạo Thái Lan đã tăng liên tục từ 376$/tấn lên đến 1000$/tấn vào giữa năm 2008, sau
đó giảm giá và sự giảm giá này kéo sang tận quý 1/2010 Đến hết quý 1/2010 giá gạoThái Lan chỉ còn 483$/tấn
Trang 40Một loại thực phẩm nữa cũng cần quan tâm đó là ngô tại Chicago, xuất phát điểm đầunăm 2008 có mức giá 499 UScents/bushel, sau 2 năm từ 2008 đến quý 1/2010 với sựđiều chỉnh tăng giá và giảm giá liên tục thì kết thúc quý 1/2010 giá chỉ còn 349UScents/bushel.
Sau khi thu thập được giá của 120 mặt hàng từ năm 2008 đến hết quý 1/2010, đượcthống kê theo tuần Thì công việc tiếp theo của luận văn sẽ là dựa trên số liệu đó đểphân tích, tính toán để đưa ra được mối quan hệ về sự thay đổi của các mặt hàng vớinhau Để thực hiện được việc này, luận văn có sử dụng phần mềm CBA để phát hiệnmối quan hệ về sự thay đổi của các mặt hàng Tiếp theo, luận văn xin giới thiệu phầnmềm CBA
2.3 Phần mềm sử dụng để phát hiện luật kết hợp - phần mềm CBA
2.3.1 Giới thiệu phần mềm CBA
Hiện có khá nhiều nhóm nghiên cứu về luật kết hợp theo các cách tiếp cận xây dựngthuật toán tìm tập phổ biến khác nhau và do đó cũng có nhiều phần mềm tìm luật kếthợp từ các CSDL tác vụ khác nhau Hầu hết các phần mềm đó chưa được trở thành sảnphẩm thương mại Luận văn này sử dụng phần mềm CBA (Classification Based onAssociations) do trường Đại học Quốc gia Xinhgapor phát triển Phần mềm CBA đã sửdụng thuật toán tìm tập phổ biến Apriori do R Agrawal và cộng sự thực hiện, đó lànhững người đầu tiên mở hướng nghiên cứu và ứng dụng về luật kết hợp Thuật toánApriori được đánh giá ở mức trung bình về độ phức tạp tính toán CBA có thể hỗ trợ
để phát hiện luật kết hợp từ các CSDL quan hệ và CSDL tác vụ; hỗ trợ phát hiện luậtkết hợp với nhiều độ hỗ trợ cực tiểu khác nhau
Một luật kết hợp tìm được qua phần mềm CBA có dạng:
A = Y → B = Y (Cover%, Conf%, CoverCount, SupCount, Sup%)