1. Trang chủ
  2. » Thể loại khác

Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá

87 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 87
Dung lượng 1,7 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Một trong những nguyên nhân của tình trạng này là chưa định lượng được tác động thực sự của các mặt hàng, mỗi khi có sự biến đổi giá cả.. Với mỗi tập con s không rỗng của I, sinh ra các

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

-

NGUYỄN HỮU HOÀNG

LUẬT KẾT HỢP ÂM DƯƠNG VÀ ỨNG DỤNG TRONG

CÔNG TÁC BÌNH ỔN GIÁ

LUẬN VĂN THẠC SĨ

Hà Nội - 2011

Trang 2

2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

-o0o -

NGUYỄN HỮU HOÀNG

LUẬT KẾT HỢP ÂM DƯƠNG VÀ ỨNG DỤNG TRONG

Trang 3

3

MỤC LỤC

Chương 1 Giới thiệu luật kết hợp, luật kết hợp mẫu âm 8

1.1 Lời mở đầu 8

1.2 Tổng quan về luật kết hợp 8

1.2.1 Khái niệm luật kết hợp 8

1.2.2 Giải thuật Apriori để sinh các luật kết hợp 11

1.3 Luật kết hợp mẫu âm 15

1.3.1 Khái niệm luật kết hợp mẫu âm 15

1.3.2 Các giai đoạn phát hiện luật kết hợp mẫu âm 19

1.3.3 Thuật toán phát hiện luật kết hợp âm 23

1.4 Kết luận chương 25

Chương 2 Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm 26

2.1 Bài toán Error! Bookmark not defined 2.2 Quá trình thu thập số liệu 28

2.2.1 Nhóm dân sinh: 28

2.2.2 Nhóm nhập khẩu 35

2.2.3 Nhóm xuất khẩu 37

2.2.4 Nhóm các mặt hàng cơ bản trên thế giới 38

2.3 Phần mềm sử dụng để phát hiện luật kết hợp - phần mềm CBA 39

2.3.1 Giới thiệu phần mềm CBA 39

2.3.2 Xử lý file dữ liệu để xác định luật kết hợp trong CBA 41

2.3.3 Xác định luật kết hợp trong CBA 42

Trang 4

4

2.4 Kết luận chương 46

Chương 3 Phát hiện mối quan hệ về sự biến động giá của các mặt hàng dân sinh 47

3.1 Mở đầu chương 47

3.2 Chuyển đổi biểu diễn dữ liệu 47

3.2.1 Bước 1: đánh ký hiệu từng mặt hàng 47

3.2.2 Bước 2: đánh ký hiệu từng sự biến đổi giá của các mặt hàng 51

3.2.3 Bước 3: chuyển toàn bộ dữ liệu đã đánh vào file *.tra 51

3.3 Thực hiện chạy phần mềm CBA để phát hiện luật kết hợp 52

3.4 Xác định mối quan hệ giá bằng phát hiện luật kết hợp 53

3.4.1 Luật kết hợp của 120 mặt hàng với đầy đủ các trạng thái : tăng giá, giảm giá, giữ nguyên giá 53

3.4.2 Luật kết hợp của 120 mặt hàng khi không tính đến trạng thái giữ nguyên giá ……… 54

3.4.3 Luật kết hợp theo cho nhóm mặt hàng dân sinh 56

3.4.4 Luật kết hợp cho các mặt hàng dân sinh trong nước và các mặt hàng nhập khẩu : ……… 58

3.4.5 Luật kết hợp cho các mặt hàng nhập khẩu, xuất khẩu và một số mặt hàng trên thế giới 60

3.5 Kết luận chương 61

Kết luận 62

Tài liệu tham khảo 63

Phụ lục 1

Phụ lục 1: Danh sách mặt hàng 1

Phụ lục 2: Kết quả các luật phát hiện được 1

Trang 5

DM Data Mining (Khai phá dữ liệu)

CPI Consumer Price Index (Chỉ số giá tiêu dùng)

AI Artificial Intelligence (Trí tuệ nhân tạo)

DSS Decision Suport System (Hệ trợ giúp quyết định)

Trang 6

6

MỞ ĐẦU

Trong những năm gần đây đã chứng kiến giá cả nhiều mặt hàng thiết yếu của đời sống dân sinh, nhiều mặt hàng xuất, nhập khẩu chủ đạo của nền kinh tế tăng rất cao Việc biến động giá và lạm phát xẩy ra do rất nhiều nguyên nhân, có thể cung không đáp ứng đủ cầu; cũng có thể là do chi phí sản xuất của các doanh nghiệp bị đẩy lên; cũng có thể do đầu cơ, lợi dụng những kẽ hở, các cơ hội để tăng giá kiếm lời cao; cũng

có thể do giá nhập khẩu của một số nguyên liệu quan trọng của nền kinh tế tăng cao; cũng có thể thiên tai, bão lụt, dịch bệnh gây ra; cũng có thể do yêu cầu tiêu dùng hàng hoá và dịch vụ của xã hội đã thay đổi hay do tác động của môi trường kinh tế, chính trị quốc tế… và sự biến động ấy có thể thay đổi rất nhanh, thậm chí hàng ngày; và ở những địa bàn khác nhau có thể cũng có mức độ thay đổi khác nhau

Thời gian qua Chính phủ đã thực hiện nhiều giải pháp để bình ổn giá và kìm chế lạm phát, các giải pháp này là rất đúng về lý thuyết kinh tế, tuy nhiên tác động của chúng lại không đạt được như mong muốn Một trong những nguyên nhân của tình trạng này là chưa định lượng được tác động thực sự của các mặt hàng, mỗi khi có sự biến đổi giá cả

Đề tài này nằm trong hướng góp phần xác định nguyên nhân nhằm phục vụ đề xuất giải pháp bình ổn giá và kìm chế lạm phát đang tăng cao ở nước ta Cụ thể đề tài tập trung nghiên cứu quan hệ nhân quả và tình hình biến động giá cả của các mặt hàng xuất, nhập khẩu chủ đạo và những sản phẩm thiết yếu của đời sống dân sinh ở nước ta Đồng thời kết quả của luận văn làm có thể làm nền tàng để xây dựng mô hình dự báo giá đã và đang được áp dụng tại bộ công thương

Đề tài được nghiên cứu dựa trên luật kết hợp (một trong những những kỹ thuật rất quan trọng của khai phá dữ liệu - data mining)

Nội dung chính của luận văn được chia thành ba chương như sau:

Trang 7

7

Chương 1: Giới thiệu luật kết hợp, luật kết hợp mẫu âm

Chương 2: Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm

Chương 3: Phát hiện luật kết hợp mẫu âm

Cuối cùng, phần kết luận trình bày một số kết quả đạt được của luận văn và hướng nghiên cứu tiếp theo trong tương lai

Trang 8

lệ đáng quan tâm Trên thực tế chúng ta không biết người mua là ai, do đó vấn đề đặt

ra là sự trùng lặp đó có ngẫu nhiên hay có một qui luật cũng như một căn cứ nào hay không? Đó là tiền đề cho sự ra đời của luật kết hợp

Cấu trúc của luật như sau: A=>B (sup, conf) Có nghĩa là luật có A thì kéo theo B với

độ hỗ trợ sup và độ tin cậy conf

Trang 9

tỷ lệ phần trăm của các giao dịch hỗ trợ X trên tổng các giao dịch trong D, nghĩa là:

sup(X)= (1)

Độ hỗ trợ tối thiểu minsup là một giá trị cho trước bởi người sử dụng Nếu tập mục X

có sup(X) minsup thì ta nói X là một tập các mục phổ biến Các phần sau sẽ sử dụng những cụm từ khác như “X có độ hỗ trợ tối thiểu”, hay “X không có độ hỗ trợ tối thiểu” cũng để nói lên rằng X thỏa mãn hay không thỏa mãn support(X) minsup

Một luật kết hợp có dạng R: X => Y, trong đó X, Y là tập các mục; X, Y I và X Y

= Luật X => Y tồn tại một độ tin cậy c Độ tin cậy c được định nghĩa là khả năng giao dịch T hỗ trợ X thì cũng hỗ trợ Y Công thức để xác định độ tin cậy c như sau:

conf(X =>Y) = p(Y I | X I ) = (2)

Qua định nghĩa trên cho thấy quá trình khai phá luật kết hợp phải được thực hiện thông qua hai bước:

Trang 10

10

Bước 1: Tìm tất cả các tập mục mà có độ hỗ trợ lớn hơn độ hỗ trợ tối thiểu do

người dùng xác định Các tập mục thoả mãn độ hỗ trợ tối thiểu được gọi là các tập mục phổ biến

Bước 2: Dùng các tập mục phổ biến để sinh ra các luật mong muốn Ý tưởng

chung là nếu gọi ABCD và AB là các tập mục phổ biến, thì chúng ta có thể xác định luật nếu AB => CD giữ lại với tỷ lệ độ tin cậy:

Thực tế, trong mỗi lần mua hàng tại siêu thị nếu khách hàng mua bánh mì, thường thì

họ sẽ mua sữa Hoặc trong những lần người mua hàng mua máy tính xách tay thì sẽ không mua máy tính để bàn…Thông tin như thế có thể chỉ dẫn người bán lựa chọn mặt hàng để sắp xếp chúng trên giá hàng, người bán có thể đặt sữa và bánh mì trong phạm

vi gần kề để gây tác động tích cực tới việc mua của khách cho cả hai mặt hàng này Việc nhận ra những mặt hàng nào thường được mua cùng nhau, còn những mặt hàng nào thường không được mua cùng nhau giúp người bán hàng có thể bán được nhiều hàng hơn do đó tăng doanh thu

Khai thác luật kết hợp nhằm tìm ra những mối liên kết đáng quan tâm hoặc những quan hệ tương quan trong một tập lớn các đối tượng Trong giao dịch thương mại

Trang 11

11

khám phá mối quan hệ trong số lượng lớn các giao dịch có thể giúp nhiều nhà kinh doanh xử lí giải quyết các vấn đề như: thiết kế catalog để quảng cáo như thế nào?

1.2.2 Giải thuật Apriori để sinh các luật kết hợp

Để hình dung rõ hơn các giai đoạn trong quá trình phát hiện luật kết hợp, chúng ta sẽ xem xét giải thuật Apriori phát hiện luật kết hợp từ cơ sở dữ liệu tác vụ

1.2.2.1 Tư tưởng chính của thuật toán Apriori

a Tìm tất cả các tập phổ biến (frequent itemsets):

- k-itemset (itemsets gồm k items) được dùng để tìm (k+1)- itemset

- Đầu tiên tìm 1-itemset (ký hiệu L1) L1 được dùng để tìm L2 (2-itemsets) L2được dùng để tìm L3 (3-itemset) và tiếp tục cho đến khi không có k-itemset được tìm thấy

b Từ tất cả các tập phổ biến sinh ra các luật kết hợp mạnh (các luật kết hợp thỏa mãn 2 tham số min_sup và min_conf)

1.2.2.2 Giải thuật Apriori

a Duyệt (Scan) toàn bộ cơ sở dữ liệu giao dịch để có được độ hỗ trợ (support) S của 1-itemset, so sánh S với độ hỗ trợ tối thiểu min_sup, để có được 1-itemset (L1)

b Sử dụng Lk-1 nối (join) Lk-1 để sinh ra candidate k-itemset Loại bỏ các itemsets không phải là tập phổ biến thu được k-itemset ( bước cắt tỉa)

c Tiếp tục duyệt cơ sở dữ liệu giao dịch để có được độ hỗ trợ S của mỗi candidate k-itemset, so sánh S với min_sup để thu được tập phổ biến k –itemset (Lk)

Trang 12

12

d Lặp lại từ bước 2 cho đến khi Candidate set (C) trống (không tìm thấy tập phổ biến)

e Với mỗi tập phổ biến I, sinh tất cả các tập con s không rỗng của I

f Với mỗi tập con s không rỗng của I, sinh ra các luật s => (I-s) nếu độ tin cậy (Confidence) của nó > =min_conf

1.2.2.3 Ví dụ minh họa

Giả sử có cơ sở dữ liệu giao dịch bán hàng gồm 5 giao dịch như sau:

1 Beer, Diaper, Baby Powder, Bread, Umbrella

2 Diaper, Baby Powder

3 Beer, Diaper, Milk

4 Diaper, Beer, Detergent

5 Beer, Milk, Coca-Cola

Thuật toán Apriori tìm các luật kết hợp trong giao dịch bán hàng trên như sau:

Trang 13

13

Trang 14

14

Bước 2:

Beer, Diaper, Milk 1/5

Empty (Stop) Beer, Diaper, Baby Powder 1/5

Diaper, Milk, Baby Powder 0/5

Bear, Milk, Baby Powder 0/5

Bước 4: min-sup=40%, min_conf=70%

Kết quả ta có các luật kết hợp sau (với min_sup= 40%, min_conf=70%)

R1: Beer => Diaper (support =60%, confidence = 75%)

Trang 15

15

R2: Diaper =>Beer (support =60%,confidence = 75%)

R3: Milk =>Beer (support =40%, confidence = 100%)

R4: Baby Powder => Diaper (support =40%,confidence = 100%)

Từ kết quả các luật được sinh ra bởi giao dịch bán hàng trên, ta thấy rằng có luật có thể tin được (hợp lý) như Baby Powder => Diaper, có luật cần phải phân tích thêm như Milk

=>Beer và có luật có vẻ khó tin như Diaper =>Beer

Ví dụ này sinh ra các luật có thể không thực tế vì dữ liệu dùng để phân tích (transaction database) hay còn gọi là tranining data rất nhỏ

1.3 Luật kết hợp mẫu âm

1.3.1 Khái niệm luật kết hợp mẫu âm

Trang 16

16

- Với giả thiết :

o Giả thiết 1 : độ hỗ trợ tối thiểu (minsup) là 30%, độ tin cậy (minconf) là 70%

o Giả thiết 2 : thuộc tính tuổi được phân ra làm 2 nhóm trên 30 và dưới 30 tuổi

- Với thông tin và hai giả thiết trên ta có được các tập phổ biến :

Trang 17

- Qua bảng trên cho thấy :

o Luật „Age<30 Coupe‟ có độ tin cậy là 75%

o Tuy nhiên nếu chúng ta xem xét dưới góc độ khác thì luật „Age>30  Not purchar Coupe‟ (những người trên 30 tuổi sẽ không sử dụng phương tiện Coupe) có độ tin cậy là 83.33% cũng rất được quan tâm

o Luật „Age>30  Not purchar Coupe‟ sau này được gọi là luật kết hợp mẫu âm

Qua ví dụ trên cho thấy, ý nghĩa thực tế của luật kết hợp mẫu âm cũng quan trọng không kém luật kết hợp dương

Tuy nhiên việc sinh luật kết hợp mẫu âm gặp hai vấn đề khó khăn :

- Thứ nhất : chúng ta không dễ dàng chọn được giá trị ngưỡng minsup và minconf để đảm bảo phù hợp cho cả luật kết hợp âm và luật kết hợp dương

- Thứ hai : trong một cơ sở dữ liệu thực tế có hàng ngàn mục Mà trong các giao dịch nhiều mục lại không xuất hiện hoặc xuất hiện rất ít

Trang 18

18

1.3.1.2 Định nghĩa luật kết hợp mẫu âm

Chúng ta định nghĩa một cách tổng quát các luật kết hợp mẫu âm, là một luật mà chứa một phủ định của một mục (tức là một luật mà nguồn gốc hay kết quả của nó có thể được thành lập bởi sự kết hợp giữa sự có mặt và vắng mặt của các điều kiện) Một ví

dụ cho sự kết hợp này như sau:

Cụ thể hơn, chúng ta có thể xem xét khái niệm luật kết hợp mẫu âm dưới hình thức tập hợp như sau :

Giả sử I = i1, i2,…, ij, , in , một giao dịch T được định nghĩa như một tập con của các khoản mục trong I (T I)

Gọi D là CSDL của n giao dịch và mỗi giao dịch được đánh nhãn với một định danh duy nhất Nói rằng, một giao dịch T D hỗ trợ một tập X I và một tập Y I nếu nó chứa tất cả các item của X và Y

Với luật kết hợp dương có dạng R: X  Y, trong đó X, Y là tập các mục, X, Y I và

X Y = X được gọi là tiên đề và Y được gọi là hệ quả của luật

Với luật kết hợp mẫu âm sẽ có dạng R‟: X ¬Y

Bây giờ chúng ta xem xét độ hỗ trợ và độ tin cậy trong luật kết hợp mẫu âm

Luật kết hợp X ¬Y, có độ hỗ trợ s%, nếu có s% giao dịch trong T có mặt X, mà không có mặt của mục Y

Độ tin cậy, giả sử U là tập các giao dịch có mặt của X, luật kết hợp X ¬Y, có độ tin cậy c%, nếu c% giao dịch trong trong U không có mặt mục Y

Trang 19

19

Tương tự như cách tính độ tin cậy trong luật kết hợp dương, độ tin cậy trong luật kết hợp âm có thể được tính như sau:

Conf(X ¬Y)=P(X ¬Y)/P(X)

Trong phần trước, chúng ta đã xem xét giải thuật xác định luật kết hợp dương, bằng cách tính toán các mục xuất hiện trong các giao dịch Tuy nhiên với luật kết hợp âm, rất khó để xác định các mục không xuất hiện trong các giao dịch

Bởi vậy, thay vì xác định các mục không xuất hiện trong các giao dịch, chúng ta tính toán các mục xuất hiện trong các giao dịch, hay chính là chúng ta xác định luật kết hợp

âm thông qua luật kết hợp dương

Với mỗi luật XY, chúng ta xác định được độ hỗ trợ Supp(XY) và độ tin cậy

Conf(XY) Khi đó chúng ta xác định độ hỗ trợ và độ tin cậy của luật kết hợp mẫu

âm (X¬Y) như sau:

Supp(X¬Y) = Supp(X) - Supp(XY) (4) Conf(X¬Y) = Supp(X¬Y)/ Supp(X) = (Supp(X) - Supp(XY) )/Supp(X)

=1 - Conf(XY) (5)

1.3.2 Các giai đoạn phát hiện luật kết hợp mẫu âm

1.3.2.1 Đặt vấn đề

Do việc xác định luật kết hợp mẫu âm phải thông qua luật kết hợp dương, nếu chúng ta

để độ hỗ trợ và độ tin cậy nhỏ thì sẽ rất khó để xác định các luật kết hợp dương mong muốn, bởi vậy chúng ta phải chấp nhận để độ hỗ trợ và độ tin cậy dương đủ lớn để dễ cho việc xác định luật kết hợp dương và khi đó các luật kết hợp âm tìm thấy sẽ có độ

hỗ trợ và độ tin cậy thấp Lúc này chúng ta phải chấp nhận một số kết quả tìm kiếm được sẽ không như mong muốn Việc loại bỏ các luật không như mong muốn này

Trang 20

20

chúng ta chỉ có thể sử dụng những miền tri thức trong kho dữ liệu để dự đoán và loại

bỏ chúng để cuối cùng có tập các luật kết hợp mẫu âm khả thi

Chúng ta xem xét sự phân loại sau:

Giả sử T là tập các loại mặt hàng như hình trên, gồm các đỉnh và các cạnh Mỗi đỉnh biểu diễn một lớp (Hardware, Computers, Electronics, ), đỉnh mà không có đỉnh con(hay có độ sâu bằng 0) thì được coi là các mặt hàng Hai đỉnh được kết nối với nhau thông qua một cạnh Các đỉnh, cành này sẽ tạo ra một miền tri thức (domain Knowledge)

Trong sự phân loại trên, có hai mối quan hệ quan trọng đó là quan hệ theo chiều dọc

và quan hệ theo chiểu ngang Mối quan hệ theo chiều dọc là mối quan hệ cha – con, mối quan hệ theo chiều ngang là mối quan hệ anh – em

Chúng ta gọi mối quan hệ anh – em là mối quan hệ địa phương (Locality Of Similarity – LOS) Các mục cùng LOS sẽ có xu hướng tham gia vào cùng một luật kết hợp Ví dụ trong một cơ sở dữ liệu bán lẻ, các mục cùng LOS sẽ có nhiều khả năng cùng được tham gia vào các giao dịch của khách hàng Do vậy trong quá trình bán hàng, người bán hàng không đưa ra những tham khảo hợp lý thì người mua hàng rất khó có thể

Trang 21

Như vậy LOS có thể được hiểu như là quan hệ anh – em, được biểu diễn như sau [„IBM Aptiva‟,„Compaq Deskpro‟] Tuy nhiên LOS cũng có thể mở rộng trên cấp, chẳng hạn chúng ta có thể đặt „IBM Aptiva‟, „Compaq Deskpro‟, Notebook, Parks vào cùng một LOS khi chúng ta nhìn cơ sở dữ liệu ở tầm cao hơn (Computers)

Bây giờ chúng ta xem xét các luật liên quan tới LOS

Với giả thiết:

a) Các tập X = { i1, i2,…, ih,…, im }, Y = { j1, j2,…, jl } và X, Y I, X Y =

b) h I, ik X, thỏa mãn [ih , ik] và supp(ih) ≥ minsup, supp(ik) ≥ minsup

Nếu (r: XY) (luật r, tiền đề X, kết quả Y) thỏa mãn Supp(XY) ≥minsup, Conf(XY) ≥minconf

Thì khi đó cũng có một khả năng Conf(X‟Y) ≥ minconf, trong đó X‟={ i1, i2,…,

ik,…, im }, cũng tương tự như X, ngoại trừ việc ih thay thế cho ik

Chúng ta gọi luật X‟Y là r‟ Khi đó luật r và r‟ được gọi là luật anh em

Trang 22

22

1.3.2.2 Quá trình phát hiện luật kết hợp mẫu âm

LOS sẽ cung cấp một số khả năng để xác định luật âm, giả sử ih,ik I, đều là thành viên của một LOS, thỏa mãn [ih,ik] Nếu luật r: XY đúng và ih X, khi đó sẽ sinh được luật anh em r‟: X‟Y, tuy nhiên nếu luật này không hỗ trợ, tức là Y không có mối quan hệ với X‟ thì sự kết hợp âm có thể tồn tại

Để phát hiện luật kết hợp mẫu âm, trước hết chúng ta xác định độ lệch giữa các đội tin cậy như sau:

Trong đó conf(r’) là độ tin cậy của r‟ được tính toán theo công thức (4)

E(conf(r’)) là dự báo độ tin cậy của r‟, được định nghĩa bằng độ tin cậy của r dựa trên

các giả thiết tương tự

Nếu giá trị SM lớn thì khi đó luật X‟  Y là sai, và khi đó luật X‟  ¬Y đúng

Từ cách lập luận trên cho thấy, với giá trị SM càng lớn thì càng cho thấy lượng thông tin lớn Đồng thời các ứng viên luật kết hợp âm tạo ra cũng phải đáp ứng cả hai tiêu chí về độ hỗ trợ và độ tin cậy thì sẽ được giữ lại

Trên thực tế để đủ điều kiện là một luật kết hợp âm thì phải thỏa mãn hai điều kiện:

- Có độ lệch lớn giữa độ tin cậy thực tế và độ tin cậy dự báo

- Có độ hỗ trợ và độ tin cậy lớn hơn cực tiểu

Trang 23

23

Như vậy trong quá trình khai phá luật kết hợp mẫu âm, chúng ta có sử dụng quá trình

dự đoán, nên khi khai phá luật kết hợp mẫu âm sẽ có có một số luật không mong muốn, và một trong những công việc quan trọng trong quá trình phát hiện luật kết hợp mẫu âm là loại bỏ một số luật không mong muốn

Một ví dụ về sự loại bỏ luật dư thừa, giả sử chúng ta có hai luật “Female  Buy Hat”

và luật “¬Male  Buy Hat” Trong miền thuộc tính về giới tính, giả sử chỉ có hai giá trị Male và Female, như vậy ¬Male cũng là Female Như vậy trong hai luật trên chỉ có

một luật được giữ lại

Như vậy, quá trình khai phá luật kết hợp mẫu âm có thể chia làm 3 giai đoạn:

1 Xác định một tập các luật kết hợp dương

2 Sinh các luật kết hợp âm dựa vào luật kết hợp dương đã có ở bước 1 và miền tri thức đã có

3 Loại các luật dư thừa

1.3.3 Thuật toán phát hiện luật kết hợp âm

Từ việc phân tích các giai đoạn trong quá trình phát hiện luật kết hợp âm ở trên, chúng

ta có thể xem xét giải thuật tìm kiếm luật kết hợp âm cụ thể như sau:

Trang 24

24

CandidateSet1 = subset (CandidateSetk , g);

for all candidates c CandidateSet1

//Sinh các luật âm:

Delete all items t from the taxonomy, t FreqSet1

For all rules r postiveRule

tmpRuleSets = genNegCand(r);

for all rules tr tmpRuleSets

if SM(tr.conf, t.conf) > confDeviate

Trang 25

// Loại bỏ các luật dư thừa:

If all members of LOS have common itemset that form {r1, r2,…, rn} Rule

delete rk, where rk falls in the categories

endif

1.4 Kết luận chương

Như vậy qua chương đầu tiên, luận văn đã đưa ra được những vấn đề cơ bản của luật kết hợp, luật kết hợp mẫu âm Ý nghĩa thực tế của việc khai phá luật kết hợp mẫu âm

Và cũng đã phân tích được các bước cơ bản để phát hiện luật kết hợp, luật kết hợp mẫu

âm Một số thuật toán phổ biến trong khai phá luật kết hợp, luật kết hợp mẫu âm cũng

đã được trình bày trong chương này

Với những vấn đề cơ bản của luật kết hợp, luật kết hợp mẫu âm như vậy, trong chương tiếp theo, luận văn sẽ đi vào xem xét bài toán cụ thể cần phải giải quyết đó là dựa vào luật kết hợp mẫu âm để xác định sự biến động giá cả dựa trên thông tin về giá cả hàng hóa trong 2 năm qua

Trang 26

Trong y học thì những tình huống như vậy là khá phổ biến, ở đó khi người bệnh có một số triệu chứng biểu hiện của một căn bệnh nào đó thì chắc chắn người đó không thể có một số triệu chứng biểu hiện cho một số căn bệnh khác, …

Đặc biệt sự biến động giá cả của các mặt hàng cho thấy trong rất nhiều trường hợp, nhóm mặt hàng này tăng thì sẽ có một số mặt hàng khác tăng, và cũng có thể sẽ kéo theo một số mặt hàng khác giảm Tuy nhiên để xác định được mối quan hệ này thì trước hết phải thu thập được dữ liệu chính xác và đầy đủ về giá cả của các mặt hàng cần quan tâm và đây chính là vấn đề mà chương 2 của luận văn sẽ đề cập tới

Với nền kinh tế lạm phát cao, giá cả mặt hàng biến động liên tục Bài toán đặt ra là trong sự biến động của các mặt hàng phải chăng có sự liên quan giữa các mặt hàng hay không? Và làm cách nào để xác định sự liên quan này? Đây là nội dung cơ bản mà luận văn sẽ phải làm rõ

Theo kinh nghiệm của Viện Nghiên cứu giá cả thị trường Bộ Tài Chính và Trung tâm Thông tin Công nghiệp và Thương mại Bộ Công Thương, các cơ quan này thường

Trang 27

27

theo dõi biến động giá cả của những mặt hàng thuộc các nhóm: hàng hóa nhập khẩu, hàng hóa xuất khẩu, hàng hóa dân sinh, giá của một số mặt hàng trên thế giới và chỉ số giá tiêu dùng(CPI) Mặc dụ trên thị trường có hàng nghìn mặt hàng được lưu thông, tuy nhiên các mặt hàng được lựa chọn này đã chiếm tỉ trọng lớn, trên 90% tổng số lượng mặt hàng lưu thông Do vậy kết quả của việc nghiên cứu biến động giá cả trên các mặt hàng này cũng đảm bảo tương đối chính xác cho tình hình biến động giá cả trên toàn thị trường Giá cả của những mặt hàng này được thu thập theo tất cả các tuần trong 2 năm 2008, 2009 và quý 1 năm 2010 Chi tiết được thể hiện trong phụ lục 1

Giá cả của các sản phẩm xuất, nhập khẩu chủ yếu được thu thập từ Tổng cục Hải quan

và tính trung bình theo tuần, trong khi giá cả của các sản phẩm thiết yếu của đời sống dân sinh được thu thập từ 3/1/2008 đến hết ngày 31/03/2010 ở địa bàn Hà Nội vào thứ hai, thứ tư, thứ sáu và giá trung bình của 3 ngày này được lấy làm giá cả của sản phẩm

đó trong tuần

Khi phân tích dữ liệu thu thập nếu nhận thấy biên độ giao động của giá cả một số mặt hàng rất nhỏ hoặc thay đổi vài tháng một lần (bao gồm 14 mặt hàng Chính phủ thực hiện bình ổn giá), luận văn sẽ loại bỏ những mặt hàng này ra khỏi phạm vi nghiên cứu Với các mặt hàng không thể thu thập được dữ liệu đầy đủ cho thời giàn nghiên cứu (3/1/2008 – 31/3/2010) thì sẽ xử lý như sau:

- Với những mặt hàng không thu thập được giá cả cho ít nhất ¾ của 120 tuần trở lên, tức là trên 90 tuần, sẽ bị loại bỏ

- Với những mặt hàng còn lại, với những tuần không thu thập được dữ liệu thì sẽ

sử dụng phương pháp trung bình trượt (bậc 4 hoặc bậc 5) hoặc phương pháp phân tích tương tự để bổ sung dữ liệu khuyết thiếu

Trang 28

28

2.2 Quá trình thu thập số liệu

Mục tiêu của luận là văn tập trung nghiên cứu làm rõ mối quan hệ về biến động giá cả, tạo điều kiện thuận lợi hơn cho việc nhận diện được một số yếu tố tác động đến biến động giá cả Bởi vậy luận văn sẽ khảo sát giá cả của những mặt hàng thiết yếu của đời sống dân sinh, những sản phẩm xuất, nhập khẩu chủ đạo của nền kinh tế

Số liệu thống kê về giá cả hàng hóa được thu thập thống nhất theo kỳ thời gian theo tuần, cụ thể như sau:

2.2.1 Nhóm dân sinh:

Với những mặt hàng thiết yếu của đời sống dân sinh như gạo tẻ thường, gạo tẻ ngon, gạo nếp,…được thu thập theo từng ngày một trên địa bàn Hà Nội Bắt đầu từ ngày 3/1/2008 và kết thúc là ngày 31/3/2010 Với số liệu của bài toán đặt ra cần phải quan tâm theo tuần (120 tuần), do vậy sau khi có số liệu giá cả các mặt hàng dân sinh theo ngày sẽ được tình giá trung bình của tuần, từ đó có số liệu theo tuần Số liệu cụ thể được thể hiện trong phụ lục 1

2.2.1.1 Nhóm lương thực

Đây là nhóm mặt hàng quan trọng bậc nhất trong nền kinh tế của nước ta Bây giờ chúng ta sẽ đi phân tích số liệu cụ thể của các loại mặt hàng thuộc nhóm mặt hàng lương thực này

Qua số liệu cho thấy, với nhóm gạo, ngô,… đại diện cho nhóm lương thực cụ thể là gạo tẻ thường, gạo tẻ ngon trong khoảng 10 tuần đầu tiên của năm 2008 (từ tuần 1 đến tuần 11) gần như không có sự biến động về giá, tuy nhiên khoảng 40 tuần tiếp theo ( từ tuần 12 đến tuần 52) giá của các mặt hàng này liên tục có sự thay đổi theo chiều hướng tăng giá, nhưng vẫn ở mức độ tăng chậm chỉ từ 7.500đ/Kg tăng lên 8.500đ/Kg với gạo

tẻ thường, từ 11.500đ/Kg đến 11.500 đ/Kg với gạo tẻ ngon

Trang 29

29

Bắt đầu từ năm 2009 (tuần 53 với khoảng thời gian thực hiện thu thập số liệu), giá của những mặt hàng lương thực có sự biến động với biên độ tăng cao, cụ thể từ 8.500 đ/Kg tăng lên 11.000đ/Kg với gạo tẻ thường Tuy nhiên mức giá này chỉ cao ổn định trong khoản 24 tuần đầu của năm 2009 (từ tuần 53 đến tuần 76), sau đó bắt đầu giảm và đi vào ổn định ở mức giá 10.000đ/Kg đối với gạo tẻ thường và 12.500đ/Kg với gạo tẻ ngon

Đến đầu năm 2010 (tuần 105 đến tuần 120), giá của các mặt hàng lương thực tăng mạnh từ 10.500 đ/Kg lên 13.000 đ/Kg với gạo tẻ thường và 12.500 đ/Kg lên 16.800 đ/Kg với gạo tẻ ngon Và trong cả 15 tuần đầu của năm 2010 này thì mức giá này luôn cao “ổn định” Quá trình tăng giá đều của nhóm mặt hàng gạo cũng gần như đại diện cho các mặt hàng lương thực: gạo, bột mì, ngô, mì ăn liền

2.2.1.2 Nhóm mặt hàng liên quan tới thịt, trứng, cá

Với nhóm nhóm mặt hàng liên quan tới thịt, trứng thì sự biến động giá có đôi chút khác so với các mặt hàng lương thực, trong khi thịt lợn mông sấn trong năm 2008 dao động ở mức giá 63.000 đ/Kg tuy nhiên thịt bò loại 1 dao động từ 90.000 đ/Kg ở trong khoảng 10 tuần đầu lên tới 115.000 đ/Kg trong những tuần cuối năm 2008 Và đặc biệt bước sang năm 2009, thị lợn có sự giảm giá và ổn định ở mức giá 55.000 đ/Kg thì thị

bò đã tăng giá một cách phi mã lên tới 130.000 đ/Kg rồi 140.000 đ/Kg vào những tuần cuối quý 1/2010 Sự biến động giá của nhóm mặt hàng thịt, trứng, tôm, cá,… cũng thể hiện không giống nhau như thịt lơn và thịt bò loại 1 mà đã phân tích ở trên

Trang 30

30

biến Cụ thể: rau bắp cải từ 5.000 đ/Kg lên đến 15.000 đ/Kg có tuần lên đến 18.000 đ/Kg, rau muống tăng từ 3.500 đ/mớ lên đến 14.000 đ/mớ và có tuần lên đến 18.000 đ/mớ, điều này cũng dễ hiểu bởi tại thời điểm này Hà Nội gặp trận mưa lụt lịch sử nên

đã đẩy giá cả của các mặt hàng rau củ quả lên cao trong mấy tuần này, các mặt hàng thực phẩm như bột ngọt, muối, đường vẫn được giữ ổn định Tuy nhiên ngay sau đó các mặt hàng rau, củ quả đã được điều chỉnh giảm ở mức ổn định rau bắp cải 7.000 đ/Kg, rau muống 6.000 đ/Kg

Sang đến năm 2009, trong khoảng hơn 20 tuần đầu tiên của năm 2009 các mặt hàng rau, củ, quả có sự điều chỉnh giá theo chiều hướng giảm Cụ thể rau bắp cải từ 7.000 đ/Kg xuống còn khoảng 4.000 đ/Kg, xoài từ khoảng 30.000 đ/Kg xuống còn 23.500 đ/Kg Đến cuối năm 2009, trong khi các loại rau tăng giá thì các loại củ, quả giá ổn định, cụ thể: rau bắp cải tăng từ 4.000 đ/Kg lại tăng giá lên đến 7.000 đ/Kg, còn xoài thì vẫn giữ giá ở mức 23.000 đ/Kg

Sang đến quý 1/2010 tình hình giá của các mặt hàng rau, củ, quả bắt đầu có hiện tượng giảm giá và đi vào ổn định

2.2.1.4 Nhóm mặt hàng đường, sữa, cafe

Tiếp đến chúng ta đi phân tích giá các mặt hàng liên quan tới đường, sữa, café

Tại thời điểm năm 2008, trong khi café luôn ổn định ở mức giá 76.000 đ/Kg thì sữa loại 900g lại có giá tăng dần đều từ 118.000 đ/Kg trong những tuần đầu năm 2008 tăng lên 121.000 đ/Kg rồi tăng lên 127.000 đ/Kg vào những tuần cuối năm 2008 Khác với café và sữa thì đường trắng nội lại có sự thay đổi giá không ổn đinh, có những tuần tăng giá và có những tuần giảm giá, tựu chung lại quá trình thay đổi giá diễn ra chậm chỉ từ mức 10.500 đ/Kg tại thời điểm đầu năm lên mức 11.000 đ/Kg vào thời điểm cuối năm 2008

Sang đến năm 2009, giống như sự thay đổi giả của đường trắng nội năm 2008, trong năm 2009 sự thay đổi giá của café cũng có sự không ổn định, đầu năm tăng lên 85.000

Trang 31

Sang đến những tuần đầu năm 2010, các loại mặt hàng này đều có sự tăng giá đều đặn

2.2.1.5 Nhóm mặt hàng rượu, bia, thuốc lá

Mặc dù đây được coi là nhóm mặt hàng xa sỉ, nhưng trên thị trường các thành phố lớn đặc biệt là Hà Nội thì số lượng của những mặt hàng này lại được tiêu thụ với số lượng rất lớn

Và nhìn vào số liệu thu thập được qua phụ lục 1, chúng ta có thể thấy giá của các mặt hàng này thường rất ổn định trong từng năm đặc biệt là rượu vodka và thuốc lá Thường tăng giá vào đầu mỗi năm và ít thấy có sự giảm giá, chỉ riêng bia tigger trong năm 2009 một số tuần có sự giảm giá

2.2.1.6 Nhóm mặt hàng vải bông, vải tổng hợp

Đây cũng là nhóm mặt hàng có thế mạnh xuất khẩu của cả nước, các mặt hàng vải bông, vải tổng hợp có sự ổn định giá trong năm 2008 Cụ thể trong cả năm 2008 giá vải bông luôn là 48.000 đ/m, vải tổng hợp luôn là 30.000 đ/m Tuy nhiên sang đến năm 2009 vải bông vẫn giữ được sự ổn định giá, mặc dù cũng có vài tuần thay đổi giảm nhưng hầu hết các tuần trong năm 2009 giá cũng vẫn ở mức 48.000 đ/m, trong khi vải tổng hợp giảm giá từ 30.000 đ/m cuối năm 2008 xuống còn 20.000 đ/m vào thời điểm cuối năm 2009

Sang đến quý 1 năm 2010 thì tình hình lại ngược lại, trong khi vải tổng hợp tăng giá lên 22.000 đ/m thì vải bông lại giảm giá xuống còn 45.000 đ/m

Trang 32

32

2.2.1.7 Nhóm mặt hàng liên quan tới vật liệu xây dựng

Đó là các mặt hàng như xi măng, gạch, sắt, thép,…Trong thời kỳ từ năm 2008 đến hết quý 1 năm 2010, các loại mặt hàng này có sự thay đổi giá không ổn định và không giống nhau

Cụ thể trong năm 2008, trong khi gạch và thép có sự tăng giá đều đặn thì xi măng chỉ tăng giá từ tuần 9 đến tuần 44 còn lại là ổn định giá Sang đến năm 2009 thì cả 3 loại mặt hàng xi măng, gạch, thép đều có sự thay đổi giá không ổn định có những tuần tăng giá, có những tuần giảm giá

Đến quý 1 năm 2010 thì ba mặt hàng này bắt đầu đồng loạt tăng giá đều đặn

2.2.1.8 Nhóm mặt hàng điện, nước, gas

Đây là nhóm các mặt hàng cơ bản và khá nhạy cảm, vì trên thực tế khi giá của các mặt hàng này thay đổi sẽ dẫn tới hàng loạt các mặt hàng khác thay đổi Trong chương sau chúng ta sẽ kiểm nghiệm thực tế này trên số liệu thực tế và luật kết hợp

Năm 2008, trong khi nước tăng giá đều từ 3.316 đ/m3 lên 3.400 đ/m3 thì giá gas lại theo chiều ngược lại giảm giá từ 250.000 đ/bình xuống còn 185.000 đ/bình Khác với hai loại mặt hằng trên, điện thì có sự giảm giá trong 30 tuần đầu năm 2008 từ 1.135 đ/Kwh xuống còn 1.085 đ/Kwh, và sau đó lại tăng dần trong hơn 20 tuần cuối năm

2008 lên tới 1.145 đ/Kwh

Sang năm 2009, nước và gas tăng với biên độ khá lớn, cụ thể nước tăng từ 3.420 đ/m3 lên tới 7.500 đ/m3, gas tăng từ 177.500 đ/bình lên tới 288.000 đ/bình Trong khi đó điện tăng trong những tuần đầu năm và lại giảm trong những tuần cuối năm

Đến quý 1 năm 2010, nước và điện thì giảm mạnh, cụ thể điện giảm xuống còn 600 đ/Kwh trong khi nước giảm xuống còn 4.000 đ/m3 Ngược lại thì gas tăng giá mạnh lên tới 300.000 đ/bình

Trang 33

33

2.2.1.9 Nhóm mặt hàng đồ điện dân dụng

Tiếp theo chúng ta sẽ xem sét giá của một số mặt hàng đồ điện dân dụng như máy điều hòa, tủ lanh, đèn điện,…Năm 2008, trong 44 tuần đầu giá đèn điện luôn ở giá 10.500 đ/bóng và 7 tuần cuối năm thì tăng lên 11.000 đ/bóng Còn máy giặt thì tăng từ 2.817.000 đ/cái lên 2.913.000 đ/cái sau đó lại giảm về 2.813.000 đ/cái Trong khi đó tủ lạnh 39 tuần đầu ổn định ở mức giá 2.260.000 đ/cái sau đó giảm xuống còn 2.133.000 đ/cái và cuối năm 2008 tiếp tục giảm xuống còn 2.033.000 đ/cái

Và từ năm 2009 cho đến tiếp tục quý 1/2010 cả 3 thiết bị này đều tăng giá, cụ thể đèn tăng giá lên 13.800 đ/bóng, máy giặt tăng lên 4.850.000 đ/cái, tủ lạnh tăng lên 4.580.000 đ/cái

2.2.1.10 Nhóm mặt hàng đồ nội thất

Bao gồm một số mặt hàng như đồng hồ, giường, tủ gỗ,… Trong 9 tuần đầu của năm

2008, giá đồng hồ là 45.000 đ/cái, 41 tuần còn lại của năm 2008 giá là 50.000 đ/cái Đối với tủ gỗ trong 26 tuần đầu giá là 1.917.000 đ/cái, sau đó tăng nhẹ lên mức 2.000.000 đ/cái cho đến cuối năm 2008 Với đồng hồ và tủ gỗ trong năm 2008 chỉ có một lần tăng giá, tuy nhiên với mặt hàng giường ngủ thì có tới 3 lần tăng giá từ 2.135.000 lên 2.300.000, sau đó tăng lên 2.400.000 và cuối năm 2008 tăng lên 2.500.000 đ/cái Trong năm 2008 cả 3 mặt hàng này đều không có sự giảm giá

Sang năm 2009 đến hết quý 1 năm 2010, đà tăng giá lại tiếp tục cho cả 3 mặt hàng Cụ thể cuối quý 1/2010 tủ gỗ giá 3.100.000 đ/cái, giường là 2.400.000 đ/cái và đồng hồ là 119.000 đ/cái cho đến tiếp tục quý 1/2010 cả 3 thiết bị này đều tăng giá, cụ thể đèn tăng giá lên 13.800 đ/bóng, máy giặt tăng lên 4.850.000 đ/cái, tủ lạnh tăng lên 4.580.000 đ/cái

Trang 34

Giá của một số loại thuốc tay phổ biến đã được thu thập như sau: thuốc ampi đầu năm

2008 là 8.300 đ/vỉ sau đó tăng lên 8.500 đ/vỉ sang đầu năm 2009 tiếp tục giữ ổn định ở mức 8.500 đ/vỉ sau đó từ tuần 77 có sự giảm giá xuống còn 7.500 đ/vỉ, sau đó giảm tiếp xuống 7.000 đ/vỉ, sang quý 1/2010 tiếp tục giảm xuống còn 6.000 đ/vỉ

Thuốc vitamin B3 và paracitamol cũng biến động tương tự như thuốc ampi, ban đầu

ổn định ở mức 1.800 đ/vỉ với Vitamin B3 và 1.700 đ/vỉ với thuốc paracitamol , sau đó vitamin tăng liên tục với mức giá 2.300 đ/vỉ và 2.500 đ/vỉ trong khi thuốc paracitamol thì vẫn ổn định với mức giá 1.700 đ/vỉ

Bắt đầu từ giữa năm 2009 cả hai loại thuốc này bắt đầu giảm giá, trong khi vitamin giảm giá về mức 2.000 đ/vỉ, còn paracitamol giảm giá về mức 1.500 đ/vỉ

2.2.1.12 Nhóm mặt hàng vàng, đô la Mỹ

Ở Việt Nam, Vàng và Đô la mỹ luôn được coi là thước đo cho thay đổi của giá cả Khi giá cả của các mặt hàng thay đổi thường dẫn đến giá vàng và đô la thay đổi và người lại Cũng bởi lý do này giá vàng, đô la mỹ thay đổi hàng tuần theo số liệu thu thập Trên thực tế giá của hai loại mặt hàng đặc biệt này thay đổi theo ngày, có thể là giờ

Theo số liệu thu thập được thì giá đô la trong nước trong 12 tuần đầu năm 2008 thì có

sự giảm giá, tuy nhiên sau đó có xu hướng tăng đều từ tuần 13 cho đến tuần cuối cùng (tuần 120), giá đô la Mỹ ở tuần cuối cùng là 19.100 đ/USD

Ngược lại với đô la, giá vàng thay đổi tăng, giảm rất thất thường Theo kết quả thu thập được thì cứ vài tuần tăng thì lại có một tuần giảm Giá vàng ở tuần cuối cùng là

Trang 35

có một số nhóm mặt hàng cũng quan trọng không kém đó là các mặt hàng nhập khấu, xuất khẩu và giá một số mặt hàng trên thế giới Từ khi Việt Nam gia nhập WTO thì các nhóm mặt hàng này càng trở nên quan trọng và ảnh hưởng nhiều đến tình hình biến động giá của Việt Nam Tiếp theo, chúng ta sẽ xem xét giá của một số mặt hàng

cơ bản thuộc nhóm này mà tôi đã thu thập được trong quá trình thực hiện luận văn

2.2.2.1 Nhóm sắt, thép

Đầu năm 2008, giá phôi thép trung quốc ở mức 655USD/tấn, quá trình tăng giá diễn ra khá đều đặn và có thời điểm lên mức 975USD/tấn (tuần 45), tuy nhiên ngay sau đó giá của mặt hàng này lại giảm Và cuối năm 2008 quay trở lại gần như giá đầu năm, ở mức 657USD/tấn (tuần 52)

Ngay đầu năm 2009, giá phôi thép này đã tăng lên 812USD/tấn, không dừng lại ở đó giá của phối thép đã tăng lên mức 1.404 USD/tấn Tuy nhiên từ giữa năm 2009 cho

Trang 36

Trong kết quả thu thập được thì giá xăng RON 92, dầu DO và dầu FO thay đổi liên tục

và gần như không có tuần nào mà giá nhập khẩu 3 mặt hàng này không thay đổi Đặc biệt trong giá của xăng RON 92 thì thấy có 7 tuần tăng liên tiếp từ thứ 4 cho đến tuần thứ 10 và sau đó cũng có 7 tuần giảm liên tiếp từ tuần 75 đến tuần 81

2.2.2.3 Nhóm nhựa

Mặt hàng nhựa nhập khẩu điển hình đó là mặt nhựa PVC TQ, kết quả khảo sát thu thập được cho thấy trong 120 tuần thì có tới 64 tuần giảm giá, 54 tuần tăng giá và có duy nhật 1 tuần không thay đổi giá (tuần 104)

Còn đối với mặt hàng nhựa DOP Malaysia thì cũng có tới 64 giảm giá,53 tuần tăng giá

và 2 tuần giá không đổi

Qua việc khảo sát hai mặt hàng nhựa nhập khẩu thuộc nhóm hàng nhựa cho thấy hai mặt hàng này biến động giá liên tục trong hơn 2 năm từ 2008 đến quý 1 năm 2010

2.2.2.4 Nhóm nguyên liệu

Nhóm nguyên liệu này bao gồm một số loại mặt hàng cơ bản sữa bột loại 1, bột Amoxycilline, bột Ampicilin, bột Vitamin B1

Trang 37

37

Trong các tuần từ 2008 đến quý 1/2010 đã chứng kiến sữa bột tăng giá 54 tuần, giảm giá 24 tuần và không thay đổi 41 tuần Trong khi các loại bột khác B1, Amoxycilline, Ampicilin thì chỉ có khoảng 10 tuần giá không thay đổi còn lại hơn 100 tuần biến động giá

2.2.3 Nhóm xuất khẩu

2.2.3.1 Nhóm dầu thô, than

Trong 120 tuần được khảo sát và thu thập số liệu, các mặt hàng xuất khẩu dầu thô, than cục 3A thì thấy hầu hết các tuần tăng giá khoảng 70 tuần tăng giá, trong khi đó chỉ có khoảng 20 tuần giảm giá còn lại là giá không thay đổi

2.2.3.2 Nhóm gạo

Đây là loại mặt hàng xuất khẩu thế mạnh của Việt Nam, là nguồn thu lớn của người dân Bởi vậy, việc biến động giá xuất khẩu cũng ảnh hưởng nhiều tới cuộc sống của người dân

Thu thập số liệu trong hơn 2 năm từ 2008 đến quý 1 năm 2010, thì thấy cả gạo tẻ 5%

và gạo tẻ 25% đều chỉ có 40 tuần tăng giá, trong khi cũng có tới khoảng 40 tuần giảm giá Kết thúc quý 1/2010 giá hai loại gạo này cũng không biến động nhiều so với giá đầu năm 2008, cụ thể gạo tẻ 5% giảm từ 420$/tấn xuống còn 403$/tấn, gạo tẻ 25% thì tăng từ 330$/tấn lên 383$/tấn

2.2.3.3 Nhóm café, cao su

Trong các nước xuất khẩu café thì Việt Nam là một trong những nước xuất khẩu café lớn nhất trên thế giới, và ở Việt Nam café là mặt hàng xuất khẩu chiếm tỉ trọng lớn Bởi vậy sự thay đổi giá xuất khẩu café cũng có ý nghĩa quan trọng trong nền kinh tế kinh dân

Kết quả thu thập được trong quá trình xuất khẩu café cho thấy có tới 53 tuần tăng giá, nhưng cũng có tớ 48 tuần giảm giá và 18 tuần giá café xuất khẩu không thay đổi

Trang 38

38

2.2.3.4 Nhóm thủy sản

Trong 2 năm trở lại đây, lượng xuất khẩu thủy sản của Việt Nam liên tục tăng, càng

có ý nghĩa hơn khi có đến 57/120 tuần loại tôm thẻ tăng giá Cụ thể giá của những tuần cuối cùng tăng liên tục từ 6$/Kg lên đến 10$/Kg

2.2.4 Nhóm các mặt hàng cơ bản trên thế giới

Việt Nam là một nước đang phát triển, nên trong rất nhiều trường hợp sự biến động giá của các mặt hàng trong nước phụ thuộc vào sự biến động của một số mặt hàng cơ bản trên thế giới Trong phần này, chúng ta sẽ đi phân tích một số kết quả biến động giá của một số mặt hàng trên thế giới đã thu thập được phục vụ cho mục định xác định mối quan hệ biến động giá cả của các mặt hàng trong chương 3

2.2.4.1 Nhóm dầu thô, gas

Như phân tích trong các phần trên thì dầu thô, gas có mặt trong cả nhóm mặt hàng dân sinh, xuất khẩu, nhập khẩu Bởi vậy giá dầu thô và gas trên thế giới cũng tác động nhiều đến giá dầu thôi, gas trong quá trình xuất, nhập khẩu ở nước ta

Cụ thể dầu thô Brent IPE tại London, trong năm 2008 đã có sự tăng giá đều đặn từ 96$/thùng lên tới 127$/thùng Tuy nhiên sang đến năm 2009 và đầu 2010 thì lại giảm mạnh xuống còn hơn 80$/thùng

Trong khi đó dầu thô nhẹ tại New York ngay trong năm 2008 đã có quá trình tăng giá

từ 96$/thùng lên đến 140$/thùng nhưng cuối năm 2008 lại băt đầu giảm xuống còn 38$/thùng, đến năm 2009 mặt hàng này tăng giá trở lại cho đến quý 1/2010 giá đạt mức 85$/thùng

2.2.4.2 Nhóm gạo, lúa, ngô

Gạo Thái Lan đã tăng liên tục từ 376$/tấn lên đến 1000$/tấn vào giữa năm 2008, sau

đó giảm giá và sự giảm giá này kéo sang tận quý 1/2010 Đến hết quý 1/2010 giá gạo Thái Lan chỉ còn 483$/tấn

Trang 39

39

Một loại thực phẩm nữa cũng cần quan tâm đó là ngô tại Chicago, xuất phát điểm đầu năm 2008 có mức giá 499 UScents/bushel, sau 2 năm từ 2008 đến quý 1/2010 với sự điều chỉnh tăng giá và giảm giá liên tục thì kết thúc quý 1/2010 giá chỉ còn 349 UScents/bushel

Sau khi thu thập được giá của 120 mặt hàng từ năm 2008 đến hết quý 1/2010, được thống kê theo tuần Thì công việc tiếp theo của luận văn sẽ là dựa trên số liệu đó để phân tích, tính toán để đưa ra được mối quan hệ về sự thay đổi của các mặt hàng với nhau Để thực hiện được việc này, luận văn có sử dụng phần mềm CBA để phát hiện mối quan hệ về sự thay đổi của các mặt hàng Tiếp theo, luận văn xin giới thiệu phần mềm CBA

2.3 Phần mềm sử dụng để phát hiện luật kết hợp - phần mềm CBA

2.3.1 Giới thiệu phần mềm CBA

Hiện có khá nhiều nhóm nghiên cứu về luật kết hợp theo các cách tiếp cận xây dựng thuật toán tìm tập phổ biến khác nhau và do đó cũng có nhiều phần mềm tìm luật kết hợp từ các CSDL tác vụ khác nhau Hầu hết các phần mềm đó chưa được trở thành sản phẩm thương mại Luận văn này sử dụng phần mềm CBA (Classification Based on Associations) do trường Đại học Quốc gia Xinhgapor phát triển Phần mềm CBA đã

sử dụng thuật toán tìm tập phổ biến Apriori do R Agrawal và cộng sự thực hiện, đó là những người đầu tiên mở hướng nghiên cứu và ứng dụng về luật kết hợp Thuật toán Apriori được đánh giá ở mức trung bình về độ phức tạp tính toán CBA có thể hỗ trợ

để phát hiện luật kết hợp từ các CSDL quan hệ và CSDL tác vụ; hỗ trợ phát hiện luật kết hợp với nhiều độ hỗ trợ cực tiểu khác nhau

Một luật kết hợp tìm được qua phần mềm CBA có dạng:

A = Y → B = Y (Cover%, Conf%, CoverCount, SupCount, Sup%)

Trang 40

÷ CoverCount: cho biết số tuần có sự biến động giá (tăng hoặc giảm giá) của các mặt hàng trong A

÷ SupCount: cho biết số tuần thu thập thông tin dữ liệu về biến động giá của các mặt hàng có sự biến động giá của các mặt hàng trong cả 2 tập A, B

÷ Sup%, gọi là độ hỗ trợ của luật, đó là số phần trăm các tuần thu thập thông tin dữ liệu biến động giá của các mặt hàng so với tổng số ở đó các mặt hàng trong cả 2 tập A và B đều biến động giá

Về bản chất luật này không khác biệt so với luật kết hợp tổng quát được phát hiện từ CSDL tác vụ bởi trong 5 thông số trên, 2 thông số Sup%, Conf% tương ứng là độ hỗ trợ và độ tin cậy của luật kết hợp đã được giới thiệu trong chương 1; 3 thông số còn lại thực ra chỉ nhằm để làm rõ hơn về 2 thông số vừa nêu

Các luật kết hợp tìm được bởi phần mềm CBA có thể được trình bày dưới nhiều hình thức như liệt kê tuần tự, thể hiện dưới dạng cây, có thể được lưu ở dạng tệp văn bản,… do đó dễ dàng đọc và sử dụng các luật được phát hiện

Ngày đăng: 23/09/2020, 21:13

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w