1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật

50 683 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 50
Dung lượng 0,96 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Với những lý do như vậy, các phương pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày càng không đáp ứng được thực tế đã làm phát triển mộtkhuynh hướng kỹ thuật mới đó là Kỹ thu

Trang 1

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINHĐẠI HỌC CÔNG NGHỆ THÔNG TIN

Bài thu hoạch môn: Hệ hỗ trợ quyết định

Trang 2

CHƯƠNG 1: LÝ THUYẾT TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 5

1.1 Phát hiện tri thức và khai phá dữ liệu 5

1.2 Các quan niệm về khai phá dữ liệu 6

1.3 Nhiệm vụ của khai phá dữ liệu 6

1.4 Triển khai việc khai phá dữ liệu 8

1.5 Quá trình phát hiện tri thức từ cơ sở dữ liệu 8

1.5.1 Giai đoạn xác định vấn đề 9

1.5.2 Giai đoạn thu thập và tiền xử lý dữ liệu 9

1.5.3 Khai thác dữ liệu 11

1.5.4 Minh họa và đánh giá 11

1.5.5 Đưa kết quả vào thực tiễn 11

1.6 Kiến trúc của hệ thống khai phá dữ liệu 11

1.7 Các kỹ thuật khai phá dữ liệu 12

1.7.1 Phân cụm dữ liệu 12

1.7.2 Phân lớp dữ liệu 13

1.7.3 Phương pháp hồi quy 13

1.7.4 Khai phá luật kết hợp 13

1.8 Một số ứng dụng khai phá dữ liệu 14

1.9 Những khó khăn trong khai phá dữ liệu 15

CHƯƠNG 2: TÌM HIỂU CHUNG VỀ PHÂN TÍCH KĨ THUẬT TRÊN THỊ TRƯỜNG CHỨNG KHOÁN VÀ LOGIC MỜ 17

2.1 Lí thuyết kinh tế 17

2.1.1.Thị trường chứng khoán 17

2.1.2 Phương pháp phân tích kỹ thuật 18

2.1.3 Lí thuyết Dow 24

2.2 Logic mờ 32

2.2.1 Logic mờ 32

2.2.2 Công cụ thực hiện hệ logic mờ 33

2.2.3 Một số ứng dụng của Logic mờ 34

2.2.4 Các yếu tố xây dựng mô hình logic mờ 35

2.2.5 Qui trình hoạt động của logic mờ 38

2.2.6 Phương pháp xây dựng mô hình 39

CHƯƠNG 3: XÂY DỰNG MÔ HÌNH LOGIC MỜ VÀ ỨNG DỤNG TRONG PHÂN TÍCH KĨ THUẬT 41

3.1 Xây dựng mô hình 41

3.1.1 Các biến ngôn ngữ 42

3.1.2 Các luật sử dụng trong mô hình 45

3.1.3 Gắn các luật vào chương trình 46

3.2 Ứng dụng của mô hình 46

3.2.1 Chức năng nhập dữ liệu 46

3.2.2 Chức năng xây dựng biểu đồ 47

3.2.3 Chức năng xem, xóa biểu đồ theo mã chứng khoán 47

3.2.4 Chức năng phân tích đánh giá xu hướng giá chứng khoán 47

3.2.5 Chức năng đưa ra phán đoán dựa vào kết quả phân tích giá chứng khoán 47

Kết luận 48

Tài liệu tham khảo 49

Trang 3

Lời nói đầu

Ngày nay, sự bùng nổ của thị trường chứng khoán thúc đẩy mạnh mẽ sự ra đời vànâng cấp của hàng loạt các công cụ phân tích kĩ thuật Nhìn chung, các biểu đồ chứađựng các thông tin hữu ích về giá cổ phiếu trong quá khứ, hiện tại và dự báo tương đốichính xác về xu hướng giá trong tương lai Hệ thống phân tích kĩ thuật giúp cho cácnhà đầu tư cập nhật liên tục và phân tích sâu sát giá chứng khoán tại từng thời điểm vàđưa ra những dự báo nhanh nhạy hơn với những sự thay đổi tức thì của giá chứngkhoán Tuy nhiên, có một thực tế là tại Việt Nam, một thị trường còn quá non trẻ, cáccông cụ phân tích kĩ thuật chưa được áp dụng rộng rãi và chưa minh họa được các xuhướng giá vốn là yếu tố cốt lõi của phân tích kĩ thuật

Từ những thực tế nêu trên, em nhận thấy cần thiết phải tìm hiểu và xây dựng mộtcông cụ phân tích kĩ thuật phù hợp với môi trường tài chính của Việt Nam nói riêng

và tạo ra thêm một công cụ dự báo thống kê đối với thế giới

Trong tiểu luận này, em tập trung tìm hiểu về logic mờ (Fuzzy logic), một logicmềm dẻo hơn logic thông thường (logic Boolean) và thích hợp hơn đối với các bàitoán phức tạp (bài toán thế nào được coi là nóng, lạnh, ấm thì logic Boolean khôngđưa ra kết luận chính xác được) Từ các nguyên tắc của fuzzy logic để xây dựng nêncác mô hình, kết hợp với các kiến thức chuyên môn về chứng khoán để đưa ra các dựbáo về giá chứng khoán trong tương lai Kết quả thu được sẽ là một hệ thống với tínhnăng chính là đoán nhận và dự báo xu hướng giá chứng khoán và một số tính năngkhác hỗ trợ nhà đầu tư chứng khoán

Tiểu luận này được chia làm ba chương chính:

Chương 1 tìm hiểu tổng quan về lý thuyết khai phá dữ liệu, từ đó giúp chúng ta cócái nhìn tổng quan về các kỹ thuật, các phương pháp khác nhau trong khai phá dữ liệu

và từ đó chúng ta lựa chọn một phương pháp cụ thể để triển khai

Chương 2 tập trung tìm hiểu về phương pháp phân tích kĩ thuật trên thị trườngchứng khoán và logic mờ Đây là những cơ sở lý thuyết về kinh tế và kĩ thuật quantrọng để xây dựng nên hệ thống dự báo giá chứng khoán Đặc biệt, chương này chútrọng vào tìm hiểu chi tiết logic mờ cùng các ứng dụng đã có trong thực tế, các bướcthực hiện một mô hình logic mờ và cơ sở để lựa chọn công cụ thực hiện

Chương 3 sẽ đi sâu vào cách tổ chức lắp ghép hệ thống dự báo giá chứng khoán,

cụ thể hóa về quá trình xây dựng mô hình và đưa ra được các chức năng cũng như ứng

Trang 4

dụng của mô hình đó trong việc tạo ra một hệ thống dự báo giá chứng khoán trongtương lai.

Cuối cùng xin gửi lời cảm ơn chân thành đến PGS TS Đỗ Phúc đã có nhữnghướng dẫn tận tình và sâu sắc!

Trang 5

CHƯƠNG 1: LÝ THUYẾT TỔNG QUAN VỀ KHAI

PHÁ DỮ LIỆU

1.1 Phát hiện tri thức và khai phá dữ liệu

Trong thời đại bùng nổ công nghệ thông tin, các công nghệ lưu trữ dữ liệu ngàycàng phát triển tạo điều kiện cho các đơn vị thu thập dữ liệu tốt hơn Đặc biệt tronglĩnh vực kinh doanh, các doanh nghiệp đã nhận thức được tầm quan trọng của việcnắm bắt và xử lý thông tin, nhằm giúp các chủ doanh nghiệp trong việc vạch ra cácchiến lược kinh doanh kịp thời mang lại những lợi nhuận to lớn cho doanh nghiệp củamình Tất cả lí do đó khiến cho các cơ quan, đơn vị và các doanh nghiệp đã tạo ra mộtlượng dữ liệu khổng lồ

Khi lưu trữ các dữ liệu khổng lồ như vậy thì chúng ta thấy rằng chắc chắn chúngphải chứa những giá trị nhất định nào đó Tuy nhiên, theo thống kê thì chỉ có mộtlượng nhỏ của những dữ liệu này (khoảng từ 5% đến 10%) là luôn được phân tích, sốcòn lại họ không biết sẽ phải làm gì hoặc có thể làm gì với chúng nhưng họ vẫn tiếptục thu thập rất tốn kém với ý nghĩ lo sợ rằng sẽ có cái gì đó quan trọng đã bị bỏ quasau này có lúc cần đến nó Mặt khác, trong môi trường cạnh tranh, người ta ngày càngcần có nhiều thông tin với tốc độ nhanh để trợ giúp việc ra quyết định và ngày càng cónhiều câu hỏi mang tính chất định tính cần phải trả lời dựa trên một khối lượng dữ liệukhổng lồ đã có Với những lý do như vậy, các phương pháp quản trị và khai thác cơ sở

dữ liệu truyền thống ngày càng không đáp ứng được thực tế đã làm phát triển mộtkhuynh hướng kỹ thuật mới đó là Kỹ thuật phát hiện tri thức và khai phá dữ liệu(KDD - Knowledge Discovery and Data Mining)

Thông thường chúng ta coi dữ liệu như một dãy các bit, hoặc các số và các kýhiệu, hoặc các “đối tượng” với một ý nghĩa nào đó khi được gửi cho một chương trìnhdưới một dạng nhất định Chúng ta sử dụng các bit để đo lường các thông tin và xem

nó như là các dữ liệu đã được lọc bỏ các dư thừa, được rút gọn tới mức tối thiểu đểđặc trưng một cách cơ bản cho dữ liệu Chúng ta có thể xem tri thức như là các thôngtin tích hợp, bao gồm các sự kiện và các mối quan hệ giữa chúng Các mối quan hệnày có thể được hiểu ra, có thể được phát hiện, hoặc có thể được học Nói cách khác,tri thức có thể được coi là dữ liệu có độ trừu tượng và tổ chức cao

Phát hiện tri thức trong các cơ sở dữ liệu là một qui trình nhận biết các mẫu hoặccác mô hình trong dữ liệu với các tính năng: hợp thức, mới, khả ích, và có thể hiểu

Trang 6

được Còn khai thác dữ liệu là một bước trong qui trình phát hiện tri thức gồm có cácthuật toán khai thác dữ liệu chuyên dùng dưới một số qui định về hiệu quả tính toánchấp nhận được để tìm ra các mẫu hoặc các mô hình trong dữ liệu Nói một cách khác,mục đích của phát hiện tri thức và khai phá dữ liệu chính là tìm ra các mẫu và/hoặccác mô hình đang tồn tại trong các cơ sở dữ liệu nhưng vẫn còn bị che khuất bởi hàng

“núi” dữ liệu

Nhiều người coi khai phá dữ liệu và khám phá tri thức trong cơ sở dữ liệu là nhưnhau Tuy nhiên trên thực tế, khai phá dữ liệu chỉ là một bước thiết yếu trong quá trìnhphát hiện tri thức trong cơ sở dữ liệu

1.2 Các quan niệm về khai phá dữ liệu

 Khai phá dữ liệu là tập hợp các thuật toán nhằm chiết xuất những thông tin cóích từ kho dữ liệu khổng lồ

 Khai phá dữ liệu được định nghĩa như một quá trình phát hiện mẫu trong dữliệu Quá trình này có thể là tự động hay bán tự động, song phần nhiều là bán

tự động Các mẫu được phát hiện thường hữu ích theo nghĩa: các mẫu mang lạicho người sử dụng một lợi thế nào đó, thường là lợi thế về kinh tế

 Khai phá dữ liệu giống như quá trình tìm ra và mô tả mẫu dữ liệu Dữ liệu như

là một tập hợp của các vật hay sự kiện, còn đầu ra của quá trình khai phá dữliệu như là những dự báo của các vật hay sự kiện mới

 Khai phá dữ liệu được áp dụng trong các cơ sở dữ liệu quan hệ, giao dịch, cơ

sở dữ liệu không gian, cũng như các kho dữ liệu phi cấu trúc, mà điển hình làWorld Wide Web

 Khám phá tri thức là quá trình nhận biết các mẫu hoặc các mô hình trong dữliệu với các tính chất: Đúng đắn, mới, khả ích và có thể hiểu được Khai phá dữliệu là một bước trong quá trình khám phá tri thức bao gồm các thuật toán khaiphá dữ liệu chuyên dùng dưới một số quy định về hiệu quả tính toán chấp nhậnđược để tìm ra các mẫu và các mô hình trong dữ liệu

Tóm lại, mục đích của khám phá tri thức và khai phá dữ liệu là tìm ra các mẫuhoặc mô hình đang tồn tại trong các cơ sở dữ liệu nhưng vẫn còn bị khuất bởi sốlượng dữ liệu quá khổng lồ

1.3 Nhiệm vụ của khai phá dữ liệu

Các bài toán liên quan đến khai phá dữ liệu về bản chất là các bài toán thống kê.Điểm khác biệt giữa các kỹ thuật khai phá dữ liệu và các công cụ phục vụ tính toánthống kê mà chúng ta đã biết là ở khối lượng cần tính toán Một khi dữ liệu đã trở nên

Trang 7

khổng lồ thì những khâu như: thu thập dữ liệu, tiền xử lý và xử lý dữ liệu đều đòi hỏiphải được tự động hóa Tuy nhiên ở công đoạn cuối cùng, việc phân tích kết quả saukhi đã khai phá dữ liệu vẫn luôn là công việc của con người

Do là một lĩnh vực đa ngành, khai phá dữ liệu thu hút các lĩnh vực khoa học khácnhư trí tuệ nhân tạo, cơ sở dữ liệu, hiển thị dữ liệu, marketing, toán học, vận trù học,tin sinh học, nhận dạng mẫu, tính toán thống kê…

Điều mà khai phá dữ liệu có thể làm rất tốt là phát hiện ra những giả thuyết mạnhtrước khi sử dụng những công cụ tính toán thống kê Mô hình dự báo sử dụng kỹ thuậtphân cụm (Clustering) để chia nhóm các sự vật, sự kiện sau đó rút ra các luật nhằmtìm ra đặc trưng cho mỗi nhóm và cuối cùng đề nghị một mô hình Ví dụ, những bạnđọc đăng ký dài hạn của một tạp chí có thể phân nhóm dựa theo nhiều tiêu chí khácnhau (lứa tuổi, giới tính, thu nhập…), sau đó tạp chí căn cứ vào đặc trưng riêng củatừng nhóm để đề ra mức phí thu trong năm sao cho phù hợp nhất

Từ đó chúng ta thấy, những nhiệm vụ cơ bản nhất của khai phá dữ liệu là:

Phân cụm, phân loại, phân nhóm, phân lớp: Có nhiệm vụ là trả lời câu hỏi:

Một dữ liệu mới thu thập sẽ thuộc về nhóm nào? Quá trình này thường đượcthực hiện một cách tự động

Khai phá luật kết hợp: Có nhiệm vụ là phát hiện ra những mối quan hệ giống

nhau của các bản ghi giao dịch Luật kết hợp X Y có dạng tổng quát là: Nếumột giao dịch đã sở hữu các tính chất X thì đồng thời nó cũng sở hữu các tínhchất Y Ở một mức độ nào đó, khai phá luật kết hợp được hiểu theo nghĩa: Biếttrước các tính chất X, vậy các tính chất Y là những tính chất nào?

Lập mô hình dự báo: Bao gồm hai nhiệm vụ hoặc là phân nhóm dữ liệu vào

một hay nhiều lớp dữ liệu đã xác định từ trước, hoặc là sử dụng các trường đãcho trong một cơ sở dữ liệu để dự báo sự xuất hiện (hoặc không xuất hiện) củacác trường hợp khác

Phân tích đối tượng ngoài cuộc: Một cơ sở dữ liệu có thể chứa các đối tượng

không tuân theo mô hình dữ liệu Các đối tượng dữ liệu như vậy gọi là các đốitượng ngoài cuộc Hầu hết các phương pháp khai phá dữ liệu đều coi các đốitượng ngoài cuộc là nhiễu và loại bỏ chúng Tuy nhiên trong một số ứng dụng,chẳng hạn như phát hiện nhiễu thì sự kiện hiếm khi xảy ra lại được chú ý hơnnhững gì thường xuyên gặp phải Sự phân tích dữ liệu ngoài cuộc được coi như

là khai phá các đối tượng ngoài cuộc Một số phương pháp được ứng dụng đểphát hiện đối tượng ngoài cuộc: Sử dụng các hình thức kiểm tra mang tính

Trang 8

thống kê trên cơ sở một phân phối dữ liệu hay một mô hình xác suất cho dữliệu, dùng các độ đo khoảng cách mà theo đó các đối tượng có một khoảngcách đáng kể đến cụm bất kỳ khác được coi là đối tượng ngoài cuộc, dùng cácphương pháp dựa trên độ lệch để kiểm tra sự khác nhau trong những đặc trưngchính của các nhóm đối tượng.

Phân tích sự tiến hóa: Phân tích sự tiến hóa thực hiện việc mô tả và mô hình

hóa các quy luật hay khuynh hướng của những đối tượng mà ứng xử của chúngthay đổi theo thời gian Phân tích sự tiến hóa có thể bao gồm cả đặc trưng hóa,phân biệt, tìm luật kết hợp, phân lớp hay phân cụm dữ liệu liên quan đến thờigian, phân tích dữ liệu theo chuỗi thời gian, so sánh mẫu theo chu kỳ và phântích dữ liệu dựa trên tính tương tự

1.4 Triển khai việc khai phá dữ liệu

Nhìn chung, việc triển khai quá trình khai phá dữ liệu theo 5 bước:

Bước 1: Xác định rõ mục tiêu thương mại cần khai phá

Bước 2: Chuẩn bị dữ liệu (Thu thập, tiền xử lý, chuyển đổi khuôn dạng dữ liệu

nếu thấy cần thiết)

Bước 3: Khai phá dữ liệu (Chọn thuật toán thích hợp)

Bước 4: Phân tích kết quả thu được (Xem có gì thú vị không?)

Bước 5: Tiêu hóa các tri thức thu lượm được (Nhằm đề ra kế hoạch khai thác các

thông tin mới)

1.5 Quá trình phát hiện tri thức từ cơ sở dữ liệu

Quá trình phát hiện tri thức có thể chia thành các bước như sau:

Bước 1: Làm sạch dữ liệu (Data cleaning): Loại bỏ dữ liệu nhiễu hoặc dữ liệu

Bước 4: Chuyển đổi dữ liệu (Data Transformation): Chuyển dữ liệu về những

dạng phù hợp cho việc khai phá

Bước 5: Khai phá dữ liệu (Data mining): Các kỹ thuật được áp dụng để trích xuất

thông tin có ích hoặc các mẫu điển hình trong dữ liệu

Trang 9

Bước 6: Đánh giá mẫu (Pattern evaluation): Đánh giá mẫu hoặc tri thức đã thu

được

Bước 7: Trình diễn dữ liệu (Knowledge Presentation): Biểu diễn những tri thức

khai phá được cho người sử dụng

Quá trình phát hiện tri thức từ cơ sở dữ liệu được diễn tả qua mô hình sau:

Mô hình trên mô tả 5 giai đoạn trong quá trình khám phá tri thức từ cơ sở dữ liệu.Mặc dù có 5 giai đoạn như trên xong quá trình khám phá tri thức từ cơ sở dữ liệu làmột quá trình tương tác và lặp di lặp lại theo chu trình liên tục kiểu xoắn ốc, trong đólần lặp sau hoàn chỉnh hơn lần lặp trước Ngoài ra, giai đoạn sau lại dựa trên kết quảthu được của giai đoạn trước theo kiểu thác nước Đây là một quá trình biện chứngmang tính chất khoa học của lĩnh vực phát hiện tri thức và là phương pháp luận trongviệc xây dựng các hệ thống phát hiện tri thức

1.5.1 Giai đoạn xác định vấn đề

Đây là một quá trình mang tính định tính với mục đích xác định được lĩnh vực yêucầu phát hiện tri thức và xây dựng bài toán tổng kết Trong thực tế, các cơ sở dữ liệuđược chuyên môn hóa và phân chia theo các lĩnh vực khác nhau như sản phẩm, kinhdoanh, tài chính,… Với mỗi tri thức phát hiện được có thể có giá trị trong lĩnh vực nàynhưng lại không mang nhiều ý nghĩa đối với một lĩnh vực khác Vì vậy mà việc xácđịnh lĩnh vực và định nghĩa bài toán giúp định hướng cho giai đoạn tiếp theo thu thập

và tiền xử lý dữ liệu

1.5.2 Giai đoạn thu thập và tiền xử lý dữ liệu

Các cơ sở dữ liệu thu được thường chứa rất nhiều thuộc tính nhưng lại không đầy

đủ, không thuần nhất, có nhiều lỗi và các giá trị đặc biệt Vì vậy, giai đoạn thu thập vàtiền xử lý dữ liệu trở nên rất quan trọng trong quá trình phát hiện tri thức từ cơ sở dữ

Trang 10

liệu Có thể nói rằng giai đoạn này chiếm từ 70% đến 80% giá thành trong toàn bộ bàitoán.

Người ta chia giai đoạn thu thập và tiền xử lý dữ liệu thành các công đoạn như: lựachọn dữ liệu, làm sạch, làm giàu, mã hóa dữ liệu Các công đoạn được thực hiện theotrình tự đưa ra được một cơ sở dữ liệu thích hợp cho các giai đoạn sau Tuy nhiên, tùytừng dữ liệu cụ thể mà quá trình trên được điều chỉnh cho phù hợp vì người ta đưa ramột phương pháp cho mọi loại dữ liệu

a Chọn lọc dữ liệu: Đây là bước chọn lọc các dữ liệu có liên quan trong các

nguồn dữ liệu khác nhau Các thông tin được chọn lọc sao cho có chứa nhiều thông tinliên quan tới lĩnh vực cần phát hiện tri thức đã xác định trong giai đoạn xác định vấnđề

b Làm sạch dữ liệu: Dữ liệu thực tế, đặc biệt dữ liệu lấy từ nhiều nguồn khác

nhau thường không đồng nhất Do đó cần có biện pháp xử lý để đưa về một cơ sở dữliệu thống nhất phục vụ cho khai thác Nhiệm vụ làm sạch dữ liệu thường bao gồm:

(i) Điều hòa dữ liệu: Công việc này nhằm giảm bớt tính không nhất quán do

dữ liệu lấy từ nhiều nguồn khác nhau Phương pháp thông thường là khử cáctrường hợp trùng lặp dữ liệu và thống nhất các ký hiệu Chẳng hạn, một kháchhàng có thể có nhiều bản ghi do việc nhập sai tên hoặc do quá trình thay đổimột số thông tin cá nhân gây ra và tạo sự lầm tưởng có nhiều khách hàng khácnhau

(ii) Xử lý các giá trị khuyết: Tính không đầy đủ của dữ liệu có thể gây ra hiện

tượng dữ liệu chứa các giá trị khuyết Đây là hiện tượng khá phổ biến Thôngthường, người ta có thể lựa chọn các phương pháp khác nhau để thực hiện việc

xử lý các giá trị khuyết như: bỏ qua các bộ có giá trị khuyết, điểm bổ sung bằngtay, dùng một hằng chung để điền vào giá trị khuyết, dùng giá trị trung bìnhcủa mọi bản ghi cùng lớp hoặc dùng các giá trị mà tần suất xuất hiện lớn

(iii) Xử lý nhiễu và các ngoại lệ: Thông thường, nhiễu dữ liệu có thể là nhiễu

ngẫu nhiên hoặc các giá trị bất thường Để làm sạch nhiễu, người ta có thể sửdụng phương pháp làm trơn nhiễu hoặc dùng các giải thuật phát hiện ra cácngoại lệ để xử lý

c Làm giàu dữ liệu: Việc thu thập dữ liệu đôi khi không đảm bảo tính đầy đủ của

dữ liệu Một số thông tin quan trọng có thể thiếu hoặc không đầy đủ Chẳng hạn, dữliệu về khách hàng lấy từ một nguồn bên ngoài không có hoặc không đầy đủ thông tin

về thu nhập Nếu thông tin về thu nhập là quan trọng trong quá trình khai thác dữ liệu

để phân tích hành vi khách hàng thì rõ ràng là ta không thể chấp nhận đưa các dữ liệukhuyết thiếu vào được

Trang 11

Quá trình làm giàu cũng bao gồm việc tích hợp và chuyển đổi dữ liệu Các dữ liệu

từ nhiều nguồn khác nhau được tích hợp thành một kho thống nhất Các khuôn dạngkhác nhau của dữ liệu cũng được quy đổi, tính toán lại để đưa về một kiểu thống nhất,tiện cho quá trình phân tích Đôi khi, một số thuộc tính mới có thể được xây dựng dựatrên các thuộc tính cũ

d Mã hóa: Các phương pháp dùng để chọn lọc, làm sạch, làm giàu dữ liệu sẽ

được mã hóa dưới dạng các thủ tục, chương trình hay tiện ích nhằm tự động hóa việckết xuất, biến đổi và di chuyển dữ liệu Các hệ thống con đó có thể được thực thi định

kỳ làm tươi dữ liệu phục vụ cho việc phân tích

1.5.3 Khai thác dữ liệu

Giai đoạn khai thác dữ liệu được bắt đầu sau khi dữ liệu đã được thu thập và tiếnhành xử lý Trong giai đoạn này, công việc chủ yếu là xác định được bài toán khaithác dữ liệu, tiến hành lựa chọn phương pháp khai thác phù hợp với dữ liệu có được

và tách ra các tri thức cần thiết

Thông thường, các bài toán khai thác dữ liệu bao gồm: các bài toán mang tính chất

mô tả – đưa ra những tính chất chung nhất của các dữ liệu, các bài toán khai thác dựbáo – bao gồm cả việc thực hiện các suy diễn trên dữ liệu Tùy theo bài toán xác địnhđược mà ta lựa chọn các phương pháp khai thác dữ liệu cho phù hợp

1.5.4 Minh họa và đánh giá

Các tri thức phát hiện từ cơ sở dữ liệu cần được tổng hợp dưới dạng các báo cáophục vụ cho các mục đích hỗ trợ quyết định khác nhau Do nhiều phương pháp khaithác có thể được áp dụng nên các kết quả có mức độ tốt/xấu khác nhau Việc đánh giácác kết quả thu được là cần thiết, giúp tạo cơ sở cho những quyết định chiến lược.Thông thường chúng được tổng hợp, so sánh bằng các biểu đồ và được kiểm nghiệm,tin học hóa Công việc này thường là của các chuyên gia, các nhà phân tích và quyếtđịnh

1.5.5 Đưa kết quả vào thực tiễn

Các kết quả của quá trình phát hiện tri thức có thể được đưa vào ứng dụng trongnhững lĩnh vực khác nhau Do các kết quả có thể là các dự báo hoặc các mô tả nênchúng có thể được đưa vào các hệ thống hỗ trợ ra quyết định nhằm tự động hóa quátrình này Quá trình phát hiện tri thức có thể được tiến hành theo các bước trên

Ngoài ra trong quá trình khai thác người ta có thể thực hiện các cải tiến, nâng cấpsao cho phù hợp

1.6 Kiến trúc của hệ thống khai phá dữ liệu

Như đã trình bày ở trên, khai phá dữ liệu là một giai đoạn trong quá trình phát hiệntri thức từ số lượng lớn dữ liệu lưu trữ trong các cơ sở dữ liệu, kho dữ liệu hoặc các

Trang 12

nơi lưu trữ khác Bước này có thể tương tác lẫn nhau giữa người sử dụng hoặc cơ sởtri thức, những mẫu đáng quan tâm được đưa cho người dùng hoặc lưu trữ như là trithức mới trong cơ sở tri thức

Kiến trúc của hệ thống khai phá dữ liệu có các thành phần như sau:

Cơ sở dữ liệu, kho dữ liệu: Đó là một hoặc tuyển tập các cơ sở dữ liệu, kho

dữ liệu … Các kỹ thuật làm sạch dữ liệu, tích hợp, lọc dữ liệu có thể thực hiệntrên dữ liệu

Cơ sở dữ liệu hoặc kho dữ liệu phục vụ: Là kết quả lấy dữ liệu có liên quan

trên cơ sở khai phá dữ liệu của người dùng

Cơ sở tri thức: Đó là lĩnh vực tri thức được sử dụng để hướng dẫn việc tìm

hoặc đánh giá các mẫu kết quả thu được

Mô tả khai phá dữ liệu: Bao gồm tập các module chức năng để thực hiện các

nhiệm vụ mô tả đặc điểm, kết hợp, phân lớp, phân cụm dữ liệu…

Đánh giá mẫu: Thành phần này sử dụng các độ đo và tương tác với module

khai phá dữ liệu để tập trung vào tìm các mẫu quan tâm

Giao diện người dùng: Đây là module giữa người dùng và hệ thống khai phá

dữ liệu Cho phép người dùng tương tác với hệ thống trên cơ sở những truy vấnhay tác vụ, cung cấp thông tin cho việc tìm kiếm

1.7 Các kỹ thuật khai phá dữ liệu

Kỹ thuật khai phá dữ liệu được chia thành hai nhóm chính:

Kỹ thuật khai phá dữ liệu mô tả: Có nhiệm vụ mô tả về các tính chất hoặc

các đặc tính chung của dữ liệu trong cơ sở dữ liệu hiện có Các kỹ thuật nàygồm có: Phân cụm (clustering), tóm tắt (summerization), trực quan hóa(visualiztation), phân tích sự phát triển và độ lệch (evolution and deviationanalyst), phân tích luật kết hợp (association rules)…

Kỹ thuật khai phá dữ liệu dự đoán: Có nhiệm vụ đưa ra các dự đoán dựa vào

các suy diễn trên dữ liệu hiện thời Các kỹ thuật này gồm có: Phân lớp(classification), hồi quy (regession)… Tuy nhiên, chỉ có một số phương phápthông dụng nhất là: Phân cụm dữ liệu, phân lớp dữ liệu, phương pháp hồi quy

và khai phá luật kết hợp

Tuy nhiên, chỉ có một số phương pháp thông dụng và phổ biến nhất là: Phân cụm

dữ liệu, phân lớp dữ liệu, phương pháp hồi quy và khai phá luật kết hợp

1.7.1 Phân cụm dữ liệu

Mục tiêu chính của phương pháp phân cụm dữ liệu là nhóm các đối tượng tương tựnhau trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một lớp là tươngđồng còn các đối tượng thuộc các cụm khác nhau sẽ không tương đồng Phân cụm dữliệu là một ví dụ của phương pháp học không có thầy Không giống như phân lớp dữ

Trang 13

liệu, phân cụm dữ liệu không đòi hỏi phải định nghĩa trước các mẫu dữ liệu huấnluyện Vì thế có thể coi phân cụm dữ liệu là một cách học bằng quan sát (learning byobservation), trong khi phân lớp dữ liệu là học bằng ví dụ (learning by example).Trong phương pháp này bạn không thể biết kết quả các cụm thu được sẽ thế nào khibắt đầu quá trình Vì vậy, thông thường cần có một chuyên gia về lĩnh vực đó để đánhgiá các cụm thu được Phân cụm dữ liệu được sử dụng nhiều trong các ứng dụng vềphân đoạn thị trường, phân đoạn khách hàng, nhận dạng mẫu, phân loại trang Web…Ngoài ra phân cụm dữ liệu còn có thể được sử dụng như một bước tiền xử lý cho cácthuật toán khai phá dữ liệu khác.

1.7.2 Phân lớp dữ liệu

Mục tiêu của phương pháp phân lớp dữ liệu là dự đoán nhãn lớp cho các mẫu dữliệu Quá trình phân lớp dữ liệu thường gồm hai bước: Xây dựng mô hình và sử dụng

mô hình để phân lớp dữ liệu

Bước 1: Một mô hình sẽ được xây dựng dựa trên việc phân tích các mẫu dữ liệu

sẵn có Mỗi mẫu tương ứng với một lớp, được quyết định bởi một thuộc tính gọi làthuộc tính lớp Các lớp dữ liệu này còn được gọi là lớp dữ liệu huấn luyện (trainingdata set) Các nhãn lớp của tập dữ liệu huấn luyện đều phải được xác định trước khixây dựng mô hình

Bước 2: Sử dụng mô hình để phân lớp dữ liệu Trước hết, chúng ta phải tính độ

chính xác của mô hình Nếu độ chính xác là chấp nhận được, mô hình sẽ được sửdụng để dự đoán nhãn lớp cho các mẫu dữ liệu khác trong tương lai Một ví dụ về việc

sử dụng phương pháp phân lớp trong khai phá dữ liệu là ứng dụng phân lớp các xuhướng trong thị trường tài chính và ứng dụng tự động xác định các đối tượng đángquan tâm trong cơ sở dữ liệu ảnh lớn

1.7.3 Phương pháp hồi quy

Phương pháp hồi quy khác với phân lớp dữ liệu ở chỗ: Hồi quy dùng để dự đoán

về các giá trị liên tục còn phân lớp dữ liệu chỉ dùng để dự đoán về các giá trị rời rạc Hồi quy là một hàm toán học ánh xạ một dữ liệu thành một biến dự đoán có giá trịthực Có rất nhiều ứng dụng khai phá dữ liệu với nhiệm vụ hồi quy, chẳng hạn nhưkhả năng đánh giá tử vong của bệnh nhân khi biết các kết quả xét nghiệm, chẩn đoán;

dự đoán nhu cầu tiêu thụ một sản phẩm mới bằng một hàm chi tiêu quảng cáo

1.7.4 Khai phá luật kết hợp

Mục tiêu của phương pháp này là phát hiện và đưa ra các mối liên hệ giữa các giátrị dữ liệu trong cơ sở dữ liệu Mẫu đầu ra của giải thuật khai phá dữ liệu là luật kếthợp tìm được Chẳng hạn, phân tích cơ sở dữ liệu bán hàng nhận được thông tin vềnhững khách hàng mua máy tính có khuynh hướng mua phần mềm quản lý tài chính

Trang 14

trong cùng lần mua được miêu tả trong luật kết hợp sau: “Máy tính Phần mềm quản

lý tài chính” (Độ hỗ trợ: 2%, độ tin cậy: 60%)

Độ hỗ trợ và độ tin cậy là hai độ đo của sự đáng quan tâm của luật Chúng phảnánh sự hữu ích và sự chắc chắn của luật đã khám phá Độ hỗ trợ 2% có nghĩa là 2%của tất cả các trường hợp đang phân tích chỉ ra rằng máy tính và phần mềm quản lý tàichính là đã được mua cùng nhau Còn độ tin cậy 60% có nghĩa là: 60% các kháchhàng mua máy tính cũng mua phần mềm Khai phá luật kết hợp được thực hiện quahai bước:

Bước 1: Tìm tất cả các tập mục phổ biến, một tập mục phổ biến được xác định qua

tính hỗ trợ và thỏa mãn độ hỗ trợ cực tiểu

Bước 2: Sinh ra các luật kết hợp mạnh từ tập mục phổ biến, các luật phải thỏa mãn

độ hỗ trợ cực tiểu và độ tin cậy cực tiểu Phương pháp này được sử dụng rất hiệu quảtrong các lĩnh vực như maketing có chủ đích, phân tích quyết định, quản lý kinhdoanh, phân tích giá thị trường…

1.8 Một số ứng dụng khai phá dữ liệu

Ở thập kỷ 90 của thế kỷ XX, người ta coi khai phá dữ liệu là quá trình phân tích cơ

sở dữ liệu nhằm phát hiện ra các thông tin mới và giá trị, thường thể hiện dưới dạngcác mối quan hệ chưa biết đến giữa các biến số Những phát hiện này được sử dụngnhằm tăng thêm tính hiệu quả của doanh nghiệp trong khi phải cạnh tranh trên thươngtrường Nhờ phân tích các dữ liệu liên quan đến khách hàng, doanh nghiệp có khảnăng dự báo trước một số hành vi ứng xử của khách hàng

Những năm gần đây, người ta quan niệm khai phá dữ liệu (đôi khi còn dùng thuậtngữ khám phá dữ liệu hay phát hiện tri thức) là một quá trình phân tích dữ liệu từ cácviễn cảnh khác nhau và rút ra các thông tin bổ ích – những thông tin có thể dùng đểtăng lợi nhuận, cắt giảm chi phí hoặc cả hai mục đích Phần mềm khai phá dữ liệu làmột công cụ phân tích dùng để phân tích dữ liệu Nó cho phép người sử dụng phântích dữ liệu theo nhiều góc nhìn khác nhau, phân loại dữ liệu theo những quan điểmriêng biệt và tổng kết các mối quan hệ đã được bóc tách Xét về khía cạnh kỹ thuật,khai phá dữ liệu là một quá trình tìm kiếm các mối tương quan giữa các mẫu ẩn chứatrong hàng chục trường dữ liệu của một cơ sở dữ liệu quan hệ cỡ lớn

Hiện nay, kỹ thuật khai phá dữ liệu đang được áp dụng một cách rộng rãi trong rấtnhiều lĩnh vực kinh doanh và đời sống khác nhau như:

Thương mại: Phân tích dữ liệu bán hàng và thị trường, phân tích đầu tư, quyết

định cho vay, phát hiện gian lận,…

Thông tin sản xuất: Điều khiển và lập kế hoạch, hệ thống quản lý, phân tích

kết quả thử nghiệm,…

Trang 15

Thông tin khoa học: Dự báo thời tiết; cơ sở dữ liệu sinh học: Ngân hàng gen,

…; khoa học địa lý: dự báo động đất,…

Thông qua việc khai phá dữ liệu, phát hiện tri thức đã thu được các kết quả đánggiá Điều đó được chứng minh bằng thực tế: Chẩn đoán bệnh trong y tế dựa trên kếtquả xét nghiệm đã giúp cho bảo hiểm y tế phát hiện ra nhiều trường hợp xét nghiệmkhông hợp lý, tiết kiệm được nhiều kinh phí mỗi năm; trong dịch vụ viễn thông đãphát hiện ra những nhóm người thường xuyên gọi cho nhau bằng điện thoại di động

và thu lợi hàng triệu USD; IBM Suft-Aid đã áp dụng khai phá dữ liệu vào phân tíchcác lần đăng nhập Web vào các trang liên quan đến thị trường để phát hiện sở thíchkhách hàng, từ đó đánh giá hiệu quả của việc tiếp thị qua Web và cải thiện hoạt độngcủa các Website; trang Web mua bán qua mạng Amazon cũng tăng doanh thu nhờ ápdụng khai phá dữ liệu trong việc phân tích sở thích mua bán của khách hàng

1.9 Những khó khăn trong khai phá dữ liệu

Việc nghiên cứu và ứng dụng kỹ thuật khai phá dữ liệu gặp nhiều khó khăn, nhưngkhông phải là không giải quyết được mà chúng cần được tìm hiểu để có thể phát triểntốt hơn Những khó khăn phát sinh trong khai phá dữ liệu chính là dữ liệu trong thực

tế thường động, không đầy đủ, lớn và bị nhiễu Trong trường hợp khác, người takhông biết cơ sở dữ liệu có chứa thông tin cần thiết cho việc khai thác hay không vàlàm thế nào để giải quyết sự dư thừa thông tin không thích hợp này

Dữ liệu lớn: Hiện nay các cơ sở dữ liệu với hàng trăm trường và bảng, hàng

triệu bản ghi với kích thước rất lớn, có thể lên đến GB Các phương pháp giảiquyết hiện nay là đưa ra một ngưỡng cho cơ sở dữ liệu, lấy mẫu, các phươngpháp tính xấp xỉ, xử lí song song

Kích thước lớn: Không chỉ có số lượng bản ghi mà số các trường trong cơ sở

dữ liệu cũng nhiều Vì vậy mà kích thước của bài toán trở nên lớn làm tăngkhông gian tìm kiếm Hơn nữa, nó cũng làm tăng khả năng một thuật toán khaiphá dữ liệu có thể tìm thấy các mẫu giả Biện pháp khắc phục là làm giảm kíchthước tác động của bài toán và sử dụng các tri thức biết trước để xác định cácbiến không phù hợp

Dữ liệu động: Đặc điểm cơ bản của hầu hết các cơ sở dữ liệu là nội dung của

chúng thay đổi liên tục Chẳng hạn như các biến trong cơ sở dữ liệu của ứngdụng đã cho có thể bị thay đổi, bị xóa hoặc là tăng lên theo thời gian Dữ liệu

có thể thay đổi theo thời gian và việc khai phá dữ liệu bị ảnh hưởng bởi thờiđiểm quan sát dữ liệu, do đó có thể làm cho mẫu khai thác được trước đó mấtgiá trị Vấn đề này được giải quyết bằng giải pháp tăng trưởng để nâng cấp cácmẫu và coi những thay đổi như là cơ hội để khai thác bằng cách sử dụng nó đểtìm kiếm các câu bị thay đổi

Các trường dữ liệu không phù hợp: Một đặc điểm quan trọng khác là tính

không thích hợp của dữ liệu – nghĩa là mục dữ liệu trở thành không thích hợp

Trang 16

với trọng tâm hiện tại của việc khai thác Bên cạnh đó, tính ứng dụng của mộtthuộc tính đối với một tập con của cơ sở dữ liệu cũng là một vấn đề đôi khicũng liên quan dến độ phù hợp.

Các giá trị bị thiếu: Sự có mặt hay vắng mặt của giá trị các thuộc tính dữ liệu

phù hợp có thể ảnh hưởng đến việc khai phá dữ liệu Trong hệ thống tương tác,

sự thiếu vắng dữ liệu quan trọng có thể dẫn tới yêu cầu cho giá trị của nó hoặckiểm tra để xác định giá trị của nó Hoặc cũng có thể sự vắng mặt của dữ liệuđược coi như một điều kiện, thuộc tính bị mất có thể được xem như một giá trịtrung gian và giá trị không biết

Các trường dữ liệu bị thiếu: Một quan sát không đầy đủ cơ sở dữ liệu có thể

làm cho dữ liệu có giá trị bị xem như có lỗi Việc quan sát cơ sở dữ liệu phảiphát hiện được toàn bộ các thuộc tính có thể dùng để thuật toán khai phá dữliệu có thể áp dụng để giải quyết bài toán Giả sử ta có các thuộc tính để phânbiệt các tình huống đáng quan tâm Nếu chúng không làm được điều đó thì cónghĩa là đã có lỗi trong dữ liệu Đây cũng là vấn đề thường xảy ra trong cơ sở

dữ liệu kinh doanh Các thuộc tính quan trọng có thể sẽ bị thiếu dữ liệu khôngđược chuẩn bị

Khả năng biểu đạt mẫu: Trong rất nhiều ứng dụng, điều quan trọng là những

điều khai thác được phải càng dễ hiểu với con người càng tốt Vì vậy, các giảipháp thường bao gồm việc diễn tả dưới dạng đồ họa, xây dựng cấu trúc luật vớicác đồ thị có hướng, biểu diễn bằng ngôn ngữ tự nhiên và kỹ thuật khác nhằmbiểu diễn các tri thức và dữ liệu

Sự tương tác với người sử dụng các tri thức sẵn có: Rất nhiều công cụ và

phương pháp khai phá dữ liệu không thực sự tương tác với người dùng vàkhông dễ dàng kết hợp cùng với các tri thức đã biết trước đó Việc sử dụng trithức miền là rất quan trọng trong khai phá dữ liệu Đã có nhiều biện pháp nhằmkhắc phục vấn đề này như sử dụng cơ sở dữ liệu suy diễn để phát hiện tri thức,những tri thức này sau đó được sử dụng để hướng dẫn cho việc tìm kiếm khaiphá dữ liệu hoặc sử dụng sự phân bố xác suất dữ liệu trước đó như một dạng

mã hóa tri thức có sẵn

Trang 17

CHƯƠNG 2: TÌM HIỂU CHUNG VỀ PHÂN TÍCH KĨ THUẬT TRÊN THỊ TRƯỜNG CHỨNG KHOÁN VÀ

Tính tập trung ở đây là muốn nói đến việc các giao dịch được tổ chức tập trungtheo một địa điểm vật chất Hình thái điển hình của thị trường chứng khoán tập trung

là Sở giao dịch chứng khoán (Stock exchange) Tại Sở giao dịch chứng khoán, cácgiao dịch được tập trung tại một địa điểm; các lệnh được chuyển tới sàn giao dịch vàtham gia vào quá trình ghép lệnh để hình thành nên giá giao dịch

Thị trường chứng khoán phi tập trung còn gọi là thị trường OTC (over thecounter) Trên thị trường OTC, các giao dịch được tiến hành qua mạng lưới các công

ty chứng khoán phân tán trên khắp quốc gia và được nối với nhau bằng mạng điện tử.Giá trên thị trường này được hình thành theo phương thức thỏa thuận

b Chức năng của thị trường chứng khoán

Huy động vốn đầu tư cho nền kinh tế

Khi các nhà đầu tư mua chứng khoán do các công ty phát hành, số tiền nhàn rỗicủa họ được đưa vào hoạt động sản xuất kinh doanh và qua đó góp phần mở rộng sảnxuất xã hội Thông qua thị trường chứng khoán, Chính phủ và chính quyền ở các địaphương cũng huy động được các nguồn vốn cho mục đích sử dụng và đầu tư phát triển

hạ tầng kinh tế, phục vụ các nhu cầu chung của xã hội

Cung cấp môi trường đầu tư cho công chúng

Thị trường chứng khoán cung cấp cho công chúng một môi trường đầu tư lànhmạnh với các cơ hội lựa chọn phong phú Các loại chứng khoán trên thị trường rấtkhác nhau về tính chất, thời hạn và độ rủi ro, cho phép các nhà đầu tư có thể lựa chọnloại hàng hoá phù hợp với khả năng, mục tiêu và sở thích của mình

Tạo tính thanh khoản cho các chứng khoán

Trang 18

Nhờ có thị trường chứng khoán các nhà đầu tư có thể chuyển đổi các chứng khoán

họ sở hữu thành tiền mặt hoặc các loại chứng khoán khác khi họ muốn Khả năngthanh khoản là một trong những đặc tính hấp dẫn của chứng khoán đối với người đầu

tư Đây là yếu tố cho thấy tính linh hoạt, an toàn của vốn đầu tư Thị trường chứngkhoán hoạt động càng năng động và có hiệu quả thì tính thanh khoản của các chứngkhoán giao dịch trên thị trường càng cao

Đánh giá hoạt động của doanh nghiệp

Thông qua chứng khoán, hoạt động của các doanh nghiệp được phản ánh một cáchtổng hợp và chính xác, giúp cho việc đánh giá và so sánh hoạt động của doanh nghiệpđược nhanh chóng và thuận tiện, từ đó cũng tạo ra một môi trường cạnh tranh lànhmạnh nhằm nâng cao hiệu quả sử dụng vốn, kích thích áp dụng công nghệ mới, cảitiến sản phẩm

Tạo môi trường giúp Chính phủ thực hiện các chính sách kinh tế vĩ mô

Các chỉ báo của thị trường chứng khoán phản ánh động thái của nền kinh tế mộtcách nhạy bén và chính xác Giá các chứng khoán tăng lên cho thấy đầu tư đang mởrộng, nền kinh tế tăng trưởng; ngược lại giá chứng khoán giảm sẽ cho thấy các dấuhiệu tiêu cực của nền kinh tế Vì thế, thị trường chứng khoán được gọi là phong vũbiểu của nền kinh tế và là một công cụ quan trọng giúp Chính phủ thực hiện các chínhsách kinh tế vĩ mô Thông qua thị trường chứng khoán, Chính phủ có thể mua và bántrái phiếu Chính phủ để tạo ra nguồn thu bù đắp thâm hụt ngân sách và quản lý lạmphát Ngoài ra, Chính phủ cũng có thể sử dụng một số chính sách, biện pháp tác độngvào thị trường chứng khoán nhằm định hướng đầu tư đảm bảo cho sự phát triển cânđối của nền kinh tế

2.1.2 Phương pháp phân tích kỹ thuật

a Định nghĩa

Phân tích kỹ thuật là việc sử dụng các mô hình toán học (đồ thị, biến đổi miền, xácsuất thống kê,…) dựa trên dữ liệu thu thập về thị trường trong quá khứ và hiện tại đểchỉ ra trạng thái của thị trường tại thời điểm xác định, thông thường là nhận định xuhướng thị trường đang lên, đang xuống hoặc nhận định tương quan lực lượng giữa sựtăng và sự giảm giá

Phân tích kỹ thuật không để ý đến các chỉ số tài chính, tình hình phát triển hay cácthông tin về thị trường về doanh nghiệp mà chỉ chú trọng vào tập các dữ liệu về giá cả,khối lượng… của cổ phiếu thu thập được tại các phiên giao dịch trong quá khứ Chính

Trang 19

vì chỉ dựa vào tập dữ liệu đã tồn tại trên thị trường, tức là các thông tin trong quá khứ– phân tích kỹ thuật không phải là công cụ để dự đoán tương lai giá cả của cổ phiếu.Những kết luận thu được từ các biện pháp phân tích kỹ thuật chỉ thị trạng thái củathị trường đã xảy ra trong quá khứ; thời điểm rút ra kết luận về trạng thái của thịtrường luôn luôn đi sau so với sự kiện đã xảy ra Khoảng thời gian chênh lệch đó gọi

là độ trễ Xét ví dụ về một phương pháp phân tích kỹ thuật sử dụng trung bình động.Giá chứng khoán trong 5 phiên đến ngày 18/05/2007 của Công ty cổ phần nhựa DNP– Mã chứng khoán DNP

Trang 20

Hình 1: Biểu đồ kỹ thuật chứng khoán trong thực tế

Bằng mắt thường quan sát đường trung bình động có thể nhận định rằng xu thế củaDNP đến thời điểm ngày 18/05/2007 là tăng giá, liệu sau ngày 18/05/2007 giá cổphiếu của DNP có tiếp tục tăng không? Đây chính là nhiệm vụ của việc phân tích kỹthuật

b Các khái niệm cơ bản trong phân tích kỹ thuật

Có điểm đảo chiều lên và đảo chiều xuống, trong trường hợp xu thế của giá chứngkhoán đang tăng xuất hiện điểm đảo chiều mà tại đó giá chứng khoán đi xuống thì gọi

là điểm đảo chiều lên Ngược lại khi giá chứng khoán đang xuống mà xuất hiện điểmđảo chiều mà tại đó giá chứng khoán đi lên thì gọi là điểm đảo chiều xuống

Phân kỳ đóng vai trò phát sinh các tín hiệu mua và bán hoặc giữ vai trò là mộtcảnh báo về sự thay đổi xu thế Có 2 loại phân kỳ là phân kỳ dương và phân kỳ âm.Phân kỳ dương là phân kỳ mà giá trị của phân tích tăng nhưng giá của chứng khoánđang có xu hướng giảm; phân kỳ dương báo hiệu về sự thay đổi xu hướng sắp tới củagiá là tăng giá

Trang 21

Hình 2: Phân kỳ dương

Phân kỳ âm là phân kỳ mà giá trị của phân tích giảm nhưng giá của chứng khoántăng; phân kỳ âm báo hiệu về sự thay đổi xu thế sắp tới sẽ là giảm giá Điều nàykhông có nghĩa là tại thời điểm mà nhà đầu tư nhìn thấy chu kỳ dương hoặc chu kỳ âmthì xu thế giá sẽ thay đổi trong tương lai gần, rất khó xác định khi nào sự thay đổi xuthế sẽ xảy ra Vì vậy không thể ra quyết định mua hoặc bán chỉ dựa vào phân kỳ màphải sử dụng với vai trò củng cố bổ trợ với các tín hiệu khác

Siêu mua và siêu bán là hai ngưỡng giá trị của phân tích Mọi giá trị nằm trênngưỡng siêu mua thì tại đó nó thể hiện giá cổ phiếu tăng Mọi giá trị nằm dưới ngưỡngsiêu bán là giá cổ phiếu giảm Phân tích việc xuyên phá các ngưỡng giá trị này nhằmchỉ ra khi giá cổ phiếu đang biến động dập dềnh nhằm chỉ ra xu thế sắp tới của giá cổphiếu sẽ là tăng giá hay giảm giá

Trong trường hợp giá cổ phiếu biến động có xu thế, sử dụng các ngưỡng siêu muahoặc siêu bán thường hay cho tín hiệu không phù hợp nếu việc mua và bán đi ngượclại xu thế của thị trường Tuy nhiên vẫn có thể sử dụng các tín hiệu mua hoặc bán khigiá trị siêu mua hoặc siêu bán bị xuyên phá nhưng phải thuận theo xu thế chung thịtrường mà không được đi ngược lại Cụ thể nếu có tín hiệu mua và biến động là tăngthì có thể mua, nếu có tín hiệu bán và biến động là giảm thì có thể bán; xu thế càngmạnh mẽ thì tín hiệu càng đáng tin cậy

Đường trung bình là ngưỡng trung bình giá trị của phân tích Nếu sự xuyên phá làvượt ngưỡng trung bình, thế trận đổi chiều nghiêng phần thắng về phe bán cổ phiếu

Trang 22

Ngược lại nếu sự xuyên phá là xuống dưới ngưỡng trung bình điều đó có nghĩa thếtrận đổi chiều nghiêng phần thắng về phe mua cổ phiếu.

Tín hiệu mua và bán

Để đưa ra các quyết định mua và bán hợp lý, cần có một số tín hiệu khác nhau bổtrợ lẫn nhau nhằm tăng cường độ chính xác của các tín hiệu và giảm thiểu rủi ro đốivới mỗi quyết định Các dấu hiệu sau được sử dụng để báo hiện việc mua hoặc bán:

- Nếu giá trị của máy dao động từ dưới vượt qua ngưỡng siêu mua rồi quaytrở lại xuống dưới ngưỡng này, đồng thời xu thế giá là đi xuống hoặc biếnđộng dập dềnh Điều đó cảnh báo thị trường sẽ chuyển sang xu thế giảm giáhoặc đang ở giai đoạn đầu của xu thế giảm giá Đây là tín hiệu bán ra

- Nếu giá trị của máy dao động từ dưới vượt qua ngưỡng siêu bán rồi quaytrở lại lên trên ngưỡng này, đồng thời xu thế giá là đi lên hoặc biến độngdập dềnh Điều đó cảnh báo thị trường sẽ chuyển sang xu thế tăng giá hoặcđang ở giai đoạn đầu của xu thế tăng giá Đây là tín hiệu mua vào

- Nếu xu thế giá đang tăng mạnh, khi giá trị của máy dao động vượt quangưỡng siêu mua có nghĩa là đang ở giai đoạn đầu của xu thế tăng giá và sẽtiếp tục tăng Đây là tín hiệu mua vào Nếu xu thế giá đang giảm mạnh, khigiá trị của máy dao động vượt qua ngưỡng siêu bán có nghĩa là đang ở giaiđoạn đầu của xu thế giảm giá và sẽ tiếp tục giảm Đây là tín hiệu bán ra

- Nếu giá trị máy dao động đang ở dưới ngưỡng siêu bán nhưng có sự xuấthiện của phân kỳ dương thì đó là tín hiệu mua vào Chú ý tính thuận theo xuthế: nếu thị trường ở trạng thái dập dềnh hoặc xu thế là tăng hoặc giảm nhẹthì có thể mua, nếu thị trường ở trạng thai giảm mạnh thì tín hiệu này khôngđáng tin Nếu giá trị máy dao động đang ở trên ngưỡng siêu mua nhưng có

sự xuất hiện của phân kỳ âm thì đó là tín hiệu bán ra

Chú ý tính thuận theo xu thế: nếu thị trường ở trạng thái dập dềnh hoặc xu thế làgiảm hoặc tăng nhẹ thì có thể bán, nếu thị trường ở trạng thái tăng mạnh thì tín hiệunày không đáng tin

Nếu giá trị máy dao động tăng vượt qua giá trị trung bình và có sự xuất hiện củaphân kỳ dương và xu thế giá đi lên thì đó là tín hiệu mua vào Nếu giá trị máy daođộng giảm xuống xuyên qua giá trị trung bình và có sự xuất hiện của phân kỳ âm và

xu thế giá đi xuống thì đó là tín hiệu bán ra

Ví dụ: Xét ví dụ về sử dụng ngưỡng trung bình của phân tích MACD đối với

chứng chỉ quỹ VF1

Trang 23

Hình 3: Biểu đồ giúp nhận biết các dấu hiệu đảo chiều

Thời điểm số (1), (5) là thời điểm giai đoạn đầu của xu thế tăng giá mạnh, ngưỡngsiêu mua bị xuyên phá, thuận theo xu thế của thị trường, đây là lúc nên mua vào Thờiđiểm số (2), (3), (4) là thời điểm mà giá cổ phiếu đã vượt từ dưới ngưỡng siêu bán lêntrên Tại các thời điểm này còn có sự xuất hiện của phân kỳ dương, đây là tín hiệumua vào Để tăng cường chính xác cần theo dõi thêm xu thế lúc đó của thị trường Tạithời điểm số (2), về dài hạn giá cổ phiếu đang theo xu thế giảm, nhưng trong ngắn hạn

5 ngày thì tại thời điểm đó giá đang tăng, nếu tuân theo xu thế ngắn hạn thì có thể muavào nhưng phải bán ngay ra khi có thể vì sự tăng giá chỉ là ngắn hạn Tại thời điểm số(3) và số (4) cho thấy những dấu hiệu chắc chắn hơn vì biến động lúc đó là dập dềnh,các tín hiệu khẳng định nên mua vào vì tin tưởng ở sự lên giá trong tương lai Thờiđiểm số (6) là thời điểm nên bán ra vì ngưỡng siêu bán đã bị xuyên phá trong xu thếbiến động giảm giá mạnh của thị trường Việc bán ra ở thời điểm này nhằm mục đíchgiảm lỗ, chờ đợi sự hồi phục lại của thị trường để tiếp tục mua vào

Phân tích chứng khoán là một nghệ thuật hơn là một ngành khoa học chính xác Vìvậy cần phải sử dụng kết hợp nhiều phương pháp khác nhau để đạt đến kết quả tốtnhất Thậm chí ngay trong cùng một phương pháp cũng có nhiều cách sử dụng khácnhau tùy thuộc vào ngữ cảnh cụ thể Vì vậy cần phải trải qua rèn luyện kiến thức vàthực hành để tự đào tạo bản thân đạt được sự nhạy bén và chính xác mà không mộtphương pháp nào có thể đạt được

c Vai trò của phân tích kỹ thuật

Phân tích kỹ thuật đóng vai trò là công cụ trợ giúp nhà đầu tư với ba chức năngchính: báo động, xác thực và dự đoán

Trang 24

Công cụ báo động

Phân tích kỹ thuật cảnh báo sự xuyên phá các ngưỡng an toàn và thiết lập nên cácngưỡng an toàn mới hay nói cách khác là thiết lập mức giá mới thực sự thay vì daođộng quanh một mức giá cũ Đối với nhà đầu tư việc nhận biết các dấu hiệu về sự thayđổi mức giá càng sớm càng tốt giúp cho họ sớm có hành động mua vào hoặc bán rakịp thời

Mỗi phương pháp phân tích kỹ thuật được sử dụng kết hợp với các phương pháp

kỹ thuật khác hoặc các phương pháp phi kỹ thuật để xác nhận về xu thế của giá Việckết hợp và bổ trợ lẫn nhau giữa các phương pháp kỹ thuật khác nhau giúp nhà đầu tư

có được kết luận chính xác và tối ưu hơn

Nhà đầu tư sử dụng các kết luận của phân tích kỹ thuật để dự đoán giá cả củatương lai với kỳ vọng về khả năng đoán tốt hơn Tuy nhiên như trên đã nói, bản chấtcủa phân tích kỹ thuật không phải là dự báo tương lai mà là chỉ thị trạng thái thịtrường trong quá khứ với một độ trễ; do đó nếu sử dụng như một công cụ dự đoán nhàđầu tư cần phải tính đến một xác suất an toàn và chấp nhận rủi ro khi dự đoán làkhông phù hợp Không ai có thể nói trước tương lai chỉ bằng thông tin trong quá khứ.Tuy nhiên nhờ có phân tích kỹ thuật, khả năng đoán sai do đoán được hạn chế rấtnhiều Mỗi phương pháp kỹ thuật được áp dụng sẽ thể hiện các vai trò trên với các ưunhược điểm khác nhau

2.1.3 Lí thuyết Dow

a Tìm hiểu chung

Lý thuyết Dow là cơ sở đầu tiên cho mọi nghiên cứu kĩ thuật trên thị trường cơ sở

để xây dựng cũng như đối tượng nghiên cứu của lý thuyết chính là những biến độngcủa bản thân thị trường (thể hiện trong chỉ số trung bình của thị trường) và không hềdựa trên cùng cơ sở của phân tích cơ bản là các thống kê hoạt động kinh doanh của doanh nghiệp

Tìm hiểu về lý thuyết của Dow, trước tiên ta phải nghiên cứu đến chỉ số trung bìnhcủa thị trường Nhìn chung giá chứng khoán của tất cả các công ty đều cùng lên vàxuống, tuy nhiên một số cổ phiếu lại chuyển động theo hướng ngược lại xu thế chungcủa các cổ phiếu khác cho dù là chỉ trong vài ngày hoặc vài tuần Thực tế cho thấy khithị trường lên giá thì giá của một số chứng khoán tăng nhanh hơn những chứng khoánkhác, còn khi thị trường xuống giá thì một số chứng khoán giảm giá nhanh chóng

Trang 25

trong khi có một số khác lại tăng lên, nhưng thực tế vẫn chứng minh rằng hầu như tất

cả các chứng khoán đều dao động theo cùng một xu thế chung

b Nguyên lý quan trọng của lý thuyết Dow

Khi nghiên cứu lý thuyết Dow có 12 nguyên lý quan trọng sau:

Chỉ số bình quân thị trường phản ánh tất cả

Bởi vì nó phản ánh những hoạt động có liên kết với nhau của hàng nghìn nhà đầu

tư, gồm cả những người có kinh nghiệm dự đoán thị trường giỏi nhất, có những thôngtin tốt nhất về xu hướng và các sự kiện, những gì có thể nhận thấy trước và tất cảnhững gì có thể ảnh hưởng đến cung và cầu của các loại chứng khoán Thậm chí cảnhững thiên tai hay thảm họa không dự tính được thì ngay khi xảy ra chúng đã đượcthị trường phản ánh ngay vào giá của các loại chứng khoán

Ba xu thế của thị trường

Thuật ngữ thị trường nhằm chỉ giá chứng khoán nói chung, dao động của thịtrường tạo thành các xu thế giá, trong đó quan trọng nhất là các xu thế cấp 1 (xu thếchính hay xu thế cơ bản) Đây là những biến động tăng hoặc giảm với qui mô lớn,thường kéo dài trong một hoặc nhiều năm và gây ra sự tăng hay giảm đến 20% giá củacác cổ phiếu Chuyển động theo xu thế cấp 1 sẽ bị ngắt quãng bởi các bởi sự xen vàocủa các dao động cấp 2 theo hướng đối nghịch - gọi là những phản ứng hay điều chỉnhcủa thị trường Những biến động này xuất hiện khi xu hướng cấp 1 tạm thời vượt quámức độ hiện tại của bản thân nó (gọi chung các biến động này là các biến động trunggian - biến động cấp 2) Những biến động cấp 2 bao gồm những biến động giá nhỏhay gọi là những biến động hàng ngày và không có ý nghĩa quan trọng trong Lýthuyết Dow

Xu thế cấp 1

Như đã nói đến ở phần trước, xu thế cấp 1 là những chuyển động lớn của giá, baohàm cả thị trường, thường kéo dài hơn 1 năm và có thể là trong vài năm Nếu như mỗiđợt tăng giá liên tiếp đều đạt đến mức cao hơn mức trước đó và mỗi điều chỉnh cấp 2đều dừng lại ở mức đáy cao hơn mức đáy của lần điều chỉnh trước thì xu thế cấp 1 lúcnày là tăng giá Còn ngược lại nếu mỗi biến động giảm đều làm cho giá xuống nhữngmức thấp hơn còn mỗi điều chỉnh đều không đủ mạnh để làm cho giá tăng lên đếnmức đỉnh của những đợt tăng giá trước đó thì xu thế cấp 1 của thị trường lúc này làgiảm giá Thông thường, về lý thuyết thì xu thế cấp 1 chỉ là một trong 3 loại xu thế màmột nhà đầu tư dài hạn quan tâm Mục đích của nhà đầu tư đó là mua chứng khoán

Ngày đăng: 21/05/2015, 08:13

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] PGS. TS. Đỗ Phúc, Bài giảng cao học “Hệ hỗ trợ quyết định”, Lưu hành nội bộ, 2014 Sách, tạp chí
Tiêu đề: Bài giảng cao học “Hệ hỗ trợ quyết định”
[2] GS. TSKH. Hoàng Kiếm, Bài giảng cao học “Cơ sở tri thức và ứng dụng”, Lưu hành nội bộ, 2013 Sách, tạp chí
Tiêu đề: Bài giảng cao học “Cơ sở tri thức và ứng dụng”
[3] Nhiều tác giả, Bài thu hoạch môn “Khai phá dữ liệu và Nhà kho dữ liệu” của các lớp cao học trường Đại học Công nghệ Thông tin ĐHQG Tp.HCM khóa 6 và 7, Lưu hành nội bộ, 2011 – 2012 Sách, tạp chí
Tiêu đề: Bài thu hoạch môn “Khai phá dữ liệu và Nhà kho dữ liệu” của cáclớp cao học trường Đại học Công nghệ Thông tin ĐHQG Tp.HCM khóa 6 và 7
[4] Website tìm kiếm thông tin: www.google.com.vn Link
[5] Website bách khoa toàn thư mở: www.vi.wikipedia.org/wiki Khác

HÌNH ẢNH LIÊN QUAN

Bảng 1: Ví dụ về thống kê chứng khoán - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Bảng 1 Ví dụ về thống kê chứng khoán (Trang 19)
Hình 1: Biểu đồ kỹ thuật chứng khoán trong thực tế - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 1 Biểu đồ kỹ thuật chứng khoán trong thực tế (Trang 20)
Hình 2: Phân kỳ dương - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 2 Phân kỳ dương (Trang 21)
Hình 3: Biểu đồ giúp nhận biết các dấu hiệu đảo chiều - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 3 Biểu đồ giúp nhận biết các dấu hiệu đảo chiều (Trang 23)
Hình 4: Chỉ số bình quân bên dưới chỉ ra thị trường đi lên và đi xuống - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 4 Chỉ số bình quân bên dưới chỉ ra thị trường đi lên và đi xuống (Trang 29)
Hình 5: Dấu hiệu đảo chiều trong thực tế - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 5 Dấu hiệu đảo chiều trong thực tế (Trang 30)
Hình 6: Mô hình đoán nhận nhiệt độ - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 6 Mô hình đoán nhận nhiệt độ (Trang 35)
Hình 7: Cấu trúc và qui trình hoat động của mô hình. - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 7 Cấu trúc và qui trình hoat động của mô hình (Trang 36)
Hình 9: Mô hình minh họa biến ngôn ngữ trong việc đoán nhận nhiệt độ - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 9 Mô hình minh họa biến ngôn ngữ trong việc đoán nhận nhiệt độ (Trang 37)
Bảng 3: Mô tả hoạt động của máy sưởi - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Bảng 3 Mô tả hoạt động của máy sưởi (Trang 39)
Hình 10: Quy trình hoạt động của hệ Logic mờ - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 10 Quy trình hoạt động của hệ Logic mờ (Trang 39)
Hình 13: Cách xác định xem giá lên hay xuống trong mô hình - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
Hình 13 Cách xác định xem giá lên hay xuống trong mô hình (Trang 43)
Đồ thị từ chỉ số 2 đến chỉ số 10 ta thấy B > A nên kết luận trong trường hợp này đồ thị đang lên. - Tiểu luận môn hệ hỗ trợ quyết định Ứng dụng logic mờ khai phá dữ liệu trong phân tích kỹ thuật
th ị từ chỉ số 2 đến chỉ số 10 ta thấy B > A nên kết luận trong trường hợp này đồ thị đang lên (Trang 44)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w