1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại

137 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Hệ Thống Trí Tuệ Kinh Doanh Cho Doanh Nghiệp Áp Dụng Vào Công Ty Sản Xuất
Tác giả Nguyễn Ngọc Phát, Cao Nguyệt Minh
Người hướng dẫn PGS. TS. Trần Minh Quang, THS. Nguyễn Thị Ái Thảo
Trường học Đại Học Bách Khoa - Đại Học Quốc Gia TP.HCM
Chuyên ngành Khoa Học Máy Tính
Thể loại Luận Văn
Năm xuất bản 2021
Thành phố TP. HCM
Định dạng
Số trang 137
Dung lượng 3,79 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

‚ Tìm hi吋u v隠 các công ngh羽 trí tu羽 nhân t衣o, khai phá d英 li羽u 8吋 phân tích d詠 báo, tr違i nghi羽m khách hàng ho員c áp d映ng t嘘k"逢w"jq "u違n xu医t, qu違n lý v壱v"v逢È ‚ Hi羽n th詠c h羽 th嘘ng e挨"ej院 E

Trang 1

VT姶云PI"A萎I H窺C BÁCH KHOA

LU 一P"X;P"V渦T NGHI烏R"A萎I H窺C

Trang 2

2

Trang 3

3

Trang 4

4

Trang 5

5

N云K"ECO"AQCP

Chúng tôi zkp"eco"8qcp"8¤{"n "e»pi"vt·pj"pijk‒p"e泳u c栄a riêng chúng tôi f逢噂i s詠

ik o"u v"x "j逢噂ng d磯n c栄a PGS TS Tr亥n Minh Quang N瓜i dung nghiên c泳u và các k院t

qu違 8隠u là trung th詠e"x "ej逢c"v瑛pi"8逢嬰c công b嘘 vt逢噂e"8¤{0"E e"u嘘 li羽w"8逢嬰c s穎 d映ng cho quá trình phân tích, nh壱p"zfiv"8逢嬰c chính chúng tôi thu th壱p t瑛 nhi隠u ngu欝n khác nhau

x "8逢嬰c ghi rõ trong ph亥n tài li羽u tham kh違o

Ngoài ra, chúng tôi e pi"e„"u穎 d映ng m瓜t s嘘 nh壱p"zfiv."8 pj"ik "x "u嘘 li羽u c栄a các tác gi違 mj e."e挨"swcp"v鰻 ch泳c khác T医t c違 8隠u có trích d磯n và chú thích ngu欝n g嘘c

N院u phát hi羽n có b医t kì s詠 gian l壱n nào, chúng tôi xin hoàn toàn ch鵜u trách nhi羽m

v隠 n瓜i dung Lu壱p"x<p"v嘘t nghi羽r"A衣i h丑c c栄c"o·pj."A衣i h丑c Bách Khoa - A衣i h丑c Qu嘘c Gia TPHCM mj»pi"nk‒p"swcp"8院n nh英ng vi ph衣m tác quy隠n, b違n quy隠n do chúng tôi gây

ra trong quá trình th詠c hi羽n

TP H欝 Chí Minh, Ngày 26 tháng 07 p<o"4243

Trang 6

6

N云K"E謂O"愛P

Qua th運i gian h丑c t壱p và rèn luy羽n t衣i Tt逢運pi"A衣i h丑c Bách Khoa - A衣i h丑c Qu嘘c Gia TP HCM, chúng tôi 8逢嬰c s詠 ch雨 b違o và gi違ng d衣y nhi羽t tình c栄a quý th亥{"e»."8員c

bi羽t là quý th亥y cô khoa Khoa h丑e"x "M "vjw壱v"O {"v pj"8«"vtw{隠p"8衣t cho nh英ng ki院n

th泳c v隠 lý thuy院t và th詠c hành trong su嘘t th運i gian h丑c t壱p 荏 vt逢運ng

Chúng tôi v噂i m丑i s詠 n厩 l詠c c栄a b違p"vj¤p"8«"jq p"vj pj"Lu壱p"x<p"v嘘t nghi羽p c栄a mình Chúng tôi zkp"ej¤p"vj pj"e o"挨p"sw#"vj亥{"e»"vt逢運pi"A衣i h丑c Bách Khoa - AJSI"VR0"JEO."8«"vtw{隠p"8衣t cho chúng tôi nh英ng ki院n th泳c b鰻 ích trong th運i gian qua Chúng tôi t臼 lòng bi院v"挨p"u¤w"u逸e"8院n PGS.TS Tr亥p"Okpj"Swcpi"8«"j逢噂ng d磯n và h厩 tr嬰 t壱n tình chúng tôi trong quá trình nghiên c泳u

Trong quá trình làm lu壱p"x<p, do ki院n th泳c còn h衣n h姻p, chúng tôi không tránh

kh臼i có nh英ng thi院u sót trong cách trình bày và di宇p"8衣t, và nh英ng công vi羽c yêu c亥u ej逢c"jq p"vj pj Chúng tôi r医t mong nh壱p"8逢嬰c s詠 8„pi"i„r"#"mk院n c栄a quý th亥y cô 8吋 báo cáo lu壱p"x<p"v嘘t nghi羽r"8衣v"8逢嬰c k院t qu違 t嘘t nh医t

Cu嘘i cùng, chúng tôi kính chúc các quý th亥y cô d欝i dào s泳c kho飲, thành công trên eqp"8逢運ng phát tri吋n s詠 nghi羽p giáo d映c 8亥{"#"pij c và cao quý

Trang 7

7

VïO"V溢V"A陰"VÉK

Ngày nay, vi羽c áp d映ng công ngh羽 vj»pi"vkp"x q"ncq"8瓜ng và s違n xu医t 8«"vt荏 thành zw"j逢噂ng và h亥u h院t các doanh nghi羽p b逸v"8亥u chuy吋p"8鰻i t医t c違 các b違n ghi trên gi医y sang các t羽p máy tính k悦 thu壱t s嘘 Qua th運i gian, doanh nghi羽p xu医t hi羽n nhu c亥u c医p thi院t là làm sao phân tích t瑛 kho d英 li羽u kh鰻ng l欝 8„"8吋 xem xét."8 pj"iká l衣i m丑i th泳 h丑 8«"làm, t瑛 h羽 th嘘ng n瓜i b瓜 8院p"v逢挨pi"v e"e栄a khách hàng T瑛 8„."fqcpj"pijk羽p có th吋 vjc{"8鰻i quy trình c栄a mình theo cách cho phép ra quy院v"8鵜nh t嘘v"j挨p."jk羽u qu違 j挨p."nâng cao tr違i nghi羽m khách hàng v噂i nhi隠w"v pj"e "pj¤p"j„c"j挨p"p英a

Nhóm 8«"ch丑n 8隠 tài "XÂY D衛NG H烏 TH渦NG TRÍ TU烏 KINH DOANH

CHO DOANH NGHI 烏P ÁP D影NG VÀO CÔNG TY S謂N XU遺T HO咽E"VJ姶愛PI"

M 萎I" v噂i s詠 j逢噂ng d磯n c栄a th亥y PGS TS Tr亥n Minh Quang làm lu壱p"x<p"v嘘t nghi羽p

A衣i h丑c 8吋 gi違i quy院t nh英pi"mj„"mj<p."pjw"e亥u c栄a doanh nghi羽p A隠 tài nghiên c泳u và phát tri吋n 泳ng d映ng h厩 tr嬰 doanh nghi羽p xây d詠ng kho d英 li羽u (Data Warehouse) và trí

tu羽 kinh doanh (Business Intelligence) H羽 th嘘pi"p {"8逢嬰c kì v丑ng là có kh違 p<pi"j厩 tr嬰 các doanh nghi羽p qu違n lý ngu欝n d英 li羽w"x "8逢c"tc"pj英ng l運k"mjw{‒p"8吋 doanh nghi羽r"8逢c"

ra nh英ng quy院v"8鵜nh mang tính quy院v"8鵜nh."8逢c"tc"pj英ng tr違i nghi羽m t嘘t nh医t cho khách hàng H羽 th嘘ng có th吋 tùy ch雨nh phù h嬰p cho nhi隠u doanh nghi羽p v噂i tr丑ng tâm là doanh nghi羽p s違n xu医t và doanh nghi羽r"vj逢挨pi"o衣i

Vtqpi"8隠 tài lu壱n x<p, nhóm tác gi違 tìm hi吋u v隠 kho d英 li羽u, quá trình trích xu医t,

bi院p"8鰻i d英 li羽u và tr詠c quan hoá d英 li羽u trong trí tu羽 mkpj"fqcpj."8隠 xu医v"rj逢挨pi"rj r"xây d詠ng kho d英 li羽w."e挨"ej院 ETL và công c映 phân tích d英 li羽u, hi羽n th詠e"rj逢挨pi"rj r"8隠 xu医t Ucw"8„."phóm xây d詠ng nh英ng quy trình chung và t鰻ng quan nh医t mà các doanh nghi羽p s違n xu医t và doanh nghi羽r"vj逢挨pi"o衣i mong mu嘘n khi xây d詠ng và s穎 d映ng m瓜t

h羽 th嘘ng kho d英 li羽u Nh英ng quy trình này 8逢嬰c nhóm tác gi違 trích xu医t t瑛 các nghiên

c泳u c栄a nhóm v隠 doanh nghi羽r"vj逢挨pi"o衣i và s違n xu医t Cu嘘i cùng, các quy trình mà nhóm tác gi違 s胤 t壱p trung phát tri吋n bao g欝m quy trình bán hàng (Sales), Nh壱p hàng (Procurement), Kho n逢w"vt英 hàng hoá (Product Inventory) và qu違n lý quan h羽 khách hàng

(Customer Relationship Management)

Trang 8

8

O影E"N影E

L云I ECO"AQCP 2

L云I C謂O"愛P 6

TÓM T溢V"A陰 TÀI 7

M影C L影C 8

DANH M影C HÌNH 12

DANH M影C B謂NG 14

DANH M影C THU一T NG頴 - T洩 VI蔭T T溢T 15

EJ姶愛PI"3<"IK閏I THI烏U 16

GI閏I THI烏U A陰 TÀI 16

M影E"VKçW"A陰 TÀI 16

GI閏I H萎P"A陰 TÀI 17

C遺U TRÚC LU一P"X;P 18

EJ姶愛PI"4<"E愛"U雲 LÝ THUY蔭T VÀ CÁC NGHIÊN C永U LIÊN QUAN 19

A渦K"V姶営NG DOANH NGHI烏P 19

2.1.1 DOANH NGHI烏R"VJ姶愛PI"O萎I 19

2.1.2 DOANH NGHI烏P S謂N XU遺T 20

KHO D頴 LI烏U (DATA WAREHOUSE) 20

40403"A卯PJ"PIJ C 20

2.2.2 CÁCH XÂY D衛NG KHO D頴 LI烏U 20

2.2.3 CÁCH TI蔭P C一N KIMBALL (BOTTOM-UP) 21

40406"AèPJ"IKè"EJWPI"X陰 CÁCH TI蔭P C一N C曳A KIMBALL 22

CÁC KHÁI NI烏M TRONG MÔ HÌNH CHI陰U D頴 LI烏U 22

40503"RJ姶愛PI"RJèR"VJK蔭T K蔭 MÔ HÌNH CHI陰U D頴 LI烏U 22

2.3.2 B謂NG S衛 TH一T (FACT) 23

2.3.3 B謂NG CHI陰U (DIMENSION) 23

2.3.4 BUS MATRIX 23

2.3.5 SCD (SLOWLY CHANGE DIMENSION) 23

2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA) 25

TRÍ TU烏 KINH DOANH 25

40603"A卯PJ"PIJ C 25

2.4.2 TRÍ TU烏 KINH DOANH K蔭T H営P V閏I KHAI PHÁ D頴 LI烏W"XÉ"M "VJW一T H窺C MÁY 26

ETL PIPELINE (EXTRACT Î TRANSFORM - LOAD) 27

2.5.1 KHÁI NI烏M 27

2.5.2 THÀNH PH井N CHÍNH TRONG TI蔭N TRÌNH ETL 27

Trang 9

9

S渦 LI烏U HOÁ (DIGITIZATION) 28

2.6.3"A卯PJ"PIJ C 28

2.6.2 S渦 LI烏U HOÁ (DIGITIZATION) VÀ S渦 HOÁ (DIGITALIZATION) 28

NH一N D萎NG KÝ T衛 QUANG H窺C (OCR) 29

2.7.1 KHÁI NI烏M 29

40904"A窺E"JQè"A愛P"BÁN HÀNG B稲NG CÔNG NGH烏 OCR 29

CÁC NGHIÊN C永U, S謂N PH域M LIÊN QUAN 31

2.8.1 CÁC NGHIÊN C永U 31

2.8.2 CÁC S謂N PH域M 32

EJ姶愛PI"5<"RJåP"VëEJ"XÉ"VJK蔭T K蔭 H烏 TH渦NG 33

V遺P"A陰 C井N GI謂I QUY蔭T 33

MJï"MJ;P 33

GI謂I PHÁP 34

PHÂN TÍCH H烏 TH渦NG 34

3.4.1 YÊU C井U CH永E"P;PI 34

3.4.2 YÊU C井U PHI CH永E"P;PI 35

50605"U愛"A唄 UML VÀ MÔ T謂 CH永E"P;PI"J烏 TH渦PI"A陰 XU遺T 36

KI蔭N TRÚC H烏 TH渦NG 40

THI蔭T K蔭 KHO D頴 LI烏U 42

50803"DWU"OCVTKZ"A陰 XU遺T 42

50804"EèE"HCEV"OQFGN"A陰 XU遺T 42

THI蔭T K蔭 E愛"EJ蔭 ETL 49

3.7.1 KI蔭N TRÚC 49

3.7.2 PHÂN TÍCH CH永E"P;PI"E愛"EJ蔭 ETL 51

50905"VJC["A蔚I C遺U TRÚC B謂NG HI烏N CÓ 54

50906"E愛"EJ蔭 A卯NH TH云I 57

CÔNG C影 PHÂN TÍCH D頴 LI烏U 58

3.8.1 NH頴PI"N PJ"X衛C C井N PHÂN TÍCH 58

3.8.2 PHÂN TÍCH YÊU C井U CHUNG C曳C"PI姶云I QU謂N LÝ 58

3.8.3 永NG D影NG MÔ HÌNH TRÍ TU烏 NHÂN T萎O 62

3.8.4 CÔNG C影 TR衛C QUAN HOÁ D頴 LI烏U 63

A域Y M萎NH KH謂 P;PI"U渦 LI烏U HOÁ VÀ THU TH一P THÔNG TIN 64

50;03"MJï"MJ;P"E曳A DOANH NGHI烏P TRONG QUÁ TRÌNH S渦 HOÁ 64

50;04"RJ姶愛PI"RJèR"U渦 HOÀ D頴 LI烏U B稲NG CÔNG NGH烏 OCR 65

EJ姶愛PI"6<"JK烏N TH衛C H烏 TH渦NG 67

XÂY D衛NG KHO D頴 LI烏U 67

Trang 10

10

4.1.1 CÁC LO萎I MÔ HÌNH D頴 LI烏W"A井U VÀO 67

4.1.2 M渦I QUAN H烏 (RELATIONSHIPS) 68

60305"V姶愛PI"VèE"X閏I CÁC B謂NG TRONG MÔ HÌNH CHI陰U 68

4.1.4 CÁC THU浦C TÍNH C曳A B謂NG TRONG MÔ HÌNH CHI陰U 69

HI烏N TH衛E"E愛"EJ蔭 ETL 70

4.2.1 TRÍCH XU遺T D頴 LI烏U (EXTRACT DATA, DATA INGESTION) 70

4.2.2 CÁC PHÉP BI蔭P"A蔚I D頴 LI烏U (DATA TRANSFORM) 72

4.2.3 T謂I D頴 LI烏U VÀO KHO D頴 LI烏U (LOAD DATA) 76

60406"E愛"EJ蔭 A卯NH TH云I 77

CÔNG C影 PHÂN TÍCH D頴 LI烏U 78

4.3.1 MÔ HÌNH AI PHÂN TÍCH PHÂN KHÚC KHÁCH HÀNG 78

4.3.2 TR衛C QUAN HOÁ D頴 LI烏U 78

4.3.3 PHÂN TÍCH D頴 LI烏U B稲NG CÁC CÔNG C影 BÊN TH永 BA 80

RJ姶愛PI"RJèR"U渦 HOÁ B稲NG CÔNG NGH烏 OCR 81

EJ姶愛PI"7<"V蔚NG K蔭T VÀ CÔNG VI烏E"VTQPI"V姶愛PI"NCK 87

K蔭T QU謂 A萎V"A姶営C 87

姶W"XÉ"PJ姶営E"AK韻O"RJ姶愛PI"RJèR"A陰 XU遺T 87

70403"姶W"AK韻M 87

5.2.2 H萎N CH蔭 88

5.2.3 GI謂I PHÁP C謂I TI蔭N 88

J姶閏NG M雲 R浦PI"V姶愛PI"NCK 89

AèNH GIÁ 89

70603"AèPJ"IKè"VTçP"[çW"E井W"PI姶云I DÙNG 89

70604"AèPJ"IKè"JK烏U XU遺T T謂I TRANG GIAO DI烏P"PI姶云I DÙNG 91

70605"AèPJ"IKè"VJ云I GIAN TH衛C HI烏N ETL CHO CÁC FACT MODEL 92

70606"AèPJ"IKè"X陰 CHI PHÍ 94

70607"AèPJ"IKè"EJK"RJë"VTQPI"VT姶云NG H営P C影 TH韻 97

TÀI LI 烏U THAM KH謂O 100

EJ姶愛PI"8<"RJ影 L影C 104

LÝ THUY蔭T LIÊN QUAN 104

6.1.1 KHÁI NI烏M DATA WAREHOUSE THEO INMON (TOP-DOWN) 104

80304"AèPJ"IKè"EJWPI"X陰 2 CÁCH TI蔭P C一N XÂY D衛NG KHO D頴 LI烏U 104

MÔ T謂 CÁC B謂NG CHI陰U DÙNG CHUNG 106

6.2.1 DATE DIMENSION 106

6.2.2 PRODUCT DIMENSION 106

6.2.3 STORE DIMENSION 107

Trang 11

11

6.2.4 WAREHOUSE DIMENSION 107

6.2.5 CUSTOMER DIMENSION 108

6.2.6 PROMOTION DIMENSION 108

6.2.7 PAYMENT METHOD DIMENSION 109

6.2.8 INVENTORY TRANSACTION TYPE DIMENSION 109

6.2.9 CONTRACT TERM DIMENSION 109

6.2.10 VENDOR DIMENSION 109

6.2.11 PROCUREMENT DIMENSION 110

6.2.12 RESELLER DIMENSION 110

6.2.13 SHIP METHOD DIMENSION 110

6.2.14 MARKET DIMENSION 111

PHI蔭U KH謂Q"UèV"AèPJ"IKè"[çW"E井U C曳A NHÀ QU謂N LÝ 111

CÔNG NGH烏 S盈 D影NG 113

6.4.1 NGÔN NG頴 L一P TRÌNH 113

6.4.2 N陰N T謂PI"XÉ"VJ姶"XK烏N S盈 D影NG 114

6.4.3 GOOGLE CLOUD PLATFORM 114

J姶閏NG D郁P"EÉK"A咽T H烏 TH渦NG 115

6.5.1 YÊU C井U V陰 PH井N C永NG 115

6.5.2 MÔK"VT姶云PI"EÉK"A咽T H烏 TH渦NG 115

80705"EÉK"A咽T H烏 TH渦NG 115

J姶閏NG D郁N S盈 D影NG 118

6.6.1 K蔭T N渦K"E愛"U雲 D頴 LI烏U DOANH NGHI烏P 118

6.6.2 T萎O KHO D頴 LI烏U 119

6.6.3 THÊM NGU唄N D頴 LI烏U (DATA SOURCE) 119

6.6.4 T萎O DATAMART 120

6.6.5 T萎O FACT-MODEL 122

6.6.6 THÊM / XOÁ B謂NG S衛 TH一T 124

6.6.7 THÊM / XOÁ B謂NG B謂NG CHI陰U 126

6.6.8 THÊM / XOÁ M浦V"VT姶云NG TRONG B謂NG 129

6.6.9 C遺W"JîPJ"E愛"EJ蔭 ETL CHO B謂NG 129

6.6.10 TÁC V影 CRUD LIÊN K蔭T GI頴A CÁC B謂NG TRONG NGU唄N D頴 LI烏U129 6.6.11 TÁC V影 CRUD LIÊN K蔭T GI頴A CÁC B謂NG TRONG FACT-MODEL 130

6.6.12 C遺W"JîPJ"E愛"EJ蔭 A卯NH TH云I ETL 131

6.6.13 THÊM / XOÁ M浦T BI韻W"A唄."A唄 TH卯 132

6.6.14 CH迂NH S盈A M浦T BI韻W"A唄."A唄 TH卯 134

6.6.15 CH迂NH S盈C"EÉK"A咽T GOOGLE CLOUD PLATFORM 135

Trang 12

12

FCPJ"O影E"JîPJ

HîNH 1: KI蔭N TRÚC DW/BI C曳A KIMBALL 22

HîNH 2: VÍ D影 MINH HO萎 SCD LO萎I 1 [9] 24

HîNH 3: VÍ D影 MINH HO萎 SCD LO萎I 2 [9] 24

HîNH 4: STAR SCHEMA 25

HîNH 5: CÁCH HI韻W"A愛P"IK謂N V陰 BI (JAYANTHI RANJAN 2005) [13] 26

HîNH 6: MÔ HÌNH CHUY韻P"A蔚I S渦 [17] 29

HîNH 7: CÔNG NGH烏 OCR [18] 29

HîNH 8: VÍ D影 MINH HO萎 OCR 30

HîPJ";<"QET"RKRGNKPG"E愛"D謂N [19] 30

HîNH 10: V遺P"A陰 C井N GI謂I QUY蔭T THEO T洩PI"IKCK"AQ萎N 33

HîPJ"33<"U愛"A唄 USER CASE H烏 TH渦NG 36

HîNH 12: QU謂N LÝ DATA SOURCE 37

HîNH 13: THÊM M閏I DATA SOURCE 37

HîNH 14: C一P NH一T THÔNG TIN DATA SOURCE 37

HîNH 15: TRANG QU謂N LÝ DATAWAREHOUSE 38

HîPJ"38<"VTCPI"A卯NH TH云I 38

HîNH 17: THÊM M閏K"A卯NH TH云I 39

HîNH 18: TRANG DASHBOARD 39

HîNH 19: THÊM BI韻W"A唄 M閏I 39

HîPJ"42<"U愛"A唄 KI蔭N TRÚC H烏 TH渦NG 40

HîNH 21: MÔ HÌNH GIAO TI蔭P GI頴A CÁC THÀNH PH井N TRONG H烏 TH渦NG 41

HîNH 22: BUS MATRIX CHO QUY TRÌNH DOANH NGHI烏P 42

HîNH 23: RETAIL SALES FACT MODEL 43

HîNH 24: RESELLER SALES FACT MODEL 44

HîNH 25: WAREHOUSE INVENTORY TRANSACTION FACT MODEL 45

HîNH 26: STORE INVENTORY SNAPSHOT FACT MODEL 46

HîNH 27: PROCUREMENT TRANSACTION FACT MODEL 46

HîNH 28: VENDOR PERFORMANCE FACT MODEL 47

HîNH 29: PROFITABILITY CM FACT MODEL 49

HîPJ"52<"E愛"EJ蔭 ETL T蔚NG QUAN 50

HîPJ"53<"E愛"EJ蔭 ETL CHI TI蔭T 51

HîNH 32: C遺U TRÚC B謂NG BATCH EXTRACT JOB 52

HîNH 33: QUÁ TRÌNH BI蔭P"A蔚I B謂NG CHI陰U TRÊN DATAFLOW 53

Trang 13

13

HỵNH 34: B謂PI"AëEJ"VT姶閏C KHI T謂K"V;PI"VK蔭N 54

HỵNH 35: B謂NG T萎O"FơPI"A韻 T謂K"V;PI"VK蔭N 54

HỵNH 36: SAU KHI T謂K"V;PI"VK蔭N SCD1 54

HỵNH 37: SAU KHI T謂K"V;PI"VK蔭N SCD2 54

HỵPJ"5:<""QET"RKRGNKPG"E愛"D謂N [19] 65

HỵNH 39: AIRFLOW DAGS CHO CÁC FACTMODEL 77

HỵNH 40: LU唄NG TH衛C THI C曳A MƠ HÌNH PHÂN KHÚC KHÁCH HÀNG 78

HỵNH 41: C遺U HÌNH M浦T BI韻W"A唄 1"A唄 TH卯 79

HỵNH 42: MEASURE EDIT 80

HỵNH 43: DIMENSION EDIT 80

HỵNH 44: MƠ HÌNH TRÍCH XU遺T D頴 LI烏U ÁP D影NG CƠNG NGH烏 OCR 81

HỵNH 45 謂PJ"A井U VÀO CHO QUÁ TRÌNH OCR 82

HỵNH 46: THÊM BOX CHO 謂NH 83

HỵNH 47: L窺C VÀ S溢P X蔭P L萎I K蔭T QU謂 T洩 TEXT RECOGNITION 84

HỵNH 48: T一P TIN THI蔭T L一P CHO QUÁ TRÌNH TRÍCH XU遺V"JQè"A愛P 85

HỵNH 49: K蔭T QU謂 TRÍCH XU遺V"JQè"A愛P"D稲NG CƠNG NGH烏 OCR 86

HỵNH 50: M永C D頴 LI烏U TRONG KI蔭N TRÚC INMON 105

HỵNH 51: KI蔭N TRÚC DW/BI C曳A INMON 105

HỵNH 52: DATE DIMENSION 106

HỵNH 53: PRODUCT DIMENSION 107

HỵNH 54: STORE DIMENSION 107

HỵNH 55: WAREHOUSE DIMENSION 108

HỵNH 56: CUSTOMER DIMENSION 108

HỵNH 57: PROMOTION DIMENSION 109

HỵNH 58: PAYMENT METHOD DIMENSION 109

HỵNH 59: CONTRACT TERM DIMENSION 109

HỵNH 60: VENDOR DIMENSION 110

HỵNH 61: PROCUREMENT TRANSACTION TYPE DIMENSION 110

HỵNH 62: RESELLER DIMENSION 110

HỵNH 63: SHIP METHOD DIMENSION 110

HỵNH 64: MARKET DIMENSION 111

Trang 14

14

FCPJ"O影E"D謂PI

B謂NG 1: T蔚NG QUÁT V陰 CÁC LO萎I SCD (KIMBALL 2002) [10] 24

B謂NG 2: M永C D頴 LI烏U C曳A CÁC B謂NG FACTS 43

B謂NG 3: KH謂O SÁT NHU C井U BÁO CÁO V陰 NGHI烏P V影 BÁN HÀNG 59

B謂NG 4: KH謂O SÁT NHU C井U BÁO CÁO V陰 NGHI烏P V影 MUA HÀNG 60

B謂NG 5: KH謂O SÁT NHU C井U V陰 NGHI烏P V影 N姶W"MJQ"JÉPI"JQè 60

B謂NG 6: KH謂O SÁT NHU C井U V陰 NGHI烏P V影 CRM 61

B謂NG 7: KI韻U D頴 LI烏W"SW["A卯NH TRONG VIÊC BI蔭P"A蔚I D頴 LI烏U 73

B謂NG 8: HÀM T蔚NG QUÁT 74

B謂NG 9: HÀM TOÁN H窺C 74

B謂NG 10: HÀM X盈 LÝ CHU姥I 74

B謂NG 11: HÀM X盈 LÝ TH云I GIAN 74

B謂PI"34<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 BÁN HÀNG 89

B謂PI"35<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 MUA HÀNG 90

B謂PI"36<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 N姶W"MJQ"JÉPI"JQè 90

B謂PI"37<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 CRM 90

B謂NG 16: K蔭T QU謂 T謂I TRANG GIAO DI烏P"PI姶云I DÙNG 91

B謂NG 17<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_SALES 93

B謂PI"3:<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_VENDORRATING 93

B謂NG 19<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_INVENTROY_PRODUCT 93

B謂NG 20<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_PROCUREMENTTRANSACTION93 B謂PI"43<"AèPJ"IKÁ TH云I GIAN TH衛C THI FM_SALES BRAZIL OLIST 94

B謂NG 22: T蔚NG H営P CHI PHÍ CHO 1 L井N CH萎["N姶W"VT頴 TRONG 1 THÁNG 99

B謂NG 23: PHI蔭U KH謂O SÁT NGHI烏P V影 BÁN HÀNG 111

B謂NG 24: PHI蔭U KH謂O SÁT NGHI烏P V影 NH一P HÀNG 111

B謂NG 25: PHI蔭U KH謂O SÁT NGHI烏P V影 QU謂N LÝ KHO 112

B謂NG 26: PHI蔭U KH謂O SÁT NGHI烏P V影 QU謂N LÝ QUAN H烏 KHÁCH HÀNG 112

Trang 15

DB Database

DD Degenerate Dimension

DM Data Mart

DW Data Warehouse ETL Extract, Transform, Load ERM Entity-Relationship Model

FK Foreign Key GCP Google Cloud Platform IDC International Data Corporation OCR Optical Character Recognition OLAP Online Analytical Processing

UDF User Defined Function UML Unified Modeling Language

PK Primary Key SQL Structured Query Language

Trang 16

16

EJ姶愛PI"3< GI 閏I THI烏U

Vtqpi"ej逢挨pi"p {."v e"ik違 gi噂i thi羽w"8隠 tài, m映c tiêu và n瓜k"fwpi"8隠 tài, gi噂i h衣n 8隠 v k."e pi"pj逢"e医u trúc lu壱p"x<p0

GI 閏I THI烏W"A陰 TÀI

Trong kh違q"u v"p<o"423:"e栄a IDC, chuy吋p"8鰻i s嘘 *Fkikvcn"Vtcpuhqtocvkqp+"8cpi"

tr荏 thành chi院p"n逢嬰c t衣i các doanh nghi羽p, t鰻 ch泳c c栄a cu瓜c cách m衣ng công nghi羽p l亥n

th泳 v逢0"Nh運 h羽 th嘘ng báo cáo thông su嘘t k鵜p th運i, chuy吋p"8鰻i s嘘 mang l衣i nhi隠u l嬰i íchpj逢"e逸t

gi違m chi phí v壱n hành, ti院p c壱p"8逢嬰c nhi隠w"rj¤p"mj¿e"mj ej"j pi."ik¿r"n«pj"8衣o ra quy院t 8鵜nh nhanh chóng và chính xác j挨p0 [1]

Trong quá trình phát tri吋n, các công ty v隠 vj逢挨pi"o衣i và s違n xu医t quan sát th医y 8逢嬰c các d英 li羽w"n逢w"vt英 c栄a công ty ngày m瓜t l噂n d亥n, (m丑i thông tin d英 li羽u t瑛 vi羽c

nh壱p/xu医t hàng, s嘘 giao d鵜ch, thông tin s違n ph育m, nhân s詠, thông tin khách hàng, È)

Nh英ng d英 li羽u này 8隠w"8逢嬰e"n逢w"vt英 trên n隠n t違ng công ngh羽 pj逢"e e"v壱p tin th嘘ng kê Gzegn"x "e挨"u荏 d英 li羽w"pj逢pi d英 li羽u thu th壱p ej逢c"8逢嬰c khai thác giá tr鵜 tri羽v"8吋 Công

ty ch雨 8丑c d英 li羽u cho các ho衣v"8瓜ng có tính chu k pj逢"xk院v"d q"e q."vjcpj"vq p"jq "8挨p."

c壱p nh壱t thông tin s違n ph育o."mj ej"j piÈ" D英 li羽w"8逢嬰e"n逢w"vt英 l衣k"pj逢"o瓜v"rj逢挨pi"

ti羽p"ijk"ejfir"8挨p"vjw亥n và không mang l衣i l嬰i ích th壱t s詠 cho công ty

Tuy nhiên, d英 li羽u là m瓜v"e挨"u荏 8 pi"vkp"e壱{"8吋 8逢c"tc"e e"ik違 8鵜nh, nh壱n xét và t瑛 8„"8逢c"tc"sw{院v"8鵜nh chi院p"n逢嬰c cho công ty Vi羽c khai thác d英 li羽w"8go"n衣i cho công ty nhi隠u l嬰k" ej"pj逢"dk院v"8逢嬰c xu th院 c栄a pi逢運i dùng, gi違i quy院t v医p"8隠 khi xu医t hi羽n s詠

ch壱m tr宇 trong khâu phân ph嘘k."e„"8逢嬰c l嬰i th院 c衣nh tranh trên th鵜 vt逢運ng nh運 vi羽e"8逢c"tc"8逢嬰c quy院v"8鵜nh nhanh chóng, c違i thi羽n quy trình ho衣v"8瓜ng công ty hi羽u qu違 j挨pÈ"

V噂i m瓜t th鵜 vt逢運pi"u»k"8瓜ng, r瓜ng l噂n pj逢"jk羽n nay, vi羽e"8逢c"tc"8逢嬰c quy院v"8鵜nh nhanh chóng và chính xác có th吋 8go"n衣i cho công ty l嬰i th院 x逢嬰t tr瓜k"j挨p"e e"8嘘i th栄 khác

Nh壱n th泳e"8逢嬰c nhu c亥w"p {."8隠 tài xây d詠ng h羽 th嘘ng Trí tu羽 kinh doanh và kho

d英 li羽u doanh nghi羽p 8逢嬰c phát tri吋n v噂i m映e"8 ej"pj茨m cung c医r"o»k"vt逢運ng làm vi羽c cho nhà phân tích d英 li羽u Trí tu羽 kinh doanh có th吋 cung c医p cho nhà phân tích cách nhìn

t鰻ng quan v隠 d英 li羽w"o "e»pi"v{"8cpi"e„"8欝ng th運i h厩 tr嬰 pj "rj¤p"v ej"8逢c"tc"sw{院v"8鵜nh chính xác và k鵜p th運i thông qua các công c映 xây d詠ng và phân tích d英 li羽u

M 影E"VKçW"A陰 TÀI

N瓜k"fwpi"8隠 tài bao g欝m các m映e"vk‒w"ucw"8¤{<

‚ Tìm hi吋u, nghiên c泳u v隠 kho d英 li羽u (Data Warehouse), trí tu羽 kinh doanh (Business Intelligence)

Trang 17

‚ Tìm hi吋u v隠 các công ngh羽 trí tu羽 nhân t衣o, khai phá d英 li羽u 8吋 phân tích d詠 báo,

tr違i nghi羽m khách hàng ho員c áp d映ng t嘘k"逢w"jq "u違n xu医t, qu違n lý v壱v"v逢È

‚ Hi羽n th詠c h羽 th嘘ng e挨"ej院 ETL, kho d英 li羽u (Data Warehouse), trí tu羽 kinh doanh (Business Intelligence) b茨ng các công ngh羽 8« tìm hi吋w"8逢嬰c

‚ Thu th壱p các d英 li羽u mô ph臼ng cho doanh nghi羽p s違n xu医t ho員c doanh nghi羽p vj逢挨pi"o衣i

‚ Ti院n hành tích h嬰p, th詠c nghi羽m trên t壱p d英 li羽u mô ph臼pi"x "8 pj"ik "mj違 p<pi"

8 r"泳ng c栄a toàn b瓜 h羽 th嘘pi"8隠 xu医v"8嘘i v噂i t壱p d英 li羽u

GI 閏I H萎P"A陰 TÀI

Trong ph衣m vi nghiên c泳u, 8隠 v k"8逢嬰c gi噂i h衣n 荏 d逢噂c h厩 tr嬰 xây d詠ng kho d英

li羽u, có tích h嬰p s印n ch泳e"p<pi"vt "vw羽 kinh doanh bao g欝m tr詠c quan hoá d英 li羽w0"A隠 tài tìm hi吋u v隠 các khái ni羽m v隠 kho d英 li羽w."e挨"ej院 ETL, các ch泳e"p<pi"e栄a trí tu羽 kinh doanh h厩 tr嬰 phân tích d英 li羽u T瑛 8„, nhóm tác gi違 8隠 xu医t nh英ng gi違i pháp h厩 tr嬰 xây

d詠ng kho d英 li羽u d詠a trên yêu c亥u chung và t鰻ng quát nh医t c栄a các công ty s違n xu医t ho員c công ty vj逢挨pi"o衣i

Các yêu c亥u chung nh医t c栄a công ty s違n xu医t ho員e"e»pi"v{"vj逢挨pi"o衣i mà nhóm tác gi違 t壱p trung phát tri吋n trong quá trình nghiên c泳u bao g欝m 荏 các quy trình bán hàng (Sales), nh壱p hàng (Procurement), kho hàng (Product Inventory) và qu違n lý quan h羽 khách hàng (Customer Relationship Management) V噂i m厩k"sw{"vt·pj"pj逢"x壱y, nhóm tác

gi違 s胤 8隠 xu医t ít nh医t là m瓜t khuôn m磯u (Template) cho vi羽c xây d詠pi"sw{"vt·pj"v逢挨pi"泳ng H羽 th嘘ng cung c医r"e挨"ej院 ETL bao g欝m t壱p các phép bi院p"8鰻i ph鰻 bi院n mà nhóm tác gi違 tìm hi吋w"8逢嬰c trong quá trình nghiên c泳w"8隠 tài

Tích h嬰p, th穎 nghi羽o"x "8 pj"ik "kh違 p<pi"8 r"泳ng c栄a h羽 th嘘pi"8隠 xu医t Tìm

hi吋u v隠 m瓜t s嘘 k悦 thu壱t trí tu羽 nhân t衣o có tác d映ng phân tích d詠 báo Cu嘘i cùng là nghiên

c泳w"x "8隠 xu医t gi違k"rj r"8育y m衣nh kh違 p<pi"u嘘 hoá, thu th壱p d英 li羽u nh茨m ph映c v映 phân tích d詠 báo và trí tu羽 kinh doanh

X·"8隠 tài t壱p trung phát tri吋n h羽 th嘘ng trí tu羽 kinh doanh áp d映ng vào công ty vj逢挨pi"o衣i ho員c s違n xu医t, các quy trình nghi羽p v映 o "8隠 tài t壱p trung phát tri吋n ch雨 là

m瓜t ph亥n trong s嘘 các quy trình c栄a 2 lo衣i công ty nêu trên A欝ng th運k."8嘘k"v逢嬰ng doanh nghi羽p mà nhóm tác gi違 t壱p trung phát tri吋p"n "e»pi"v{"vj逢挨pi"o衣i

Trang 18

18

C 遺U TRÚC LU一P"X;P

Ej逢挨pi"3 Gi噂i thi羽u chung v隠 8隠 tài, m映c tiêu và n瓜k"fwpi"8隠 tài, gi噂i h衣p"8隠 tài

e pi"pj逢 c医u trúc lu壱p"x<p

Ej逢挨pi"4 E挨"u荏 lý thuy院t c栄a doanh nghi羽r"vj逢挨pi"o衣i và doanh nghi羽p s違n xu医t,

kho d英 li羽u (Data Warehouse), trí tu羽 kinh doanh Các khái ni羽m liên swcp"8院n vi羽c xây d詠ng, phát tri吋n kho d英 li羽u theo mô hình chi隠u d英

li羽u c栄a Kimball

Ej逢挨pi"3 Thi院t k院 h羽 th嘘ng, mô hình h羽 th嘘ng, rj逢挨pi"rj r"8隠 xu医t t瑛 các v医n

8隠 c亥n gi違i quy院t 8吋 xây d詠ng h羽 th嘘ng trí tu羽 kinh doanh cho công ty

s違n xu医t và công ty vj逢挨pi"o衣i

Ej逢挨pi"4 Hi羽n th詠c h羽 th嘘ng Vtqpi"ej逢挨pi"p {."pj„o"v e"ik違 t壱p trung nói v隠

cách th泳c hi羽n th詠c h羽 th嘘ng g欝m các ch泳e"p<pi."e»pi"f映pi"8逢嬰c h厩 tr嬰,

t壱p d英 li羽u th穎 nghi羽m, giao di羽n h羽 th嘘ng và m瓜t s嘘 k院t qu違 8衣v"8逢嬰c

Ej逢挨pi"5 T鰻ng k院t Vtqpi"ej逢挨pi"p {."pj„o"v e"ik違 8隠 c壱r"8院n k院t qu違 8衣v"8逢嬰c,

逢w"x "pj逢嬰e"8k吋m c栄a gi違i rj r"8隠 xu医t, rj逢挨pi"j逢噂ng phát tri吋n trong v逢挨pi"n衣i và m瓜t s嘘 8 pj"ik "v隠 s違n ph育m, v隠 m員t chi phí và m員t k悦 thu壱t

Ej逢挨pi"6 Ph映 l映c Ej逢挨pi"p { cung c医r"ejq"pi逢運k"8丑c các thông tin h英u ích khác,

góp ph亥n hi吋u rõ v隠 8隠 tài bao g欝m các ki院n th泳c liên quan, các công ngh羽 8逢嬰c s穎 d映ng, j逢噂ng d磯n e k"8員t và s穎 d映ng h羽 th嘘ng

Trang 19

19

EJ姶愛PI"4< E愛"U雲 LÝ THUY蔭T VÀ CÁC NGHIÊN C永U LIÊN QUAN

Trong ph衣o"xk"8隠 tài, nhóm s穎 d映pi"e e"e挨"u荏 lý thuy院v"8逢嬰e"vt·pj"d {"ucw"8¤{"8吋

n o"e挨"u荏 n隠n t違ng cho vi羽c gi違i quy院t bài toán, phân tích và thi院t k院 h羽 th嘘ng 8隠 xu医t

A渦K"V姶営NG DOANH NGHI烏P

Trong ph亥n này, nhóm s胤 rj¤p"v ej"jck"8嘘k"v逢嬰ng nghiên c泳u là doanh nghi羽p vj逢挨pi"o衣i và doanh nghi羽p s違n xu医t T瑛 8„."pj„o"v e"ik違 s胤 phân tích, thi院t k院 báo cáo ejq"pi逢運i phân tích d英 li羽u

2.1.1 DOANH NGHI 烏R"VJ姶愛PI"O萎I

2.1.1.1 A卯PJ"PIJ C

Doanh nghi羽r"vj逢挨pi"o衣i là nh英pi"8挨p"x鵜 mkpj"fqcpj"8逢嬰c thành l壱p v噂i m映c

8 ej"vj詠c hi羽n các ho衣v"8瓜pi"vtqpi"mkpj"fqcpj"vj逢挨pi"o衣i, t鰻 ch泳c mua bán hàng hóa

nh茨m mang l衣i l嬰i nhu壱n [2]

2.1.1.2 CÁC LO 萎I HÌNH DOANH NGHI烏R"VJ姶愛PI"O萎I

Doanh nghi羽r"vj逢挨pi"o衣k"8逢嬰c chia thành nh英ng lo衣i hình sau: [2]

‚ Doanh nghi羽p kinh doanh chuyên môn hóa: là doanh nghi羽r"vj逢挨pi"o衣i chuyên kinh doanh m瓜t lo衣i hàng hóa c映 th吋 có cùng công d映pi"vtqpi"8運i s嘘ng và s違n xu医t c映 th吋

‚ Doanh nghi羽p kinh doanh t鰻ng h嬰p: kinh doanh nhi隠u lo衣k"j pi"j„c"e„"8員e"8k吋m và tính

ch医t khác nhau

‚ Doanh nghi羽r"mkpj"fqcpj"8c"f衣ng hóa: kinh doanh c違 s違n xu医t và c違 kinh doanh hàng hóa và th詠c hi羽n các ho衣v"8瓜pi"vj逢挨pi"o衣i

‚ Các doanh nghi羽r"vj逢挨pi"o衣k"8逢嬰c thành l壱p và qu違n lý b荏k"e e"e挨"swcp"pj "p逢噂c

‚ Các doanh nghi羽r"vj逢挨pi"o衣k"8逢嬰c thành l壱p b荏i các cá nhân, t鰻 ch泳e"vj»pi"vj逢運ng

2.1.1.3 CH 永E"P;PI"EJëPJ"E曳A DOANH NGHI烏R"VJ姶愛PI"O萎I

Doanh nghi羽r"vj逢挨pi"o衣k"n "8挨p"x鵜 cung 泳pi."8 r"泳ng nh英ng nhu c亥u c栄c"pi逢運i tiêu dùng, khách hàng b茨ng s違n ph育o1j pi"j„c."fq"8„"h丑 c亥n ph違k"swcp"v¤o"8院n giá tr鵜 s穎 d映ng c栄a

j pi"j„c"x "ejk"rj "n逢w"vj»pi"j pi"j„c0"V瑛 8„."fqcpj"pijk羽p s胤 e„"8逢嬰c m泳c giá bán h嬰p lý mà

h丑 có th吋 ch医p nh壱p"8逢嬰c và cung c医p s嘘 n逢嬰ng phù h嬰p v噂i nhu c亥u th鵜 vt逢運ng A吋 vi羽e"n逢w"thông hàng hóa/s違n ph育o"8逢嬰c hi羽u qu違 và chuyên nghi羽p, các t鰻 ch泳c doanh nghi羽r"vj逢挨pi"m衣k"e pi"u胤 8亥w"v逢"sw "vt·pj"n逢w"vj»pi"ucq"ejq"x瑛a nhanh chóng và v瑛c"8違m b違o r茨ng nó có th吋

l医{"8逢嬰c s詠 hài lòng c栄a khách hàng [3]

Doanh nghi羽r"vj逢挨pi"o衣i s胤 th詠c hi羽n mua bán hàng hóa nh茨m k鵜p th運k"8 r"泳pi"8逢嬰c nhu c亥u c栄c"pi逢運i tiêu dùng t瑛 s嘘 n逢嬰pi"ejq"8院n ch医v"n逢嬰ng và c違 l嬰i nhu壱n mà doanh nghi羽p vjw"8逢嬰e0"Vw{"pjk‒p."8吋 th詠c hi羽p"8逢嬰c ch泳e"p<pi"p {."8k隠w"8„"eòn tùy thu瓜c vào quy mô c栄a doanh nghi羽r"vj逢挨pi"o衣i và h羽 th嘘ng m衣pi"n逢噂i (kho, tr衣m, c穎a hàng, siêu th鵜, qu亥{"j pi."8衣i lý ) c栄a t瑛ng t鰻 ch泳c

Doanh nghi羽r"vj逢挨pi"o衣i có ho衣v"8瓜ng qu違n tr鵜 v噂i m瓜t s嘘 8挨p"x鵜 nk‒p"swcp"pj逢"pj "cung c医p, b瓜 ph壱n mua hàng, nh壱r"mjq."x "8嘘i tác phân ph嘘k.000"X "8逢挨pi"pjk‒p"mj¤w"owc"j pi"

ej pj"n "mj¤w"8亥w"vk‒p"x "e pi"là khâu e挨"d違n nh医t 8嘘i v噂i b医t c泳 m瓜v"8挨p"x鵜 ho衣v"8瓜ng kinh fqcpj0"A欝ng th運k"p„"e pi"n "8k隠u ki羽p."8瓜ng l詠c duy trì và phát tri吋n t鰻 ch泳c Vi羽c bán hàng thu壱n l嬰i v瑛a là ch泳e"p<pi."v瑛a là m映c tiêu chính c栄a doanh nghi羽r"vj逢挨pi"o衣i [3]

Trang 20

2.1.2.2 A咽E"AK韻M C曳A DOANH NGHI烏P S謂N XU遺T

Doanh nghi羽p s違n xu医t có nh英pi"8員e"8k吋m sau: [5]

‚ Quy院v"8鵜nh ho衣v"8瓜ng c栄a doanh nghi羽p: d詠a trên nh英ng yêu c亥w."8 k"j臼i c栄a th鵜 vt逢運ng 8吋 8逢c"tc"pj英ng quy院v"8鵜nh trong vi羽c s違n xu医t các m員v"j pi"vk‒w"f́pi"8吋 cân b茨ng gi英a cung và c亥u trên th鵜 vt逢運ng

‚ Quy trình s違n xu医t: quá trình d詠a trên m瓜t chu厩i k院t h嬰p gi英a nguyên v壱t li羽u thô, nhân công và các trang thi院t b鵜 8吋 t衣o nên s違n ph育m

‚ Chi phí s違n xu医t: là chi phí phát sinh trong quá trình s違n xu医t hàng hóa, g欝m chi phí nhân công và nguyên v壱t li羽w"j pi"j„c"8吋 ph映c v映 cho vi羽c s違n xu医t hàng hóa

‚ Giá thành s違n ph育m: toàn b瓜 ejk"rj "8吋 hoàn thành m瓜t s嘘 n逢嬰ng hàng hóa nh医v"8鵜nh trong th運k"ikcp"sw{"8鵜nh

2.2.1 A卯PJ"PIJ C

Kho d英 li羽w"n "e e"e挨"u荏 d英 li羽w"8逢嬰c các nhà ra quy院v"8鵜nh s穎 d映pi"8吋 phân tích tình

tr衣ng và s詠 phát tri吋n trong n瓜i b瓜 công ty Kho d英 li羽u d詠c"vt‒p"n逢嬰ng d英 li羽u l噂p"8逢嬰c tích h嬰p

t瑛 nhi隠u ngu欝p"mj e"pjcw"x q"e挨"u荏 d英 li羽u d衣pi"8c"ejk隠u (Multidimensional Database) C e"e挨"

s荏 d英 li羽w"p {"8逢嬰c t嘘k"逢w"jq "pj茨m truy c壱p d英 li羽u m瓜t cách t詠 nhiên nh医t cho các nhà phân tích [6] [7] [8]

Kho d英 li羽u (Data Warehouse) là m瓜t c挨"u荏 d英 li羽u vtwpi"v¤o"8逢嬰c s穎 d映ng nh茨m th詠c hi羽n các phân tích và 8逢c"tc"e e"sw{院v"8鵜nh D英 li羽u c栄a Kho d英 li羽u 8逢嬰c t鰻ng h嬰p t瑛 nhi隠u h羽

th嘘ng giao d鵜ch (Transactional System), h羽 th嘘pi"e挨"u荏 d英 li羽u và nhi隠u ngu欝n d英 li羽u khác sau 8„"8逢嬰e"8鵜nh d衣ng, làm s衣ch, xác th詠c, t鰻ng h嬰p và t鰻 ch泳c l衣i D英 li羽u có th吋 8逢嬰e"n逢w"vt英 f逢噂i d衣ng chi ti院t nh医t, ph映c v映 cho công vi羽c phân tích và báo cáo Chuyên viên phân tích d英 li羽u (Data Analyst), k悦 u逢"f英 li羽u (Data Engineer), nhà khoa h丑c d英 li羽u (Data Scientist) truy xu医t

d英 li羽u thông qua các công c映 SQL, h羽 th嘘ng trí tu羽 kinh doanh và các 泳ng d映ng phân tích khác Kho d英 li羽u cho phép các t鰻 ch泳c có th吋 th詠c hi羽n các phân tích trên d英 li羽u kh鰻ng l欝 o "e挨"u荏

d英 li羽w"vj»pi"vj逢運ng không th詠c hi羽p"8逢嬰c v噂i hi羽u su医v"v逢挨pi"v詠

C医u trúc c栄a Kho d英 li羽u vj»pi"vj逢運ng bao g欝m ba t亥ng:

‚ T亥pi"f逢噂i: T亥pi"f逢噂i bao g欝m m瓜t máy ch栄 Kho d英 li羽u."vj逢運ng s穎 d映ng h羽 th嘘pi"e挨"

s荏 d英 li羽u quan h羽, nó thu gom d英 li羽u t瑛 nhi隠u ngu欝p"x "ucw"8„"n o"u衣ch và bi院p"8鰻i thông qua m瓜v"sw "vt·pj"8逢嬰c g丑i là Extract - Transform - Load (ETL)

‚ T亥ng gi英a: T亥ng gi英a bao g欝m m瓜t máy ch栄 QNCR"ejq"rjfir"v<pi"v嘘e"8瓜 truy v医n

‚ T亥ng trên: T亥ng trên là giao di羽p"pi逢運i dùng ho員c các công c映 d q"e q."ejq"rjfir"pi逢運i

s穎 d映ng có th吋 s穎 d映ng các phân tích ad-hoc trên d英 li羽u

2.2.2 CÁCH XÂY D 衛NG KHO D頴 LI烏U

Mjk"p„k"8院n cách xây d詠ng ki院n trúc Kho d英 li羽u, có hai cách ti院p c壱n ph鰻 bi院n hi羽n này 8„"n "e ej"vk院p c壱n theo Inmon và cách ti院p c壱n theo Kimball C違 hai cách ti院p c壱p"8隠w"8欝ng ý 荏 vi羽c Data Warehouse là m瓜t kho d英 li羽u trung tâm cho doanh nghi羽p, m映e"8 ej"ej pj"n "rj映c v映

Trang 21

21

doanh nghi羽p trong vi羽c cung c医p n瓜i dung không ch雨 cho vi羽c báo cáo mà còn ph映c v映 vi羽c cung c医p các d英 li羽u l鵜ch s穎 m瓜t cách chính xác và nhanh chóng, c違 4"8隠u s穎 d映ng e挨"ej院 ETL 8吋 t違i d英 li羽u lên kho d英 li羽u và m瓜t s嘘 8k吋m chung n鰻i b壱v"mj e"pj逢"8隠u ph映c v映 cho m映e"8 ej"yêu c亥u doanh nghi羽p (Business Requirements), khái ni羽m v隠 Fcvc"Octvu000"Ak吋m khác bi羽t chính c栄a 2 cách ti院p c壱n là cách mà d英 li羽w"8逢嬰c c医u trúc, t違k"x "n逢w"vt英 trên Kho d英 li羽u S詠 khác bi羽t này v隠 m員t ki院n trúc s胤 違pj"j逢荏ng tr詠c ti院p 8院n 8瓜 ph泳c t衣p trong mô hình d英 li羽u theo th運i gian, ngu欝n tài nguyên s穎 d映pi"8吋 duy trì và b違o trì h羽 th嘘pi."e pi"pj逢"e e"vjw瓜e"v pj"8欝ng nh医v."f逢"th瑛a c栄a d英 li羽u

Ngoài ra còn m瓜t s嘘 ki院p"vt¿e"Fcvc"Yctgjqwug"mj e"pj逢<"e ej"vk院p c壱n h厩n h嬰p (Hybrid), cách ti院p c壱n liên k院t (Federated) Ej逢挨pi"p {"pj„o"v e"ik違 t壱p trung nói v隠 cách ti院p c壱n theo j逢噂ng Kimball

2.2.3 CÁCH TI 蔭P C一N KIMBALL (BOTTOM-UP)

A鵜pj"pij c"Fcvc"Yctgjqwug"vjgq"Mkodcnn<

ÐKho d英 li羽u là m瓜t h羽 th嘘ng trích xu医t, làm s衣ch, tuân th栄 và cung c医p ngu欝n d英 li羽u vào kho d英 li羽u chi隠w."ucw"8„"j厩 tr嬰 và tri吋n khai truy v医n và phân tích cho các m映e"8 ej"tc"sw{院t 8鵜nh.Ñ (Ralph Kimball, 2004) [9]

Ralph Kimball s穎 d映ng cách ti院p c壱n Bottom-Wr"8吋 xây d詠pi"Fcvc"Yctgjqwug"pij c"n "nhi隠w"Fcvc"Octv"8逢嬰c xây d詠pi"vt逢噂c d詠a vào các yêu c亥u nghi羽p v映 c栄a doanh nghi羽p

M瓜t s嘘 khái ni羽m, thu壱t ng英 ph鰻 bi院n trong cách ti院p c壱n Kimball:

‚ Mô hình ngôi sao (Star Schema) là y院u t嘘 quan tr丑ng trong mô hình chi隠u c栄a Kimball Trong mô hình ngôi sao, b違pi"Hcev"8逢嬰c bao quanh b荏i nhi隠u b違ng Dimension

‚ A吋 8違m báo s詠 tích h嬰p d英 li羽w"*Kpvgitcvgf"fcvc+."Mkodcnn"8逢c"tc"#"v逢荏ng v隠 mô hình chi隠u chu育n (Conformed Dimension) Mô hình chi隠u chu育n s胤 là các b違ng e挨"d違p"8逢嬰c chia s飲 gi英a nhi隠u b違ng S詠 th壱t (Fact) khác nhau Ak隠w"8„"8違m b違o

d英 li羽w"8逢嬰c s穎 d映ng 荏 nhi隠w"p挨k"mj e"pjcw"pj逢pi"e„"épi"p瓜i dung

‚ Cách ti院p c壱n c栄a Kimball d詠a trên khái ni羽m Mô hình chi隠u d英 li羽u (Dimensional Modeling), n瓜i dung này s胤 8逢嬰e"8隠 c壱p c映 th吋 j挨p"vtqpi m映c 2.3.1,

mô hình bao g欝m hàng lo衣t các khái ni羽m n隠n t違pi"mj e"pj逢<"d違ng S詠 th壱t (m映c 2.3.2), b違ng Chi隠u (m映c 2.3.3) và Bus Matrix (m映c 2.3.4)

‚ Kimball cho r茨pi"Fcvc"Yctgjqwug"8逢嬰c t衣o thành t瑛 m瓜t t壱p các Data Marts và

d詠a trên các chi隠u chu育n chia s飲 (Shared Conformed Dimension)

Mô hình ki院n trúc Data Warehouse c栄c" Mkodcnn" 8逢嬰c mô t違 pj逢" H·nh 1, Source Transactions là ngu欝n d英 li羽w"8亥w"x q"vj逢運pi"n "e挨"u荏 d英 li羽u doanh nghi羽r."Dcemtqqo"n "p挨k"

di宇n ra các ho衣v"8瓜ng th詠c vjk"e挨"ej院 ETL, thi院t k院, c医u trúc c栄a kho d英 li羽u, các c医u hình cho các b違ng S詠 th壱t và b違ng Chi隠w."e挨"ej院 8鵜nh th運i th詠c thi d英 li羽u FrontRoom n "p挨k"pi逢運i dùng doanh nghi羽p s穎 d映pi"vj逢運ng xuyên, t衣k"8¤{"j羽 th嘘ng s胤 cung c医p các công c映 tr詠c quan hoá d英

li羽u, các ch泳e"p<pi"vt "vw羽 kinh doanh, các l羽nh truy v医n Ad-hoc 8隠w"8逢嬰c th詠c hi羽n t衣i giao di羽n pi逢運i dùng H亥w"pj逢"ikcq"fk羽p"pi逢運i dùng s胤 ch雨 giao ti院p v噂i kho d英 li羽u mà không bi院v"8逢嬰c phía Backroom s胤 làm nh英ng công vi羽e"pj逢"vj院 p q."x "pi逢嬰c l衣i

Trang 22

22

H·nh 1: Kixn trúc DW/BI cてa Kimball

2.2.4 AèPJ"IKè CHUNG V陰 CÁCH TI蔭P C一N C曳A KIMBALL

M瓜t s嘘 8 pj"ik "x隠 逢w"x "pj逢嬰e"8k吋m khi xây d詠ng kho d英 li羽u theo cách c栄a Kimball:

‚ 姶w"8k吋m l噂n nh医t c栄a cách ti院p c壱n Kimball (Bottom-Up) là t壱p trung t衣o ra c医u trúc d英

li羽u có tính linh ho衣t và thân thi羽n v噂k"pi逢運i dùng doanh nghi羽p b茨ng cách s穎 d映ng các chi隠u (Dimensional) và mô hình ngôi sao (Star Schema) M»"j·pj"pi»k"ucq"8逢嬰e"8 pj"

ik "n "8挨p"ik違n ngay c違 8嘘i v噂k"pi逢運i có ít ki院n th泳c v隠 e挨"u荏 d英 li羽u

‚ N逢w"vt英 d英 li羽u d衣ng chi隠u ph映c v映 t嘘t cho vi羽c truy v医n và phân tích d英 li羽w"j挨p"uq"x噂i mjk"n逢w"vt英 d英 li羽u d衣ng chu育n hoá vj逢運pi"8逢嬰c s穎 d映ng trong e e"e挨"u荏 d英 li羽u quan h羽

‚ T嘘n ít th運k"ikcp"j挨p"vtqpi"sw "vt·pj"rj¤p"v ej."fq"f英 li羽w"8逢嬰c t鰻 ch泳c theo d衣ng không chu育n hoá (Denormalize) Th運i gian th医{"8逢嬰c k院t qu違 dcp"8亥w"pjcpj"j挨p0

‚ S詠 f逢"vj瑛a d英 li羽u có th吋 gây ra các d英 li羽u c壱p nh壱t b医v"vj逢運ng

‚ Vi羽c thêm m瓜t c瓜t trong b違ng Fact có th吋 gây ra v医p"8隠 hi羽u su医t vì b違pi"Hcev"8逢嬰c thi院t

k院 r医t chi ti院t, vi羽c thêm 1 c瓜v"vtqpi"Hcev."m ej"vj逢噂c c栄a b違ng Fact s胤 v<pi"ecq"x "e„"vj吋 gây ra v医p"8隠 hi羽u su医t Vì v壱y, thi院t k院 theo cách mô hình chi隠u d英 li羽u (Dimensional Oqfgnkpi+"mj„"8 r"泳ng s詠 vjc{"8鰻i c栄a nghi羽p v映

‚ Không th吋 áp d映ng cho toàn b瓜 doanh nghi羽r"x·"Fcvc"Yctgjqwug"8逢嬰c thi院t k院 theo ki吋u j逢噂ng mô hình các yêu c亥u nghi羽p v映 c映 th吋 thay vì cho c違 doanh nghi羽p

M映c này, nhóm tác gi違 t壱p trung nói v隠 các khái ni羽o."8鵜pj"pij c"rj鰻 bi院n và chung nh医t

v隠 mô hình chi隠u d英 li羽u 8逢嬰c phát tri吋n b荏i Ralph Kimball

2.3.1 RJ姶愛PI"RJèR THI蔭T K蔭 MÔ HÌNH CHI陰U D頴 LI烏U

Khái ni羽m mô hình chi隠u d英 li羽w"*Fkogpukqpcn"Oqfgnkpi+"8逢嬰c phát tri吋n b荏i Ralph Kimball Mô hình chi隠u d英 li羽u là m瓜t k悦 thu壱t c医u trúc d英 li羽w"8逢嬰c t嘘k"逢w"ejq"vi羽c n逢w"vt英 d英 li羽u t衣i Kho d英 li羽u M映e"8 ej"e栄a mô hình chi隠u d英 li羽w"n "8吋 t嘘k"逢w Kho d英 li羽u v噂i t嘘e"8瓜 truy

v医n d英 li羽u nhanh và tr詠c quan v噂k"8嘘k"v逢嬰ng s穎 d映ng doanh nghi羽p

V隠 ki院n trúc, mô hình chi隠u d英 li羽w"8逢嬰e"n逢w"vt英 trên n隠n t違pi"e挨"u荏 d英 li羽u quan h羽 (Relational Database Platform) f逢噂i d衣ng mô hình ngôi sao (Star Schema) Ngoài ra, mô hình chi隠u d英 li羽w" 8逢嬰e" n逢w" vt英 theo c医u trúc k悦 thu壱t x穎 lý phâp" v ej" 8c" ejk隠u tr詠c tuy院n

*Ownvkfkogpukqpcn"Qpnkpg"Cpcn{vkecn"Rtqeguukpi+"8逢嬰c g丑i là các kh嘘i (Cubes) (Kimball, 2013) [9]

V隠 thi院t k院."vjgq"Mkodcnn."vc"e„"6"d逢噂e"8吋 thi院t k院 mô hình chi隠u d英 li羽w"pj逢"ucw (Kimball, 2002) [10]:

1 L詠a ch丑n quy trình doanh nghi羽p (Select the Business Process)

Trang 23

23

2 Khai báo m泳c d英 li羽u (Declare the Grain)

3 Z e"8鵜nh các b違ng Dimensions (Identify the Dimensions)

4 Z e"8鵜nh các b違ng Facts (Identify the Facts)

2.3.2 B 謂NG S衛 TH一T (FACT)

B違ng S詠 th壱t ch泳a các k院t qu違 ho衣v"8瓜ng s違n xu医t kinh doanh c栄a doanh nghi羽p t瑛 quy trình kinh doanh c栄a doanh nghi羽p B違ng S詠 th壱t có ba d衣pi"ej pj"8„"n b違ng S詠 th壱t giao d鵜ch(Transaction Fact Table), B違ng S詠 th壱t t鰻ng h嬰p vj逢運ng k (Snapshot Fact Table) và b違ng

S詠 th壱t lu悦 k院 (Accumulating Snapshot Fact Table)

M厩i dòng c栄a b違ng S詠 th壱t v逢挨pi"泳ng v噂i m瓜t s詠 ki羽p"8q"8衣c M厩i dòng d英 li羽u bao g欝m các thông tin chi ti院v"8逢嬰e"zgo"n "8瓜 m鵜n (Grain) T医t c違 các dòng c栄a m瓜t b違ng S詠 th壱t ph違i có épi"8瓜 m鵜n

T医t c違 các b違ng S詠 th壱t bao g欝m khóa ngo衣i (Foreign Key) và khoá chính (Primary Key) Các khóa ngo衣i vj逢運ng liên k院t v噂i các b違ng Chi隠u Khoá chính vj逢運ng là s詠 t壱p h嬰p c栄a toàn

b瓜 các khoá ngo衣i ho員c s穎 d映ng khoá c栄a b違ng 8逢嬰c l医y tr詠c ti院p t瑛 e挨"u荏 d英 li羽u doanh nghi羽p,

vì các khoá này không liên k院t v噂i b医t k b違ng Chi隠w"p q"pj逢pi"n衣i có tính ch医t c栄a m瓜t khoá chính, e e"vt逢運ng d英 li羽w"pj逢"x壱{"8逢嬰c g丑i v噂i tên là Degenerate Dimension

2.3.3 B 謂NG CHI陰U (DIMENSION)

B違ng Dimension ch泳a các thông tin chi ti院t v隠 các s詠 ki羽p"8q"8衣c c栄a m瓜t quy trình doanh nghi羽p Chúng mô t違 Ðck."e k"i·."荏 8¤w."mjk"p q."pj逢"vj院 nào, t衣i sao" 泳ng v噂i s詠 ki羽p"8„0 B違ng Chi隠u s胤 8逢嬰c liên k院t v噂i m瓜t ho員c nhi隠u b違ng S詠 th壱t nh茨m cung c医p thông tin d英 li羽u cho

b違ng S詠 th壱v"o "p„"8逢嬰c liên k院v"8院n Các d英 li羽u trong b違ng Chi隠w"vj逢運ng là d英 li羽u d衣ng mô

t違, gi違i thích di宇n gi違i nh茨m ph映c v映 cho vi羽c thi院t l壱p cho m瓜t mô hình chi隠u d英 li羽u

Nh英ng thu瓜c tích c栄a b違ng Dimension là ngu欝n d英 li羽u cho truy v医n, phân nhóm và báo

e q0"Ej¿pi"8„pi"xck"vt "swcp"vt丑ng trong h羽 th嘘ng DW/BI, giúp cho h羽 th嘘ng DW/BI d宇 hi吋u

và d宇 s穎 d映ng Tên c栄a nh英ng thu瓜c tính nên là nh英ng c映m t瑛 th詠c t院 j挨p"n "pj逢pi"v瑛 vi院t t逸t khó hi吋u

2.3.4 BUS MATRIX

Data Warehouse Bus Matrix hay Bus Matrix là công c映 thi院t y院w"8吋 thi院t k院 và giao ti院p

v噂i ki院n trúc bus c栄a Data Warehouse Các hàng c栄a ma tr壱n là các quy trình nghi羽p v映 và các

c瓜v"n "e e"Fkogpukqp0"E e"»"8逢嬰e"8 pj"f医u c栄a ma tr壱n cho bi院t li羽u m瓜v"Fkogpukqp"e„"8逢嬰c liên k院t v噂i m瓜t quy trình nghi羽p v映 nh医v"8鵜nh hay không Nhóm thi院t k院 quét t瑛pi"j pi"8吋 ki吋m tra xem Dimension 8逢嬰c ch丑n có phù h嬰p v噂k"sw{"vt·pj"mkpj"fqcpj"jc{"mj»pi"x "e pi"swfiv"v瑛ng

c瓜v"8吋 xem Dimension c亥p"8逢嬰c tuân th栄 trong nhi隠u quy trình nghi羽p v映

2.3.5 SCD (SLOWLY CHANGE DIMENSION)

Trong th詠c t院, các thu瓜c tính có trong b違ng Chi隠u có th吋 c嘘 8鵜pj."pj逢pi"e e"d英 li羽u c栄a các thu瓜e"v pj"8„"n衣k"vjc{"8鰻i trong quá trình n衣p d英 li羽u, m員c dù s詠 vjc{"8鰻i x違y ra ch壱m theo

th運i gian Khi pi逢運i dùng c亥n theo dõi s詠 vjc{"8鰻i, ta s胤 s穎 d映ng Chi隠w"vjc{"8鰻i ch壱o"8吋 qu違n

lý s詠 vjc{"8鰻i c栄a các thu嘘c tính có trong b違ng Chi隠u

V噂i m厩i thu瓜c tính có trong b違ng Chi隠u, ta ph違i thi院t l壱p m瓜t chi院n l逢嬰e"tk‒pi"8吋 8嘘i phó

v噂i s詠 vjc{"8鰻i Nói cách khác, khi m瓜t thu瓜e"v pj"8逢嬰e"vjc{"8鰻i giá tr鵜 trong th院 gi噂i th壱t thì

n o"ucq"8吋 áp d映ng s詠 vjc{"8鰻k"8„"vtqpi"o»"j·pj"ejk隠u?

Các lo衣k"rj逢挨pi"rj r"vtqpi"UEF<

Lo 衣i 1<"Ijk"8fl"*Qxgtytkvg+

Trang 24

24

Khi có s詠 vjc{"8鰻i x違y ra, SCD Lo衣i 1 gi違i quy院t b茨pi"e ej"ijk"8fl"f英 li羽u m噂k"x q"8¿pi"

v鵜 trí xu医t hi羽n c栄a d英 li羽w"e 0"X噂i cách này, các thu瓜c tính luôn ph違n ánh giá tr鵜 8逢嬰c c壱p nh壱t

g亥p"8¤{"pj医t

Ví d映<"pj逢"H·nh 2 phía f逢噂i, giá tr鵜 e "e„"vtqpi"vjw瓜c tính Department Name là Education,

d英 li羽u m噂k"8逢嬰c n衣r"x q"pj逢pi"n衣k"e„"Fgrctvogpv"Pcog"vjc{"8鰻i thành Stragegy, thì b茨ng cách

s穎 d映ng SCD lo衣i 1, b違ng d英 li羽u m噂k"vjw"8逢嬰c s胤 pj逢 H·nh 2 rj c"f逢噂i:

H·nh 2: Ví dつ minh hoT SCD loTi 1 [9]

Lo 衣i 2: Thêm 1 hàng m噂i (Add New Row)

SCD lo衣i 2 gi違i quy院t s詠 vjc{"8鰻i b茨ng cách thay vì ch雨nh s穎a ngay trên d英 li羽w"e "vc"u胤 t衣o thêm 1 hàng d英 li羽u m噂k"8吋 ph違n ánh s詠 vjc{"8鰻k0"Piq k"tc"8吋 áp d映pi"rj逢挨pi"rj r"p {."t瑛ng hàng d英 li羽u thu瓜c b違ng Chi隠w"8„"rj違i có thêm 3 thu瓜c tính ph映 tr嬰 là Row Effective Date

và Row Expiration Date, có th吋 có thêm thu瓜c tính Current Row Indicator Row Effective Date

là th運i gian mà dòng d英 li羽u này b逸v"8亥u có hi羽u l詠e."8„"e„"vj吋 là th運i gian mà s違n ph育m này 8逢嬰c nh壱p hàng, ho員c là th運i gian mà d英 li羽u p {"8逢嬰c n衣p vào Data Warehouse Row Expiration Date là th運i gian cu嘘i cùng mà d英 li羽u này còn có hi羽u l詠e."pij c"n "e„"o瓜t s詠 vjc{"8鰻i x違y ra làm cho các d英 li羽w"e "mj»pi"e p"ej pj"z e"x "e„"jk羽u l詠c Ví d映 minh ho衣 pj逢"H·nh 3

H·nh 3: Ví dつ minh hoT SCD loTi 2 [9]

‚ Ngoài ra ta còn có m瓜t s嘘 rj逢挨pi"rj r"ik違i quy院t s詠 vjc{"8鰻i giá tr鵜 trong b違ng Chi隠u

mj e"8逢嬰c mô t違 pj逢"d違ng 1

BVng 1: Tごng quát vz các loTi SCD (Kimball 2002) [10]

Lo 衣i SCD J pj"8瓜ng v噂i b違ng Dimension V e"8瓜pi"8院n b違ng Fact

Lo衣i 0 Các giá tr鵜 thu瓜c tính không có s詠

vjc{"8鰻i Fact ktính nguyên b院t h嬰p v噂i các giá tr鵜 thu瓜c 違p"mj»pi"vjc{"8鰻i

Lo衣i 1 Ijk"8fl"ik "vt鵜 thu瓜c tính Fact k院t h嬰p v噂i các giá tr鵜 thu瓜c

tính hi羽n t衣i và m噂i nh医t

Lo衣i 2 Thêm m瓜t dòng m噂i trong b違ng

Chi隠u v噂i giá tr鵜 m噂i Fact ktính khi có hi院t h嬰p v噂i các giá tr鵜 thu瓜c 羽u l詠c

Lo衣i 3 Thêm m瓜t c瓜t m噂k" 8吋 n逢w" ik " vt鵜

hi羽n t衣i và gi英 giá tr鵜 vt逢噂e"8„0 Fact km噂i và giá tr鵜 thu瓜e"v pj"e 0 院t h嬰p v噂i giá tr鵜 thu瓜c tính

Trang 25

25

Lo衣i 4 Thêm m瓜t b違ng Chi隠u nh臼

(mini-fkogpukqp+" n逢w" vt英 các giá tr鵜 vj逢運pi"zw{‒p"vjc{"8鰻i

Fact k院t h嬰p v噂i b違ng Chi隠u nh臼 khi

có hi羽u l詠c

Lo衣i 5 K院t h嬰p lo衣i 4 t衣o thêm m瓜t b違ng

Chi隠u nh臼 và lo衣k"3"ijk"8fl"ik "vt鵜 trên b違ng Chi隠w"e挨"u荏

Fact k院t h嬰p v噂i Chi隠u nh臼 có giá tr鵜 vj逢運pi" zw{‒p" vjc{" 8鰻i và b違ng Chi隠w"e挨"u荏 có giá tr鵜 vj逢運ng xuyên vjc{"8鰻i hi羽n t衣i

Lo衣i 6 K院t h嬰p lo衣k" 3" ijk" 8fl" ik " vt鵜 lên

dòng sinh ra b荏i lo衣k"4."ucw"8„"ijk"

8fl"v医t c違 e e"f pi"vt逢噂e"8„0

Fact k院t h嬰p v噂i giá tr鵜 thu瓜c tính có

m噂i nh医t và giá tr鵜 hi羽n t衣i

Lo衣i 7 K院t h嬰p lo衣i 2 v噂i giá tr鵜 thu瓜c tính

m噂i, k院t h嬰p v噂i m瓜t góc nhìn (View) h衣n ch院 8院n dòng ho員c giá

tr鵜 hi羽n t衣i

Fact k院t h嬰p v噂i giá tr鵜 thu瓜c tính có

hi羽u l詠c và giá tr鵜 hi羽n t衣i

2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA)

O»"j·pj"pi»k"ucq"n "o»"j·pj"8挨p"ik違p"8逢嬰c s穎 d映ng cho Kho d英 li羽u C医u trúc c栄a nó bao g欝m b違ng S詠 th壱t n茨m 荏 v鵜 trí trung tâm, bao xung quanh nó là các b違ng Chi隠u, khi v胤 hình này t衣o cho ta c違m giác gi嘘pi"pj逢"j·pj"ucq"p‒p"p„"v‒p"i丑i là Mô hình ngôi sao (H·nh 4) Các b違ng liên k院t v噂i nhau thông qua khoá ngo衣i c栄a b違ng S詠 th壱t 8逢嬰c n嘘i v噂i khoá chính c栄a b違ng Chi隠w0"O»"j·pj"pi»k"ucq"e„"8k吋m m衣pj"n "8挨p"ik違n, h厩 tr嬰 kh違 p<pi"vtw{"x医n và gi違m th運i gian

kh逸t khe c栄a nhà qu違n lý v隠 tính hi羽u qu違 trong vi羽c phân tích d英 li羽u c栄a doanh nghi羽p, t瑛 8„"

có th吋 n逸m b逸v"8逢嬰c tình hình kinh doanh hi羽n t衣i c栄a h丑 và c違i thi羽n quy trình ra quy院v"8鵜nh (M Golfarelli, S Rizzi, I Cella, 2004) [12]

Trang 26

là quá trình bi院p"8鰻i d英 li羽w"vj pj"e»pi"vkp"8«"swc"z穎 lý r欝i bi院n nó thành ki院n th泳c)

Nhìn chung, Trí tu羽 kinh doanh (Business Intelligence) là quy trình và công ngh羽 mà các doanh nghi羽r"f́pi"8吋 ki吋m soát kh嘘k"n逢嬰ng d英 li羽u kh鰻ng l欝, khai phá tri th泳c giúp cho các doanh nghi羽p có th吋 8逢c"e e"sw{院v"8鵜nh hi羽u qu違 j挨p"vtqpi"jq衣v"8瓜ng kinh doanh c栄a mình Trí tu羽 kinh doanh không ch雨 ik¿r"ejq"pi逢運i qu違n lý bi院v"8逢嬰e"8k隠w"i·"8«"z違y ra trong quá kh泳, tình tr衣ng doanh nghi羽p hi羽n t衣i, th壱m chí trí tu羽 mkpj"fqcpj"pi {"pc{"8«"rj v"vtk吋p"8院n m泳c có th吋 8逢c"tc"f詠 8q p"ejq"v逢挨pi"n衣i Các b瓜 ph壱p"e挨"d違n c栄a m瓜t h羽 th嘘ng trí tu羽 kinh doanh có th吋 k吋 8院n bao g欝m b瓜 thu th壱p d英 li羽u, e挨"ej院 ETL, kho d英 li羽u, kh嘘i d英 li羽u d衣ng OLAP và các h羽 th嘘ng h厩 tr嬰 giao di羽p"pi逢運i dùng pj逢"8欝 th鵜, bi吋w"8欝, d詠pi"d q"e qÈ

H·nh 5: Cách hiあw"8¬p"ikVn vz BI (Jayanthi Ranjan 2005) [13]

T瑛 ki院n trúc Error! Reference source not found., quy trình c栄a m瓜t trí tu羽 kinh doanh c

ó th吋 8逢嬰c hi吋w"pj逢"ucw<

‚ D英 li羽w"8逢嬰c trích xu医t t瑛 nhi隠u ngu欝n và m映e"8 ej"u穎 d映ng khác nhau mà công

ty, doanh nghi羽r"8cpi"u荏 h英u

‚ Các d英 li羽w"p {"8逢嬰c bi院p"8鰻i, s逸p x院p, t鰻 ch泳c sao cho phù h嬰r"x "n逢w"vt英 t衣i kho d英 li羽u D英 li羽u 8逢嬰e"n逢w"vt英 trên kho d英 li羽u có th吋 8逢嬰c t鰻 ch泳c d衣ng kh嘘i OLAP

‚ Sau khi trí tu羽 kinh doanh thu th壱p và bi院p"8鰻i thành các d英 li羽u h英u ích, cu嘘i cùng nó s胤 cung c医p các công c映 ph映c v映 ejq"pi逢運i dùng ch鰯ng h衣p"pj逢"e e"dk吋u 8欝, khai phá d英 li羽w"8吋 8逢c"tc"e e #"v逢荏ng, c違nh báo ho員e"d q"e q.È

2.4.2 TRÍ TU 烏 KINH DOANH K蔭T H営P V閏I KHAI PHÁ D頴 LI烏U XÉ"M "VJW一T

H 窺C MÁY

V医p"8隠 c嘘t lõi trong h羽 th嘘ng trí tu羽 kinh doanh là kho d英 li羽u (Data Warehouse) và khai phá d英 li羽u (Data Mining) vì d英 li羽u dùng trong h羽 th嘘ng là d英 li羽u t鰻ng h嬰p (Nhi隠u ngu欝n, nhi隠w"8鵜nh d衣ng, phân tán và có tính l鵜ch s穎+"8„"n "8員e"vt逢pi"e栄a kho d英 li羽w0"A欝ng th運i vi羽c phân tích d英 li羽u trong h羽 th嘘ng không ph違i là nh英pi"rj¤p"v ej"8挨p"ik違n (Query, Filtering) mà

Trang 27

27

là nh英ng k悦 thu壱t trong khai phá d英 li羽w"f́pi"8吋 phân lo衣i (Classification), gom c映m (Clustering), hay d詠 8q p"*Rtgfkevkqp+0"X·"x壱y h羽 th嘘ng trí tu羽 kinh doanh có m嘘i quan h羽 r医t ch員t ch胤 v噂i kho

d英 li羽u và khai phá d英 li羽u

雲 ph亥n này, nhóm s胤 8逢c"tc"o瓜t s嘘 k悦 thu壱t h丑c máy tìm hi吋w"8逢嬰c vtqpi"8隠 tài lu壱p"x<p0"Trong bài toán gom c映m d英 li羽u, k-Ogcpu"8逢嬰c s穎 d映ng khá ph鰻 bi院n

Thu壱t toán phân c映m k-means là m瓜v"rj逢挨pi"rj r"8逢嬰c s穎 d映ng trong phân tích tính

ch医t c映m c栄a d英 li羽w0"P„"8員c bi羽v"8逢嬰c s穎 d映ng nhi隠u trong khai phá d英 li羽u và th嘘ng kê Nó phân vùng d英 li羽u thành k c映m khác nhau Gi違i thu壱v"p {"ik¿r"ej¿pi"vc"z e"8鵜pj"8逢嬰c d英 li羽u

th詠c s詠 thu瓜c v隠 nhóm nào

Trong các mô hình kinh doanh, doanh nghi羽p s胤 chia nh臼 t羽p khách hàng ra thành nh英ng pj„o"8嘘k"v逢嬰pi"mj e"pjcw"8吋 có th吋 áp d映ng nh英ng chi院p"n逢嬰c kinh doanh c映 th吋 cho t瑛ng nhóm 8嘘k"v逢嬰pi0"Ak隠w"p {"ik¿r"ejq"mj ej"j pi"8逢嬰c ti院p c壱n v噂i các s違n ph育m th壱t s詠 phù h嬰p v噂i

b違n thân h丑 S詠 phù h嬰r"8„"u胤 kéo doanh s嘘 c栄a doanh nghi羽p v<pi"n‒p0"

""v逢荏ng c栄a thu壱t toán k-means:

1 Kh荏i t衣q"M"8k吋m d英 li羽u trong b瓜 d英 li羽u và t衣m th運i coi nó là tâm c栄a các c映m d英 li羽u

2 V噂i m厩k"8k吋m d英 li羽u trong b瓜 d英 li羽u, tâm c映m c栄a nó s胤 8逢嬰e"z e"8鵜nh là 1 trong K tâm c映m g亥n nó nh医t

3 Sau khi t医t c違 e e"8k吋m d英 li羽w"8«"e„"v¤o."v pj"vq p"n衣i v鵜 trí c栄a tâm c映o"8吋 8違m b違o tâm

c栄a c映m n茨m 荏 chính gi英a c映m

4 D逢噂e"4"x "d逢噂c 3 s胤 8逢嬰c l員r"8k"n員p l衣i cho t噂i khi v鵜 trí c栄a tâm c映o"mj»pi"vjc{"8鰻i

ho員c tâm c栄a t医t c違 e e"8k吋m d英 li羽w"mj»pi"vjc{"8鰻i

2.5.1 KHÁI NI 烏M

Khi ta c亥n d英 li羽u c亥n thi院t cho quá trình phân tích và x穎 lý, các d英 li羽u này s胤 8逢嬰e"8逢c"vào kho d英 li羽u Tuy nhiên do b違n ch医t h亥w"pj逢"e e"f英 li羽u không có cùng ngu欝n g嘘c, và 8逢嬰c

c医u trúc khác nhau p‒p"sw{"vt·pj"GVN"8«"8逢嬰c phát tri吋n nh茨m gi違i quy院t v医p"8隠 8„0

ETL là vi院t t逸t c栄a Extract - Transform - Load Trong b嘘i c違nh trí tu羽 kinh doanh, trích xu医t - bi院p"8鰻i - t違k"*GVN+"8隠 c壱r"8院n quy trình trích xu医t d英 li羽u t瑛 m瓜t ho員c nhi隠u ngu欝n, bi院n 8鰻i d英 li羽u v隠 8鵜nh d衣ng chu育n, và t違i k院t qu違 vào kho d英 li羽u nh茨m báo cáo, phân tích ho員c 8欝ng b瓜 hoá d英 li羽uÈ0

2.5.2 THÀNH PH 井N CHÍNH TRONG TI蔭N TRÌNH ETL

Ki院n trúc ETL Pipeline g欝m 3 thành ph亥n chính:

Trích xu 医t (Extract) n "sw "vt·pj"8丑c d英 li羽u t瑛 m瓜t ho員c nhi隠u ngu欝n khác nhau ch鰯ng

h衣p"pj逢"File JSON, File CSV, thi院t b鵜 c違m bi院p"*Ugpuqt+."e挨"u荏 d英 li羽w"*Fcvcdcug+.000"A員e"8k吋m c栄a các d英 li羽u này có th吋 n "8«"e„"u印n c医w"vt¿e"pj逢"e e"d違pi"vtqpi"e挨"u荏 d英 li羽u quan h羽 ho員c không có c医u trúc, 8鵜nh d衣ng chu育p"pj逢"File Logs Công vi羽c chính c栄a d逢噂c này là d英 li羽w"8逢嬰c truy xu医t t瑛 nhi隠u ngu欝n khác nhau x "8逢c"x隠 m瓜t khu n逢w"vt英 t壱p trung vj逢運pi"8逢嬰c g丑i là d逢噂c 8羽m ho員c m瓜t s嘘 vt逢運ng h嬰p nh医v"8鵜nh s胤 8逢嬰c g丑i là h欝 d英 li羽u (Datalake)

Bi 院p"8鰻i (Transform) là c亥u n嘘i gi英a trích xu医t (Extract) và t違i (Load), t衣k"8¤{"f英 li羽u

trích xu医v"8逢嬰c s胤 8k"swc"ejw厩i các bi院p"8鰻i theo các d衣ng công th泳c khác nhau 8吋 ti院p"x q"d逢噂c

t違i (Load) phía sau Công vi羽c chính c栄c"d逢噂c bi院p"8鰻i là lo衣i b臼 d英 li羽u trùng l員p."8鵜nh d衣ng l衣i, làm s衣ch, xoá b臼 f逢"vj瑛a, k院t h嬰p ho員c tách r運i d英 li羽u t瑛 nhi隠u ngu欝p"8吋 8逢嬰c d英 li羽u hoàn ch雨nh, Quá trình bi院p"8鰻i ph違k"8違m b違o k院t qu違 d英 li羽u có s詠 8欝ng nh医t v隠 c医u trúc, tr壱t t詠 ho員c

m瓜t chu育p"tk‒pi"p q"8„"ik¿r"v<pi"v pj"鰻p"8鵜nh cho qua trình t違i d英 li羽u cu嘘i cùng

Trang 28

28

T 違i (Load) là quá trình ghi chép d英 li羽u vào m瓜t ho員c nhi隠w" 8k吋o" 8 ej" pj逢" Fcvc"

Warehouse T衣k"d逢噂c này vi羽c t違i có th吋 th詠c hi羽n th栄 công ho員c có chu k t詠 8瓜ng nh茨m c壱p

nh壱v"ejq"8k吋o"8 ej0"Jq p"vj pj"xk羽c t違i d英 li羽u không nh医t thi院t ph違i k院t thúc dây chuy隠n trích

xu医t - bi院p"8鰻i - t違i (ETL Pipeline) mà ta có th吋 th詠c hi羽n các ch泳e"p<pi"mj e"ej鰯ng h衣p"pj逢"kích ho衣t m瓜t chu厩i ETL Pipeline khác

S 渦 LI烏U HOÁ (DIGITIZATION)

2.6.1 A卯PJ"PIJ C

S嘘 li羽u hoá (Digitization) là quá trình bi院p"8鰻i, mã hoá thông tin d衣ng Analog thành con

s嘘 0, 1 mà máy tính có th吋 n逢w"vt英, x穎 lý và v壱n chuy吋n Analog là m瓜t phép nói 育n d映 cho vi羽c n逢w"vt英 d英 li羽w"f逢噂i d衣ng gi医y0"Ak隠u quan tr丑ng c栄a s嘘 li羽u hoá là d英 li羽w"8逢嬰c s嘘 hoá và không bao g欝m quy trình(Process) [14]

S嘘 li羽u hóa d英 li羽w"n逢w"vt英 là hình th泳c chuy吋p"8鰻i d英 li羽u t瑛 d衣pi"x<p"d違n h羽 th嘘ng bên ngoài thành nh英ng d英 li羽u d衣ng tín hi羽u s嘘 8逢嬰c máy tính hi吋w"x "n逢w"vt英 [15]

S嘘 li羽u hoá là m瓜v"d逢噂c chuy吋p"8鰻i t瑛 cách ghi chép truy隠n th嘘ng trên gi医{"vj pj"n逢w"vt英 trên các t壱p tin máy tính, s嘘 li羽u hoá không thay th院 hoàn toàn cách th泳c ghi chép truy隠n th嘘ng, vjc{"x q"8„."8¤{"n "o瓜t quy trình c亥n thi院t cho vi羽c áp d映ng công ngh羽 thông tin vào cách th泳c

v壱n hành c栄a công ty và doanh nghi羽p

M瓜t s嘘 ví d映 8k吋n hình c栄a s嘘 li羽u hoá là vi羽c chuy吋p"8鰻i t瑛 ch英 vi院v"jq "8挨p"vt‒p"ik医y thành d衣ng t壱r"vkp"n逢w"vt英 trên máy tính f逢噂i d衣ng pdf và csv, ho員c chuy吋p"8鰻i âm nh衣c sang OR5."OR6"vjc{"ejq"f́pi"d<pi"8 c"XJU

2.6.2 S 渦 LI烏U HOÁ (DIGITIZATION) VÀ S渦 HOÁ (DIGITALIZATION)

Khác v噂k"uw{"pij "e栄c"8衣k"8c"u嘘 m丑k"pi逢運i, các khái ni羽m v隠 S嘘 li羽u hoá (Digitization),

s嘘 hoá (Digitalization) và Chuy吋p"8鰻i s嘘 (Digital Transformation) là khác nhau Chuy吋p"8鰻i s嘘

là m瓜t quy trình ph泳c t衣p, t嘘n kém c違 v隠 m員t th運i gian và ti隠n b衣c, th壱m chí chuy吋p"8鰻i s嘘 s胤 mj»pi"8go"n衣i quá nhi隠u l嬰k" ej"vt逢噂c m逸t cho doanh nghi羽r"8亥w"v逢0

Khác v噂i S嘘 li羽u hoá, S嘘 hoá mj»pi"e„"8鵜pj"pij c"t "t pi."ÐFkikvk|cvkqp"x "Fkikvcnk|cvkqp"

là các thu壱t ng英 có liên quan ch員t ch胤 x "vj逢運pi"8逢嬰c s穎 dung thay th院 cho nhau trong nhi隠u tài

li羽wÑ."ÐFkikvcnk|cvkqp"n "o瓜t cách th泳c mà nhi隠w"n pj"x詠e"8運i s嘘ng xã h瓜k"8逢嬰c tái c医u trúc xung swcpj"e挨"u荏 h衣 t亥ng truy隠n thông và giao ti院p k悦 thu壱t s嘘Ñ [16] S嘘 hoá 荏 8¤{"8«"mj»pi"e p"ej雨 8挨p"vjw亥n là chuy吋p"8鰻i hình th泳e"n逢w"vt英 vj»pi"vkp"pj逢"u嘘 li羽u hoá, S嘘 hoá 8«"v瑛pi"d逢噂c ti院p

c壱p"j挨p"x噂i cách th泳c v壱n hành, quy trình ho衣v"8瓜ng c栄a t瑛ng doanh nghi羽p

S嘘 hoá n "sw "vt·pj"8逢嬰c th詠c hi羽p"ucw"mjk"8«"u嘘 li羽u hoá, b茨ng cách áp d映ng nh英ng thông vkp"8«"8逢嬰c s嘘 li羽u hoá vào m映e"8 ej t嘘k"逢w."8挨p"ik違n hoá cách th泳c ho衣v"8瓜ng, giúp doanh nghi羽p 8衣v"8逢嬰c hi羽u qu違 ncq"8瓜pi"ecq"j挨p0"Vtqpi"mj k"pk羽m s嘘 hoá mj»pi"8隠 c壱r"8院n vi羽e"vjc{"8鰻i cách doanh nghi羽p kinh doanh hay t衣o ra lo衣i hình kinh doanh m噂k."o "8¤{"ej雨 là vi羽c ti院p t映c

mô hình kinh doanh s印p"e„"pj逢pi"x噂i t嘘e"8瓜 v壱n hành nhanh, hi羽u qu違 ecq"j挨p"vt逢噂e"8¤{0

Thông qua H·nh 6, m瓜t quá trình chuy吋p"8鰻i s嘘 tr違k"swc"5"ikck"8q衣n chính t瑛 S嘘 li羽u hoá,

s嘘 hoá và cu嘘i cùng là chuy吋p"8鰻i s嘘 Trong khi s嘘 li羽u hoá t壱p trung vào gi違i quy院t các v医p"8隠 trong quá kh泳 pij c"n "vjc{"8鰻i t瑛 rj逢挨pi"rj r"vtw{隠n th嘘ng sang s穎 d映ng công ngh羽 máy tính cho vi羽c ghi chép, qu違n lý và truy v医n, s嘘 hoá t壱p trung vào c違i thi羽n các quy trình, ho衣v"8瓜ng trong công ty mà có áp d映ng các công c映, k悦 thu壱t máy tính và d詠a trên d詠 li羽u s嘘 hoá, v<pi"p<pi"xu医t và hi羽u qu違 c栄a t瑛ng quy trình, ho衣v"8瓜ng, cu嘘k"épi"n "d逢噂c chuy吋p"8鰻i s嘘."vjc{"8鰻i hoàn toàn cách th泳e"o "e»pi"v{"8«"x壱n hành, t壱r"vtwpi"u¤w"j挨p"e違 x q"eqp"pi逢運i và công ngh羽 nh茨m 8go"n衣i giá tr鵜 c衣nh tranh m噂i Nhìn chung, m厩i ikck"8q衣n trong quá trình chuy吋p"8鰻i s嘘 có m嘘i quan h羽 ch員t ch胤 không tách r運i và 違pj"j逢荏ng tr詠c ti院r"8院n nhau

Trang 29

8 pj"o {È Công ngh羽 p {"vj逢運pi"8逢嬰c s穎 d映pi"8吋 truy隠n t違i và nh壱p li羽u

H·nh 7: Công Nghう OCR [18]

T瑛 H·nh 7, OCR không ch雨 ejq"rjfir"8丑c d英 li羽u trên các t壱r"vkp"8逢嬰c vi院t b荏i máy tính,

mà th壱m chí là các ch英 vi院v"vc{."8c"f衣ng v隠 ngôn ng英, b嘘 c映c e pi"8逢嬰c áp d映ng, nh運 vào s詠 phát tri吋n c栄a các mô hình trí tu羽 nhân t衣o và h丑c sâu, t瑛 8„"vt ej"zw医t sang các t壱r"vkp"x<p"d違n

và có th吋 n逢w"vt英 trên máy tính ho員c e挨"u荏 d英 li羽u

2.7.2 A窺C JQè"A愛P"BÁN HÀNG B稲NG CÔNG NGH烏 OCR

Jq "8挨p"ej泳a các thông tin c亥n thi院t cho m瓜t giao d鵜ch gi英a công ty v噂i khách hàng ho員c v噂i công ty khác, h亥u h院v"e e"jq "8挨p"8逢嬰c in ra gi医y t瑛 các máy POS, ho員c các t壱p tin PDFs và

d英 li羽u t瑛 jq "8挨p"8k羽n t穎

Truy隠n th嘘pi"vt逢噂e"8¤{."e e"jq "8挨p"kp"tc"ik医{"8逢嬰c áp d映ng 荏 8衣k"8c"u嘘 các c穎a hàng bán l飲 pj逢"các c穎a hàng ti羽n l嬰i, siêu th鵜, ch嬰 giao d鵜ch,È m瓜v"jq "8挨p"u胤 8逢嬰c g穎i cho khách hàng, m瓜v"jq "8挨p"e p"n衣i s胤 do c穎c"j pi"n逢w"vt英 Khi t鰻ng k院v"fqcpj"vjw."e e"jq "8挨p"vtqpi"ngày ho員c tháng s胤 8逢嬰c l医y ra và ghi chép vào s鰻 sách V医p"8隠 phát sinh v噂i cách làm truy隠n

th嘘ng này là các hoá 8挨p"n逢w"vt英 th運i gian dài có th吋 d磯p"8院n m医t mát, ch医v"n逢嬰ng ch英 vi院t gi違m, chi phí c亥n thi院t cho kho n逢w"vt英 e e"jq "8挨p v<pi"ecq0"Xì v壱{"rj逢挨pi"rj r"ik違i quy院t hi羽u qu違 ngày nay mà m丑i c穎a hàng 8鰻i m噂i áp d映ng là s穎 d映ng các h羽 th嘘pi"n逢w"vt英 thông minh nj逢"e挨"

s荏 d英 li羽u máy tính, v瑛a gi違i quy院v"8逢嬰c bài toán nh壱p li羽u, v瑛a gi違o"8逢嬰e"ejk"rj "vjw‒"mjq"n逢w"tr英."8 r"泳pi"8逢嬰c nhu c亥u truy v医p"e e"jq "8挨p"o瓜t cách nhanh chóng và chính xác

Trang 30

30

A吋 vi羽c qu違n lý các d英 li羽u hi羽u qu違, công ty s胤 n逢w"vt英 các thông tin hq "8挨p"x q"o瓜t e挨"u荏 d英 li羽u máy tính, theo cách truy隠n th嘘ng các công ty s胤 s穎 d映ng nhân công có nhi羽m v映

nh壱p li羽u t瑛pi"jq "8挨p"tk‒pi"n飲 x q"vtqpi"e挨"u荏 d英 li羽u c栄a công ty V噂k"rj逢挨pi"rj r"vt‒p."o瓜t

s嘘 v医p"8隠 phát sinh pj逢"ejk"rj "fw{"vt·"8瓜k"pi "nhân công, th運i gian nh壱p li羽u dài và quan tr丑ng nh医v"n "e e"vt逢運ng h嬰p nh壱p li羽u sai Vì v壱y, c亥n có m瓜t gi違i pháp v瑛a có kh違 p<pi"ik違o"8逢嬰c

th運i gian nh壱p li羽u."v逢挨pi v e"8逢嬰c v噂i các h羽 th嘘ng thông tin khác nhau, e pi"pj逢"ik違m thi吋u

s詠 sai sót trong quá trình s嘘 li羽u hoá

S嘘 li羽u jq "e e"jq "8挨p"d p"j pi"nên là m瓜t quy trình có trách nhi羽m t詠 8瓜ng hoá vi羽c rút trích thông tin t瑛 m瓜v"jq "8挨p"ucw"8„"n逢w"vt英 vj»pi"vkp"8„ trên m瓜v"e挨"u荏 d英 li羽u máy tính T瑛

H·nh 8, v噂k"8亥u vào là m瓜t b泳c hình ch映p c栄a m瓜v"jq "8挨p."b茨ng cách áp d映ng công ngh羽 OCR, 8亥u ra c栄a quá trình s嘘 li羽u hoá là d英 li羽u có c医u trúc JSON v噂i các n瓜i dung c亥n thi院t 8逢嬰c rút trích t瑛 違nh

H·nh 8: Ví dつ minh hoT OCR

Pj·p"ejwpi."sw{"vt·pj"8丑c thông tin trên m瓜v"jq "8挨p"u胤 e„"7"d逢噂c chính, H·nh 9:

‚ Ti院n x穎 lý 違pj"8亥u vào

‚ Phát hi羽p"x<p"d違n (Text Detection)

‚ Nh壱n di羽n x<p"d違n (Text Recognition)

‚ Trích xu医t thông tin (Information Extract)

‚ Xu医t Thông tin (Data Dumps)

H·nh 9<"QET"Rkrgnkpg"e¬"dVn [19]

Trang 31

li羽u c栄c"pj "n«pj"8衣o và nhà ra quy院v"8鵜nh Nh茨m ph映c v映 cho nhu c亥w"8„."8«"e„"t医t nhi隠u nghiên c泳w."d k"d q"8隠 xu医t các gi違i pháp, cách thi院t k院 h羽 th嘘ng trí tu羽 mkpj"fqcpj"8 r"泳ng nhu c亥u th詠c ti宇n c栄a các công ty trong quá trình phân tích d英 li羽w"x "8逢c"tc"sw{院t 8鵜nh

Fauziyah (2018) [20]<"8«" r"f映pi"rj逢挨pi"rj r"Mkodcnn"8吋 xây d詠ng kho d英 li羽u cho các công ty s違n xu医v"8欝 8k羽n t穎 Bài vi院t t壱p trung xây d詠ng kho d英 li羽u d詠a trên rj逢挨pi"rj r"e栄a Kimball áp d映ng cho nghi羽p v映 c栄a công ty s違n xu医t chuyên v隠 8k羽n t穎, các ho衣v"8瓜ng chính t瑛 khâu 8員t mua nguyên li羽u thô, nh壱p kho, gia công ejq"8院n bán thành ph育oÈ"Mjq"f英 li羽w"8逢嬰c thi院t k院 có th吋 n逸m b逸t tr丑n v姻n m丑i d英 li羽u trong quá trình ho衣v"8瓜ng c栄a công ty t瑛 8„"8 pj"ik "8逢嬰c hi羽u qu違."p<pi"su医t c栄a t瑛ng ikck"8q衣n trong ho衣v"8瓜ng công ty Bài vi院t s穎 d映pi"e ej"8 pj"ik "mk吋o"vtc"8瓜 ch医p nh壱p"pi逢運i f́pi"*Wugt"Ceegrvcpeg"Vguv+"x "8衣t k院t qu違 kh違 quan."x逢嬰t m泳c trung bình t瑛 pi逢運i dùng

h羽 th嘘ng

Ari Yanuar Ridwan (2015) [21]: cung c医p m瓜t cách ti院p c壱n trong quá trình thi院t

k院 và xây d詠ng m瓜t kho d英 li羽u h厩 tr嬰 vi羽c phân tích d英 li羽u cho nghi羽p v映 mua hàng cho công ty Ki院p"vt¿e"8逢嬰c tác gi違 8隠 xu医t và hi羽n th詠c bao g欝m h羽 th嘘ng ngu欝n d英 li羽u 8亥u vào, máy ch栄 ETL, máy ch栄 OLAP, h羽 th嘘ng báo cáo, b瓜 nh噂 n逢w"vt英 trung tâm và giao di羽p"pi逢運i dùng T瑛 các nhu c亥u ch泳e"p<pi"e栄a h羽 th嘘ng, ki院p"vt¿e"8逢嬰c hi羽n th詠c

b茨ng h羽 e挨"u荏 d英 li羽u SQL Server 2008 R2, Windows Server và ngôn ng英 l壱p trình Dotnet Trong bài vi院t, tác gi違 áp d映pi"rj逢挨pi"rj r"z¤{"f詠ng kho d英 li羽u c栄a Kimball bao g欝m các mô hình chi隠u d英 li羽u g欝m 8 Fact-models, ph映c v映 vi羽c phân tích cho ho衣v"8瓜ng mua

j pi"pj逢"nhu c亥u mua hàng, l詠a ch丑n nhà cung c医p, qu違p"n#"jq "8挨p"nh壱p hàng, rj逢挨pi"

th泳c v壱n chuy吋p.È T瑛 8„"xây d詠ng e挨"ej院 ETL phù h嬰p sao cho vi羽c ch衣{"e挨"ej院 ETL 8逢嬰c th詠c hi羽n trên m瓜t máy ch栄 riêng bi羽t nh茨m nâng cao hi羽u su医t c栄a toàn b瓜 h羽 th嘘ng Ngoài ra, trong ki院n trúc mà tác gi違 xây d詠ng bao g欝m c違 m瓜t công c映 báo cáo cho phép pi逢運i dùng có th吋 thao tác v噂i các d英 li羽u thông qua bi吋w"8欝."8欝 th鵜 tr詠c quan giúp vi羽c 8逢c"tc"sw{院v"8鵜nh c栄a nhà qu違n lý t嘘v"j挨p

Trang 32

32

2.8.2 CÁC S 謂N PH域M

Pentaho: là m瓜t ph亥n m隠m m衣nh m胤 8逢嬰c phát tri吋n b荏i Hitachi, kh違 p<pi"e栄a Pentaho bao g欝m tích h嬰p d英 li羽u, xây d詠ng d鵜ch v映 OLAP, báo cáo, tr詠c quan hoá d英

li羽u, khai phá d英 li羽u, xây d詠pi"e挨"ej院 ETL, và vô s嘘 các ch泳e"p<pi"mj e"rj映c v映 cho

h羽 th嘘ng trí tu羽 kinh doanh Pentaho là m瓜t ph亥n m隠m cung c医p t壱p các công c映 pj逢 trích

xu医t, bi院p"8鰻i và t違i d英 li羽w"*e挨"ej院 ETL) t衣q"8k隠u ki羽n thu壱n l嬰i cho quá trình thu th壱p, làm s衣ch x "n逢w"vt英 d英 li羽u t瑛 nhi隠w"e挨"ej院 k院t n嘘i ngu欝n d英 li羽u khác nhau Pentaho còn

h厩 tr嬰 c違 khai phá d英 li羽u và h丑c máy, các k悦 thu壱t khai phá d英 li羽w" pj逢" rj¤p" n噂p (Classification), H欝i quy (Regression), quy tách k院t h嬰p và phân c映m (Association Rules and Clustering) Rgpvcjq"ejq"rjfir"pi逢運i dùng xây d詠ng các Dashboard, 8欝 th鵜 tr詠c quan ngay trên h羽 th嘘ng ph映c v映 cho vi羽e"rj¤p"v ej"x "8逢c"tc"sw{院v"8鵜nh c栄c"pi逢運i dùng h羽

th嘘ng Vw{"pjk‒p"8吋 s穎 d映pi"8逢嬰c ph亥n m隠o"8 k"j臼k"pi逢運i dùng ph違i có ki院n th泳c v隠 công ngh羽 thông tin

Holistics: Ph亥n m隠o"8逢嬰c phát tri吋n b荏i công ty Holistics là m瓜t h羽 th嘘ng trí tu羽 kinh doanh t詠 ph映c v映 (Self-service BI), h羽 th嘘pi"ejq"rjfir"8丑c d英 li羽u t瑛 nhi隠u n隠n t違ng e挨"u荏 d英 li羽u khác nhau, s穎 d映ng các e挨"ej院 ETL 8吋 xây d詠ng mô hình d英 li羽u riêng trên

h羽 th嘘ng Ph亥n m隠m tích h嬰p c違 b瓜 công c映 phân tích d英 li羽w."pi逢運i dùng có th吋 s穎 d映ng các mô hình d英 li羽w"8«"z¤{"f詠pi"8吋 t衣o d詠ng các bi吋u 8欝."8欝 th鵜 ph映c v映 cho vi羽c phân tích Giao di羽n h羽 th嘘ng thân thi羽n, d宇 hi吋u v噂k"pi逢運i dùng."pi逢運i dùng c亥n có ki院n th泳c e挨"d違n v隠 câu l羽nh truy v医p"8隠u có th吋 s穎 d映ng

SSAS, SSIS, SSRS: là ba d鵜ch v映 8逢嬰c phát tri吋n b噂i Microsoft, tích h嬰p c違 ba

d鵜ch v映 pi逢運i dùng có th吋 xây d詠ng m瓜t h羽 th嘘ng trí tu羽 kinh doanh hoàn ch雨nh SSAS (Oketquqhv"USN"UgtxgtÓu"Cpcn{uku"Ugtxkegu+"n "f鵜ch v映 h厩 tr嬰 xây d詠ng kh嘘i OLAP, khai phá d英 li羽u và là m瓜t công c映 ph映c v映 vi羽c báo cáo SSIS (Sql Server Integration Services) là d鵜ch v映 8逢嬰c xây d詠ng ph映c v映 ejq"e挨"ej院 ETL và xây d詠ng kho d英 li羽u SSRS(Sql Server Reporting Services) là d鵜ch v映 8逢嬰c s穎 d映pi"8吋 thi院t k院 các Dashboard,

bi吋w"8欝."8欝 th鵜 và tr詠c quan hoá d英 li羽u A吋 s穎 d映ng thành th衣q"vj·"8 k"j臼i ph違i có ki院n

th泳c công ngh羽 thông tin nh医v"8鵜nh

Trang 33

33

EJ姶愛PI"5< PHÂN TÍCH VÀ THI 蔭T K蔭 H烏 TH渦NG

Vtqpi"ej逢挨pi"p {."pj„o"v e"ik違 z e"8鵜nh các v医p"8隠 c亥n gi違i quy院t, phân tích v隠 các yêu c亥u ch泳e"p<pi."rjk"ej泳e"p<pi"e栄a h羽 th嘘ng, 8逢c"tc"d瓜 công c映 8隠 xu医v"ejq"e挨"

ch院 ETL, các Fact Model 8隠 xu医v"8吋 xây d詠ng kho d英 li羽u và công c映 phân tích d英 li羽u

V 遺P"A陰 C井N GI謂I QUY蔭T

Sau khi có nh英ng ki院n th泳c n隠n t違ng, nhóm có nh英ng v医p"8隠 c亥n gi違i quy院t trong 8隠 v k"pj逢"ucw<

H·nh 10: VXp"8z cZn giVi quyxt theo tなng ikck"8qTn

‚ Z e"8鵜nh nhu c亥u c栄a doanh nghi羽p qua phân tích nghi羽p v映, chuy吋n nhu c亥u doanh nghi羽p thành yêu c亥u ch泳e"p<pi"e栄a h羽 th嘘ng

‚ Thi院t k院 và xây d詠ng các Fact Model d詠a theo yêu c亥u c栄a các phòng ban trong doanh nghi羽r"vj逢挨pi"o衣i ho員c doanh nghi羽p s違n xu医t

‚ Z e"8鵜nh c医w"vt¿e"x "8鵜nh d衣ng d英 li羽w"8亥u vào c栄a h羽 th嘘ng bao g欝m d英 li羽u t瑛

h羽 e挨"u荏 d英 li羽u và t瑛 t壱p tin c栄a doanh nghi羽p

‚ Xây d詠pi"e挨"ej院 ETL phù h嬰r"8 r"泳pi"8逢嬰c vi羽c xây d詠ng kho d英 li羽u c栄c"pi逢運i

qu違p"n#1"pi逢運i dùng

‚ C亥p"e„"e挨"ej院 8鵜nh th運i, h厩 tr嬰 vi羽c c壱p nh壱t kho d英 li羽u m瓜t cách t詠 8瓜ng

‚ Xây d詠ng Dashboard ph映c v映 vi羽c phân tích d英 li羽u

‚ Xây d詠pi"8逢嬰c 泳ng d映ng Web, pi逢運i dùng có th吋 xem báo cáo k院t qu違, t壱p h嬰p các bi吋w"8欝."n逢嬰e"8欝 theo yêu c亥u c栄c"pi逢運i dùng

‚ O»k"vt逢運ng v壱n hành h羽 th嘘ng 鰻p"8鵜nh, có th吋 d宇 dàng tri吋n khai và m荏 r瓜ng

‚ Nghiên c泳w"x "8隠 xu医v"rj逢挨pi"rj r"8育y m衣nh s嘘 li羽u hoá, thu th壱p d英 li羽u ph映c

v映 phân tích d詠 báo và trí tu羽 kinh doanh

MJï"MJ;P

Trong quá trình gi違i quy院t v医p"8隠 8逢嬰c nêu 荏 m映c 3.1, nhóm g員p ph違i nh英ng khó mj<p"ucw<

‚ Xây d詠ng các b違ng Fact và b違ng Dimension s穎 d映pi"8逢嬰c cho c違 doanh nghi羽p

s違n xu医v"x "vj逢挨pi"o衣i 8 k"j臼i nhóm ph違i phân tích k悦 nghi羽p v映 doanh nghi羽p

và nhu c亥u th詠c t院 hi羽n nay

Trang 34

34

‚ Xây d詠ng e挨"ej院 ETL toàn di羽n, phù h嬰p 8 p 泳pi"8逢嬰c nhu c亥u xây d詠ng kho d英

li羽u t瑛 8挨p"ik違p"8院n ph泳c t衣p."8 k"j臼i nhóm ph違i có th運i gian tìm hi吋u, nghiên c泳u trên các s違n ph育m có công d映pi"v逢挨pi"v詠 nh茨m tích h嬰p vào h羽 th嘘ng c栄a mình

‚ Xây d詠ng các Dashboard, bi吋w"8欝."8欝 th鵜 c亥p"e„"8瓜 linh ho衣t ccq."pi逢運i dùng có

th吋 tu bi院n theo ý thích

‚ E挨"u荏 h衣 t亥ng, yêu c亥u ph亥n c泳ng có kh違 p<pi"8 r"泳ng khi ph違i x穎 lý m瓜v"n逢嬰ng

d英 li羽u l噂n

‚ Kho d英 li羽w"n逢w"vt英 ph違k"8違m b違o ho衣v"8瓜ng 鰻p"8鵜pj."x "8違m b違o toàn v姻n, an toàn

d英 li羽u, không gây th医v"vjq v"ejq"pi逢運i dùng trong quá trình s穎 d映ng

GI 謂I PHÁP

A吋 gi違i quy院t nh英pi"mj„"mj<p"8«"p‒w"荏 vt‒p."pj„o"8«"vk院n hành th詠c hi羽n các gi違i pháp sau:

‚ Phân tích, tìm hi吋w"t "8k吋m chung v隠 m員t nghi羽p v映 gi英a hai lo衣i công ty s違n xu医t

x "vj逢挨pi"o衣i, t瑛 8„"pj„o"rj¤p"v ej"x "pihiên c泳u các quá trình nghi羽p v映 8吋 có

th吋 8隠 xu医t và xây d詠ng kho d英 li羽u phù h嬰p

‚ T壱n d映ng l衣i nh英ng bài báo, nghiên c泳u khoa h丑c c栄a các h丑c gi違 khác, nh茨m n逸m

b逸v"8逢嬰c các nhu c亥u trong vi羽c thi院t k院 và xây d詠ng các Fact Model chung và

t鰻ng quát cho các công ty thu瓜e"n pj"x詠c khác nhau

‚ Tìm hi吋u, nghiên c泳u thêm t瑛 các s違n ph育m có trên th鵜 vt逢運ng."ucw"8„"pj„o"rj¤p"tích và c違i thi羽n h羽 th嘘pi"GVN"8吋 có th吋 x穎 lý 8逢嬰c nhi隠u lo衣i d英 li羽u t瑛 nhi隠u ngu欝n chính xác và hi羽u qu違 j挨p0

‚ S穎 d映ng công ngh羽 8k羽n toán 8 o"o¤{"pj逢"Iqqing"Enqwf"Rncvhqto nh茨o"8衣v"8逢嬰c 8瓜 tin c壱y cao trong vi羽c b違o m壱t, tính s印n sàng và kh違 p<pi"o荏 r瓜ng c栄a h羽 th嘘ng

3.4.1 YÊU C 井U CH永E"P;PG

M瓜t cách t鰻ng quát, yêu c亥u c栄a ph亥n m隠m 8逢嬰c chia thành yêu c亥u ch泳e"p<pi"x "yêu c亥u phi ch泳e"p<pi0

3.4.1.1 YÊU C 井U CH永E"P;PI"X陰 B謂NG BÁO CÁO

‚ Pi逢運i dùng có th吋 nhìn th医y các bi吋w"8欝 8逢嬰c h羽 th嘘ng hi羽n th詠c

‚ Pi逢運i dùng có th吋 t衣o bi吋w"8欝 m噂i

‚ Pi逢運i dùng có th吋 kéo, th違 v鵜 trí bi吋w"8欝 m噂i

3.4.1.2 YÊU C 井U CH永E"P;PI"X陰 KHO D頴 LI烏U

‚ Pi逢運i dùng có th吋 t衣o/xóa/ch雨nh s穎a Fact Model trong kho d英 li羽u

‚ Pi逢運i dùng có th吋 t衣o/xóa/ch雨nh s穎a Fact Model trong Data Mart

‚ Pi逢運i dùng có th吋 qu違n lý các b違ng Fact ho員c Dimension

Trang 35

35

3.4.1.3 YÊU C 井U CH永E"P;PI"X陰 VI烏C TRÍCH XU遺T Î BI蔭P"A蔚I Î T謂I

‚ Pi逢運i dùng có th吋 t衣o nhi隠u ngu欝n d英 li羽w"8鰻 vào cùng m瓜t b違ng d英 li羽u trên kho

d英 li羽u

‚ Pi逢運i dùng có th吋 t衣o/xóa/ch雨nh s穎a k院t n嘘i gi英c"e挨"u荏 d英 li羽u và h羽 th嘘ng

‚ Pi逢運i dùng có th吋 t衣o liên k院t gi英a các b違ng d英 li羽u

‚ Pi逢運i dùng có th吋 lên l鵜ch th詠c hi羽n quá trình trích xu医t Î bi院p"8鰻i Î t違i d英 li羽u

‚ Pi逢運i dùng có th吋 tu ch雨nh các phép bi院p"8鰻k"8嘘i v噂i b違ng theo ý mu嘘n

‚ E„"e挨"ej院 8鵜nh th運i h厩 tr嬰 quá trình t詠 8瓜ng hoá th詠c thi các tác v映

3.4.1.4 YÊU C 井U CH永E"P;PI"X陰 CÔNG C影 PHÂN TÍCH D頴 LI烏U

‚ Cung c医p giao di羽n giúp pi逢運i dùng xem các Dashboard, bi吋w"8欝

‚ T衣o m噂i, chính s穎a ho員c xoá bi吋w"8欝."8欝 th鵜

‚ Có kh違 p<pi"mfiq"vj違 các bi吋w"8欝."8欝 th鵜 tu vào v鵜 trí s逸p x院r"pi逢運i dùng ch丑n

‚ Piq k"e e"vt逢運ng d英 li羽u có s印p."pi逢運i dùng có th吋 dùng l羽nh truy v医p"USN"8吋

t衣q"vj‒o"e e"vt逢運ng m噂i

‚ Th詠c hi羽n Drill Up/Drill Down 荏 m瓜t s嘘 8欝 th鵜

3.4.2 YÊU C 井U PHI CH永E"P;PI

‚ Front-end c栄a h羽 th嘘pi"8逢嬰c xây d詠ng trên n隠n t違ng Web

‚ Có kh違 p<pi"v詠 8瓜ng khôi ph映c khi g員p l厩i trong quá trình th詠c thi ti院n trình ETL

‚ Có kh違 p<pi"o荏 r瓜ng h羽 th嘘ng

‚ A違m b違o t嘘e"8瓜 hi吋n th鵜 các bi吋w"8欝."8欝 th鵜 không quá 10 giây

Trang 36

36

3.4.3 U愛"A唄 UML VÀ MÔ T謂 CH永E"P;PI H烏 TH渦NG A陰 XU遺T

H·nh 11<"U¬"8げ User Case hう thぐng

H·nh 11 Mô t違 các ch泳e"p<pi"ej pj"e栄a h羽 th嘘ng bao g欝m Qu違n lý Data Source, qu違n lý Data Warehouse, th詠c thi quá trình ETL và qu違n lý Dashboard

3.4.3.1 QU 謂N LÝ NGU唄N D頴 LI烏U (DATA SOURCE)

Mô tV: H羽 th嘘ng cjq"rjfir"pi逢運i dùng k院t n嘘i v噂k"e e"e挨"u荏 d英 li羽u và xem các

e挨"u荏 d英 li羽w"p {"n "e e"e挨"u荏 d英 li羽u ngu欝n cho h羽 th嘘ng

Các H·nh 12, H·nh 13, H·nh 14 mô t違 l亥p"n逢嬰t các giao di羽p"pi逢運i dùng c栄a ch泳c p<pi"sw違n lý ngu欝n d英 li羽u

Trang 37

37

H·nh 12: QuVn lý Data Source

H·nh 13: Thêm mずi Data Source

H·nh 14: Cfp nhft thông tin Data Source

Trang 38

38

3.4.3.2 QU 謂N LÝ DATA WAREHOUSE

Mô tV: H羽 th嘘pi"ejq"rjfir"pi逢運i dùng thêm, xóa, s穎a Data Warehouse, Data Mart,

Fact Model, Fact, Dimension

H·nh 15: Trang quVn lý Datawarehouse

H·nh 15 mô t違 giao di羽p"pi逢運i dùng trong ch泳e"p<pi"su違n lý Data Warehouse

3.4.3.3 TH 衛C THI TI蔭N TRÌNH ETL

Mô tV: H羽 th嘘pi"ejq"rjfir"pi逢運i dùng th詠e"vjk"e e"sw "vt·pj"GVN"ucw"mjk"pi逢運i

dùng thi院t l壱p Data Warehouse và h羽 th嘘pi"8違m b違o quá trình thi院t l壱p c栄c"pi逢運i dùng

h嬰p l羽

H·nh 16: Trang 8おnh thぜi

Trang 40

d英 li羽w"8逢嬰c t壱p trung b茨pi"QFDE"vt逢噂c khi chuy吋n d英 li羽w"swc"Oqfwng"GVN"8吋 x穎 lý

Chi ti院t module:

‚ T医t c違 d英 li羽u ngu欝p"8逢嬰c k院t n嘘i v噂k"QFDE"8吋 truy xu医t d英 li羽u

ETL Module: module này x穎 lý d英 li羽w"vjgq"dc"d逢噂c g欝m Trích xu医t (Extract),

Bi院p"8鰻i (Transform), T違i (Load)

o Trích xu医t: Module s穎 d映ng d英 li羽u t瑛 e挨"u荏 d英 li羽u doanh nghi羽p và các t壱p tin pj逢"Urtgcfujggvu."eux."000"n o"f英 li羽w"8亥w"x q0"Ucw"8„."Oqfwng"vt ej"zw医t các b違ng,

e e"vt逢運ng, các thu瓜c tính c亥n thi院t và phù h嬰p v噂i yêu c亥u nghi羽p v映

o Bi院p"8鰻i: D英 li羽u sau khi trích xu医t s胤 8逢嬰c x穎 lý d詠a vào các quy t逸c nghi羽p v映 cho phù h嬰p v噂i c医w" vt¿e" x " 8鵜nh d衣ng c栄a các b違pi." vt逢運ng trong Data Warehouse và Data Marts

o T違i: D英 li羽u sau khi x穎 lý s胤 8逢嬰e"8鵜nh th運k"8吋 chuy吋p"ucpi"n逢w"x q"Fcvc"Octvu"

và Data Warehouse

Ngày đăng: 03/06/2022, 11:31

HÌNH ẢNH LIÊN QUAN

CÁC KHÁI NI烏M TRONG MÔ HÌNH CHI陰U D頴 LI烏U - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
CÁC KHÁI NI烏M TRONG MÔ HÌNH CHI陰U D頴 LI烏U (Trang 22)
M瓜t s嘘 bi院n th吋 c栄a mô hình sao là mô hình r院t (Centipede Schema), m瓜t b違pi&#34;Hcev&#34;8逢嬰c bao quanh b荏i quá nhi隠u b違ng Chi隠u, mô hình bông tuy院t (Snowflake Schema), b違ng Fact n嘘i  v 噂i b違ng Chi隠u và b違ng Chi隠u l衣i n嘘i v噂i các b違ng Chi隠u khác - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
t s嘘 bi院n th吋 c栄a mô hình sao là mô hình r院t (Centipede Schema), m瓜t b違pi&#34;Hcev&#34;8逢嬰c bao quanh b荏i quá nhi隠u b違ng Chi隠u, mô hình bông tuy院t (Snowflake Schema), b違ng Fact n嘘i v 噂i b違ng Chi隠u và b違ng Chi隠u l衣i n嘘i v噂i các b違ng Chi隠u khác (Trang 25)
2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA) - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA) (Trang 25)
H·nh 6: Mô hình Chuy あp&#34;Aご i Sぐ [17] - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
nh 6: Mô hình Chuy あp&#34;Aご i Sぐ [17] (Trang 29)
NH一N D萎NG KÝ T衛 QUANG H窺C (OCR) - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
NH一N D萎NG KÝ T衛 QUANG H窺C (OCR) (Trang 29)
Minh hoạ Giải thuật ALPT với dữ liệu tại Bảng 4.1. - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
inh hoạ Giải thuật ALPT với dữ liệu tại Bảng 4.1 (Trang 30)
‚ Phân tích d英 li羽u &lt;&#34;Oqfwng&#34;8逢嬰e&#34;pj„o&#34;8隠 xu 医t g欝m b嘘n thành ph亥n là mô hình d 詠8qƒp&#34;ƒr&#34;f映ng Máy h丑c (Machine Learning Model), công c映 trí tu羽 kinh doanh  (BI  Tools),  chu 育n  b鵜  d英  li羽u  (Data  Preparation  Module),  b瓜  qu - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
h ân tích d英 li羽u &lt;&#34;Oqfwng&#34;8逢嬰e&#34;pj„o&#34;8隠 xu 医t g欝m b嘘n thành ph亥n là mô hình d 詠8qƒp&#34;ƒr&#34;f映ng Máy h丑c (Machine Learning Model), công c映 trí tu羽 kinh doanh (BI Tools), chu 育n b鵜 d英 li羽u (Data Preparation Module), b瓜 qu (Trang 41)
T瑛 H·nh 22, nhóm tác gi違 cung c医p thông tin v隠 Bus Matrix g欝m n瓜i dung c栄a 8 mô hình Fact-model, 16 b違ng Chi隠u chia s飲 dùng chung 8逢嬰c hi羽n th詠c trong h羽 th嘘ng 8隠 xu医t - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
nh 22, nhóm tác gi違 cung c医p thông tin v隠 Bus Matrix g欝m n瓜i dung c栄a 8 mô hình Fact-model, 16 b違ng Chi隠u chia s飲 dùng chung 8逢嬰c hi羽n th詠c trong h羽 th嘘ng 8隠 xu医t (Trang 42)
3.8.3 永NG D影NG MÔ HÌNH TRÍ TU烏 NHÂN T萎O - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
3.8.3 永NG D影NG MÔ HÌNH TRÍ TU烏 NHÂN T萎O (Trang 62)
4.3.1 MÔ HÌNH AI PHÂN TÍCH PHÂN KHÚC KHÁCH HÀNG - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
4.3.1 MÔ HÌNH AI PHÂN TÍCH PHÂN KHÚC KHÁCH HÀNG (Trang 78)
‚ Bi 吋w&#34;8欝 hình tròn - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
i 吋w&#34;8欝 hình tròn (Trang 79)
H·nh 44: Mô hình trích xuXt dの liうu áp dつng công nghう OCR - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
nh 44: Mô hình trích xuXt dの liうu áp dつng công nghう OCR (Trang 81)
Ucw&#34;mjk&#34;8«&#34;jq p&#34;vj pj&#34;d逢噂 cnh 壱n di 羽p&#34;x&lt;p&#34;d違 n, ta có th吋 v胤 các khung hình ch英 nh 壱t tr詠c ti院p lên 違nh nh茨m ki吋m tra tính 8¿pi&#34;8逸n c栄a thu壱t toán, t瑛8„&#34;e„&#34;vj吋 tr 詠 c ti 院 p  c 違i thi羽n các thông s嘘 giúp cho vi羽 - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
cw &#34;mjk&#34;8«&#34;jq p&#34;vj pj&#34;d逢噂 cnh 壱n di 羽p&#34;x&lt;p&#34;d違 n, ta có th吋 v胤 các khung hình ch英 nh 壱t tr詠c ti院p lên 違nh nh茨m ki吋m tra tính 8¿pi&#34;8逸n c栄a thu壱t toán, t瑛8„&#34;e„&#34;vj吋 tr 詠 c ti 院 p c 違i thi羽n các thông s嘘 giúp cho vi羽 (Trang 83)
馨 Trong ph衣m vi lu壱p&#34;x&lt;p.&#34;rj逢挨pi&#34;rjƒr&#34;vk院p c壱n mô hình t瑛 trên xu嘘ng (Bottom-up) s胤 8逢嬰c áp d映pị&#34;e pi&#34;n &#34;eƒej&#34;vk院p c壱n c栄c&#34;Mkodcnn0&#34;Ak隠w&#34;8„&#34;p„k&#34;n‒p&#34;t茨ng m瓜t Data Mart (Ví  d 映&lt;&#34;Ucngư&#34;8逢 - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
rong ph衣m vi lu壱p&#34;x&lt;p.&#34;rj逢挨pi&#34;rjƒr&#34;vk院p c壱n mô hình t瑛 trên xu嘘ng (Bottom-up) s胤 8逢嬰c áp d映pị&#34;e pi&#34;n &#34;eƒej&#34;vk院p c壱n c栄c&#34;Mkodcnn0&#34;Ak隠w&#34;8„&#34;p„k&#34;n‒p&#34;t茨ng m瓜t Data Mart (Ví d 映&lt;&#34;Ucngư&#34;8逢 (Trang 105)
‚ C亥p&#34;e„&#34;pi逢運i chuyên môn v隠 c違 mô hình hoá d英 li羽u và bi院t v隠 nghi羽p v映 kinh doanh c 栄a doanh nghi羽p nh亥m thi院t k院, xây d詠pi&#34;e挨&#34;u荏 h衣 t亥pi&#34;8吋 ph映c v映 cho vi羽e&#34;n逢w&#34;vt英 d逢噂e&#34;8羽o&#34;*Uvcikpi+.&#34;Fcvc&#34;Yctgjqwug&#34;e pi - Xây dựng hệ thống trí tuệ kinh doanh cho doanh nghiệp áp dụng vào công ty sản xuất hoặc thương mại
p &#34;e„&#34;pi逢運i chuyên môn v隠 c違 mô hình hoá d英 li羽u và bi院t v隠 nghi羽p v映 kinh doanh c 栄a doanh nghi羽p nh亥m thi院t k院, xây d詠pi&#34;e挨&#34;u荏 h衣 t亥pi&#34;8吋 ph映c v映 cho vi羽e&#34;n逢w&#34;vt英 d逢噂e&#34;8羽o&#34;*Uvcikpi+.&#34;Fcvc&#34;Yctgjqwug&#34;e pi (Trang 106)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w