‚ Tìm hi吋u v隠 các công ngh羽 trí tu羽 nhân t衣o, khai phá d英 li羽u 8吋 phân tích d詠 báo, tr違i nghi羽m khách hàng ho員c áp d映ng t嘘k"逢w"jq "u違n xu医t, qu違n lý v壱v"v逢È ‚ Hi羽n th詠c h羽 th嘘ng e挨"ej院 E
Trang 1VT姶云PI"A萎I H窺C BÁCH KHOA
LU 一P"X;P"V渦T NGHI烏R"A萎I H窺C
Trang 22
Trang 33
Trang 44
Trang 55
N云K"ECO"AQCP
Chúng tôi zkp"eco"8qcp"8¤{"n "e»pi"vt·pj"pijk‒p"e泳u c栄a riêng chúng tôi f逢噂i s詠
ik o"u v"x "j逢噂ng d磯n c栄a PGS TS Tr亥n Minh Quang N瓜i dung nghiên c泳u và các k院t
qu違 8隠u là trung th詠e"x "ej逢c"v瑛pi"8逢嬰c công b嘘 vt逢噂e"8¤{0"E e"u嘘 li羽w"8逢嬰c s穎 d映ng cho quá trình phân tích, nh壱p"zfiv"8逢嬰c chính chúng tôi thu th壱p t瑛 nhi隠u ngu欝n khác nhau
x "8逢嬰c ghi rõ trong ph亥n tài li羽u tham kh違o
Ngoài ra, chúng tôi e pi"e„"u穎 d映ng m瓜t s嘘 nh壱p"zfiv."8 pj"ik "x "u嘘 li羽u c栄a các tác gi違 mj e."e挨"swcp"v鰻 ch泳c khác T医t c違 8隠u có trích d磯n và chú thích ngu欝n g嘘c
N院u phát hi羽n có b医t kì s詠 gian l壱n nào, chúng tôi xin hoàn toàn ch鵜u trách nhi羽m
v隠 n瓜i dung Lu壱p"x<p"v嘘t nghi羽r"A衣i h丑c c栄c"o·pj."A衣i h丑c Bách Khoa - A衣i h丑c Qu嘘c Gia TPHCM mj»pi"nk‒p"swcp"8院n nh英ng vi ph衣m tác quy隠n, b違n quy隠n do chúng tôi gây
ra trong quá trình th詠c hi羽n
TP H欝 Chí Minh, Ngày 26 tháng 07 p<o"4243
Trang 66
N云K"E謂O"愛P
Qua th運i gian h丑c t壱p và rèn luy羽n t衣i Tt逢運pi"A衣i h丑c Bách Khoa - A衣i h丑c Qu嘘c Gia TP HCM, chúng tôi 8逢嬰c s詠 ch雨 b違o và gi違ng d衣y nhi羽t tình c栄a quý th亥{"e»."8員c
bi羽t là quý th亥y cô khoa Khoa h丑e"x "M "vjw壱v"O {"v pj"8«"vtw{隠p"8衣t cho nh英ng ki院n
th泳c v隠 lý thuy院t và th詠c hành trong su嘘t th運i gian h丑c t壱p 荏 vt逢運ng
Chúng tôi v噂i m丑i s詠 n厩 l詠c c栄a b違p"vj¤p"8«"jq p"vj pj"Lu壱p"x<p"v嘘t nghi羽p c栄a mình Chúng tôi zkp"ej¤p"vj pj"e o"挨p"sw#"vj亥{"e»"vt逢運pi"A衣i h丑c Bách Khoa - AJSI"VR0"JEO."8«"vtw{隠p"8衣t cho chúng tôi nh英ng ki院n th泳c b鰻 ích trong th運i gian qua Chúng tôi t臼 lòng bi院v"挨p"u¤w"u逸e"8院n PGS.TS Tr亥p"Okpj"Swcpi"8«"j逢噂ng d磯n và h厩 tr嬰 t壱n tình chúng tôi trong quá trình nghiên c泳u
Trong quá trình làm lu壱p"x<p, do ki院n th泳c còn h衣n h姻p, chúng tôi không tránh
kh臼i có nh英ng thi院u sót trong cách trình bày và di宇p"8衣t, và nh英ng công vi羽c yêu c亥u ej逢c"jq p"vj pj Chúng tôi r医t mong nh壱p"8逢嬰c s詠 8„pi"i„r"#"mk院n c栄a quý th亥y cô 8吋 báo cáo lu壱p"x<p"v嘘t nghi羽r"8衣v"8逢嬰c k院t qu違 t嘘t nh医t
Cu嘘i cùng, chúng tôi kính chúc các quý th亥y cô d欝i dào s泳c kho飲, thành công trên eqp"8逢運ng phát tri吋n s詠 nghi羽p giáo d映c 8亥{"#"pij c và cao quý
Trang 77
VïO"V溢V"A陰"VÉK
Ngày nay, vi羽c áp d映ng công ngh羽 vj»pi"vkp"x q"ncq"8瓜ng và s違n xu医t 8«"vt荏 thành zw"j逢噂ng và h亥u h院t các doanh nghi羽p b逸v"8亥u chuy吋p"8鰻i t医t c違 các b違n ghi trên gi医y sang các t羽p máy tính k悦 thu壱t s嘘 Qua th運i gian, doanh nghi羽p xu医t hi羽n nhu c亥u c医p thi院t là làm sao phân tích t瑛 kho d英 li羽u kh鰻ng l欝 8„"8吋 xem xét."8 pj"iká l衣i m丑i th泳 h丑 8«"làm, t瑛 h羽 th嘘ng n瓜i b瓜 8院p"v逢挨pi"v e"e栄a khách hàng T瑛 8„."fqcpj"pijk羽p có th吋 vjc{"8鰻i quy trình c栄a mình theo cách cho phép ra quy院v"8鵜nh t嘘v"j挨p."jk羽u qu違 j挨p."nâng cao tr違i nghi羽m khách hàng v噂i nhi隠w"v pj"e "pj¤p"j„c"j挨p"p英a
Nhóm 8«"ch丑n 8隠 tài "XÂY D衛NG H烏 TH渦NG TRÍ TU烏 KINH DOANH
CHO DOANH NGHI 烏P ÁP D影NG VÀO CÔNG TY S謂N XU遺T HO咽E"VJ姶愛PI"
M 萎I" v噂i s詠 j逢噂ng d磯n c栄a th亥y PGS TS Tr亥n Minh Quang làm lu壱p"x<p"v嘘t nghi羽p
A衣i h丑c 8吋 gi違i quy院t nh英pi"mj„"mj<p."pjw"e亥u c栄a doanh nghi羽p A隠 tài nghiên c泳u và phát tri吋n 泳ng d映ng h厩 tr嬰 doanh nghi羽p xây d詠ng kho d英 li羽u (Data Warehouse) và trí
tu羽 kinh doanh (Business Intelligence) H羽 th嘘pi"p {"8逢嬰c kì v丑ng là có kh違 p<pi"j厩 tr嬰 các doanh nghi羽p qu違n lý ngu欝n d英 li羽w"x "8逢c"tc"pj英ng l運k"mjw{‒p"8吋 doanh nghi羽r"8逢c"
ra nh英ng quy院v"8鵜nh mang tính quy院v"8鵜nh."8逢c"tc"pj英ng tr違i nghi羽m t嘘t nh医t cho khách hàng H羽 th嘘ng có th吋 tùy ch雨nh phù h嬰p cho nhi隠u doanh nghi羽p v噂i tr丑ng tâm là doanh nghi羽p s違n xu医t và doanh nghi羽r"vj逢挨pi"o衣i
Vtqpi"8隠 tài lu壱n x<p, nhóm tác gi違 tìm hi吋u v隠 kho d英 li羽u, quá trình trích xu医t,
bi院p"8鰻i d英 li羽u và tr詠c quan hoá d英 li羽u trong trí tu羽 mkpj"fqcpj."8隠 xu医v"rj逢挨pi"rj r"xây d詠ng kho d英 li羽w."e挨"ej院 ETL và công c映 phân tích d英 li羽u, hi羽n th詠e"rj逢挨pi"rj r"8隠 xu医t Ucw"8„."phóm xây d詠ng nh英ng quy trình chung và t鰻ng quan nh医t mà các doanh nghi羽p s違n xu医t và doanh nghi羽r"vj逢挨pi"o衣i mong mu嘘n khi xây d詠ng và s穎 d映ng m瓜t
h羽 th嘘ng kho d英 li羽u Nh英ng quy trình này 8逢嬰c nhóm tác gi違 trích xu医t t瑛 các nghiên
c泳u c栄a nhóm v隠 doanh nghi羽r"vj逢挨pi"o衣i và s違n xu医t Cu嘘i cùng, các quy trình mà nhóm tác gi違 s胤 t壱p trung phát tri吋n bao g欝m quy trình bán hàng (Sales), Nh壱p hàng (Procurement), Kho n逢w"vt英 hàng hoá (Product Inventory) và qu違n lý quan h羽 khách hàng
(Customer Relationship Management)
Trang 88
O影E"N影E
L云I ECO"AQCP 2
L云I C謂O"愛P 6
TÓM T溢V"A陰 TÀI 7
M影C L影C 8
DANH M影C HÌNH 12
DANH M影C B謂NG 14
DANH M影C THU一T NG頴 - T洩 VI蔭T T溢T 15
EJ姶愛PI"3<"IK閏I THI烏U 16
GI閏I THI烏U A陰 TÀI 16
M影E"VKçW"A陰 TÀI 16
GI閏I H萎P"A陰 TÀI 17
C遺U TRÚC LU一P"X;P 18
EJ姶愛PI"4<"E愛"U雲 LÝ THUY蔭T VÀ CÁC NGHIÊN C永U LIÊN QUAN 19
A渦K"V姶営NG DOANH NGHI烏P 19
2.1.1 DOANH NGHI烏R"VJ姶愛PI"O萎I 19
2.1.2 DOANH NGHI烏P S謂N XU遺T 20
KHO D頴 LI烏U (DATA WAREHOUSE) 20
40403"A卯PJ"PIJ C 20
2.2.2 CÁCH XÂY D衛NG KHO D頴 LI烏U 20
2.2.3 CÁCH TI蔭P C一N KIMBALL (BOTTOM-UP) 21
40406"AèPJ"IKè"EJWPI"X陰 CÁCH TI蔭P C一N C曳A KIMBALL 22
CÁC KHÁI NI烏M TRONG MÔ HÌNH CHI陰U D頴 LI烏U 22
40503"RJ姶愛PI"RJèR"VJK蔭T K蔭 MÔ HÌNH CHI陰U D頴 LI烏U 22
2.3.2 B謂NG S衛 TH一T (FACT) 23
2.3.3 B謂NG CHI陰U (DIMENSION) 23
2.3.4 BUS MATRIX 23
2.3.5 SCD (SLOWLY CHANGE DIMENSION) 23
2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA) 25
TRÍ TU烏 KINH DOANH 25
40603"A卯PJ"PIJ C 25
2.4.2 TRÍ TU烏 KINH DOANH K蔭T H営P V閏I KHAI PHÁ D頴 LI烏W"XÉ"M "VJW一T H窺C MÁY 26
ETL PIPELINE (EXTRACT Î TRANSFORM - LOAD) 27
2.5.1 KHÁI NI烏M 27
2.5.2 THÀNH PH井N CHÍNH TRONG TI蔭N TRÌNH ETL 27
Trang 99
S渦 LI烏U HOÁ (DIGITIZATION) 28
2.6.3"A卯PJ"PIJ C 28
2.6.2 S渦 LI烏U HOÁ (DIGITIZATION) VÀ S渦 HOÁ (DIGITALIZATION) 28
NH一N D萎NG KÝ T衛 QUANG H窺C (OCR) 29
2.7.1 KHÁI NI烏M 29
40904"A窺E"JQè"A愛P"BÁN HÀNG B稲NG CÔNG NGH烏 OCR 29
CÁC NGHIÊN C永U, S謂N PH域M LIÊN QUAN 31
2.8.1 CÁC NGHIÊN C永U 31
2.8.2 CÁC S謂N PH域M 32
EJ姶愛PI"5<"RJåP"VëEJ"XÉ"VJK蔭T K蔭 H烏 TH渦NG 33
V遺P"A陰 C井N GI謂I QUY蔭T 33
MJï"MJ;P 33
GI謂I PHÁP 34
PHÂN TÍCH H烏 TH渦NG 34
3.4.1 YÊU C井U CH永E"P;PI 34
3.4.2 YÊU C井U PHI CH永E"P;PI 35
50605"U愛"A唄 UML VÀ MÔ T謂 CH永E"P;PI"J烏 TH渦PI"A陰 XU遺T 36
KI蔭N TRÚC H烏 TH渦NG 40
THI蔭T K蔭 KHO D頴 LI烏U 42
50803"DWU"OCVTKZ"A陰 XU遺T 42
50804"EèE"HCEV"OQFGN"A陰 XU遺T 42
THI蔭T K蔭 E愛"EJ蔭 ETL 49
3.7.1 KI蔭N TRÚC 49
3.7.2 PHÂN TÍCH CH永E"P;PI"E愛"EJ蔭 ETL 51
50905"VJC["A蔚I C遺U TRÚC B謂NG HI烏N CÓ 54
50906"E愛"EJ蔭 A卯NH TH云I 57
CÔNG C影 PHÂN TÍCH D頴 LI烏U 58
3.8.1 NH頴PI"N PJ"X衛C C井N PHÂN TÍCH 58
3.8.2 PHÂN TÍCH YÊU C井U CHUNG C曳C"PI姶云I QU謂N LÝ 58
3.8.3 永NG D影NG MÔ HÌNH TRÍ TU烏 NHÂN T萎O 62
3.8.4 CÔNG C影 TR衛C QUAN HOÁ D頴 LI烏U 63
A域Y M萎NH KH謂 P;PI"U渦 LI烏U HOÁ VÀ THU TH一P THÔNG TIN 64
50;03"MJï"MJ;P"E曳A DOANH NGHI烏P TRONG QUÁ TRÌNH S渦 HOÁ 64
50;04"RJ姶愛PI"RJèR"U渦 HOÀ D頴 LI烏U B稲NG CÔNG NGH烏 OCR 65
EJ姶愛PI"6<"JK烏N TH衛C H烏 TH渦NG 67
XÂY D衛NG KHO D頴 LI烏U 67
Trang 1010
4.1.1 CÁC LO萎I MÔ HÌNH D頴 LI烏W"A井U VÀO 67
4.1.2 M渦I QUAN H烏 (RELATIONSHIPS) 68
60305"V姶愛PI"VèE"X閏I CÁC B謂NG TRONG MÔ HÌNH CHI陰U 68
4.1.4 CÁC THU浦C TÍNH C曳A B謂NG TRONG MÔ HÌNH CHI陰U 69
HI烏N TH衛E"E愛"EJ蔭 ETL 70
4.2.1 TRÍCH XU遺T D頴 LI烏U (EXTRACT DATA, DATA INGESTION) 70
4.2.2 CÁC PHÉP BI蔭P"A蔚I D頴 LI烏U (DATA TRANSFORM) 72
4.2.3 T謂I D頴 LI烏U VÀO KHO D頴 LI烏U (LOAD DATA) 76
60406"E愛"EJ蔭 A卯NH TH云I 77
CÔNG C影 PHÂN TÍCH D頴 LI烏U 78
4.3.1 MÔ HÌNH AI PHÂN TÍCH PHÂN KHÚC KHÁCH HÀNG 78
4.3.2 TR衛C QUAN HOÁ D頴 LI烏U 78
4.3.3 PHÂN TÍCH D頴 LI烏U B稲NG CÁC CÔNG C影 BÊN TH永 BA 80
RJ姶愛PI"RJèR"U渦 HOÁ B稲NG CÔNG NGH烏 OCR 81
EJ姶愛PI"7<"V蔚NG K蔭T VÀ CÔNG VI烏E"VTQPI"V姶愛PI"NCK 87
K蔭T QU謂 A萎V"A姶営C 87
姶W"XÉ"PJ姶営E"AK韻O"RJ姶愛PI"RJèR"A陰 XU遺T 87
70403"姶W"AK韻M 87
5.2.2 H萎N CH蔭 88
5.2.3 GI謂I PHÁP C謂I TI蔭N 88
J姶閏NG M雲 R浦PI"V姶愛PI"NCK 89
AèNH GIÁ 89
70603"AèPJ"IKè"VTçP"[çW"E井W"PI姶云I DÙNG 89
70604"AèPJ"IKè"JK烏U XU遺T T謂I TRANG GIAO DI烏P"PI姶云I DÙNG 91
70605"AèPJ"IKè"VJ云I GIAN TH衛C HI烏N ETL CHO CÁC FACT MODEL 92
70606"AèPJ"IKè"X陰 CHI PHÍ 94
70607"AèPJ"IKè"EJK"RJë"VTQPI"VT姶云NG H営P C影 TH韻 97
TÀI LI 烏U THAM KH謂O 100
EJ姶愛PI"8<"RJ影 L影C 104
LÝ THUY蔭T LIÊN QUAN 104
6.1.1 KHÁI NI烏M DATA WAREHOUSE THEO INMON (TOP-DOWN) 104
80304"AèPJ"IKè"EJWPI"X陰 2 CÁCH TI蔭P C一N XÂY D衛NG KHO D頴 LI烏U 104
MÔ T謂 CÁC B謂NG CHI陰U DÙNG CHUNG 106
6.2.1 DATE DIMENSION 106
6.2.2 PRODUCT DIMENSION 106
6.2.3 STORE DIMENSION 107
Trang 1111
6.2.4 WAREHOUSE DIMENSION 107
6.2.5 CUSTOMER DIMENSION 108
6.2.6 PROMOTION DIMENSION 108
6.2.7 PAYMENT METHOD DIMENSION 109
6.2.8 INVENTORY TRANSACTION TYPE DIMENSION 109
6.2.9 CONTRACT TERM DIMENSION 109
6.2.10 VENDOR DIMENSION 109
6.2.11 PROCUREMENT DIMENSION 110
6.2.12 RESELLER DIMENSION 110
6.2.13 SHIP METHOD DIMENSION 110
6.2.14 MARKET DIMENSION 111
PHI蔭U KH謂Q"UèV"AèPJ"IKè"[çW"E井U C曳A NHÀ QU謂N LÝ 111
CÔNG NGH烏 S盈 D影NG 113
6.4.1 NGÔN NG頴 L一P TRÌNH 113
6.4.2 N陰N T謂PI"XÉ"VJ姶"XK烏N S盈 D影NG 114
6.4.3 GOOGLE CLOUD PLATFORM 114
J姶閏NG D郁P"EÉK"A咽T H烏 TH渦NG 115
6.5.1 YÊU C井U V陰 PH井N C永NG 115
6.5.2 MÔK"VT姶云PI"EÉK"A咽T H烏 TH渦NG 115
80705"EÉK"A咽T H烏 TH渦NG 115
J姶閏NG D郁N S盈 D影NG 118
6.6.1 K蔭T N渦K"E愛"U雲 D頴 LI烏U DOANH NGHI烏P 118
6.6.2 T萎O KHO D頴 LI烏U 119
6.6.3 THÊM NGU唄N D頴 LI烏U (DATA SOURCE) 119
6.6.4 T萎O DATAMART 120
6.6.5 T萎O FACT-MODEL 122
6.6.6 THÊM / XOÁ B謂NG S衛 TH一T 124
6.6.7 THÊM / XOÁ B謂NG B謂NG CHI陰U 126
6.6.8 THÊM / XOÁ M浦V"VT姶云NG TRONG B謂NG 129
6.6.9 C遺W"JîPJ"E愛"EJ蔭 ETL CHO B謂NG 129
6.6.10 TÁC V影 CRUD LIÊN K蔭T GI頴A CÁC B謂NG TRONG NGU唄N D頴 LI烏U129 6.6.11 TÁC V影 CRUD LIÊN K蔭T GI頴A CÁC B謂NG TRONG FACT-MODEL 130
6.6.12 C遺W"JîPJ"E愛"EJ蔭 A卯NH TH云I ETL 131
6.6.13 THÊM / XOÁ M浦T BI韻W"A唄."A唄 TH卯 132
6.6.14 CH迂NH S盈A M浦T BI韻W"A唄."A唄 TH卯 134
6.6.15 CH迂NH S盈C"EÉK"A咽T GOOGLE CLOUD PLATFORM 135
Trang 1212
FCPJ"O影E"JîPJ
HîNH 1: KI蔭N TRÚC DW/BI C曳A KIMBALL 22
HîNH 2: VÍ D影 MINH HO萎 SCD LO萎I 1 [9] 24
HîNH 3: VÍ D影 MINH HO萎 SCD LO萎I 2 [9] 24
HîNH 4: STAR SCHEMA 25
HîNH 5: CÁCH HI韻W"A愛P"IK謂N V陰 BI (JAYANTHI RANJAN 2005) [13] 26
HîNH 6: MÔ HÌNH CHUY韻P"A蔚I S渦 [17] 29
HîNH 7: CÔNG NGH烏 OCR [18] 29
HîNH 8: VÍ D影 MINH HO萎 OCR 30
HîPJ";<"QET"RKRGNKPG"E愛"D謂N [19] 30
HîNH 10: V遺P"A陰 C井N GI謂I QUY蔭T THEO T洩PI"IKCK"AQ萎N 33
HîPJ"33<"U愛"A唄 USER CASE H烏 TH渦NG 36
HîNH 12: QU謂N LÝ DATA SOURCE 37
HîNH 13: THÊM M閏I DATA SOURCE 37
HîNH 14: C一P NH一T THÔNG TIN DATA SOURCE 37
HîNH 15: TRANG QU謂N LÝ DATAWAREHOUSE 38
HîPJ"38<"VTCPI"A卯NH TH云I 38
HîNH 17: THÊM M閏K"A卯NH TH云I 39
HîNH 18: TRANG DASHBOARD 39
HîNH 19: THÊM BI韻W"A唄 M閏I 39
HîPJ"42<"U愛"A唄 KI蔭N TRÚC H烏 TH渦NG 40
HîNH 21: MÔ HÌNH GIAO TI蔭P GI頴A CÁC THÀNH PH井N TRONG H烏 TH渦NG 41
HîNH 22: BUS MATRIX CHO QUY TRÌNH DOANH NGHI烏P 42
HîNH 23: RETAIL SALES FACT MODEL 43
HîNH 24: RESELLER SALES FACT MODEL 44
HîNH 25: WAREHOUSE INVENTORY TRANSACTION FACT MODEL 45
HîNH 26: STORE INVENTORY SNAPSHOT FACT MODEL 46
HîNH 27: PROCUREMENT TRANSACTION FACT MODEL 46
HîNH 28: VENDOR PERFORMANCE FACT MODEL 47
HîNH 29: PROFITABILITY CM FACT MODEL 49
HîPJ"52<"E愛"EJ蔭 ETL T蔚NG QUAN 50
HîPJ"53<"E愛"EJ蔭 ETL CHI TI蔭T 51
HîNH 32: C遺U TRÚC B謂NG BATCH EXTRACT JOB 52
HîNH 33: QUÁ TRÌNH BI蔭P"A蔚I B謂NG CHI陰U TRÊN DATAFLOW 53
Trang 1313
HỵNH 34: B謂PI"AëEJ"VT姶閏C KHI T謂K"V;PI"VK蔭N 54
HỵNH 35: B謂NG T萎O"FơPI"A韻 T謂K"V;PI"VK蔭N 54
HỵNH 36: SAU KHI T謂K"V;PI"VK蔭N SCD1 54
HỵNH 37: SAU KHI T謂K"V;PI"VK蔭N SCD2 54
HỵPJ"5:<""QET"RKRGNKPG"E愛"D謂N [19] 65
HỵNH 39: AIRFLOW DAGS CHO CÁC FACTMODEL 77
HỵNH 40: LU唄NG TH衛C THI C曳A MƠ HÌNH PHÂN KHÚC KHÁCH HÀNG 78
HỵNH 41: C遺U HÌNH M浦T BI韻W"A唄 1"A唄 TH卯 79
HỵNH 42: MEASURE EDIT 80
HỵNH 43: DIMENSION EDIT 80
HỵNH 44: MƠ HÌNH TRÍCH XU遺T D頴 LI烏U ÁP D影NG CƠNG NGH烏 OCR 81
HỵNH 45 謂PJ"A井U VÀO CHO QUÁ TRÌNH OCR 82
HỵNH 46: THÊM BOX CHO 謂NH 83
HỵNH 47: L窺C VÀ S溢P X蔭P L萎I K蔭T QU謂 T洩 TEXT RECOGNITION 84
HỵNH 48: T一P TIN THI蔭T L一P CHO QUÁ TRÌNH TRÍCH XU遺V"JQè"A愛P 85
HỵNH 49: K蔭T QU謂 TRÍCH XU遺V"JQè"A愛P"D稲NG CƠNG NGH烏 OCR 86
HỵNH 50: M永C D頴 LI烏U TRONG KI蔭N TRÚC INMON 105
HỵNH 51: KI蔭N TRÚC DW/BI C曳A INMON 105
HỵNH 52: DATE DIMENSION 106
HỵNH 53: PRODUCT DIMENSION 107
HỵNH 54: STORE DIMENSION 107
HỵNH 55: WAREHOUSE DIMENSION 108
HỵNH 56: CUSTOMER DIMENSION 108
HỵNH 57: PROMOTION DIMENSION 109
HỵNH 58: PAYMENT METHOD DIMENSION 109
HỵNH 59: CONTRACT TERM DIMENSION 109
HỵNH 60: VENDOR DIMENSION 110
HỵNH 61: PROCUREMENT TRANSACTION TYPE DIMENSION 110
HỵNH 62: RESELLER DIMENSION 110
HỵNH 63: SHIP METHOD DIMENSION 110
HỵNH 64: MARKET DIMENSION 111
Trang 1414
FCPJ"O影E"D謂PI
B謂NG 1: T蔚NG QUÁT V陰 CÁC LO萎I SCD (KIMBALL 2002) [10] 24
B謂NG 2: M永C D頴 LI烏U C曳A CÁC B謂NG FACTS 43
B謂NG 3: KH謂O SÁT NHU C井U BÁO CÁO V陰 NGHI烏P V影 BÁN HÀNG 59
B謂NG 4: KH謂O SÁT NHU C井U BÁO CÁO V陰 NGHI烏P V影 MUA HÀNG 60
B謂NG 5: KH謂O SÁT NHU C井U V陰 NGHI烏P V影 N姶W"MJQ"JÉPI"JQè 60
B謂NG 6: KH謂O SÁT NHU C井U V陰 NGHI烏P V影 CRM 61
B謂NG 7: KI韻U D頴 LI烏W"SW["A卯NH TRONG VIÊC BI蔭P"A蔚I D頴 LI烏U 73
B謂NG 8: HÀM T蔚NG QUÁT 74
B謂NG 9: HÀM TOÁN H窺C 74
B謂NG 10: HÀM X盈 LÝ CHU姥I 74
B謂NG 11: HÀM X盈 LÝ TH云I GIAN 74
B謂PI"34<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 BÁN HÀNG 89
B謂PI"35<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 MUA HÀNG 90
B謂PI"36<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 N姶W"MJQ"JÉPI"JQè 90
B謂PI"37<"AèPJ"IKè"J烏 TH渦NG V陰 NGHI烏P V影 CRM 90
B謂NG 16: K蔭T QU謂 T謂I TRANG GIAO DI烏P"PI姶云I DÙNG 91
B謂NG 17<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_SALES 93
B謂PI"3:<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_VENDORRATING 93
B謂NG 19<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_INVENTROY_PRODUCT 93
B謂NG 20<"AèPJ"IKè"VJ云I GIAN TH衛C THI FM_PROCUREMENTTRANSACTION93 B謂PI"43<"AèPJ"IKÁ TH云I GIAN TH衛C THI FM_SALES BRAZIL OLIST 94
B謂NG 22: T蔚NG H営P CHI PHÍ CHO 1 L井N CH萎["N姶W"VT頴 TRONG 1 THÁNG 99
B謂NG 23: PHI蔭U KH謂O SÁT NGHI烏P V影 BÁN HÀNG 111
B謂NG 24: PHI蔭U KH謂O SÁT NGHI烏P V影 NH一P HÀNG 111
B謂NG 25: PHI蔭U KH謂O SÁT NGHI烏P V影 QU謂N LÝ KHO 112
B謂NG 26: PHI蔭U KH謂O SÁT NGHI烏P V影 QU謂N LÝ QUAN H烏 KHÁCH HÀNG 112
Trang 15DB Database
DD Degenerate Dimension
DM Data Mart
DW Data Warehouse ETL Extract, Transform, Load ERM Entity-Relationship Model
FK Foreign Key GCP Google Cloud Platform IDC International Data Corporation OCR Optical Character Recognition OLAP Online Analytical Processing
UDF User Defined Function UML Unified Modeling Language
PK Primary Key SQL Structured Query Language
Trang 1616
EJ姶愛PI"3< GI 閏I THI烏U
Vtqpi"ej逢挨pi"p {."v e"ik違 gi噂i thi羽w"8隠 tài, m映c tiêu và n瓜k"fwpi"8隠 tài, gi噂i h衣n 8隠 v k."e pi"pj逢"e医u trúc lu壱p"x<p0
GI 閏I THI烏W"A陰 TÀI
Trong kh違q"u v"p<o"423:"e栄a IDC, chuy吋p"8鰻i s嘘 *Fkikvcn"Vtcpuhqtocvkqp+"8cpi"
tr荏 thành chi院p"n逢嬰c t衣i các doanh nghi羽p, t鰻 ch泳c c栄a cu瓜c cách m衣ng công nghi羽p l亥n
th泳 v逢0"Nh運 h羽 th嘘ng báo cáo thông su嘘t k鵜p th運i, chuy吋p"8鰻i s嘘 mang l衣i nhi隠u l嬰i íchpj逢"e逸t
gi違m chi phí v壱n hành, ti院p c壱p"8逢嬰c nhi隠w"rj¤p"mj¿e"mj ej"j pi."ik¿r"n«pj"8衣o ra quy院t 8鵜nh nhanh chóng và chính xác j挨p0 [1]
Trong quá trình phát tri吋n, các công ty v隠 vj逢挨pi"o衣i và s違n xu医t quan sát th医y 8逢嬰c các d英 li羽w"n逢w"vt英 c栄a công ty ngày m瓜t l噂n d亥n, (m丑i thông tin d英 li羽u t瑛 vi羽c
nh壱p/xu医t hàng, s嘘 giao d鵜ch, thông tin s違n ph育m, nhân s詠, thông tin khách hàng, È)
Nh英ng d英 li羽u này 8隠w"8逢嬰e"n逢w"vt英 trên n隠n t違ng công ngh羽 pj逢"e e"v壱p tin th嘘ng kê Gzegn"x "e挨"u荏 d英 li羽w"pj逢pi d英 li羽u thu th壱p ej逢c"8逢嬰c khai thác giá tr鵜 tri羽v"8吋 Công
ty ch雨 8丑c d英 li羽u cho các ho衣v"8瓜ng có tính chu k pj逢"xk院v"d q"e q."vjcpj"vq p"jq "8挨p."
c壱p nh壱t thông tin s違n ph育o."mj ej"j piÈ" D英 li羽w"8逢嬰e"n逢w"vt英 l衣k"pj逢"o瓜v"rj逢挨pi"
ti羽p"ijk"ejfir"8挨p"vjw亥n và không mang l衣i l嬰i ích th壱t s詠 cho công ty
Tuy nhiên, d英 li羽u là m瓜v"e挨"u荏 8 pi"vkp"e壱{"8吋 8逢c"tc"e e"ik違 8鵜nh, nh壱n xét và t瑛 8„"8逢c"tc"sw{院v"8鵜nh chi院p"n逢嬰c cho công ty Vi羽c khai thác d英 li羽w"8go"n衣i cho công ty nhi隠u l嬰k" ej"pj逢"dk院v"8逢嬰c xu th院 c栄a pi逢運i dùng, gi違i quy院t v医p"8隠 khi xu医t hi羽n s詠
ch壱m tr宇 trong khâu phân ph嘘k."e„"8逢嬰c l嬰i th院 c衣nh tranh trên th鵜 vt逢運ng nh運 vi羽e"8逢c"tc"8逢嬰c quy院v"8鵜nh nhanh chóng, c違i thi羽n quy trình ho衣v"8瓜ng công ty hi羽u qu違 j挨pÈ"
V噂i m瓜t th鵜 vt逢運pi"u»k"8瓜ng, r瓜ng l噂n pj逢"jk羽n nay, vi羽e"8逢c"tc"8逢嬰c quy院v"8鵜nh nhanh chóng và chính xác có th吋 8go"n衣i cho công ty l嬰i th院 x逢嬰t tr瓜k"j挨p"e e"8嘘i th栄 khác
Nh壱n th泳e"8逢嬰c nhu c亥w"p {."8隠 tài xây d詠ng h羽 th嘘ng Trí tu羽 kinh doanh và kho
d英 li羽u doanh nghi羽p 8逢嬰c phát tri吋n v噂i m映e"8 ej"pj茨m cung c医r"o»k"vt逢運ng làm vi羽c cho nhà phân tích d英 li羽u Trí tu羽 kinh doanh có th吋 cung c医p cho nhà phân tích cách nhìn
t鰻ng quan v隠 d英 li羽w"o "e»pi"v{"8cpi"e„"8欝ng th運i h厩 tr嬰 pj "rj¤p"v ej"8逢c"tc"sw{院v"8鵜nh chính xác và k鵜p th運i thông qua các công c映 xây d詠ng và phân tích d英 li羽u
M 影E"VKçW"A陰 TÀI
N瓜k"fwpi"8隠 tài bao g欝m các m映e"vk‒w"ucw"8¤{<
‚ Tìm hi吋u, nghiên c泳u v隠 kho d英 li羽u (Data Warehouse), trí tu羽 kinh doanh (Business Intelligence)
Trang 17‚ Tìm hi吋u v隠 các công ngh羽 trí tu羽 nhân t衣o, khai phá d英 li羽u 8吋 phân tích d詠 báo,
tr違i nghi羽m khách hàng ho員c áp d映ng t嘘k"逢w"jq "u違n xu医t, qu違n lý v壱v"v逢È
‚ Hi羽n th詠c h羽 th嘘ng e挨"ej院 ETL, kho d英 li羽u (Data Warehouse), trí tu羽 kinh doanh (Business Intelligence) b茨ng các công ngh羽 8« tìm hi吋w"8逢嬰c
‚ Thu th壱p các d英 li羽u mô ph臼ng cho doanh nghi羽p s違n xu医t ho員c doanh nghi羽p vj逢挨pi"o衣i
‚ Ti院n hành tích h嬰p, th詠c nghi羽m trên t壱p d英 li羽u mô ph臼pi"x "8 pj"ik "mj違 p<pi"
8 r"泳ng c栄a toàn b瓜 h羽 th嘘pi"8隠 xu医v"8嘘i v噂i t壱p d英 li羽u
GI 閏I H萎P"A陰 TÀI
Trong ph衣m vi nghiên c泳u, 8隠 v k"8逢嬰c gi噂i h衣n 荏 d逢噂c h厩 tr嬰 xây d詠ng kho d英
li羽u, có tích h嬰p s印n ch泳e"p<pi"vt "vw羽 kinh doanh bao g欝m tr詠c quan hoá d英 li羽w0"A隠 tài tìm hi吋u v隠 các khái ni羽m v隠 kho d英 li羽w."e挨"ej院 ETL, các ch泳e"p<pi"e栄a trí tu羽 kinh doanh h厩 tr嬰 phân tích d英 li羽u T瑛 8„, nhóm tác gi違 8隠 xu医t nh英ng gi違i pháp h厩 tr嬰 xây
d詠ng kho d英 li羽u d詠a trên yêu c亥u chung và t鰻ng quát nh医t c栄a các công ty s違n xu医t ho員c công ty vj逢挨pi"o衣i
Các yêu c亥u chung nh医t c栄a công ty s違n xu医t ho員e"e»pi"v{"vj逢挨pi"o衣i mà nhóm tác gi違 t壱p trung phát tri吋n trong quá trình nghiên c泳u bao g欝m 荏 các quy trình bán hàng (Sales), nh壱p hàng (Procurement), kho hàng (Product Inventory) và qu違n lý quan h羽 khách hàng (Customer Relationship Management) V噂i m厩k"sw{"vt·pj"pj逢"x壱y, nhóm tác
gi違 s胤 8隠 xu医t ít nh医t là m瓜t khuôn m磯u (Template) cho vi羽c xây d詠pi"sw{"vt·pj"v逢挨pi"泳ng H羽 th嘘ng cung c医r"e挨"ej院 ETL bao g欝m t壱p các phép bi院p"8鰻i ph鰻 bi院n mà nhóm tác gi違 tìm hi吋w"8逢嬰c trong quá trình nghiên c泳w"8隠 tài
Tích h嬰p, th穎 nghi羽o"x "8 pj"ik "kh違 p<pi"8 r"泳ng c栄a h羽 th嘘pi"8隠 xu医t Tìm
hi吋u v隠 m瓜t s嘘 k悦 thu壱t trí tu羽 nhân t衣o có tác d映ng phân tích d詠 báo Cu嘘i cùng là nghiên
c泳w"x "8隠 xu医t gi違k"rj r"8育y m衣nh kh違 p<pi"u嘘 hoá, thu th壱p d英 li羽u nh茨m ph映c v映 phân tích d詠 báo và trí tu羽 kinh doanh
X·"8隠 tài t壱p trung phát tri吋n h羽 th嘘ng trí tu羽 kinh doanh áp d映ng vào công ty vj逢挨pi"o衣i ho員c s違n xu医t, các quy trình nghi羽p v映 o "8隠 tài t壱p trung phát tri吋n ch雨 là
m瓜t ph亥n trong s嘘 các quy trình c栄a 2 lo衣i công ty nêu trên A欝ng th運k."8嘘k"v逢嬰ng doanh nghi羽p mà nhóm tác gi違 t壱p trung phát tri吋p"n "e»pi"v{"vj逢挨pi"o衣i
Trang 1818
C 遺U TRÚC LU一P"X;P
Ej逢挨pi"3 Gi噂i thi羽u chung v隠 8隠 tài, m映c tiêu và n瓜k"fwpi"8隠 tài, gi噂i h衣p"8隠 tài
e pi"pj逢 c医u trúc lu壱p"x<p
Ej逢挨pi"4 E挨"u荏 lý thuy院t c栄a doanh nghi羽r"vj逢挨pi"o衣i và doanh nghi羽p s違n xu医t,
kho d英 li羽u (Data Warehouse), trí tu羽 kinh doanh Các khái ni羽m liên swcp"8院n vi羽c xây d詠ng, phát tri吋n kho d英 li羽u theo mô hình chi隠u d英
li羽u c栄a Kimball
Ej逢挨pi"3 Thi院t k院 h羽 th嘘ng, mô hình h羽 th嘘ng, rj逢挨pi"rj r"8隠 xu医t t瑛 các v医n
8隠 c亥n gi違i quy院t 8吋 xây d詠ng h羽 th嘘ng trí tu羽 kinh doanh cho công ty
s違n xu医t và công ty vj逢挨pi"o衣i
Ej逢挨pi"4 Hi羽n th詠c h羽 th嘘ng Vtqpi"ej逢挨pi"p {."pj„o"v e"ik違 t壱p trung nói v隠
cách th泳c hi羽n th詠c h羽 th嘘ng g欝m các ch泳e"p<pi."e»pi"f映pi"8逢嬰c h厩 tr嬰,
t壱p d英 li羽u th穎 nghi羽m, giao di羽n h羽 th嘘ng và m瓜t s嘘 k院t qu違 8衣v"8逢嬰c
Ej逢挨pi"5 T鰻ng k院t Vtqpi"ej逢挨pi"p {."pj„o"v e"ik違 8隠 c壱r"8院n k院t qu違 8衣v"8逢嬰c,
逢w"x "pj逢嬰e"8k吋m c栄a gi違i rj r"8隠 xu医t, rj逢挨pi"j逢噂ng phát tri吋n trong v逢挨pi"n衣i và m瓜t s嘘 8 pj"ik "v隠 s違n ph育m, v隠 m員t chi phí và m員t k悦 thu壱t
Ej逢挨pi"6 Ph映 l映c Ej逢挨pi"p { cung c医r"ejq"pi逢運k"8丑c các thông tin h英u ích khác,
góp ph亥n hi吋u rõ v隠 8隠 tài bao g欝m các ki院n th泳c liên quan, các công ngh羽 8逢嬰c s穎 d映ng, j逢噂ng d磯n e k"8員t và s穎 d映ng h羽 th嘘ng
Trang 1919
EJ姶愛PI"4< E愛"U雲 LÝ THUY蔭T VÀ CÁC NGHIÊN C永U LIÊN QUAN
Trong ph衣o"xk"8隠 tài, nhóm s穎 d映pi"e e"e挨"u荏 lý thuy院v"8逢嬰e"vt·pj"d {"ucw"8¤{"8吋
n o"e挨"u荏 n隠n t違ng cho vi羽c gi違i quy院t bài toán, phân tích và thi院t k院 h羽 th嘘ng 8隠 xu医t
A渦K"V姶営NG DOANH NGHI烏P
Trong ph亥n này, nhóm s胤 rj¤p"v ej"jck"8嘘k"v逢嬰ng nghiên c泳u là doanh nghi羽p vj逢挨pi"o衣i và doanh nghi羽p s違n xu医t T瑛 8„."pj„o"v e"ik違 s胤 phân tích, thi院t k院 báo cáo ejq"pi逢運i phân tích d英 li羽u
2.1.1 DOANH NGHI 烏R"VJ姶愛PI"O萎I
2.1.1.1 A卯PJ"PIJ C
Doanh nghi羽r"vj逢挨pi"o衣i là nh英pi"8挨p"x鵜 mkpj"fqcpj"8逢嬰c thành l壱p v噂i m映c
8 ej"vj詠c hi羽n các ho衣v"8瓜pi"vtqpi"mkpj"fqcpj"vj逢挨pi"o衣i, t鰻 ch泳c mua bán hàng hóa
nh茨m mang l衣i l嬰i nhu壱n [2]
2.1.1.2 CÁC LO 萎I HÌNH DOANH NGHI烏R"VJ姶愛PI"O萎I
Doanh nghi羽r"vj逢挨pi"o衣k"8逢嬰c chia thành nh英ng lo衣i hình sau: [2]
‚ Doanh nghi羽p kinh doanh chuyên môn hóa: là doanh nghi羽r"vj逢挨pi"o衣i chuyên kinh doanh m瓜t lo衣i hàng hóa c映 th吋 có cùng công d映pi"vtqpi"8運i s嘘ng và s違n xu医t c映 th吋
‚ Doanh nghi羽p kinh doanh t鰻ng h嬰p: kinh doanh nhi隠u lo衣k"j pi"j„c"e„"8員e"8k吋m và tính
ch医t khác nhau
‚ Doanh nghi羽r"mkpj"fqcpj"8c"f衣ng hóa: kinh doanh c違 s違n xu医t và c違 kinh doanh hàng hóa và th詠c hi羽n các ho衣v"8瓜pi"vj逢挨pi"o衣i
‚ Các doanh nghi羽r"vj逢挨pi"o衣k"8逢嬰c thành l壱p và qu違n lý b荏k"e e"e挨"swcp"pj "p逢噂c
‚ Các doanh nghi羽r"vj逢挨pi"o衣k"8逢嬰c thành l壱p b荏i các cá nhân, t鰻 ch泳e"vj»pi"vj逢運ng
2.1.1.3 CH 永E"P;PI"EJëPJ"E曳A DOANH NGHI烏R"VJ姶愛PI"O萎I
Doanh nghi羽r"vj逢挨pi"o衣k"n "8挨p"x鵜 cung 泳pi."8 r"泳ng nh英ng nhu c亥u c栄c"pi逢運i tiêu dùng, khách hàng b茨ng s違n ph育o1j pi"j„c."fq"8„"h丑 c亥n ph違k"swcp"v¤o"8院n giá tr鵜 s穎 d映ng c栄a
j pi"j„c"x "ejk"rj "n逢w"vj»pi"j pi"j„c0"V瑛 8„."fqcpj"pijk羽p s胤 e„"8逢嬰c m泳c giá bán h嬰p lý mà
h丑 có th吋 ch医p nh壱p"8逢嬰c và cung c医p s嘘 n逢嬰ng phù h嬰p v噂i nhu c亥u th鵜 vt逢運ng A吋 vi羽e"n逢w"thông hàng hóa/s違n ph育o"8逢嬰c hi羽u qu違 và chuyên nghi羽p, các t鰻 ch泳c doanh nghi羽r"vj逢挨pi"m衣k"e pi"u胤 8亥w"v逢"sw "vt·pj"n逢w"vj»pi"ucq"ejq"x瑛a nhanh chóng và v瑛c"8違m b違o r茨ng nó có th吋
l医{"8逢嬰c s詠 hài lòng c栄a khách hàng [3]
Doanh nghi羽r"vj逢挨pi"o衣i s胤 th詠c hi羽n mua bán hàng hóa nh茨m k鵜p th運k"8 r"泳pi"8逢嬰c nhu c亥u c栄c"pi逢運i tiêu dùng t瑛 s嘘 n逢嬰pi"ejq"8院n ch医v"n逢嬰ng và c違 l嬰i nhu壱n mà doanh nghi羽p vjw"8逢嬰e0"Vw{"pjk‒p."8吋 th詠c hi羽p"8逢嬰c ch泳e"p<pi"p {."8k隠w"8„"eòn tùy thu瓜c vào quy mô c栄a doanh nghi羽r"vj逢挨pi"o衣i và h羽 th嘘ng m衣pi"n逢噂i (kho, tr衣m, c穎a hàng, siêu th鵜, qu亥{"j pi."8衣i lý ) c栄a t瑛ng t鰻 ch泳c
Doanh nghi羽r"vj逢挨pi"o衣i có ho衣v"8瓜ng qu違n tr鵜 v噂i m瓜t s嘘 8挨p"x鵜 nk‒p"swcp"pj逢"pj "cung c医p, b瓜 ph壱n mua hàng, nh壱r"mjq."x "8嘘i tác phân ph嘘k.000"X "8逢挨pi"pjk‒p"mj¤w"owc"j pi"
ej pj"n "mj¤w"8亥w"vk‒p"x "e pi"là khâu e挨"d違n nh医t 8嘘i v噂i b医t c泳 m瓜v"8挨p"x鵜 ho衣v"8瓜ng kinh fqcpj0"A欝ng th運k"p„"e pi"n "8k隠u ki羽p."8瓜ng l詠c duy trì và phát tri吋n t鰻 ch泳c Vi羽c bán hàng thu壱n l嬰i v瑛a là ch泳e"p<pi."v瑛a là m映c tiêu chính c栄a doanh nghi羽r"vj逢挨pi"o衣i [3]
Trang 202.1.2.2 A咽E"AK韻M C曳A DOANH NGHI烏P S謂N XU遺T
Doanh nghi羽p s違n xu医t có nh英pi"8員e"8k吋m sau: [5]
‚ Quy院v"8鵜nh ho衣v"8瓜ng c栄a doanh nghi羽p: d詠a trên nh英ng yêu c亥w."8 k"j臼i c栄a th鵜 vt逢運ng 8吋 8逢c"tc"pj英ng quy院v"8鵜nh trong vi羽c s違n xu医t các m員v"j pi"vk‒w"f́pi"8吋 cân b茨ng gi英a cung và c亥u trên th鵜 vt逢運ng
‚ Quy trình s違n xu医t: quá trình d詠a trên m瓜t chu厩i k院t h嬰p gi英a nguyên v壱t li羽u thô, nhân công và các trang thi院t b鵜 8吋 t衣o nên s違n ph育m
‚ Chi phí s違n xu医t: là chi phí phát sinh trong quá trình s違n xu医t hàng hóa, g欝m chi phí nhân công và nguyên v壱t li羽w"j pi"j„c"8吋 ph映c v映 cho vi羽c s違n xu医t hàng hóa
‚ Giá thành s違n ph育m: toàn b瓜 ejk"rj "8吋 hoàn thành m瓜t s嘘 n逢嬰ng hàng hóa nh医v"8鵜nh trong th運k"ikcp"sw{"8鵜nh
2.2.1 A卯PJ"PIJ C
Kho d英 li羽w"n "e e"e挨"u荏 d英 li羽w"8逢嬰c các nhà ra quy院v"8鵜nh s穎 d映pi"8吋 phân tích tình
tr衣ng và s詠 phát tri吋n trong n瓜i b瓜 công ty Kho d英 li羽u d詠c"vt‒p"n逢嬰ng d英 li羽u l噂p"8逢嬰c tích h嬰p
t瑛 nhi隠u ngu欝p"mj e"pjcw"x q"e挨"u荏 d英 li羽u d衣pi"8c"ejk隠u (Multidimensional Database) C e"e挨"
s荏 d英 li羽w"p {"8逢嬰c t嘘k"逢w"jq "pj茨m truy c壱p d英 li羽u m瓜t cách t詠 nhiên nh医t cho các nhà phân tích [6] [7] [8]
Kho d英 li羽u (Data Warehouse) là m瓜t c挨"u荏 d英 li羽u vtwpi"v¤o"8逢嬰c s穎 d映ng nh茨m th詠c hi羽n các phân tích và 8逢c"tc"e e"sw{院v"8鵜nh D英 li羽u c栄a Kho d英 li羽u 8逢嬰c t鰻ng h嬰p t瑛 nhi隠u h羽
th嘘ng giao d鵜ch (Transactional System), h羽 th嘘pi"e挨"u荏 d英 li羽u và nhi隠u ngu欝n d英 li羽u khác sau 8„"8逢嬰e"8鵜nh d衣ng, làm s衣ch, xác th詠c, t鰻ng h嬰p và t鰻 ch泳c l衣i D英 li羽u có th吋 8逢嬰e"n逢w"vt英 f逢噂i d衣ng chi ti院t nh医t, ph映c v映 cho công vi羽c phân tích và báo cáo Chuyên viên phân tích d英 li羽u (Data Analyst), k悦 u逢"f英 li羽u (Data Engineer), nhà khoa h丑c d英 li羽u (Data Scientist) truy xu医t
d英 li羽u thông qua các công c映 SQL, h羽 th嘘ng trí tu羽 kinh doanh và các 泳ng d映ng phân tích khác Kho d英 li羽u cho phép các t鰻 ch泳c có th吋 th詠c hi羽n các phân tích trên d英 li羽u kh鰻ng l欝 o "e挨"u荏
d英 li羽w"vj»pi"vj逢運ng không th詠c hi羽p"8逢嬰c v噂i hi羽u su医v"v逢挨pi"v詠
C医u trúc c栄a Kho d英 li羽u vj»pi"vj逢運ng bao g欝m ba t亥ng:
‚ T亥pi"f逢噂i: T亥pi"f逢噂i bao g欝m m瓜t máy ch栄 Kho d英 li羽u."vj逢運ng s穎 d映ng h羽 th嘘pi"e挨"
s荏 d英 li羽u quan h羽, nó thu gom d英 li羽u t瑛 nhi隠u ngu欝p"x "ucw"8„"n o"u衣ch và bi院p"8鰻i thông qua m瓜v"sw "vt·pj"8逢嬰c g丑i là Extract - Transform - Load (ETL)
‚ T亥ng gi英a: T亥ng gi英a bao g欝m m瓜t máy ch栄 QNCR"ejq"rjfir"v<pi"v嘘e"8瓜 truy v医n
‚ T亥ng trên: T亥ng trên là giao di羽p"pi逢運i dùng ho員c các công c映 d q"e q."ejq"rjfir"pi逢運i
s穎 d映ng có th吋 s穎 d映ng các phân tích ad-hoc trên d英 li羽u
2.2.2 CÁCH XÂY D 衛NG KHO D頴 LI烏U
Mjk"p„k"8院n cách xây d詠ng ki院n trúc Kho d英 li羽u, có hai cách ti院p c壱n ph鰻 bi院n hi羽n này 8„"n "e ej"vk院p c壱n theo Inmon và cách ti院p c壱n theo Kimball C違 hai cách ti院p c壱p"8隠w"8欝ng ý 荏 vi羽c Data Warehouse là m瓜t kho d英 li羽u trung tâm cho doanh nghi羽p, m映e"8 ej"ej pj"n "rj映c v映
Trang 2121
doanh nghi羽p trong vi羽c cung c医p n瓜i dung không ch雨 cho vi羽c báo cáo mà còn ph映c v映 vi羽c cung c医p các d英 li羽u l鵜ch s穎 m瓜t cách chính xác và nhanh chóng, c違 4"8隠u s穎 d映ng e挨"ej院 ETL 8吋 t違i d英 li羽u lên kho d英 li羽u và m瓜t s嘘 8k吋m chung n鰻i b壱v"mj e"pj逢"8隠u ph映c v映 cho m映e"8 ej"yêu c亥u doanh nghi羽p (Business Requirements), khái ni羽m v隠 Fcvc"Octvu000"Ak吋m khác bi羽t chính c栄a 2 cách ti院p c壱n là cách mà d英 li羽w"8逢嬰c c医u trúc, t違k"x "n逢w"vt英 trên Kho d英 li羽u S詠 khác bi羽t này v隠 m員t ki院n trúc s胤 違pj"j逢荏ng tr詠c ti院p 8院n 8瓜 ph泳c t衣p trong mô hình d英 li羽u theo th運i gian, ngu欝n tài nguyên s穎 d映pi"8吋 duy trì và b違o trì h羽 th嘘pi."e pi"pj逢"e e"vjw瓜e"v pj"8欝ng nh医v."f逢"th瑛a c栄a d英 li羽u
Ngoài ra còn m瓜t s嘘 ki院p"vt¿e"Fcvc"Yctgjqwug"mj e"pj逢<"e ej"vk院p c壱n h厩n h嬰p (Hybrid), cách ti院p c壱n liên k院t (Federated) Ej逢挨pi"p {"pj„o"v e"ik違 t壱p trung nói v隠 cách ti院p c壱n theo j逢噂ng Kimball
2.2.3 CÁCH TI 蔭P C一N KIMBALL (BOTTOM-UP)
A鵜pj"pij c"Fcvc"Yctgjqwug"vjgq"Mkodcnn<
ÐKho d英 li羽u là m瓜t h羽 th嘘ng trích xu医t, làm s衣ch, tuân th栄 và cung c医p ngu欝n d英 li羽u vào kho d英 li羽u chi隠w."ucw"8„"j厩 tr嬰 và tri吋n khai truy v医n và phân tích cho các m映e"8 ej"tc"sw{院t 8鵜nh.Ñ (Ralph Kimball, 2004) [9]
Ralph Kimball s穎 d映ng cách ti院p c壱n Bottom-Wr"8吋 xây d詠pi"Fcvc"Yctgjqwug"pij c"n "nhi隠w"Fcvc"Octv"8逢嬰c xây d詠pi"vt逢噂c d詠a vào các yêu c亥u nghi羽p v映 c栄a doanh nghi羽p
M瓜t s嘘 khái ni羽m, thu壱t ng英 ph鰻 bi院n trong cách ti院p c壱n Kimball:
‚ Mô hình ngôi sao (Star Schema) là y院u t嘘 quan tr丑ng trong mô hình chi隠u c栄a Kimball Trong mô hình ngôi sao, b違pi"Hcev"8逢嬰c bao quanh b荏i nhi隠u b違ng Dimension
‚ A吋 8違m báo s詠 tích h嬰p d英 li羽w"*Kpvgitcvgf"fcvc+."Mkodcnn"8逢c"tc"#"v逢荏ng v隠 mô hình chi隠u chu育n (Conformed Dimension) Mô hình chi隠u chu育n s胤 là các b違ng e挨"d違p"8逢嬰c chia s飲 gi英a nhi隠u b違ng S詠 th壱t (Fact) khác nhau Ak隠w"8„"8違m b違o
d英 li羽w"8逢嬰c s穎 d映ng 荏 nhi隠w"p挨k"mj e"pjcw"pj逢pi"e„"épi"p瓜i dung
‚ Cách ti院p c壱n c栄a Kimball d詠a trên khái ni羽m Mô hình chi隠u d英 li羽u (Dimensional Modeling), n瓜i dung này s胤 8逢嬰e"8隠 c壱p c映 th吋 j挨p"vtqpi m映c 2.3.1,
mô hình bao g欝m hàng lo衣t các khái ni羽m n隠n t違pi"mj e"pj逢<"d違ng S詠 th壱t (m映c 2.3.2), b違ng Chi隠u (m映c 2.3.3) và Bus Matrix (m映c 2.3.4)
‚ Kimball cho r茨pi"Fcvc"Yctgjqwug"8逢嬰c t衣o thành t瑛 m瓜t t壱p các Data Marts và
d詠a trên các chi隠u chu育n chia s飲 (Shared Conformed Dimension)
Mô hình ki院n trúc Data Warehouse c栄c" Mkodcnn" 8逢嬰c mô t違 pj逢" H·nh 1, Source Transactions là ngu欝n d英 li羽w"8亥w"x q"vj逢運pi"n "e挨"u荏 d英 li羽u doanh nghi羽r."Dcemtqqo"n "p挨k"
di宇n ra các ho衣v"8瓜ng th詠c vjk"e挨"ej院 ETL, thi院t k院, c医u trúc c栄a kho d英 li羽u, các c医u hình cho các b違ng S詠 th壱t và b違ng Chi隠w."e挨"ej院 8鵜nh th運i th詠c thi d英 li羽u FrontRoom n "p挨k"pi逢運i dùng doanh nghi羽p s穎 d映pi"vj逢運ng xuyên, t衣k"8¤{"j羽 th嘘ng s胤 cung c医p các công c映 tr詠c quan hoá d英
li羽u, các ch泳e"p<pi"vt "vw羽 kinh doanh, các l羽nh truy v医n Ad-hoc 8隠w"8逢嬰c th詠c hi羽n t衣i giao di羽n pi逢運i dùng H亥w"pj逢"ikcq"fk羽p"pi逢運i dùng s胤 ch雨 giao ti院p v噂i kho d英 li羽u mà không bi院v"8逢嬰c phía Backroom s胤 làm nh英ng công vi羽e"pj逢"vj院 p q."x "pi逢嬰c l衣i
Trang 2222
H·nh 1: Kixn trúc DW/BI cてa Kimball
2.2.4 AèPJ"IKè CHUNG V陰 CÁCH TI蔭P C一N C曳A KIMBALL
M瓜t s嘘 8 pj"ik "x隠 逢w"x "pj逢嬰e"8k吋m khi xây d詠ng kho d英 li羽u theo cách c栄a Kimball:
‚ 姶w"8k吋m l噂n nh医t c栄a cách ti院p c壱n Kimball (Bottom-Up) là t壱p trung t衣o ra c医u trúc d英
li羽u có tính linh ho衣t và thân thi羽n v噂k"pi逢運i dùng doanh nghi羽p b茨ng cách s穎 d映ng các chi隠u (Dimensional) và mô hình ngôi sao (Star Schema) M»"j·pj"pi»k"ucq"8逢嬰e"8 pj"
ik "n "8挨p"ik違n ngay c違 8嘘i v噂k"pi逢運i có ít ki院n th泳c v隠 e挨"u荏 d英 li羽u
‚ N逢w"vt英 d英 li羽u d衣ng chi隠u ph映c v映 t嘘t cho vi羽c truy v医n và phân tích d英 li羽w"j挨p"uq"x噂i mjk"n逢w"vt英 d英 li羽u d衣ng chu育n hoá vj逢運pi"8逢嬰c s穎 d映ng trong e e"e挨"u荏 d英 li羽u quan h羽
‚ T嘘n ít th運k"ikcp"j挨p"vtqpi"sw "vt·pj"rj¤p"v ej."fq"f英 li羽w"8逢嬰c t鰻 ch泳c theo d衣ng không chu育n hoá (Denormalize) Th運i gian th医{"8逢嬰c k院t qu違 dcp"8亥w"pjcpj"j挨p0
‚ S詠 f逢"vj瑛a d英 li羽u có th吋 gây ra các d英 li羽u c壱p nh壱t b医v"vj逢運ng
‚ Vi羽c thêm m瓜t c瓜t trong b違ng Fact có th吋 gây ra v医p"8隠 hi羽u su医t vì b違pi"Hcev"8逢嬰c thi院t
k院 r医t chi ti院t, vi羽c thêm 1 c瓜v"vtqpi"Hcev."m ej"vj逢噂c c栄a b違ng Fact s胤 v<pi"ecq"x "e„"vj吋 gây ra v医p"8隠 hi羽u su医t Vì v壱y, thi院t k院 theo cách mô hình chi隠u d英 li羽u (Dimensional Oqfgnkpi+"mj„"8 r"泳ng s詠 vjc{"8鰻i c栄a nghi羽p v映
‚ Không th吋 áp d映ng cho toàn b瓜 doanh nghi羽r"x·"Fcvc"Yctgjqwug"8逢嬰c thi院t k院 theo ki吋u j逢噂ng mô hình các yêu c亥u nghi羽p v映 c映 th吋 thay vì cho c違 doanh nghi羽p
M映c này, nhóm tác gi違 t壱p trung nói v隠 các khái ni羽o."8鵜pj"pij c"rj鰻 bi院n và chung nh医t
v隠 mô hình chi隠u d英 li羽u 8逢嬰c phát tri吋n b荏i Ralph Kimball
2.3.1 RJ姶愛PI"RJèR THI蔭T K蔭 MÔ HÌNH CHI陰U D頴 LI烏U
Khái ni羽m mô hình chi隠u d英 li羽w"*Fkogpukqpcn"Oqfgnkpi+"8逢嬰c phát tri吋n b荏i Ralph Kimball Mô hình chi隠u d英 li羽u là m瓜t k悦 thu壱t c医u trúc d英 li羽w"8逢嬰c t嘘k"逢w"ejq"vi羽c n逢w"vt英 d英 li羽u t衣i Kho d英 li羽u M映e"8 ej"e栄a mô hình chi隠u d英 li羽w"n "8吋 t嘘k"逢w Kho d英 li羽u v噂i t嘘e"8瓜 truy
v医n d英 li羽u nhanh và tr詠c quan v噂k"8嘘k"v逢嬰ng s穎 d映ng doanh nghi羽p
V隠 ki院n trúc, mô hình chi隠u d英 li羽w"8逢嬰e"n逢w"vt英 trên n隠n t違pi"e挨"u荏 d英 li羽u quan h羽 (Relational Database Platform) f逢噂i d衣ng mô hình ngôi sao (Star Schema) Ngoài ra, mô hình chi隠u d英 li羽w" 8逢嬰e" n逢w" vt英 theo c医u trúc k悦 thu壱t x穎 lý phâp" v ej" 8c" ejk隠u tr詠c tuy院n
*Ownvkfkogpukqpcn"Qpnkpg"Cpcn{vkecn"Rtqeguukpi+"8逢嬰c g丑i là các kh嘘i (Cubes) (Kimball, 2013) [9]
V隠 thi院t k院."vjgq"Mkodcnn."vc"e„"6"d逢噂e"8吋 thi院t k院 mô hình chi隠u d英 li羽w"pj逢"ucw (Kimball, 2002) [10]:
1 L詠a ch丑n quy trình doanh nghi羽p (Select the Business Process)
Trang 2323
2 Khai báo m泳c d英 li羽u (Declare the Grain)
3 Z e"8鵜nh các b違ng Dimensions (Identify the Dimensions)
4 Z e"8鵜nh các b違ng Facts (Identify the Facts)
2.3.2 B 謂NG S衛 TH一T (FACT)
B違ng S詠 th壱t ch泳a các k院t qu違 ho衣v"8瓜ng s違n xu医t kinh doanh c栄a doanh nghi羽p t瑛 quy trình kinh doanh c栄a doanh nghi羽p B違ng S詠 th壱t có ba d衣pi"ej pj"8„"n b違ng S詠 th壱t giao d鵜ch(Transaction Fact Table), B違ng S詠 th壱t t鰻ng h嬰p vj逢運ng k (Snapshot Fact Table) và b違ng
S詠 th壱t lu悦 k院 (Accumulating Snapshot Fact Table)
M厩i dòng c栄a b違ng S詠 th壱t v逢挨pi"泳ng v噂i m瓜t s詠 ki羽p"8q"8衣c M厩i dòng d英 li羽u bao g欝m các thông tin chi ti院v"8逢嬰e"zgo"n "8瓜 m鵜n (Grain) T医t c違 các dòng c栄a m瓜t b違ng S詠 th壱t ph違i có épi"8瓜 m鵜n
T医t c違 các b違ng S詠 th壱t bao g欝m khóa ngo衣i (Foreign Key) và khoá chính (Primary Key) Các khóa ngo衣i vj逢運ng liên k院t v噂i các b違ng Chi隠u Khoá chính vj逢運ng là s詠 t壱p h嬰p c栄a toàn
b瓜 các khoá ngo衣i ho員c s穎 d映ng khoá c栄a b違ng 8逢嬰c l医y tr詠c ti院p t瑛 e挨"u荏 d英 li羽u doanh nghi羽p,
vì các khoá này không liên k院t v噂i b医t k b違ng Chi隠w"p q"pj逢pi"n衣i có tính ch医t c栄a m瓜t khoá chính, e e"vt逢運ng d英 li羽w"pj逢"x壱{"8逢嬰c g丑i v噂i tên là Degenerate Dimension
2.3.3 B 謂NG CHI陰U (DIMENSION)
B違ng Dimension ch泳a các thông tin chi ti院t v隠 các s詠 ki羽p"8q"8衣c c栄a m瓜t quy trình doanh nghi羽p Chúng mô t違 Ðck."e k"i·."荏 8¤w."mjk"p q."pj逢"vj院 nào, t衣i sao" 泳ng v噂i s詠 ki羽p"8„0 B違ng Chi隠u s胤 8逢嬰c liên k院t v噂i m瓜t ho員c nhi隠u b違ng S詠 th壱t nh茨m cung c医p thông tin d英 li羽u cho
b違ng S詠 th壱v"o "p„"8逢嬰c liên k院v"8院n Các d英 li羽u trong b違ng Chi隠w"vj逢運ng là d英 li羽u d衣ng mô
t違, gi違i thích di宇n gi違i nh茨m ph映c v映 cho vi羽c thi院t l壱p cho m瓜t mô hình chi隠u d英 li羽u
Nh英ng thu瓜c tích c栄a b違ng Dimension là ngu欝n d英 li羽u cho truy v医n, phân nhóm và báo
e q0"Ej¿pi"8„pi"xck"vt "swcp"vt丑ng trong h羽 th嘘ng DW/BI, giúp cho h羽 th嘘ng DW/BI d宇 hi吋u
và d宇 s穎 d映ng Tên c栄a nh英ng thu瓜c tính nên là nh英ng c映m t瑛 th詠c t院 j挨p"n "pj逢pi"v瑛 vi院t t逸t khó hi吋u
2.3.4 BUS MATRIX
Data Warehouse Bus Matrix hay Bus Matrix là công c映 thi院t y院w"8吋 thi院t k院 và giao ti院p
v噂i ki院n trúc bus c栄a Data Warehouse Các hàng c栄a ma tr壱n là các quy trình nghi羽p v映 và các
c瓜v"n "e e"Fkogpukqp0"E e"»"8逢嬰e"8 pj"f医u c栄a ma tr壱n cho bi院t li羽u m瓜v"Fkogpukqp"e„"8逢嬰c liên k院t v噂i m瓜t quy trình nghi羽p v映 nh医v"8鵜nh hay không Nhóm thi院t k院 quét t瑛pi"j pi"8吋 ki吋m tra xem Dimension 8逢嬰c ch丑n có phù h嬰p v噂k"sw{"vt·pj"mkpj"fqcpj"jc{"mj»pi"x "e pi"swfiv"v瑛ng
c瓜v"8吋 xem Dimension c亥p"8逢嬰c tuân th栄 trong nhi隠u quy trình nghi羽p v映
2.3.5 SCD (SLOWLY CHANGE DIMENSION)
Trong th詠c t院, các thu瓜c tính có trong b違ng Chi隠u có th吋 c嘘 8鵜pj."pj逢pi"e e"d英 li羽u c栄a các thu瓜e"v pj"8„"n衣k"vjc{"8鰻i trong quá trình n衣p d英 li羽u, m員c dù s詠 vjc{"8鰻i x違y ra ch壱m theo
th運i gian Khi pi逢運i dùng c亥n theo dõi s詠 vjc{"8鰻i, ta s胤 s穎 d映ng Chi隠w"vjc{"8鰻i ch壱o"8吋 qu違n
lý s詠 vjc{"8鰻i c栄a các thu嘘c tính có trong b違ng Chi隠u
V噂i m厩i thu瓜c tính có trong b違ng Chi隠u, ta ph違i thi院t l壱p m瓜t chi院n l逢嬰e"tk‒pi"8吋 8嘘i phó
v噂i s詠 vjc{"8鰻i Nói cách khác, khi m瓜t thu瓜e"v pj"8逢嬰e"vjc{"8鰻i giá tr鵜 trong th院 gi噂i th壱t thì
n o"ucq"8吋 áp d映ng s詠 vjc{"8鰻k"8„"vtqpi"o»"j·pj"ejk隠u?
Các lo衣k"rj逢挨pi"rj r"vtqpi"UEF<
‚ Lo 衣i 1<"Ijk"8fl"*Qxgtytkvg+
Trang 2424
Khi có s詠 vjc{"8鰻i x違y ra, SCD Lo衣i 1 gi違i quy院t b茨pi"e ej"ijk"8fl"f英 li羽u m噂k"x q"8¿pi"
v鵜 trí xu医t hi羽n c栄a d英 li羽w"e 0"X噂i cách này, các thu瓜c tính luôn ph違n ánh giá tr鵜 8逢嬰c c壱p nh壱t
g亥p"8¤{"pj医t
Ví d映<"pj逢"H·nh 2 phía f逢噂i, giá tr鵜 e "e„"vtqpi"vjw瓜c tính Department Name là Education,
d英 li羽u m噂k"8逢嬰c n衣r"x q"pj逢pi"n衣k"e„"Fgrctvogpv"Pcog"vjc{"8鰻i thành Stragegy, thì b茨ng cách
s穎 d映ng SCD lo衣i 1, b違ng d英 li羽u m噂k"vjw"8逢嬰c s胤 pj逢 H·nh 2 rj c"f逢噂i:
H·nh 2: Ví dつ minh hoT SCD loTi 1 [9]
‚ Lo 衣i 2: Thêm 1 hàng m噂i (Add New Row)
SCD lo衣i 2 gi違i quy院t s詠 vjc{"8鰻i b茨ng cách thay vì ch雨nh s穎a ngay trên d英 li羽w"e "vc"u胤 t衣o thêm 1 hàng d英 li羽u m噂k"8吋 ph違n ánh s詠 vjc{"8鰻k0"Piq k"tc"8吋 áp d映pi"rj逢挨pi"rj r"p {."t瑛ng hàng d英 li羽u thu瓜c b違ng Chi隠w"8„"rj違i có thêm 3 thu瓜c tính ph映 tr嬰 là Row Effective Date
và Row Expiration Date, có th吋 có thêm thu瓜c tính Current Row Indicator Row Effective Date
là th運i gian mà dòng d英 li羽u này b逸v"8亥u có hi羽u l詠e."8„"e„"vj吋 là th運i gian mà s違n ph育m này 8逢嬰c nh壱p hàng, ho員c là th運i gian mà d英 li羽u p {"8逢嬰c n衣p vào Data Warehouse Row Expiration Date là th運i gian cu嘘i cùng mà d英 li羽u này còn có hi羽u l詠e."pij c"n "e„"o瓜t s詠 vjc{"8鰻i x違y ra làm cho các d英 li羽w"e "mj»pi"e p"ej pj"z e"x "e„"jk羽u l詠c Ví d映 minh ho衣 pj逢"H·nh 3
H·nh 3: Ví dつ minh hoT SCD loTi 2 [9]
‚ Ngoài ra ta còn có m瓜t s嘘 rj逢挨pi"rj r"ik違i quy院t s詠 vjc{"8鰻i giá tr鵜 trong b違ng Chi隠u
mj e"8逢嬰c mô t違 pj逢"d違ng 1
BVng 1: Tごng quát vz các loTi SCD (Kimball 2002) [10]
Lo 衣i SCD J pj"8瓜ng v噂i b違ng Dimension V e"8瓜pi"8院n b違ng Fact
Lo衣i 0 Các giá tr鵜 thu瓜c tính không có s詠
vjc{"8鰻i Fact ktính nguyên b院t h嬰p v噂i các giá tr鵜 thu瓜c 違p"mj»pi"vjc{"8鰻i
Lo衣i 1 Ijk"8fl"ik "vt鵜 thu瓜c tính Fact k院t h嬰p v噂i các giá tr鵜 thu瓜c
tính hi羽n t衣i và m噂i nh医t
Lo衣i 2 Thêm m瓜t dòng m噂i trong b違ng
Chi隠u v噂i giá tr鵜 m噂i Fact ktính khi có hi院t h嬰p v噂i các giá tr鵜 thu瓜c 羽u l詠c
Lo衣i 3 Thêm m瓜t c瓜t m噂k" 8吋 n逢w" ik " vt鵜
hi羽n t衣i và gi英 giá tr鵜 vt逢噂e"8„0 Fact km噂i và giá tr鵜 thu瓜e"v pj"e 0 院t h嬰p v噂i giá tr鵜 thu瓜c tính
Trang 2525
Lo衣i 4 Thêm m瓜t b違ng Chi隠u nh臼
(mini-fkogpukqp+" n逢w" vt英 các giá tr鵜 vj逢運pi"zw{‒p"vjc{"8鰻i
Fact k院t h嬰p v噂i b違ng Chi隠u nh臼 khi
có hi羽u l詠c
Lo衣i 5 K院t h嬰p lo衣i 4 t衣o thêm m瓜t b違ng
Chi隠u nh臼 và lo衣k"3"ijk"8fl"ik "vt鵜 trên b違ng Chi隠w"e挨"u荏
Fact k院t h嬰p v噂i Chi隠u nh臼 có giá tr鵜 vj逢運pi" zw{‒p" vjc{" 8鰻i và b違ng Chi隠w"e挨"u荏 có giá tr鵜 vj逢運ng xuyên vjc{"8鰻i hi羽n t衣i
Lo衣i 6 K院t h嬰p lo衣k" 3" ijk" 8fl" ik " vt鵜 lên
dòng sinh ra b荏i lo衣k"4."ucw"8„"ijk"
8fl"v医t c違 e e"f pi"vt逢噂e"8„0
Fact k院t h嬰p v噂i giá tr鵜 thu瓜c tính có
m噂i nh医t và giá tr鵜 hi羽n t衣i
Lo衣i 7 K院t h嬰p lo衣i 2 v噂i giá tr鵜 thu瓜c tính
m噂i, k院t h嬰p v噂i m瓜t góc nhìn (View) h衣n ch院 8院n dòng ho員c giá
tr鵜 hi羽n t衣i
Fact k院t h嬰p v噂i giá tr鵜 thu瓜c tính có
hi羽u l詠c và giá tr鵜 hi羽n t衣i
2.3.6 MÔ HÌNH NGÔI SAO (STAR SCHEMA)
O»"j·pj"pi»k"ucq"n "o»"j·pj"8挨p"ik違p"8逢嬰c s穎 d映ng cho Kho d英 li羽u C医u trúc c栄a nó bao g欝m b違ng S詠 th壱t n茨m 荏 v鵜 trí trung tâm, bao xung quanh nó là các b違ng Chi隠u, khi v胤 hình này t衣o cho ta c違m giác gi嘘pi"pj逢"j·pj"ucq"p‒p"p„"v‒p"i丑i là Mô hình ngôi sao (H·nh 4) Các b違ng liên k院t v噂i nhau thông qua khoá ngo衣i c栄a b違ng S詠 th壱t 8逢嬰c n嘘i v噂i khoá chính c栄a b違ng Chi隠w0"O»"j·pj"pi»k"ucq"e„"8k吋m m衣pj"n "8挨p"ik違n, h厩 tr嬰 kh違 p<pi"vtw{"x医n và gi違m th運i gian
kh逸t khe c栄a nhà qu違n lý v隠 tính hi羽u qu違 trong vi羽c phân tích d英 li羽u c栄a doanh nghi羽p, t瑛 8„"
có th吋 n逸m b逸v"8逢嬰c tình hình kinh doanh hi羽n t衣i c栄a h丑 và c違i thi羽n quy trình ra quy院v"8鵜nh (M Golfarelli, S Rizzi, I Cella, 2004) [12]
Trang 26là quá trình bi院p"8鰻i d英 li羽w"vj pj"e»pi"vkp"8«"swc"z穎 lý r欝i bi院n nó thành ki院n th泳c)
Nhìn chung, Trí tu羽 kinh doanh (Business Intelligence) là quy trình và công ngh羽 mà các doanh nghi羽r"f́pi"8吋 ki吋m soát kh嘘k"n逢嬰ng d英 li羽u kh鰻ng l欝, khai phá tri th泳c giúp cho các doanh nghi羽p có th吋 8逢c"e e"sw{院v"8鵜nh hi羽u qu違 j挨p"vtqpi"jq衣v"8瓜ng kinh doanh c栄a mình Trí tu羽 kinh doanh không ch雨 ik¿r"ejq"pi逢運i qu違n lý bi院v"8逢嬰e"8k隠w"i·"8«"z違y ra trong quá kh泳, tình tr衣ng doanh nghi羽p hi羽n t衣i, th壱m chí trí tu羽 mkpj"fqcpj"pi {"pc{"8«"rj v"vtk吋p"8院n m泳c có th吋 8逢c"tc"f詠 8q p"ejq"v逢挨pi"n衣i Các b瓜 ph壱p"e挨"d違n c栄a m瓜t h羽 th嘘ng trí tu羽 kinh doanh có th吋 k吋 8院n bao g欝m b瓜 thu th壱p d英 li羽u, e挨"ej院 ETL, kho d英 li羽u, kh嘘i d英 li羽u d衣ng OLAP và các h羽 th嘘ng h厩 tr嬰 giao di羽p"pi逢運i dùng pj逢"8欝 th鵜, bi吋w"8欝, d詠pi"d q"e qÈ
H·nh 5: Cách hiあw"8¬p"ikVn vz BI (Jayanthi Ranjan 2005) [13]
T瑛 ki院n trúc Error! Reference source not found., quy trình c栄a m瓜t trí tu羽 kinh doanh c
ó th吋 8逢嬰c hi吋w"pj逢"ucw<
‚ D英 li羽w"8逢嬰c trích xu医t t瑛 nhi隠u ngu欝n và m映e"8 ej"u穎 d映ng khác nhau mà công
ty, doanh nghi羽r"8cpi"u荏 h英u
‚ Các d英 li羽w"p {"8逢嬰c bi院p"8鰻i, s逸p x院p, t鰻 ch泳c sao cho phù h嬰r"x "n逢w"vt英 t衣i kho d英 li羽u D英 li羽u 8逢嬰e"n逢w"vt英 trên kho d英 li羽u có th吋 8逢嬰c t鰻 ch泳c d衣ng kh嘘i OLAP
‚ Sau khi trí tu羽 kinh doanh thu th壱p và bi院p"8鰻i thành các d英 li羽u h英u ích, cu嘘i cùng nó s胤 cung c医p các công c映 ph映c v映 ejq"pi逢運i dùng ch鰯ng h衣p"pj逢"e e"dk吋u 8欝, khai phá d英 li羽w"8吋 8逢c"tc"e e #"v逢荏ng, c違nh báo ho員e"d q"e q.È
2.4.2 TRÍ TU 烏 KINH DOANH K蔭T H営P V閏I KHAI PHÁ D頴 LI烏U XÉ"M "VJW一T
H 窺C MÁY
V医p"8隠 c嘘t lõi trong h羽 th嘘ng trí tu羽 kinh doanh là kho d英 li羽u (Data Warehouse) và khai phá d英 li羽u (Data Mining) vì d英 li羽u dùng trong h羽 th嘘ng là d英 li羽u t鰻ng h嬰p (Nhi隠u ngu欝n, nhi隠w"8鵜nh d衣ng, phân tán và có tính l鵜ch s穎+"8„"n "8員e"vt逢pi"e栄a kho d英 li羽w0"A欝ng th運i vi羽c phân tích d英 li羽u trong h羽 th嘘ng không ph違i là nh英pi"rj¤p"v ej"8挨p"ik違n (Query, Filtering) mà
Trang 2727
là nh英ng k悦 thu壱t trong khai phá d英 li羽w"f́pi"8吋 phân lo衣i (Classification), gom c映m (Clustering), hay d詠 8q p"*Rtgfkevkqp+0"X·"x壱y h羽 th嘘ng trí tu羽 kinh doanh có m嘘i quan h羽 r医t ch員t ch胤 v噂i kho
d英 li羽u và khai phá d英 li羽u
雲 ph亥n này, nhóm s胤 8逢c"tc"o瓜t s嘘 k悦 thu壱t h丑c máy tìm hi吋w"8逢嬰c vtqpi"8隠 tài lu壱p"x<p0"Trong bài toán gom c映m d英 li羽u, k-Ogcpu"8逢嬰c s穎 d映ng khá ph鰻 bi院n
Thu壱t toán phân c映m k-means là m瓜v"rj逢挨pi"rj r"8逢嬰c s穎 d映ng trong phân tích tính
ch医t c映m c栄a d英 li羽w0"P„"8員c bi羽v"8逢嬰c s穎 d映ng nhi隠u trong khai phá d英 li羽u và th嘘ng kê Nó phân vùng d英 li羽u thành k c映m khác nhau Gi違i thu壱v"p {"ik¿r"ej¿pi"vc"z e"8鵜pj"8逢嬰c d英 li羽u
th詠c s詠 thu瓜c v隠 nhóm nào
Trong các mô hình kinh doanh, doanh nghi羽p s胤 chia nh臼 t羽p khách hàng ra thành nh英ng pj„o"8嘘k"v逢嬰pi"mj e"pjcw"8吋 có th吋 áp d映ng nh英ng chi院p"n逢嬰c kinh doanh c映 th吋 cho t瑛ng nhóm 8嘘k"v逢嬰pi0"Ak隠w"p {"ik¿r"ejq"mj ej"j pi"8逢嬰c ti院p c壱n v噂i các s違n ph育m th壱t s詠 phù h嬰p v噂i
b違n thân h丑 S詠 phù h嬰r"8„"u胤 kéo doanh s嘘 c栄a doanh nghi羽p v<pi"n‒p0"
""v逢荏ng c栄a thu壱t toán k-means:
1 Kh荏i t衣q"M"8k吋m d英 li羽u trong b瓜 d英 li羽u và t衣m th運i coi nó là tâm c栄a các c映m d英 li羽u
2 V噂i m厩k"8k吋m d英 li羽u trong b瓜 d英 li羽u, tâm c映m c栄a nó s胤 8逢嬰e"z e"8鵜nh là 1 trong K tâm c映m g亥n nó nh医t
3 Sau khi t医t c違 e e"8k吋m d英 li羽w"8«"e„"v¤o."v pj"vq p"n衣i v鵜 trí c栄a tâm c映o"8吋 8違m b違o tâm
c栄a c映m n茨m 荏 chính gi英a c映m
4 D逢噂e"4"x "d逢噂c 3 s胤 8逢嬰c l員r"8k"n員p l衣i cho t噂i khi v鵜 trí c栄a tâm c映o"mj»pi"vjc{"8鰻i
ho員c tâm c栄a t医t c違 e e"8k吋m d英 li羽w"mj»pi"vjc{"8鰻i
2.5.1 KHÁI NI 烏M
Khi ta c亥n d英 li羽u c亥n thi院t cho quá trình phân tích và x穎 lý, các d英 li羽u này s胤 8逢嬰e"8逢c"vào kho d英 li羽u Tuy nhiên do b違n ch医t h亥w"pj逢"e e"f英 li羽u không có cùng ngu欝n g嘘c, và 8逢嬰c
c医u trúc khác nhau p‒p"sw{"vt·pj"GVN"8«"8逢嬰c phát tri吋n nh茨m gi違i quy院t v医p"8隠 8„0
ETL là vi院t t逸t c栄a Extract - Transform - Load Trong b嘘i c違nh trí tu羽 kinh doanh, trích xu医t - bi院p"8鰻i - t違k"*GVN+"8隠 c壱r"8院n quy trình trích xu医t d英 li羽u t瑛 m瓜t ho員c nhi隠u ngu欝n, bi院n 8鰻i d英 li羽u v隠 8鵜nh d衣ng chu育n, và t違i k院t qu違 vào kho d英 li羽u nh茨m báo cáo, phân tích ho員c 8欝ng b瓜 hoá d英 li羽uÈ0
2.5.2 THÀNH PH 井N CHÍNH TRONG TI蔭N TRÌNH ETL
Ki院n trúc ETL Pipeline g欝m 3 thành ph亥n chính:
Trích xu 医t (Extract) n "sw "vt·pj"8丑c d英 li羽u t瑛 m瓜t ho員c nhi隠u ngu欝n khác nhau ch鰯ng
h衣p"pj逢"File JSON, File CSV, thi院t b鵜 c違m bi院p"*Ugpuqt+."e挨"u荏 d英 li羽w"*Fcvcdcug+.000"A員e"8k吋m c栄a các d英 li羽u này có th吋 n "8«"e„"u印n c医w"vt¿e"pj逢"e e"d違pi"vtqpi"e挨"u荏 d英 li羽u quan h羽 ho員c không có c医u trúc, 8鵜nh d衣ng chu育p"pj逢"File Logs Công vi羽c chính c栄a d逢噂c này là d英 li羽w"8逢嬰c truy xu医t t瑛 nhi隠u ngu欝n khác nhau x "8逢c"x隠 m瓜t khu n逢w"vt英 t壱p trung vj逢運pi"8逢嬰c g丑i là d逢噂c 8羽m ho員c m瓜t s嘘 vt逢運ng h嬰p nh医v"8鵜nh s胤 8逢嬰c g丑i là h欝 d英 li羽u (Datalake)
Bi 院p"8鰻i (Transform) là c亥u n嘘i gi英a trích xu医t (Extract) và t違i (Load), t衣k"8¤{"f英 li羽u
trích xu医v"8逢嬰c s胤 8k"swc"ejw厩i các bi院p"8鰻i theo các d衣ng công th泳c khác nhau 8吋 ti院p"x q"d逢噂c
t違i (Load) phía sau Công vi羽c chính c栄c"d逢噂c bi院p"8鰻i là lo衣i b臼 d英 li羽u trùng l員p."8鵜nh d衣ng l衣i, làm s衣ch, xoá b臼 f逢"vj瑛a, k院t h嬰p ho員c tách r運i d英 li羽u t瑛 nhi隠u ngu欝p"8吋 8逢嬰c d英 li羽u hoàn ch雨nh, Quá trình bi院p"8鰻i ph違k"8違m b違o k院t qu違 d英 li羽u có s詠 8欝ng nh医t v隠 c医u trúc, tr壱t t詠 ho員c
m瓜t chu育p"tk‒pi"p q"8„"ik¿r"v<pi"v pj"鰻p"8鵜nh cho qua trình t違i d英 li羽u cu嘘i cùng
Trang 2828
T 違i (Load) là quá trình ghi chép d英 li羽u vào m瓜t ho員c nhi隠w" 8k吋o" 8 ej" pj逢" Fcvc"
Warehouse T衣k"d逢噂c này vi羽c t違i có th吋 th詠c hi羽n th栄 công ho員c có chu k t詠 8瓜ng nh茨m c壱p
nh壱v"ejq"8k吋o"8 ej0"Jq p"vj pj"xk羽c t違i d英 li羽u không nh医t thi院t ph違i k院t thúc dây chuy隠n trích
xu医t - bi院p"8鰻i - t違i (ETL Pipeline) mà ta có th吋 th詠c hi羽n các ch泳e"p<pi"mj e"ej鰯ng h衣p"pj逢"kích ho衣t m瓜t chu厩i ETL Pipeline khác
S 渦 LI烏U HOÁ (DIGITIZATION)
2.6.1 A卯PJ"PIJ C
S嘘 li羽u hoá (Digitization) là quá trình bi院p"8鰻i, mã hoá thông tin d衣ng Analog thành con
s嘘 0, 1 mà máy tính có th吋 n逢w"vt英, x穎 lý và v壱n chuy吋n Analog là m瓜t phép nói 育n d映 cho vi羽c n逢w"vt英 d英 li羽w"f逢噂i d衣ng gi医y0"Ak隠u quan tr丑ng c栄a s嘘 li羽u hoá là d英 li羽w"8逢嬰c s嘘 hoá và không bao g欝m quy trình(Process) [14]
S嘘 li羽u hóa d英 li羽w"n逢w"vt英 là hình th泳c chuy吋p"8鰻i d英 li羽u t瑛 d衣pi"x<p"d違n h羽 th嘘ng bên ngoài thành nh英ng d英 li羽u d衣ng tín hi羽u s嘘 8逢嬰c máy tính hi吋w"x "n逢w"vt英 [15]
S嘘 li羽u hoá là m瓜v"d逢噂c chuy吋p"8鰻i t瑛 cách ghi chép truy隠n th嘘ng trên gi医{"vj pj"n逢w"vt英 trên các t壱p tin máy tính, s嘘 li羽u hoá không thay th院 hoàn toàn cách th泳c ghi chép truy隠n th嘘ng, vjc{"x q"8„."8¤{"n "o瓜t quy trình c亥n thi院t cho vi羽c áp d映ng công ngh羽 thông tin vào cách th泳c
v壱n hành c栄a công ty và doanh nghi羽p
M瓜t s嘘 ví d映 8k吋n hình c栄a s嘘 li羽u hoá là vi羽c chuy吋p"8鰻i t瑛 ch英 vi院v"jq "8挨p"vt‒p"ik医y thành d衣ng t壱r"vkp"n逢w"vt英 trên máy tính f逢噂i d衣ng pdf và csv, ho員c chuy吋p"8鰻i âm nh衣c sang OR5."OR6"vjc{"ejq"f́pi"d<pi"8 c"XJU
2.6.2 S 渦 LI烏U HOÁ (DIGITIZATION) VÀ S渦 HOÁ (DIGITALIZATION)
Khác v噂k"uw{"pij "e栄c"8衣k"8c"u嘘 m丑k"pi逢運i, các khái ni羽m v隠 S嘘 li羽u hoá (Digitization),
s嘘 hoá (Digitalization) và Chuy吋p"8鰻i s嘘 (Digital Transformation) là khác nhau Chuy吋p"8鰻i s嘘
là m瓜t quy trình ph泳c t衣p, t嘘n kém c違 v隠 m員t th運i gian và ti隠n b衣c, th壱m chí chuy吋p"8鰻i s嘘 s胤 mj»pi"8go"n衣i quá nhi隠u l嬰k" ej"vt逢噂c m逸t cho doanh nghi羽r"8亥w"v逢0
Khác v噂i S嘘 li羽u hoá, S嘘 hoá mj»pi"e„"8鵜pj"pij c"t "t pi."ÐFkikvk|cvkqp"x "Fkikvcnk|cvkqp"
là các thu壱t ng英 có liên quan ch員t ch胤 x "vj逢運pi"8逢嬰c s穎 dung thay th院 cho nhau trong nhi隠u tài
li羽wÑ."ÐFkikvcnk|cvkqp"n "o瓜t cách th泳c mà nhi隠w"n pj"x詠e"8運i s嘘ng xã h瓜k"8逢嬰c tái c医u trúc xung swcpj"e挨"u荏 h衣 t亥ng truy隠n thông và giao ti院p k悦 thu壱t s嘘Ñ [16] S嘘 hoá 荏 8¤{"8«"mj»pi"e p"ej雨 8挨p"vjw亥n là chuy吋p"8鰻i hình th泳e"n逢w"vt英 vj»pi"vkp"pj逢"u嘘 li羽u hoá, S嘘 hoá 8«"v瑛pi"d逢噂c ti院p
c壱p"j挨p"x噂i cách th泳c v壱n hành, quy trình ho衣v"8瓜ng c栄a t瑛ng doanh nghi羽p
S嘘 hoá n "sw "vt·pj"8逢嬰c th詠c hi羽p"ucw"mjk"8«"u嘘 li羽u hoá, b茨ng cách áp d映ng nh英ng thông vkp"8«"8逢嬰c s嘘 li羽u hoá vào m映e"8 ej t嘘k"逢w."8挨p"ik違n hoá cách th泳c ho衣v"8瓜ng, giúp doanh nghi羽p 8衣v"8逢嬰c hi羽u qu違 ncq"8瓜pi"ecq"j挨p0"Vtqpi"mj k"pk羽m s嘘 hoá mj»pi"8隠 c壱r"8院n vi羽e"vjc{"8鰻i cách doanh nghi羽p kinh doanh hay t衣o ra lo衣i hình kinh doanh m噂k."o "8¤{"ej雨 là vi羽c ti院p t映c
mô hình kinh doanh s印p"e„"pj逢pi"x噂i t嘘e"8瓜 v壱n hành nhanh, hi羽u qu違 ecq"j挨p"vt逢噂e"8¤{0
Thông qua H·nh 6, m瓜t quá trình chuy吋p"8鰻i s嘘 tr違k"swc"5"ikck"8q衣n chính t瑛 S嘘 li羽u hoá,
s嘘 hoá và cu嘘i cùng là chuy吋p"8鰻i s嘘 Trong khi s嘘 li羽u hoá t壱p trung vào gi違i quy院t các v医p"8隠 trong quá kh泳 pij c"n "vjc{"8鰻i t瑛 rj逢挨pi"rj r"vtw{隠n th嘘ng sang s穎 d映ng công ngh羽 máy tính cho vi羽c ghi chép, qu違n lý và truy v医n, s嘘 hoá t壱p trung vào c違i thi羽n các quy trình, ho衣v"8瓜ng trong công ty mà có áp d映ng các công c映, k悦 thu壱t máy tính và d詠a trên d詠 li羽u s嘘 hoá, v<pi"p<pi"xu医t và hi羽u qu違 c栄a t瑛ng quy trình, ho衣v"8瓜ng, cu嘘k"épi"n "d逢噂c chuy吋p"8鰻i s嘘."vjc{"8鰻i hoàn toàn cách th泳e"o "e»pi"v{"8«"x壱n hành, t壱r"vtwpi"u¤w"j挨p"e違 x q"eqp"pi逢運i và công ngh羽 nh茨m 8go"n衣i giá tr鵜 c衣nh tranh m噂i Nhìn chung, m厩i ikck"8q衣n trong quá trình chuy吋p"8鰻i s嘘 có m嘘i quan h羽 ch員t ch胤 không tách r運i và 違pj"j逢荏ng tr詠c ti院r"8院n nhau
Trang 298 pj"o {È Công ngh羽 p {"vj逢運pi"8逢嬰c s穎 d映pi"8吋 truy隠n t違i và nh壱p li羽u
H·nh 7: Công Nghう OCR [18]
T瑛 H·nh 7, OCR không ch雨 ejq"rjfir"8丑c d英 li羽u trên các t壱r"vkp"8逢嬰c vi院t b荏i máy tính,
mà th壱m chí là các ch英 vi院v"vc{."8c"f衣ng v隠 ngôn ng英, b嘘 c映c e pi"8逢嬰c áp d映ng, nh運 vào s詠 phát tri吋n c栄a các mô hình trí tu羽 nhân t衣o và h丑c sâu, t瑛 8„"vt ej"zw医t sang các t壱r"vkp"x<p"d違n
và có th吋 n逢w"vt英 trên máy tính ho員c e挨"u荏 d英 li羽u
2.7.2 A窺C JQè"A愛P"BÁN HÀNG B稲NG CÔNG NGH烏 OCR
Jq "8挨p"ej泳a các thông tin c亥n thi院t cho m瓜t giao d鵜ch gi英a công ty v噂i khách hàng ho員c v噂i công ty khác, h亥u h院v"e e"jq "8挨p"8逢嬰c in ra gi医y t瑛 các máy POS, ho員c các t壱p tin PDFs và
d英 li羽u t瑛 jq "8挨p"8k羽n t穎
Truy隠n th嘘pi"vt逢噂e"8¤{."e e"jq "8挨p"kp"tc"ik医{"8逢嬰c áp d映ng 荏 8衣k"8c"u嘘 các c穎a hàng bán l飲 pj逢"các c穎a hàng ti羽n l嬰i, siêu th鵜, ch嬰 giao d鵜ch,È m瓜v"jq "8挨p"u胤 8逢嬰c g穎i cho khách hàng, m瓜v"jq "8挨p"e p"n衣i s胤 do c穎c"j pi"n逢w"vt英 Khi t鰻ng k院v"fqcpj"vjw."e e"jq "8挨p"vtqpi"ngày ho員c tháng s胤 8逢嬰c l医y ra và ghi chép vào s鰻 sách V医p"8隠 phát sinh v噂i cách làm truy隠n
th嘘ng này là các hoá 8挨p"n逢w"vt英 th運i gian dài có th吋 d磯p"8院n m医t mát, ch医v"n逢嬰ng ch英 vi院t gi違m, chi phí c亥n thi院t cho kho n逢w"vt英 e e"jq "8挨p v<pi"ecq0"Xì v壱{"rj逢挨pi"rj r"ik違i quy院t hi羽u qu違 ngày nay mà m丑i c穎a hàng 8鰻i m噂i áp d映ng là s穎 d映ng các h羽 th嘘pi"n逢w"vt英 thông minh nj逢"e挨"
s荏 d英 li羽u máy tính, v瑛a gi違i quy院v"8逢嬰c bài toán nh壱p li羽u, v瑛a gi違o"8逢嬰e"ejk"rj "vjw‒"mjq"n逢w"tr英."8 r"泳pi"8逢嬰c nhu c亥u truy v医p"e e"jq "8挨p"o瓜t cách nhanh chóng và chính xác
Trang 3030
A吋 vi羽c qu違n lý các d英 li羽u hi羽u qu違, công ty s胤 n逢w"vt英 các thông tin hq "8挨p"x q"o瓜t e挨"u荏 d英 li羽u máy tính, theo cách truy隠n th嘘ng các công ty s胤 s穎 d映ng nhân công có nhi羽m v映
nh壱p li羽u t瑛pi"jq "8挨p"tk‒pi"n飲 x q"vtqpi"e挨"u荏 d英 li羽u c栄a công ty V噂k"rj逢挨pi"rj r"vt‒p."o瓜t
s嘘 v医p"8隠 phát sinh pj逢"ejk"rj "fw{"vt·"8瓜k"pi "nhân công, th運i gian nh壱p li羽u dài và quan tr丑ng nh医v"n "e e"vt逢運ng h嬰p nh壱p li羽u sai Vì v壱y, c亥n có m瓜t gi違i pháp v瑛a có kh違 p<pi"ik違o"8逢嬰c
th運i gian nh壱p li羽u."v逢挨pi v e"8逢嬰c v噂i các h羽 th嘘ng thông tin khác nhau, e pi"pj逢"ik違m thi吋u
s詠 sai sót trong quá trình s嘘 li羽u hoá
S嘘 li羽u jq "e e"jq "8挨p"d p"j pi"nên là m瓜t quy trình có trách nhi羽m t詠 8瓜ng hoá vi羽c rút trích thông tin t瑛 m瓜v"jq "8挨p"ucw"8„"n逢w"vt英 vj»pi"vkp"8„ trên m瓜v"e挨"u荏 d英 li羽u máy tính T瑛
H·nh 8, v噂k"8亥u vào là m瓜t b泳c hình ch映p c栄a m瓜v"jq "8挨p."b茨ng cách áp d映ng công ngh羽 OCR, 8亥u ra c栄a quá trình s嘘 li羽u hoá là d英 li羽u có c医u trúc JSON v噂i các n瓜i dung c亥n thi院t 8逢嬰c rút trích t瑛 違nh
H·nh 8: Ví dつ minh hoT OCR
Pj·p"ejwpi."sw{"vt·pj"8丑c thông tin trên m瓜v"jq "8挨p"u胤 e„"7"d逢噂c chính, H·nh 9:
‚ Ti院n x穎 lý 違pj"8亥u vào
‚ Phát hi羽p"x<p"d違n (Text Detection)
‚ Nh壱n di羽n x<p"d違n (Text Recognition)
‚ Trích xu医t thông tin (Information Extract)
‚ Xu医t Thông tin (Data Dumps)
H·nh 9<"QET"Rkrgnkpg"e¬"dVn [19]
Trang 31li羽u c栄c"pj "n«pj"8衣o và nhà ra quy院v"8鵜nh Nh茨m ph映c v映 cho nhu c亥w"8„."8«"e„"t医t nhi隠u nghiên c泳w."d k"d q"8隠 xu医t các gi違i pháp, cách thi院t k院 h羽 th嘘ng trí tu羽 mkpj"fqcpj"8 r"泳ng nhu c亥u th詠c ti宇n c栄a các công ty trong quá trình phân tích d英 li羽w"x "8逢c"tc"sw{院t 8鵜nh
Fauziyah (2018) [20]<"8«" r"f映pi"rj逢挨pi"rj r"Mkodcnn"8吋 xây d詠ng kho d英 li羽u cho các công ty s違n xu医v"8欝 8k羽n t穎 Bài vi院t t壱p trung xây d詠ng kho d英 li羽u d詠a trên rj逢挨pi"rj r"e栄a Kimball áp d映ng cho nghi羽p v映 c栄a công ty s違n xu医t chuyên v隠 8k羽n t穎, các ho衣v"8瓜ng chính t瑛 khâu 8員t mua nguyên li羽u thô, nh壱p kho, gia công ejq"8院n bán thành ph育oÈ"Mjq"f英 li羽w"8逢嬰c thi院t k院 có th吋 n逸m b逸t tr丑n v姻n m丑i d英 li羽u trong quá trình ho衣v"8瓜ng c栄a công ty t瑛 8„"8 pj"ik "8逢嬰c hi羽u qu違."p<pi"su医t c栄a t瑛ng ikck"8q衣n trong ho衣v"8瓜ng công ty Bài vi院t s穎 d映pi"e ej"8 pj"ik "mk吋o"vtc"8瓜 ch医p nh壱p"pi逢運i f́pi"*Wugt"Ceegrvcpeg"Vguv+"x "8衣t k院t qu違 kh違 quan."x逢嬰t m泳c trung bình t瑛 pi逢運i dùng
h羽 th嘘ng
Ari Yanuar Ridwan (2015) [21]: cung c医p m瓜t cách ti院p c壱n trong quá trình thi院t
k院 và xây d詠ng m瓜t kho d英 li羽u h厩 tr嬰 vi羽c phân tích d英 li羽u cho nghi羽p v映 mua hàng cho công ty Ki院p"vt¿e"8逢嬰c tác gi違 8隠 xu医t và hi羽n th詠c bao g欝m h羽 th嘘ng ngu欝n d英 li羽u 8亥u vào, máy ch栄 ETL, máy ch栄 OLAP, h羽 th嘘ng báo cáo, b瓜 nh噂 n逢w"vt英 trung tâm và giao di羽p"pi逢運i dùng T瑛 các nhu c亥u ch泳e"p<pi"e栄a h羽 th嘘ng, ki院p"vt¿e"8逢嬰c hi羽n th詠c
b茨ng h羽 e挨"u荏 d英 li羽u SQL Server 2008 R2, Windows Server và ngôn ng英 l壱p trình Dotnet Trong bài vi院t, tác gi違 áp d映pi"rj逢挨pi"rj r"z¤{"f詠ng kho d英 li羽u c栄a Kimball bao g欝m các mô hình chi隠u d英 li羽u g欝m 8 Fact-models, ph映c v映 vi羽c phân tích cho ho衣v"8瓜ng mua
j pi"pj逢"nhu c亥u mua hàng, l詠a ch丑n nhà cung c医p, qu違p"n#"jq "8挨p"nh壱p hàng, rj逢挨pi"
th泳c v壱n chuy吋p.È T瑛 8„"xây d詠ng e挨"ej院 ETL phù h嬰p sao cho vi羽c ch衣{"e挨"ej院 ETL 8逢嬰c th詠c hi羽n trên m瓜t máy ch栄 riêng bi羽t nh茨m nâng cao hi羽u su医t c栄a toàn b瓜 h羽 th嘘ng Ngoài ra, trong ki院n trúc mà tác gi違 xây d詠ng bao g欝m c違 m瓜t công c映 báo cáo cho phép pi逢運i dùng có th吋 thao tác v噂i các d英 li羽u thông qua bi吋w"8欝."8欝 th鵜 tr詠c quan giúp vi羽c 8逢c"tc"sw{院v"8鵜nh c栄a nhà qu違n lý t嘘v"j挨p
Trang 3232
2.8.2 CÁC S 謂N PH域M
Pentaho: là m瓜t ph亥n m隠m m衣nh m胤 8逢嬰c phát tri吋n b荏i Hitachi, kh違 p<pi"e栄a Pentaho bao g欝m tích h嬰p d英 li羽u, xây d詠ng d鵜ch v映 OLAP, báo cáo, tr詠c quan hoá d英
li羽u, khai phá d英 li羽u, xây d詠pi"e挨"ej院 ETL, và vô s嘘 các ch泳e"p<pi"mj e"rj映c v映 cho
h羽 th嘘ng trí tu羽 kinh doanh Pentaho là m瓜t ph亥n m隠m cung c医p t壱p các công c映 pj逢 trích
xu医t, bi院p"8鰻i và t違i d英 li羽w"*e挨"ej院 ETL) t衣q"8k隠u ki羽n thu壱n l嬰i cho quá trình thu th壱p, làm s衣ch x "n逢w"vt英 d英 li羽u t瑛 nhi隠w"e挨"ej院 k院t n嘘i ngu欝n d英 li羽u khác nhau Pentaho còn
h厩 tr嬰 c違 khai phá d英 li羽u và h丑c máy, các k悦 thu壱t khai phá d英 li羽w" pj逢" rj¤p" n噂p (Classification), H欝i quy (Regression), quy tách k院t h嬰p và phân c映m (Association Rules and Clustering) Rgpvcjq"ejq"rjfir"pi逢運i dùng xây d詠ng các Dashboard, 8欝 th鵜 tr詠c quan ngay trên h羽 th嘘ng ph映c v映 cho vi羽e"rj¤p"v ej"x "8逢c"tc"sw{院v"8鵜nh c栄c"pi逢運i dùng h羽
th嘘ng Vw{"pjk‒p"8吋 s穎 d映pi"8逢嬰c ph亥n m隠o"8 k"j臼k"pi逢運i dùng ph違i có ki院n th泳c v隠 công ngh羽 thông tin
Holistics: Ph亥n m隠o"8逢嬰c phát tri吋n b荏i công ty Holistics là m瓜t h羽 th嘘ng trí tu羽 kinh doanh t詠 ph映c v映 (Self-service BI), h羽 th嘘pi"ejq"rjfir"8丑c d英 li羽u t瑛 nhi隠u n隠n t違ng e挨"u荏 d英 li羽u khác nhau, s穎 d映ng các e挨"ej院 ETL 8吋 xây d詠ng mô hình d英 li羽u riêng trên
h羽 th嘘ng Ph亥n m隠m tích h嬰p c違 b瓜 công c映 phân tích d英 li羽w."pi逢運i dùng có th吋 s穎 d映ng các mô hình d英 li羽w"8«"z¤{"f詠pi"8吋 t衣o d詠ng các bi吋u 8欝."8欝 th鵜 ph映c v映 cho vi羽c phân tích Giao di羽n h羽 th嘘ng thân thi羽n, d宇 hi吋u v噂k"pi逢運i dùng."pi逢運i dùng c亥n có ki院n th泳c e挨"d違n v隠 câu l羽nh truy v医p"8隠u có th吋 s穎 d映ng
SSAS, SSIS, SSRS: là ba d鵜ch v映 8逢嬰c phát tri吋n b噂i Microsoft, tích h嬰p c違 ba
d鵜ch v映 pi逢運i dùng có th吋 xây d詠ng m瓜t h羽 th嘘ng trí tu羽 kinh doanh hoàn ch雨nh SSAS (Oketquqhv"USN"UgtxgtÓu"Cpcn{uku"Ugtxkegu+"n "f鵜ch v映 h厩 tr嬰 xây d詠ng kh嘘i OLAP, khai phá d英 li羽u và là m瓜t công c映 ph映c v映 vi羽c báo cáo SSIS (Sql Server Integration Services) là d鵜ch v映 8逢嬰c xây d詠ng ph映c v映 ejq"e挨"ej院 ETL và xây d詠ng kho d英 li羽u SSRS(Sql Server Reporting Services) là d鵜ch v映 8逢嬰c s穎 d映pi"8吋 thi院t k院 các Dashboard,
bi吋w"8欝."8欝 th鵜 và tr詠c quan hoá d英 li羽u A吋 s穎 d映ng thành th衣q"vj·"8 k"j臼i ph違i có ki院n
th泳c công ngh羽 thông tin nh医v"8鵜nh
Trang 3333
EJ姶愛PI"5< PHÂN TÍCH VÀ THI 蔭T K蔭 H烏 TH渦NG
Vtqpi"ej逢挨pi"p {."pj„o"v e"ik違 z e"8鵜nh các v医p"8隠 c亥n gi違i quy院t, phân tích v隠 các yêu c亥u ch泳e"p<pi."rjk"ej泳e"p<pi"e栄a h羽 th嘘ng, 8逢c"tc"d瓜 công c映 8隠 xu医v"ejq"e挨"
ch院 ETL, các Fact Model 8隠 xu医v"8吋 xây d詠ng kho d英 li羽u và công c映 phân tích d英 li羽u
V 遺P"A陰 C井N GI謂I QUY蔭T
Sau khi có nh英ng ki院n th泳c n隠n t違ng, nhóm có nh英ng v医p"8隠 c亥n gi違i quy院t trong 8隠 v k"pj逢"ucw<
H·nh 10: VXp"8z cZn giVi quyxt theo tなng ikck"8qTn
‚ Z e"8鵜nh nhu c亥u c栄a doanh nghi羽p qua phân tích nghi羽p v映, chuy吋n nhu c亥u doanh nghi羽p thành yêu c亥u ch泳e"p<pi"e栄a h羽 th嘘ng
‚ Thi院t k院 và xây d詠ng các Fact Model d詠a theo yêu c亥u c栄a các phòng ban trong doanh nghi羽r"vj逢挨pi"o衣i ho員c doanh nghi羽p s違n xu医t
‚ Z e"8鵜nh c医w"vt¿e"x "8鵜nh d衣ng d英 li羽w"8亥u vào c栄a h羽 th嘘ng bao g欝m d英 li羽u t瑛
h羽 e挨"u荏 d英 li羽u và t瑛 t壱p tin c栄a doanh nghi羽p
‚ Xây d詠pi"e挨"ej院 ETL phù h嬰r"8 r"泳pi"8逢嬰c vi羽c xây d詠ng kho d英 li羽u c栄c"pi逢運i
qu違p"n#1"pi逢運i dùng
‚ C亥p"e„"e挨"ej院 8鵜nh th運i, h厩 tr嬰 vi羽c c壱p nh壱t kho d英 li羽u m瓜t cách t詠 8瓜ng
‚ Xây d詠ng Dashboard ph映c v映 vi羽c phân tích d英 li羽u
‚ Xây d詠pi"8逢嬰c 泳ng d映ng Web, pi逢運i dùng có th吋 xem báo cáo k院t qu違, t壱p h嬰p các bi吋w"8欝."n逢嬰e"8欝 theo yêu c亥u c栄c"pi逢運i dùng
‚ O»k"vt逢運ng v壱n hành h羽 th嘘ng 鰻p"8鵜nh, có th吋 d宇 dàng tri吋n khai và m荏 r瓜ng
‚ Nghiên c泳w"x "8隠 xu医v"rj逢挨pi"rj r"8育y m衣nh s嘘 li羽u hoá, thu th壱p d英 li羽u ph映c
v映 phân tích d詠 báo và trí tu羽 kinh doanh
MJï"MJ;P
Trong quá trình gi違i quy院t v医p"8隠 8逢嬰c nêu 荏 m映c 3.1, nhóm g員p ph違i nh英ng khó mj<p"ucw<
‚ Xây d詠ng các b違ng Fact và b違ng Dimension s穎 d映pi"8逢嬰c cho c違 doanh nghi羽p
s違n xu医v"x "vj逢挨pi"o衣i 8 k"j臼i nhóm ph違i phân tích k悦 nghi羽p v映 doanh nghi羽p
và nhu c亥u th詠c t院 hi羽n nay
Trang 3434
‚ Xây d詠ng e挨"ej院 ETL toàn di羽n, phù h嬰p 8 p 泳pi"8逢嬰c nhu c亥u xây d詠ng kho d英
li羽u t瑛 8挨p"ik違p"8院n ph泳c t衣p."8 k"j臼i nhóm ph違i có th運i gian tìm hi吋u, nghiên c泳u trên các s違n ph育m có công d映pi"v逢挨pi"v詠 nh茨m tích h嬰p vào h羽 th嘘ng c栄a mình
‚ Xây d詠ng các Dashboard, bi吋w"8欝."8欝 th鵜 c亥p"e„"8瓜 linh ho衣t ccq."pi逢運i dùng có
th吋 tu bi院n theo ý thích
‚ E挨"u荏 h衣 t亥ng, yêu c亥u ph亥n c泳ng có kh違 p<pi"8 r"泳ng khi ph違i x穎 lý m瓜v"n逢嬰ng
d英 li羽u l噂n
‚ Kho d英 li羽w"n逢w"vt英 ph違k"8違m b違o ho衣v"8瓜ng 鰻p"8鵜pj."x "8違m b違o toàn v姻n, an toàn
d英 li羽u, không gây th医v"vjq v"ejq"pi逢運i dùng trong quá trình s穎 d映ng
GI 謂I PHÁP
A吋 gi違i quy院t nh英pi"mj„"mj<p"8«"p‒w"荏 vt‒p."pj„o"8«"vk院n hành th詠c hi羽n các gi違i pháp sau:
‚ Phân tích, tìm hi吋w"t "8k吋m chung v隠 m員t nghi羽p v映 gi英a hai lo衣i công ty s違n xu医t
x "vj逢挨pi"o衣i, t瑛 8„"pj„o"rj¤p"v ej"x "pihiên c泳u các quá trình nghi羽p v映 8吋 có
th吋 8隠 xu医t và xây d詠ng kho d英 li羽u phù h嬰p
‚ T壱n d映ng l衣i nh英ng bài báo, nghiên c泳u khoa h丑c c栄a các h丑c gi違 khác, nh茨m n逸m
b逸v"8逢嬰c các nhu c亥u trong vi羽c thi院t k院 và xây d詠ng các Fact Model chung và
t鰻ng quát cho các công ty thu瓜e"n pj"x詠c khác nhau
‚ Tìm hi吋u, nghiên c泳u thêm t瑛 các s違n ph育m có trên th鵜 vt逢運ng."ucw"8„"pj„o"rj¤p"tích và c違i thi羽n h羽 th嘘pi"GVN"8吋 có th吋 x穎 lý 8逢嬰c nhi隠u lo衣i d英 li羽u t瑛 nhi隠u ngu欝n chính xác và hi羽u qu違 j挨p0
‚ S穎 d映ng công ngh羽 8k羽n toán 8 o"o¤{"pj逢"Iqqing"Enqwf"Rncvhqto nh茨o"8衣v"8逢嬰c 8瓜 tin c壱y cao trong vi羽c b違o m壱t, tính s印n sàng và kh違 p<pi"o荏 r瓜ng c栄a h羽 th嘘ng
3.4.1 YÊU C 井U CH永E"P;PG
M瓜t cách t鰻ng quát, yêu c亥u c栄a ph亥n m隠m 8逢嬰c chia thành yêu c亥u ch泳e"p<pi"x "yêu c亥u phi ch泳e"p<pi0
3.4.1.1 YÊU C 井U CH永E"P;PI"X陰 B謂NG BÁO CÁO
‚ Pi逢運i dùng có th吋 nhìn th医y các bi吋w"8欝 8逢嬰c h羽 th嘘ng hi羽n th詠c
‚ Pi逢運i dùng có th吋 t衣o bi吋w"8欝 m噂i
‚ Pi逢運i dùng có th吋 kéo, th違 v鵜 trí bi吋w"8欝 m噂i
3.4.1.2 YÊU C 井U CH永E"P;PI"X陰 KHO D頴 LI烏U
‚ Pi逢運i dùng có th吋 t衣o/xóa/ch雨nh s穎a Fact Model trong kho d英 li羽u
‚ Pi逢運i dùng có th吋 t衣o/xóa/ch雨nh s穎a Fact Model trong Data Mart
‚ Pi逢運i dùng có th吋 qu違n lý các b違ng Fact ho員c Dimension
Trang 3535
3.4.1.3 YÊU C 井U CH永E"P;PI"X陰 VI烏C TRÍCH XU遺T Î BI蔭P"A蔚I Î T謂I
‚ Pi逢運i dùng có th吋 t衣o nhi隠u ngu欝n d英 li羽w"8鰻 vào cùng m瓜t b違ng d英 li羽u trên kho
d英 li羽u
‚ Pi逢運i dùng có th吋 t衣o/xóa/ch雨nh s穎a k院t n嘘i gi英c"e挨"u荏 d英 li羽u và h羽 th嘘ng
‚ Pi逢運i dùng có th吋 t衣o liên k院t gi英a các b違ng d英 li羽u
‚ Pi逢運i dùng có th吋 lên l鵜ch th詠c hi羽n quá trình trích xu医t Î bi院p"8鰻i Î t違i d英 li羽u
‚ Pi逢運i dùng có th吋 tu ch雨nh các phép bi院p"8鰻k"8嘘i v噂i b違ng theo ý mu嘘n
‚ E„"e挨"ej院 8鵜nh th運i h厩 tr嬰 quá trình t詠 8瓜ng hoá th詠c thi các tác v映
3.4.1.4 YÊU C 井U CH永E"P;PI"X陰 CÔNG C影 PHÂN TÍCH D頴 LI烏U
‚ Cung c医p giao di羽n giúp pi逢運i dùng xem các Dashboard, bi吋w"8欝
‚ T衣o m噂i, chính s穎a ho員c xoá bi吋w"8欝."8欝 th鵜
‚ Có kh違 p<pi"mfiq"vj違 các bi吋w"8欝."8欝 th鵜 tu vào v鵜 trí s逸p x院r"pi逢運i dùng ch丑n
‚ Piq k"e e"vt逢運ng d英 li羽u có s印p."pi逢運i dùng có th吋 dùng l羽nh truy v医p"USN"8吋
t衣q"vj‒o"e e"vt逢運ng m噂i
‚ Th詠c hi羽n Drill Up/Drill Down 荏 m瓜t s嘘 8欝 th鵜
3.4.2 YÊU C 井U PHI CH永E"P;PI
‚ Front-end c栄a h羽 th嘘pi"8逢嬰c xây d詠ng trên n隠n t違ng Web
‚ Có kh違 p<pi"v詠 8瓜ng khôi ph映c khi g員p l厩i trong quá trình th詠c thi ti院n trình ETL
‚ Có kh違 p<pi"o荏 r瓜ng h羽 th嘘ng
‚ A違m b違o t嘘e"8瓜 hi吋n th鵜 các bi吋w"8欝."8欝 th鵜 không quá 10 giây
Trang 3636
3.4.3 U愛"A唄 UML VÀ MÔ T謂 CH永E"P;PI H烏 TH渦NG A陰 XU遺T
H·nh 11<"U¬"8げ User Case hう thぐng
H·nh 11 Mô t違 các ch泳e"p<pi"ej pj"e栄a h羽 th嘘ng bao g欝m Qu違n lý Data Source, qu違n lý Data Warehouse, th詠c thi quá trình ETL và qu違n lý Dashboard
3.4.3.1 QU 謂N LÝ NGU唄N D頴 LI烏U (DATA SOURCE)
Mô tV: H羽 th嘘ng cjq"rjfir"pi逢運i dùng k院t n嘘i v噂k"e e"e挨"u荏 d英 li羽u và xem các
e挨"u荏 d英 li羽w"p {"n "e e"e挨"u荏 d英 li羽u ngu欝n cho h羽 th嘘ng
Các H·nh 12, H·nh 13, H·nh 14 mô t違 l亥p"n逢嬰t các giao di羽p"pi逢運i dùng c栄a ch泳c p<pi"sw違n lý ngu欝n d英 li羽u
Trang 3737
H·nh 12: QuVn lý Data Source
H·nh 13: Thêm mずi Data Source
H·nh 14: Cfp nhft thông tin Data Source
Trang 3838
3.4.3.2 QU 謂N LÝ DATA WAREHOUSE
Mô tV: H羽 th嘘pi"ejq"rjfir"pi逢運i dùng thêm, xóa, s穎a Data Warehouse, Data Mart,
Fact Model, Fact, Dimension
H·nh 15: Trang quVn lý Datawarehouse
H·nh 15 mô t違 giao di羽p"pi逢運i dùng trong ch泳e"p<pi"su違n lý Data Warehouse
3.4.3.3 TH 衛C THI TI蔭N TRÌNH ETL
Mô tV: H羽 th嘘pi"ejq"rjfir"pi逢運i dùng th詠e"vjk"e e"sw "vt·pj"GVN"ucw"mjk"pi逢運i
dùng thi院t l壱p Data Warehouse và h羽 th嘘pi"8違m b違o quá trình thi院t l壱p c栄c"pi逢運i dùng
h嬰p l羽
H·nh 16: Trang 8おnh thぜi
Trang 40d英 li羽w"8逢嬰c t壱p trung b茨pi"QFDE"vt逢噂c khi chuy吋n d英 li羽w"swc"Oqfwng"GVN"8吋 x穎 lý
Chi ti院t module:
‚ T医t c違 d英 li羽u ngu欝p"8逢嬰c k院t n嘘i v噂k"QFDE"8吋 truy xu医t d英 li羽u
‚ ETL Module: module này x穎 lý d英 li羽w"vjgq"dc"d逢噂c g欝m Trích xu医t (Extract),
Bi院p"8鰻i (Transform), T違i (Load)
o Trích xu医t: Module s穎 d映ng d英 li羽u t瑛 e挨"u荏 d英 li羽u doanh nghi羽p và các t壱p tin pj逢"Urtgcfujggvu."eux."000"n o"f英 li羽w"8亥w"x q0"Ucw"8„."Oqfwng"vt ej"zw医t các b違ng,
e e"vt逢運ng, các thu瓜c tính c亥n thi院t và phù h嬰p v噂i yêu c亥u nghi羽p v映
o Bi院p"8鰻i: D英 li羽u sau khi trích xu医t s胤 8逢嬰c x穎 lý d詠a vào các quy t逸c nghi羽p v映 cho phù h嬰p v噂i c医w" vt¿e" x " 8鵜nh d衣ng c栄a các b違pi." vt逢運ng trong Data Warehouse và Data Marts
o T違i: D英 li羽u sau khi x穎 lý s胤 8逢嬰e"8鵜nh th運k"8吋 chuy吋p"ucpi"n逢w"x q"Fcvc"Octvu"
và Data Warehouse