Phát triển hệ thống hoạch định tài nguyên doanh nghi ệp ERP ứng dụng dữ liệu lớn và trí tu ệ nhân tạo Hệ thống hoạch định nguồn lực doanh nghi ệp ERP là m ột giải pháp quản lý tổng thể d
Trang 1Phát triển hệ thống hoạch định tài nguyên doanh nghi ệp (ERP) ứng dụng dữ
liệu lớn và trí tu ệ nhân tạo
Hệ thống hoạch định nguồn lực doanh nghi ệp (ERP) là m ột giải pháp quản lý tổng thể doanh nghiệp đã đư ợc các doanh nghi ệp biết đến
Điểm nổi bật của giải pháp này là việc tích hợp các phân hệ thành một thể thống nhất cung c ấp thông tin t ổng hợp, nhất quán theo thời gian thực
Cùng với thời gian, những nhu c ầu mới, công nghệ mới ra đời đã buộc các
hệ thống ERP ph ải phát triển để phù hợp và một trong nh ững thách thức lớn nhất đối với các h ệ thống ERP ngày nay là th ực hiện được các chức năng thông minh với tốc độ xử lý nhanh, độ chính xác cao Thách thức này đòi hỏi các nhà cung cấp ERP phải ứng dụng các công nghệ mới vào phát triển hệ thống Trong bài vi ết này, tác giả đề xuất một mô hình ki ến trúc tổng thể hệ thống ERP ứng dụng công nghệ mới, dữ liệu lớn và trí tuệ nhân tạo để thực hiện đư ợc các chức năng thông minh, t ự động hóa s ản xuất nhằm đạt lợi thế cạnh tranh tối đa cho doanh nghiệp, đồng thời là một kênh giúp các doanh nghi ệp xác định chức năng, công ngh ệ và dữ liệu cần thiết khi xây dựng hệ thống ERP cho mình
1 Đặt vấn đề
Cuộc cách mạng công nghi ệp 4.0 đã đem l ại những tác đ ộng sâu s ắc đến tư duy và nh ận thức của các doanh nghiệp không chỉ ở Việt Nam, mà trên toàn thế giới Nó đã và đang đ ặt ra rất nhiều cơ hội và thách th ức cho các doanh nghiệp, nhất là khi thế giới đang ti ến vào kỷ nguyên số, công nghệ thông tin, thiết bị hỗ trợ quản lý ngày càng phát tri ển nhanh, mạnh và tiện dụng Việc, sử dụng công cụ quản lý hiện đại cho doanh nghi ệp trong th ời đại mới là điều vô cùng cần thiết, ERP - hệ thống hoạch định ngu ồn lực doanh nghiệp được ưu tiên lựa chọn cho các doanh nghi ệp hiện nay
Theo báo cáo từ Market Research Engine năm 2018, th ị trường ERP toàn cầu đư ợc kì vọng vượt qua mức 49 tỷ USD vào năm 2020 Trong m ột
nghiên cứu khác c ủa MarketResearch, dự đoán thị trường ERP sẽ đáng giá 41.04 tỷ USD vào năm 2020, v ới tỷ lệ tăng trưởng bình quân 6,9% t ừ 2015
- 2020 [M arket Research Future, 2018] Allied Market Research cũng đưa
ra con số tương tự, vào kho ảng 41,0 t ỷ USD, v ới tỷ lệ tăng trư ởng 7,2%
Trang 2Đến nay, ERP còn được coi là tiền đề để doanh nghiệp tiến hành chuyển đổi số, điều này giúp phần thúc đẩy thị trường ERP phát triển nhanh và mạnh hơn [Panorama Consulting Solutions, 2018]
ERP là sự tích hợp tất cả các phần mềm được sử dụng để quản lý doanh nghiệp thành một hệ thống duy nhất Với ERP, t ất cả các dữ liệu về hoạt động của doanh nghiệp được tạo ra luôn được cập nhật đầy đủ, tổng quan theo thời gian thực, Chính sự kết nối và hợp nhất các phần mềm trong cùng một hệ thống đã giúp doanh nghi ệp lưu trữ dữ liệu ở một nơi với một phiên bản sử dụng xuyên suốt cho tất cả bộ phận, phòng, ban hay chi
nhánh Khi xảy ra bất cứ sự thay đổi nào thì m ọi thông tin đều tự động hiển thị và tính toán l ại sao cho trùng kh ớp và giúp tránh đư ợc những sai sót, Các hệ thống ERP hiện nay, tuy có sự đồng bộ và thống nhất về dữ liệu nhưng mới chỉ sử dụng được các dữ liệu có cấu trúc, một khoảng trống rất lớn cần đư ợc khai thác chính là s ử dụng đư ợc nguồn dữ liệu lớn (bigdata) Ngày nay, công ngh ệ thông tin đóng vai trò quan tr ọng, không thể thiếu trong quá trình qu ản lý, điều hành các hoạt động sản xuất kinh doanh c ủa doanh nghiệp Sự xuất hiện của những công nghệ thời đại như: V ạn vật kết nối; dữ liệu lớn; điện toán đám mây; trí tu ệ nhân tạo, đã làm thay đ ổi mô hình và cách thức hoạt động kinh doanh c ủa doanh nghiệp, các giao d ịch truyền thống chuyển dần sang giao dịch điện tử, nhiều hoạt động thủ công được thay bằng tự động hóa, tất cả đã đỏi hỏi sự phát triển, hoàn thiện trong các công c ụ quản lý doanh nghiệp và tất yếu, hệ thống ERP cũng c ần được phát triển lên một tầm cao mới ERP mới này sẽ lấp được khoảng trống mà các h ệ thống ERP hi ện nay chưa giải quyết đư ợc như: H ỗ trợ doanh nghiệp thực hiện được những chức năng kinh doanh thông minh, t ự động hóa sản xuất, cá nhân hóa sản phẩm, ra các quyết định quản lý, để
hệ thống ERP gi ải quyết đư ợc các nhi ệm vụ trên, cần phải ứng dụng các công nghệ hiện đại như dữ liệu lớn và trí tu ệ nhân tạo, đ ể thu thập, xử lý
và phân tích dữ liệu tự động
Bước vào kỷ nguyên số, thông tin chính là tài s ản quan trọng của doanh nghiệp, cơ hội có được thông tin một cách nhanh nh ất, chính xác nh ất sẽ là chìa khóa thành công c ủa mỗi doanh nghi ệp Chính vì vậy, sự xuất hiện của ERP ứng dụng dữ liệu lớn và trí tu ệ nhân tạo là một tất yếu và tr ở nên quan trọng hơn bao giờ hết Với hệ thống ERP này, các doanh nghi ệp chủ động hơn trong việc khai thác thông tin để xây dựng giải pháp theo thời gian thực nhằm thúc đ ẩy việc đưa ra các quyết định chiến lư ợc một cách nhanh
Trang 3chóng, cải thiện hoạt động, gia tăng lợi nhuận của tổ chức
2 Thực trạng các hệ thống ERP hiện nay
Đến nay, ERP không chỉ được coi là một phần mềm, mà nó còn được xem
là một giải pháp qu ản lý tổng thể cho doanh nghi ệp, vì khi m ột doanh
nghiệp triển khai ERP là doanh nghi ệp có sự thay đổi về qui trình qu ản lý, con người và công nghệ Theo kết quả nghiên cứu thị trường ERP của
Panorama Consulting Group năm 2019 cho th ấy: Hiện nay, t ất cả các doanh nghiệp có qui mô khác nhau thu ộc tất cả các ngành ngh ề đang ph ải đối mặt với thách thức tăng chi phí ho ạt động, tài nguyên b ị hạn chế và nhân sự thay đổi, dẫn đến thách thức lớn với các nhà cung cấp giải pháp ERP, buộc các nhà cung c ấp giải pháp ph ải bổ sung chức năng, thay đ ổi công nghệ, để giải quy ết được các thách thức mà doanh nghi ệp đang phải đối mặt Thị trường ERP trong và ngoài nư ớc rất đa dạng và phong phú, có khá nhiều cách để phân loại giải pháp ERP Tuy nhiên, m ục tiêu c ủa bài báo là
đề xuất một kiến trúc hệ thống ERP ứng dụng dữ liệu lớn và trí tuệ nhân tạo để thực hiện các chức năng mới cần bổ sung vào h ệ thống Do v ậy, giải pháp ERP được phân loại theo hướng giải pháp trong nước và giải pháp nước ngoài, tập trung vào các chức năng và công nghệ sử dụng
2.1 Phân loại các giải pháp ERP
Để xác định được các chức năng và các công nghệ đang sử dụng của ERP hiện nay, tác gi ả thu thập dữ liệu từ báo cáo v ề kết quả nghiên cứu của Panorama năm 2018 và năm 2019 làm căn c ứ xác định các chức năng đã cung cấp, các chức năng sẽ bổ sung trong tương l ai và công ngh ệ của các giải pháp nư ớc ngoài Các ch ức năng và công ngh ệ của các giải pháp ERP trong nước được tác giả tổng hợp từ kết quả khảo sát của 10 doanh nghiệp cung cấp giải pháp ERP trong nư ớc hàng đầu Việt Nam Đối tư ợng đư ợc lựa chọn để khảo sát là các giám đốc công ngh ệ và giám đ ốc triển khai hệ thống Kết quả như sau:
Giải pháp ERP nước ngoài
Các giải pháp ERP nư ớc ngoài n ổi tiếng trên thị trường: ERP SAP, Oracle ERP, Microsoft Dynamics, Sage ERP các gi ải pháp này có đi ểm chung
Trang 4là: Có đầy đủ các chức năng, công nghệ hiện đại, bề dầy kinh nghiệm và đã
áp dụng thành công t ại nhiều doanh nghiệp ở trên thế giới Khi triển khai ở Việt Nam, quy trình qu ản lý đã được chuẩn hóa, đư ợc thiết kế và điều
chỉnh theo nhu c ầu của các doanh nghi ệp cho ph ù hợp với quy trình và tính pháp lý trong nước Các phần mềm ERP nước ngoài thường có giá thành cao, ngoài chi phí tư vấn, triển khai phần mềm, doanh nghiệp còn phải trả khoản tiền bản quyền tương đ ối lớn Đặc biệt, trong h ệ thống ERP, phân h ệ
Kế toán thường là module quan tr ọng nhất, module này là đ ầu mối trung tâm của dữ liệu, có nhi ệm vụ hạch toán các nghi ệp vụ phát sinh và in ra các báo cáo theo đúng chế độ, chuẩn mực kế toán Việt Nam, các nhà cung cấp nư ớc ngoài thư ờng khó đáp ứng đư ợc yêu cầu này
Giải pháp ERP trong nư ớc
Các nhà cung c ấp giải pháp ERP trong nư ớc hiện nay cũng đủ khả năng thiết kế những phần mềm ERP thuần Việt Những phần mềm này phù h ợp với năng lực, trình độ, luật pháp và cũng nhanh chóng k ịp thời cập nhật các thông tư, quyết định hướng dẫn các doanh nghiệp cần phải thực hiện Tuy nhiên, các phần mềm ERP trong nư ớc thường phát tri ển từ các phần mềm
kế toán và chưa thực sự cung cấp đầy đủ các chức năng, phân h ệ cho doanh nghiệp, công nghệ sử dụng chưa cập nhật đư ợc theo th ời đại Chi phí cho các hệ ERP trong nư ớc thường rẻ hơn nhi ều so với ERP ngoại
Kết quả nghiên cứu của Panorama năm 2019 còn cho th ấy các chức năng cần bổ sung thêm trong th ời gian t ới là: CRM (Quản trị quan hệ khách hàng); HCM (Quản trị nguồn nhân lực); EAM (Quản trị tài sản doanh
nghiệp); PLM (Quản lý vòng đ ời sản phẩm); PIM (Qu ản lý thông tin s ản
Trang 5phẩm); PDM (Quản lý dữ liệu sản phẩm); QA (Đ ảm bảo chất lư ợng); MES (Hệ thống thực thi sản xuất); Quản lý chu ỗi cung ứng (SCM); TMS (H ệ thống quản lý vận tải) và WMS (H ệ thống quản lý kho), M ỗi ứng dụng này được thực hiện ở mức độ tự động hoặc bán tự động và có thể được triển khai như m ột hệ thống bổ sung cho các hệ thống để hỗ trợ giải pháp ERP hiện đại hoặc có th ể được nhúng hoặc tích h ợp với hệ thống ERP c ốt lõi
2.2 Kiến trúc chung c ủa ERP hiện nay
Đặc trưng chung của phần mềm ERP trong nước và nước ngoài đều có cấu trúc phân hệ, mỗi phân h ệ có một tập hợp các chức năng Từng phân hệ có thể hoạt động độc lập nhưng do bản chất của hệ thống ERP nên các phân h ệ được kết nối với nhau để tự động chia sẻ nhằm tạo nên một hệ thống đồng nhất Từ kết quả khảo sát của Panorama và của tác giả, kiến trúc tổng thể của ERP trong nư ớc và nước ngoài đư ợc mô hình hóa như hình 1
Trang 6
- Tầng ứng dụng là tầng giao ti ếp với người sử dụng thông qua vi ệc cung cấp các giao diện, các chức năng của các phân h ệ Các hệ thống ERP c ủa các hãng khác nhau có s ự đặt tên chức năng và phân h ệ khác nhau, tên c ủa các phân hệ trong tầng ứng dụng hình 1 đư ợc lựa chọn từ số đông các nhà cung cấp sử dụng
- Tầng công nghệ và dịch vụ là các công nghệ được sử dụng để thiết kế, xây dựng các ch ức năng Ngoài ra, còn có các công ngh ệ nền đư ợc cài đặt trên các h ệ thống máy ch ủ, máy tr ạm khi triển khai hệ thống Mỗi nhà cung cấp sử dụng các công ngh ệ khác nhau cho s ản phẩm của mình Các công nghệ được liệt kê ở hình 1 là các công ngh ệ cốt lõi các nhà cung c ấp giải pháp ERP đang sử dụng hiện nay
Tầng dữ liệu là nơi cho phép h ệ thống khai thác các dữ liệu để thực hiện được các yêu cầu từ người dùng thông qua giao diện các chức năng ở tầng ứng dụng Với các hệ thống ERP hiện nay thì các dữ liệu hệ thống đang khai thác thường là những dữ liệu truyền thống dữ liệu có có cấu trúc
Các hệ thống ERP ngày nay, v ề cơ bản, đã cung c ấp các chức năng đáp ứng được nhu cầu tối thiểu của doanh nghiệp Tuy nhiên, với sự phát triển của
xã hội, của công nghệ, cần phát tri ển hệ thống ERP lên một tầm cao mới, ERP ứng dụng các công ngh ệ mới để giải quyết những bài toán c ủa doanh nghiệp trong th ời đại 4.0 và bư ớc vào thời kì số hóa
3 Đề xuất kiến trúc ERP ứng dụng dữ liệu lớn và trí tuệ nhân tạo
Trí tuệ nhân tạo đang là m ột chủ đề nóng trong những năm gần đây, ứng dụng trí tu ệ nhân tạo trong t ất cả các hoạt động đời sống của con ngư ời ngày một gia tăng và đem l ại những kết quả đáng ghi nh ận Thực tế cho thấy rằng, những tổ chức nào chấp nhận ứng dụng trí tu ệ nhân t ạo sẽ có những bư ớc tiến mạnh mẽ, trong khi nh ững tổ chức từ chối tiếp nhận công nghệ sẽ bị tụt hậu ERP ứng dụng dữ liệu lớn và trí tu ệ nhân tạo sẽ là một giải pháp, một công cụ quản lý tổng thể doanh nghiệp đáp ứng đư ợc như cầu của thời đại Ki ến trúc hệ thống ERP này đư ợc xây dựng dựa trên: (i)
Xu hướng các chức năng cần bổ sung; (ii) Các công nghệ mới (điện toán đám mây; dữ liệu lớn; trí tuệ nhân tạo; vạn vật kết nối); (iii) Thu thập và
Trang 7lưu trữ dữ liệu
3.1 Xu hướng các chức năng cần bổ sung
Thực chất ERP ứng dụng dữ liệu lớn và trí tu ệ nhân tạo không dựa trên một công nghệ cụ thể nào, mà dựa trên khả năng h ệ thống ERP có thể sử dụng nhiều công nghệ để hỗ trợ các chức năng thông minh Trong doanh nghi ệp, các chức năng thông minh thư ờng bắt đầu từ việc tự động hóa các qui trình, nhất là các qui trình đư ợc thực hiện thường xuyên Theo th ời gian, l ại có các chức năng khác đư ợc phát triển như phát hiện lỗi trong s ản xuất, phân tích dự đoán để lập kế hoạch và dự báo nhu cầu, thì lại cần các công nghệ học máy, học sâu, xử lý ngôn ngữ tự nhiên cho các h ệ thống điều khiển bằng giọng nói trong sản xuất hoặc trong kho, đi ều này phần thực trạng cũng đã khẳng định được sự cần thiết phải thay đổi Do vậy, kiến trúc hệ thống ERP mới này đư ợc xây dựng dựa trên khả năng ứng dụng các công nghệ để mở rộng các chức năng và tích h ợp với các ứng dụng sá ng tạo theo thời gian nhằm đáp ứng đư ợc nhu cầu thay đ ổi của doanh nghiệp
3.2 Các công ngh ệ mới
Các hệ thống thông minh đòi h ỏi một lượng dữ liệu lớn mới có thể xác định
xu hướng, mô hình và mối tương quan, cũng như kh ả năng tìm hiểu và đưa
ra kết luận Hệ thống ERP m ới rất cần nguồn dữ liệu đa dạng, chính xác theo thời gian thực để thực hiện các chức năng Do vậy, ngoài hai công nghệ chủ chốt là dữ liệu lớn và trí tuệ nhân tạo, hệ thống còn ứng dụng nhiều công nghệ khác, dư ới đây sẽ làm rõ ý nghĩa và chức năng c ủa các công nghệ chính đư ợc ứng dụng vào hệ thống
Điện toán đám mây (Cloud Computing)
Điện toán đám mây là công nghệ cung cấp các tài nguyên máy tính cho người dùng theo mục đích sử dụng thông qua kết nối Internet Điện toán đám mây cung cấp theo ba loại hình dịch vụ chính: (1) IaaS - Internet as a Service (Dịch vụ mạng), cung c ấp hạ tầng máy chủ, thư ờng dành cho các nhà phát tri ển phần mềm; (2) PaaS - Platform as a Service (D ịch vụ hạ tầng), cung cấp nền tảng để triển khai phần mềm; (3) SaaS - Software as a Service (Dịch vụ phần mềm), cung cấp sản phẩm ứng dụng, chủ yếu dành
Trang 8cho người dùng cuối
Ngày nay, dữ liệu là tâm điểm của các hệ thống ERP, trong các h ệ thống ERP truyền thống, quá trình thu th ập và lưu trữ dữ liệu thiếu hiệu quả, hầu hết việc lưu trữ hạn chế và độ chính xác chưa cao do nh ập dữ liệu thủ công
và không tương thích Sự phát triển nhanh chóng của công nghệ đám mây
đã tạo ra một cơ hội hoàn toàn mới cho ERP, lưu trữ dữ liệu đã trở nên hợp
lý hơn khi các giải pháp ERP được xây dựng dựa trên đám mây có thể dễ dàng được tích hợp với nhiều hệ thống Khi triển khai hệ thống ERP, tùy vào từng doanh nghi ệp sẽ sử dụng các loại hình dịch vụ điện toán đám mây khác nhau, loại hình SaaS đư ợc coi là phù h ợp với nhiều doanh nghiệp nhất
Vạn vật kết nối (Internet of Things - IoT)
Ngày nay, s ố lượng thiết bị kết nối ngày càng tăng đã t ạo ra các ngu ồn lực
có thể giúp phát tri ển ERP truy ền thống Các thiết bị cá nhân như đi ện thoại thông minh, đ ồng hồ thông minh đã đư ợc nhiều công ty hiệu chỉnh để thu thập dữ liệu hữu ích và cung c ấp cho hệ thống Nhờ có IoT đã cải thiện đáng kể quy trình thu thập dữ liệu, hoàn toàn vượt qua quy trình trước đây khi dữ liệu được thu thập thủ công, chuyển qua nhiều cấp nhân viên và cuối cùng đưa vào h ệ thống Điều này còn đ ảm bảo rằng doanh nghi ệp có thể thu thập dữ liệu thời gian thực, do vậy các hệ thống ERP cập nhật liên tục một khối lượng thông tin kh ổng lồ giúp quá trình phân tích k ết quả được nhanh chóng và chính xác
Dữ liệu lớn (Big Data)
Sự xuất hiện của dữ liệu lớn trong bối cảnh hiện nay đư ợc các doanh
nghiệp kỳ vọng như nguồn tài nguyên kh ổng lồ, đẩy các doanh nghi ệp phải đối mặt với hàng loạt hạn chế trong việc xử lý thông tin, dẫn đến khả năng đưa ra các quyết định kinh doanh bị chậm trễ hoặc thậm chí là trì hoãn Điều này về lâu dài chắc chắn sẽ ảnh hưởng không nhỏ đến hiệu quả kinh doanh Dữ liệu lớn là ch ỉ những tập hợp dữ liệu phát triển nhanh chóng và rộng khắp dư ới nhiều hình thức khác nhau, làm cho chúng vư ợt quá kh ả năng xử lý của những hệ thống cơ sở dữ liệu truyền thống và dữ liệu lớn
Trang 9có 5 đặc trưng:
- Khối lượng dữ liệu (Volume): Chỉ sự tăng trưởng về mặt khối lư ợng dữ liệu rất lớn đư ợc tạo ra và lưu trữ Khối lượng của dữ liệu lớn đư ợc tính từ đơn vị terabyte cho đến petabyte Với dữ liệu lớn, công nghệ Điện toán đám mây mới đủ khả năng đáp ứng nhu cầu lưu trữ
- Tốc độ (Velocity): Thể hiện sự tăng trưởng về mặt tốc độ hoạt động xử lý
và phân tích dữ liệu Tốc độ có thể hiểu theo 2 khía c ạnh: (1) Khối lượng
dữ liệu gia tăng rất nhanh (mỗi giây có tới 72.9 triệu các yêu cầu truy cập tìm kiếm trên web bán hàng c ủa Amazon); (2) X ử lý dữ liệu nhanh ở mức thời gian thực (real -time), có nghĩa d ữ liệu được xử lý ngay tức thời, ngay sau khi chúng phát sinh
- Đa dạng (Variety) : Là sự tăng lên về tính đa d ạng của dữ liệu, đối với dữ liệu truyền thống - dữ liệu có cấu trúc, nhưng ngày nay hơn 80% d ữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, bài hát, dữ liệu
từ thiết bị cảm biến vật lý, thi ết bị chăm sóc sức khỏe, file log, ) D ữ liệu lớn của một tổ chức là tập hợp của nhiều nguồn dữ liệu, mà tính đa d ạng của nó cũng đang ngày càng tăng lên làm cho tính ph ức tạp của dữ liệu ngày càng phức tạp hơn
- Độ tin cậy/chính xác (Veracity): Tính xác th ực dữ liệu lớn phản ánh mức
độ tin cậy ứng với từng kiểu dữ liệu trong từng nguồn dữ liệu khác biệt [B.Vorhies, 2013] Trên th ực tế, có một số nguồn dữ liệu vốn không xác định và thường xuyên thay đổi, như ý kiến khách hàng về một thương hiệu hay sản phẩm dịch vụ, mức độ hứng thú đ ối với một chiến dịch hay m ột dòng sản phẩm mới, xu hướng thị trường và các yếu tố kinh tế Tính tin cậy của dữ liệu lớn phụ thuộc vào nguồn gốc dữ liệu, có giá tr ị ảnh hư ởng bởi yếu tố thời gian và sự tác động của các kĩ thu ật khai phá đ ối với các thông tin phân tích để đưa ra quyết định hành động [K.Normandeau, 2013]
- Giá trị (Value): Là tính ch ất quan trọng nhất Ở đây, cần phải hoạch định được những giá trị thông tin hữu ích của dữ liệu lớn cho vấn đề, bài toán hoặc mô hình ho ạt động kinh doanh c ần giải quyết Dữ liệu lớn đư ợc xem
là công ngh ệ mang lại cho tổ chức những giá trị gia tăng nhằm duy trì và bảo vệ lợi thế cạnh tranh [Rao, et al., 2015) (Vorhies, 2013)] Thay vì lưu
Trang 10trữ và quản trị dữ liệu khách hàng theo cách ti ếp cận tổng quát, dữ liệu lớn giúp tổ chức chuyên biệt hóa từng đối tượng và lưu trữ dữ liệu độc lập phục vụ cho hoạt động phân tích hành vi và gia tăng tr ải nghi ệm
Hệ sinh thái Hadoop
Hệ sinh thái Hadoop là n ền tảng công nghệ mã nguồn mở, cho phép lưu tr ữ
và xử lý phân tán các t ệp dữ liệu lớn trên các c ụm máy tính thông qua m ột
mô hình l ập trình linh ho ạt, dễ dàng mở rộng quy mô [BMC, 2016] H ệ sinh thái Hadoop bao g ồm nhiều thành ph ần:
- Hadoop Common: Các ti ện ích ph ổ biến hỗ trợ các phần Hadoop khác
- Hadoop Distributed File System: Cung c ấp khả năng truy c ập dữ liệu ứng dụng cao
- Hadoop YARN: Một khuôn mẫu cho kế hoạch làm vi ệc và qu ản lý tài nguyên cụm
- Hadoop MapReduce: M ột hệ thống dựa trên YARN đ ể xử lý song song b ộ Big Data
Ngoài ra, trong hệ sinh thái Hadoop, còn bao g ồm nhiều công ngh ệ và các công cụ giải pháp khác, như mô hình l ập trình Spark là m ột khuôn m ẫu tính toán cụm nguồn mở được sử dụng làm công cụ xử lý Big Data trong
Hadoop Spark đã trở thành một trong những khuôn mẫu xử lý dữ liệu lớn quan trọng, và có thể được triển khai theo nhi ều cách khác nhau Nó cung cấp các ràng buộc bản địa đối với Java, Scala, Python, ngôn ng ữ lập trình
R và hỗ trợ SQL, streaming data, machine learning và x ử lý đồ thị, cung cấp cổng vào cho các tính to án trên bộ nhớ, giao di ện dòng l ệnh, [J
Roman, 2014]
Trí tuệ nhân tạo (Artificial Intelligence - AI)
Trí tuệ nhân tạo đang là xu hư ớng phát tri ển chung trên toàn th ế giới bởi khả năng xử lý hàng tri ệu thông tin m ột cách tự động trong th ời gian rất ngắn Trí tu ệ nhân t ạo là trí tu ệ của máy móc đư ợc tạo ra bởi con ngư ời Trí tuệ này có thể tư duy, suy nghĩ, h ọc hỏi như trí tu ệ con ngư ời, nhưng