35 PHÂN TÍCH DỮ LIỆU VÀ ỨNG DỤNG PHÂN TÍCH DỮ LIỆU CHO DOANH NGHIỆP Nguyễn Quốc Thanh Khoa Công nghệ Thông tin Trường Đại học Tài chính Marketing Email nqthanh@ufm edu vn Tóm tắt Ngành nghề phân tích[.]
Trang 135
PHÂN TÍCH DỮ LIỆU VÀ ỨNG DỤNG PHÂN TÍCH DỮ LIỆU
CHO DOANH NGHIỆP Nguyễn Quốc Thanh
Khoa Công nghệ Thông tin Trường Đại học Tài chính - Marketing
Email: nqthanh@ufm.edu.vn
Tóm tắt: Ngành nghề phân tích dữ liệu (Data Analytics) đang là một trong những nghề nóng
nhất và phát triển nhanh trên toàn thế giới Bài viết tìm hiểu về nghành nghề phân tích dữ liệu, các
số liệu cần phân tích, việc áp dụng phân tích dữ liệu trong kinh doanh cũng như tìm hiểu qua các công cụ phần mềm hỗ trợ cho các kỹ sư phân tích dữ liệu trong tương lai
Từ khóa: data analytics, phân tích dữ liệu, công cụ phân tích dữ liệu
1 PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS) LÀ GÌ?
Trước tiên, chúng ta cần làm rõ khái niệm về Data Analysis – phân tích dữ liệu là gì? Nói một cách ngắn gọn, phân tích dữ liệu là quá trình chọn lọc dữ liệu; rồi sau đó tìm kiếm, thu thập thông tin quan trọng và tổng hợp số liệu dựa trên số lượng lớn các thông tin hỗn độn
Bạn có thể hiểu theo cách đơn giản, đây là quá trình chuyển dữ liệu thô thành dữ liệu
có thể dùng được và đưa đến kết luận
Quy trình phân tích dữ liệu giờ đây, được tự động hóa thành quy trình và thuật toán
để chuyển từ số liệu thô thành dữ liệu dùng được
Kỹ thuật phân tích giúp chúng ta tổng hợp dữ liệu và đưa đến kết luận cuối cùng Thông tin này có thể sử dụng để tối ưu hóa các quy trình và tăng hiệu quả tổng thể của doanh nghiệp trong việc quản lý toàn bộ hệ thống
Ví dụ: hình bên dưới là một mẫu báo cáo dữ liệu về bán hàng trên facebook, khi được công cụ A1 Analytics phân tích và cho ra kết quả là những số liệu trực quan được thể hiện bằng đồ thị
Trang 2Hình 1: Báo cáo dữ liệu trên facebook sử dụng công cụ A1 Analytics
2 KHẢ NĂNG ỨNG DỤNG CỦA PHÂN TÍCH DỮ LIỆU (DATA ANALYTICS)
Phân tích dự đoán
Phân tích dự đoán là phân tích dữ liệu hiện tại để dự báo và tránh các tình huống có vấn đề trước Các nhà sản xuất rất quan tâm đến việc giám sát hoạt động của công ty và hiệu suất cao của nó Tìm cách tốt nhất có thể để xử lý các vấn đề có lỗi, khắc phục khó khăn hoặc ngăn chặn chúng xảy ra là những cơ hội tuyệt vời cho các nhà sản xuất sử dụng phân tích dự đoán Việc thực hiện phân tích dự đoán cho phép xử lý tổn thất (sản xuất thừa, thời gian nhàn rỗi, hậu cần, hàng tồn kho, …) Do đó, hãy tập trung vào các giải pháp khả thi do phân tích dự đoán mang lại
Dự đoán lỗi và bảo trì phòng ngừa
Cả hai mô hình dự đoán này đều nhằm mục đích dự báo thời điểm khi thiết bị không thực hiện được nhiệm vụ Kết quả là, mục tiêu thứ cấp có thể đạt được – để ngăn chặn những thất bại này xảy ra hoặc ít nhất là để giảm số lượng của chúng Điều này trở nên khả thi với nhiều kỹ thuật dự đoán Bảo trì phòng ngừa thường được áp dụng cho các thiết bị vẫn đang hoạt động để giảm khả năng hỏng hóc của nó Có hai loại bảo trì phòng ngừa chính: dựa trên thời gian và dựa trên việc sử dụng Sức mạnh lớn nhất của bào trì phòng ngừa là lập kế hoạch Có trong tay những dự đoán liên quan đến những rắc rối trong tương lai với thiết bị, nhà sản xuất có thể lên kế hoạch nghỉ ngơi hoặc ngừng hoạt động để sửa
Trang 337
chữa Việc nghỉ như vậy thường được thực hiện để tránh sự chậm trễ và thất bại đáng kể, thường được gây ra bởi các vấn đề quan trọng hơn có thể phát sinh
Dự báo nhu cầu và quản lý hàng tồn kho
Dự báo nhu cầu (demand forecast) là một quá trình phức tạp liên quan đến phân tích
dữ liệu và công việc lớn của kế toán viên và chuyên gia Hơn nữa, nó dường như có mối quan hệ mạnh mẽ với quản lý hàng tồn kho Một thực tế đơn giản có thể giải thích mối liên
hệ này – dự báo nhu cầu sử dụng dữ liệu của chuỗi cung ứng Có rất nhiều lợi ích của việc
dự báo nhu cầu cho các nhà sản xuất Trước hết, nó mang lại cơ hội kiểm soát hàng tồn kho tốt hơn và giảm nhu cầu lưu trữ một lượng đáng kể các sản phẩm vô dụng Bên cạnh đó, phần mềm quản lý hàng tồn kho trực tuyến giúp thu thập dữ liệu có thể được sử dụng nhiều
để phân tích thêm Một yếu tố quan trọng hơn là đầu vào dữ liệu cho dự báo nhu cầu có thể được cập nhật liên tục Do đó, dự báo có liên quan có thể được thực hiện Lợi ích bổ sung nằm ở việc cải thiện mối quan hệ giữa nhà cung cấp và nhà sản xuất, vì cả hai đều có thể điều tiết hiệu quả cổ phiếu và quy trình cung ứng của họ Dự báo nhu cầu và quản lý hàng tồn kho có tính đến nhiều yếu tố, trong đó có các yếu tố bên ngoài như nền kinh tế hoặc thị trường, nguồn nguyên liệu thôi, … Bằng cách này, chúng ta có thể có được cái nhìn phức tạp hơn về hiệu quả kinh doanh sản xuất của mình và lập kế hoạch thêm
Tối ưu hóa giá thành sản xuất
Sản xuất và bán sản phẩm liên quan đến việc tính đến nhiều yếu tố và tiêu chí ảnh hưởng đến giá sản phẩm Tất cả các yếu tố bắt đầu với giá ban đầu của nguyên liệu thô và đến chi phí phân phối đóng góp vào giá sản phẩm cuối cùng Và điều gì xảy ra khi khách hàng thấy mức giá này quá cao hoặc quá thấp? Tối ưu hóa giá là quá trình tìm giá tốt nhất
có thể cho cả nhà sản xuất và khách hàng, không quá cao và không quá thấp Các giải pháp tối ưu hóa giá hiện đại có thể tăng lợi nhuận của bạn một cách hiệu quả Các công cụ này tổng hợp và phân tích giá cả và dữ liệu chi phí cả từ các nguồn nội bộ và các đối thủ cạnh tranh của bạn và rút ra các biến thể giá tối ưu hóa Trong điều kiện thị trường cạnh tranh cao và thay đổi nhu cầu của khách hàng, tối ưu hóa giá cả trở thành bắt buộc và phát triển thành một quá trình liên tục
Phân tích bảo hành
Các nhà sản xuất OEM đang chi một khoản tiền đáng kể mỗi năm cho việc hỗ trợ yêu cầu bảo hành Yêu cầu bảo hành tiết lộ thông tin có giá trị về chất lượng và độ tin cậy của
Trang 4sản phẩm Chúng giúp tiết lộ những cảnh báo sớm hoặc khiếm khuyến của sản phẩm Sử dụng dữ liệu này, nhà sản xuất có thể cải tiến các sản phẩm hiện có hoặc phát triển những sản phẩm mới, hiệu quả và tốt hơn Các giải pháp phân tích bảo hành hiện đại giúp các nhà sản xuất xử lý khối lượng lớn dữ liệu liên quan đến bảo hành từ nhiều nguồn khác nhau và
áp dụng kiến thức này để khám phá các vấn đề bảo hành đang gia tăng và lý do xảy ra
Robot hóa
Robot đang thay đổi bộ mặt sản xuất Ngày nay, đó là một nguyên nhân phổ biến để
sử dụng robot thực hiện các nhiệm vụ thông thường và những thứ có thể gây khó khăn hoặc nguy hiểm cho con người Các nhà sản xuất có xu hướng đầu tự ngày càng nhiều tiền vào việc robot hóa các doanh nghiệp của họ mỗi năm Các mô hình robot được hỗ trợ bởi trí tuệ nhân tạo (Artificial Intelligent) giúp đáp ứng nhu cầu ngày càng tăng Hơn nữa, robot công nghiệp phần lớn góp phần tăng chất lượng sản phẩm Hàng năm, các mô hình nâng cấp robot đến khu vực sản xuất để cách mạng hóa dây chuyền sản xuất Và hiện tại, robot sản xuất đang có giá cả phải chăng cho các doanh nghiệp hơn bao giờ hết
Phát triển sản phẩm
Dữ liệu lớn đã mang lại cơ hội lớn cho các công ty sản xuất liên quan đến phát triển sản phẩm Các nhà sản xuất sử dụng lợi thế của dữ liệu lớn để hiểu khách hàng hơn, đáp ứng nhu cầu của khách hàng và cả nhu cầu của họ Do đó, dữ liệu có thể được sử dụng để phát triển các sản phẩm mới hoặc để cải thiện các sản phẩm hiện có Sử dụng dữ liệu lớn
để phát triển sản phẩm, các nhà sản xuất có thể thiết kế một sản phẩm với giá trị khách hàng tăng lên và giảm thiểu rủi ro liên quan đến việc giới thiệu sản phẩm mới ra thị trường Những hiểu biết có thể hành động được tính đến trong khi lập mô hình và lập kế hoạch Dữ liệu này có thể tăng cường quá trình ra quyết định Ngoài ra, các công cụ quản lý dữ liệu được áp dụng rộng rãi để tối ưu hóa các khía cạnh hoạt động của chuỗi phân phối Xử lý phản hồi của khách hàng và cung cấp dữ liệu này cho các nhà tiếp thị sản phẩm có thể đóng góp vào giai đoạn tạo ý tưởng Do đó, một sản phẩm mới sẽ hữu ích hơn cho khách hàng
và có lợi hơn cho các nhà sản xuất có thể được phát triển
Ứng dụng thị giác máy tính
Các công nghệ hỗ trợ trí tuệ nhân tạo và các ứng dụng thị giác máy tính đã tìm thấy việc sử dụng chúng trong sản xuất ở giai đoạn kiểm soát chất lượng Về mặt này, nhận dạng đối tượng và phát hiện, phân loại đối tượng được chứng minh là rất hiệu quả Thông thường,
Trang 539
giám sát kiểm soát chất lượng được thực hiện bởi mọi người Tuy nhiên, hiện nay người ta thường dựa vào thị giác máy tính hơn là thị giác con người Các hệ thống giám sát này thường bao gồm phần cứng và phần mềm máy tính, máy ảnh và ánh sáng để chụp ảnh Sau
đó, những hình ảnh này được so sánh với các tiêu chuẩn để xác định sự khác biệt Trong số các lợi thế chính của các ứng dụng là: kiểm soát chất lượng cao được cải thiện, giảm chi phí lao động, khả năng xử lý tốc độ cao, khả năng hoạt động liên tục 24/7
Quản lý rủi ro chuỗi cung ứng
Chuỗi cung ứng luôn luôn phức tạp và không thể đoán trước Rủi ro luôn là một phần của qui trình sản xuất và phân phối sản phẩm Sử dụng phân tích dữ liệu lớn để quản lý rủi
ro chuỗi cung ứng có thể khá có lợi cho các nhà sản xuất Với sự trợ giúp của phân tích dữ liệu, các công ty có thể dự đoán sự chậm trễ tiềm ẩn và tính toán xác suất của các vấn đề có lỗi Các công ty sử dụng kết quả của phân tích dữ liệu để xác định các nhà cung cấp dự phòng và phát triển các kế hoạch dự phòng Để theo kịp xu hướng thay đổi liên tục, việc áp dụng phân tích dữ liệu thời gian thực là rất cần thiết Dự đoán và quản lý rủi ro có thể xảy
ra là rất quan trọng cho hoạt động của một doanh nghiệp sản xuất thành công
Trở lại thị trường Marketing & Sale tại Việt Nam trong mấy năm qua, một mặt thổi phồng quá mức về Big Data, Machine Learning (trong khi ứng dụng trong thực tế rất hạn chế), một mặt bị chán nản bởi nạn mua bán thông tin (rồi spam sms, email, messenger tràn lan)….Tuy nhiên có nhiều doanh nghiệp đã ứng dụng Data Analytics rất thành công và tạo
ra tăng trưởng vượt bậc Ví dụ: The Coffee House hiểu rất rõ hành vi của tất cả khách hàng bằng cách thu thập dữ liệu giao dịch tại quán, app, đặt hàng online… từ đó đưa ra các chiến dịch marketing/sale cá nhân hoá cho từng nhóm khách, từng sản phẩm và từng thời điểm
Ví dụ sáng nay, Bình Thạnh âm u như sắp đổ mưa thì sẽ cần code gì cho thật “chill” và push tới nhóm nào trên app để ra được lượng đặt hàng tốt nhất Việc đó dĩ nhiên không thể
tự ngồi đoán
3 HIỂU PHÂN TÍCH DỮ LIỆU NHƯ THẾ NÀO?
Đây là thuật ngữ rộng bao gồm nhiều loại phân tích khác nhau Bất kỳ thông tin nào cũng cần kỹ thuật phân tích dữ liệu để có được cái nhìn sâu sắc và sử dụng để cải thiện kết quả kinh doanh Ví dụ: Các xí nghiệp sản xuất thường phải dùng cách phân tích thủ công
để kiểm tra các hoạt động của một dây chuyền sản xuất, lên lịch sản xuất, thống kê số lượng hàng, kiểm tra hết hàng, sản xuất hàng mới, thì giờ đây các dữ liệu sẽ được công cụ phân
Trang 6tích làm toàn bộ, từ việc thống kê đến lên kế hoạch tiếp theo Tóm lại, quá trình phân tích luôn cần đến cho dù bạn đang làm lĩnh vực gì Đặc điểm chung bạn phải tuân thủ theo các bước:
Bước đầu tiên, xác định các yêu cầu dữ liệu hoặc cách để phân loại nhóm Dữ liệu
có thể được phân tách theo độ tuổi, nhân khẩu học, thu nhập hoặc giới tính Giá trị dữ liệu
có thể là số hoặc nhóm được phân chia
Bước thứ hai, là quá trình thu thập dữ liệu Bạn có thể thực hiện bước này từ nhiều
nguồn khác nhau như: mạng internet, picture, video, môi trường xung quanh, hoặc thông qua nhân sự Sau khi dữ liệu được thu thập, bạn phải tổ chức để tổng hợp và phân tích Thực hiện trên một bảng tính hoặc một dạng phần mềm khác có thể lấy dữ liệu thống kê
Bước cuối cùng, kiểm tra lại toàn bộ số liệu đã được phân tích Điều này có nghĩa là
nó được kiểm tra và đảm bảo không có sự trùng lặp hoặc lỗi không đầy đủ Bước này giúp bạn sửa lại lỗi trước khi đi đến bước phân tích cuối cùng và ra quyết định
4 CÁC LOẠI SỐ LIỆU CẦN PHÂN TÍCH
Dữ liệu phân tích được chia thành bốn loại cơ bản sau:
Descriptive analytics (phân tích mô tả): Đây là quá trình phân tích dựa trên khoảng
thời gian nhất định Dựa trên số lượt xem trang, Doanh số tháng này…
Diagnostic analytics (phân tích chẩn đoán): Tập trung vào phân tích chuyên sâu, tại
sao nó xảy ra Điều này liên quan đến đầu vào dữ liệu và một vài giả thuyết Thời tiết có ảnh hưởng đến doanh số bán bia không? Chiến dịch tiếp thị có ảnh hưởng đến doanh số không?
Predictive analytics (phân tích dự báo): Dự đoán điều gì xảy ra trong tương lai Điều
đó có gây ảnh hưởng tới doanh số cuối cùng? Có bao nhiêu mô hình dự báo kết quả?
Prescriptive analytics (phân tích chuẩn đoán): Giúp bạn đưa đến kết luận quá trình
hoạt động có đang thực sự hiệu quả
Một số lĩnh vực đã áp dụng phân tích dữ liệu bao gồm ngành bán hàng, du lịch và khách sạn, bất động sản… nơi công việc chồng chéo mà không thể tổng hợp và xử lý nhanh chóng Thu thập dữ liệu khách hàng và tìm ra vấn đề để từ đó tìm ra cách khắc phục và đưa đến kết luận cuối cùng Các nhà bán lẻ thu thập và phân tích giúp họ xu hướng thị trường, giới thiệu sản phẩm và đề ra các chiến dịch mới tăng trưởng lợi nhuận
Trang 741
5 CÔNG CỤ CHO CÁC NHÀ PHÂN TÍCH DỮ LIỆU
Lập trình R
Lập trình R là một công cụ rất mạnh cho học máy, thống kê và phân tích dữ liệu Nó
là một ngôn ngữ lập trình và bạn hoàn toàn có thể phân tích dữ liệu với R Ngôn ngữ R là một platform-independent do đó chúng ta có thể sử dụng nó cho bất kỳ hệ điều hành nào Việc cài đặt R cũng miễn phí vì thế chúng ta có thể sử dụng mà không cần phải mua bản quyền
Tableau
Tableau là công cụ thực hiện các nghiệp vụ phân tích một cách nhanh chóng, đơn giản và trực quan dành cho tất cả mọi người Đối với các phòng ban nghiệp vụ, để sử dụng
dữ liệu để định hướng các hoạt động kinh doanh phải cần một môi trường có thể phân tích
và xử lý dưới dạng đồ họa Tuy nhiên nhiều trường hợp, để làm được điều đó thì cần phải
có kỹ năng và kiến thức lập trình, nên có rất nhiều yêu cầu phân tích, report gửi đến phòng
IT hoặc phòng ban chuyên môn Các yêu cầu đó dù có được gửi sớm đi chăng nữa cũng không thể thực hiện phân tích được thực hiện ngay vì còn liên quan đến vấn đề nhân lực và thời gian, do vậy có thể dẫn đến sự chậm trễ của các hoạt động (quyết định) kinh doanh Mặt khác, Nếu chỉ report bằng excel dựa trên các ký tự và con số thì sẽ rất khó để đưa ra cái nhìn trực quan Hiện tại thì có rất nhiều tool phân tích dữ liệu được gọi là giải pháp BI (Business Intelligence) Trong đó Tableau là một công cụ BI được nhiều người trong và ngoài nước Nhật sử dụng
Python
Python là một ngôn ngữ lập trình scripting phổ biến và hết sức thú vị Nó không phải ngôn ngữ có tốc độ thực thi nhanh như Assembly, C, C ++ … Nó được chọn làm ngôn ngữ lập trình đầu tiên để dạy cho những người chưa biết lập trình hoặc thanh thiếu niên Google, Microsoft, và nhiều tập đoàn, công ty tin học sử dụng để vận hành hệ thống dịch vụ của mình Các nhà nghiên cứu khóa học, nhà phân tích dữ liệu lớn cũng thích sử dụng Python cho công việc của mình, vì nó được việc, không màu mè, học nhanh, dùng luôn
SAS
Đây là một trong những bộ chương trình chuyên dụng phục vụ cho xử lý và phân tích
số liệu thống kê rất thông dụng trên thế giới SAS rất mạnh trong lĩnh vực quản lý dữ liệu,
Trang 8cho phép người sử dụng thao tác dữ liệu hầu như với mọi cách có thể SAS cũng đưa vào thủ tục Proc sql cho phép thực hiện mọi câu hỏi Sql (Structured query language) trên file
dữ liệu
Excel
Excel nằm trong bộ công cụ văn phòng Microsoft Office gồm nhiều phần mềm hỗ trợ viết văn bản, thuyết trình, quản lý email hay bảng tính như Excel Phần mềm này giúp tạo
ra các bảng tính, cùng các tính năng, công cụ hỗ trợ người dùng tính toán dữ liệu nhanh, chính xác với số lượng hàng triệu ô tính
RapidMiner
Rapidminer được biết đến là mã nguồn mở, áp dụng trên môi trường Machine learning và Data mining và sử dụng ngôn ngữ lập trình Java Được sử dụng theo mô hình Client/Server với máy chủ là on-premise hoặc public cloud/ private cloud Các nhà nghiên cứu thị trường, các công ty lớn thường dùng RapidMiner, vì nó tiện dụng, dễ dùng, không cần biết đến đầu ra Output mà có thể cho ra khuôn mẫu theo thẻ Label hoặc Target
5 KẾT LUẬN
Trong lĩnh vực sản xuất đang thực hiện những thay đổi đáng kể do sự phát triển của các công nghệ và sự xuất hiện của các giải pháp máy học và trí tuệ nhân tạo Bài viết đã cung cấp một số ví dụ sinh động về trường hợp sử dụng khoa học dữ liệu cho sản xuất cùng với những lợi ích mà chúng mang lại cho các doanh nghiệp Cùng với dự báo rủi ro, nhu cầu và yêu cầu của thị trường, phân tích dữ liệu có thể giúp theo kịp các tiêu chuẩn chất lượng cao và số liệu chất lượng Hơn nữa, việc kết hợp các kỹ thuật dữ liệu thông minh vào sản xuất có thể giúp dự báo các tổn thất hoặc sự cố không mong muốn Dữ liệu lớn có thể giúp đạt được nhiều mục tiêu kinh doanh được đặt ra bởi các nhà sản xuất đã mất rất ít thời gian và tiền bạc hơn bao giờ hết
TÀI LIỆU THAM KHẢO
[1] Smart Factory Marketing, Một số ứng dụng của phân tích dữ liệu trong sản xuất và công nghiệp, smartfactoryvn.com, 2021
[2] Intel Tecnologies, Advanced Data Analytics: Making Your Business Smarter, intel.vn [3] https://en.wikipedia.org/wiki/Analytics
Trang 9Báo cáo giải pháp công tác quản lý Mầm non
tài liệu mầm non mẫu giáo
Kỹ năng sống cho trẻ mầm non
sáng kiến kinh nghiệm
thư viện kiến thức tổng hợp về mầm non -
mẫu giáo này để chăm sóc và nuôi dạy con của mình ngày một tốt hơn
Trang 10Báo cáo giải pháp công tác quản lý Mầm non
tài liệu mầm non mẫu giáo
Kỹ năng sống cho trẻ mầm non
sáng kiến kinh nghiệm
thư viện kiến thức tổng hợp về mầm non -
mẫu giáo này để chăm sóc và nuôi dạy con của mình ngày một tốt hơn