Descriptive analysis Phân tích miêu t ả Phương pháp phân tích mô tả là điểm khởi đầu cho bất kỳ quá trình phân tích nào, và nó nh ằm mục đích tr ả lời câu h ỏi “điều gì đã xảy ra?” bằng
Trang 1Các phương thức phân tích dữ liệu và ứng dụng trong kinh doanh
Phân tích dữ liệu là gì?
Phương pháp phân tích dữ liệu là quá trình thu thập, mô hình hóa và phân tích dữ liệu để rút ra những hiểu biết sâu sắc hỗ trợ việc ra quy ết định Có một số phương pháp và k ỹ thuật để thực hiện phân tích tùy thu ộc vào
ngành và mục đích của phân tích
Tất cả các phương pháp phân tích d ữ liệu khác nhau này ch ủ yếu dựa trên hai lĩnh vực cốt lõi: phương pháp định lượng và phương pháp định
tính trong nghiên c ứu
• Dữ liệu định lư ợng (quantitative data) là các thư ớc đo giá trị hoặc số lượng và được biểu thị dưới dạng số Dữ liệu định lượng là dữ liệu về các biến số, trả lời cho các câu hỏi về số lượng như bao nhiêu? ho ặc tần suất bao nhiêu?
Trang 2• Dữ liệu định tính (qualitative data) mô t ả phẩm chất hoặc đặc điểm,
nó có thể được biểu thị bằng tên, ký hi ệu hoặc mã số Dữ liệu định tính trả lời cho các câu h ỏi về tính ch ất như loại gì? như th ế nào?
7 Loại Phương pháp Phân tích D ữ liệu Cơ bản
Ở phần này, điều kiện cần là nhân viên đã được đào tạo qua khóa h ọc phân tích dữ liệu từ A-Z Sau khi hoàn thành hóa h ọc data analyst, h ọc viên có
đủ kiến thức xây dựng báo báo quản trị, kỹ năng phân tích dữ liệu thông qua các phương pháp cơ bản dưới đây
1 Descriptive analysis (Phân tích miêu t ả)
Phương pháp phân tích mô tả là điểm khởi đầu cho bất kỳ quá trình phân tích nào, và nó nh ằm mục đích tr ả lời câu h ỏi “điều gì đã xảy ra?” bằng
cách sắp xếp, thao tác và di ễn giải dữ liệu thô từ nhiều nguồn khác nhau để biến nó thành insights có giá tr ị cho doanh nghiệp của bạn
Ví dụ phổ biến nhất của phân tích mô t ả là các loại báo cáo tài chính, báo cáo doanh thu, tình hình kinh doanh c ủa công ty, ví d ụ: thay đổi giá qua từng năm, tăng trư ởng doanh số hàng tháng, s ố lượng ngư ời dùng hoặc tổng doanh thu trên m ỗi ngư ời đăng ký Các thư ớc đo này đều mô tả những gì đã xảy ra trong m ột doanh nghiệp trong m ột khoảng thời gian nh ất định
Mặc dù bản thân phân tích miêu t ả sẽ không cho phép b ạn dự đoán kết quả trong tương lai hoặc cho bạn biết câu trả lời cho những câu hỏi như tại sao điều gì đó đã xảy ra, nhưng nó sẽ giúp doanh nghiệp tìm ra nguyên nhân của vấn đề để đưa ra hư ớng giải quyết chính xác hơn Bên c ạnh đó, trong lĩnh vực phân tích dữ liệu khác, phân tích mô tả cũng giúp dữ liệu của bạn được sắp xếp và sẵn sàng tiến hành phân tích thêm
2 Exploratory analysis (Phân tích khám phá)
Trang 3Sau khi dữ liệu được điều tra, phân tích khám phá cho phép bạn tìm ra
các kết nối và đưa ra các gi ả thuyết và giải pháp cho các v ấn đề cụ thể Một lĩnh vực ứng dụng điển hình cho phân tí ch khám phá là khai thác d ữ liệu
Một số nhiệm vụ được thực hiện với phân tích dữ liệu khám phá là tìm l ỗi, phát hiện dữ liệu, lập bản đồ cấu trúc dữ liệu, liệt kê các điểm bất thư ờng
và thiết lập các tham số Do đó, phân tích d ữ liệu khám phá là m ột bước quan trọng để đảm bảo bạn có tập dữ liệu hoàn h ảo vì nó t ạo tiền đề cho các phân tích nâng cao hơn, như máy h ọc và mô hình dữ liệu
3 Diagnostic Analysis (Phân tích ch ẩn đoán)
Một trong những lo ại hình phân tích d ữ liệu mạnh mẽ nhất Phân tích ch ẩn đoán là phương pháp nhằm để hỏi dữ liệu của mình: Tại sao điều này lại xảy ra? Phân tích chuẩn đoán tìm hiểu sâu vào dữ liệu của bạn để tìm kiếm
thông tin chi ti ết có giá trị
Phân tích mô tả, bư ớc đầu tiên trong phân tích d ữ liệu của hầu hết các công
ty, là một quy trình đơn gi ản hơn ghi l ại các dữ kiện về những gì đã x ảy ra Phân tích chẩn đoán s ẽ tiến thêm m ột bước nữa để khám phá ra lý do đ ằng sau 1 kết quả hoặc kết luận
Phân tích chẩn đoán thư ờng được thực hiện bằng cách sử dụng các kỹ thuật
như Exploratory analysis (khám phá dữ liệu), drill-down (xem chi tiết),
data mining (khai thác d ữ liệu), and correlations (các m ối tương quan)
4 Predictive Analysis (Phân tích d ự đoán)
Phương pháp dự đoán cho phép bạn nhìn vào dữ liệu để trả lời câu
hỏi: điều gì sẽ xảy ra? Để làm được điều này, phương pháp d ự đoán sử
dụng kết quả của phân tích mô t ả, khám phá và ch ẩn đoán đã đ ề cập trước
đó, bên cạnh học máy (ML) và trí tuệ nhân tạo (AI) Như vậy, bạn có thể
Trang 4phát hiện ra các xu hư ớng trong tương lai, các v ấn đề tiềm ẩn trong dữ liệu của bạn
Trong lĩnh vực kinh doanh, bất kỳ ngành nào cũng có thể sử dụng phân tích
dự đoán để giảm rủi ro, tối ưu hóa ho ạt động và tăng doanh thu
Ví dụ ngành tài chính t ừ lâu đã ch ấp nhận phân tích dự đoán để phát hiện
và giảm gian l ận, đo lường rủi ro tín d ụng, tối đa hóa cơ hội bán kèm / bán thêm và giữ chân khách hàng có giá tr ị Ngân hàng Commonwealth s ử dụng phân tích để dự đoán khả năng xảy ra hoạt động gian lận đối với bất kỳ giao dịch nhất định nào trư ớc khi đư ợc phép – trong vòng 40 mili giây k ể
từ khi bắt đầu giao dịch
5 Prescriptive Analysis (Phân tích đ ề xuất)
Một trong những lo ại phương pháp phân tích d ữ liệu hiệu quả nhất trong
nghiên cứu Phân tích đ ề xuất nhằm trả lời cho câu h ỏi “Nó sẽ diễn ra như thế nào?” và “Nên làm gì tiếp theo?” Phân tích đề xuất là một quy
trình phân tích d ữ liệu và đưa ra các đ ề xuất tức thì về cách tối ưu hóa các phương thức kinh doanh để phù hợp với nhiều kết quả dự đoán
Về bản chất, phân tích đ ề xuất lấy “những gì chúng ta bi ết” (dữ liệu), hiểu một cách toàn di ện dữ liệu đó để dự đoán những gì có th ể xảy ra và đề xuất các phương án tốt nhất dựa trên các kết quả phân tích mô phỏng
Dưới đây là bảy loại phương pháp phân tích dữ liệu thiết yếu được sử dụng trong kinh doanh:
1 Cluster analysis (Phân tích c ụm)
Phân tích c ụm là kỹ thuật nhóm một tập hợp các phần tử dữ liệu giống
nhau với nhau Vì không có d ữ liệu mục tiêu khi phân nhóm, phương pháp này thường được sử dụng để tìm các mô hình ẩn trong dữ liệu Phương
Trang 5pháp này cũng được sử dụng để cung cấp ngữ cảnh cho một xu hướng hoặc tập dữ liệu
Ví dụ về phân tích cụm dưới góc độ kinh doanh Các nhà ti ếp thị luôn mong muốn có thể phân tích từng khách hàng m ột cách riêng bi ệt và cung cấp cho họ dịch vụ được cá nhân hóa t ốt nhất, tuy nhiên trong kinh doanh thực tế, với một lư ợng lớn khách hàng lên đ ến hàng trăm nghìn ngư ời, không thể nào phân tích t ừng khách riêng bi ệt cùng 1 lúc đư ợc Đó là lý do phân tích cụm xuất hiện
Bằng cách n hóm khách hàng thành các c ụm dựa trên nhân khẩu học, hành
vi mua hàng, giá tr ị tiền tệ hoặc bất kỳ yếu tố nào khác có thể liên quan đến công ty của bạn, bạn sẽ có thể ngay lập tức tối ưu hóa nỗ lực của mình
và mang đến cho khách hàng trải nghiệm tốt nhất dựa trên về nhu cầu của
họ
2 Cohort analysis (Phân tích theo nhóm)
Trang 6Loại phương pháp phân tích d ữ liệu này sử dụng dữ liệu lịch sử để kiểm tra
và so sánh một phân đoạn đã xác định về hành vi c ủa ngư ời dùng, sau đó
có thể được nhóm l ại với những phân đoạn khác có đ ặc điểm tương tự Bằng cách sử dụng phương pháp phân tích d ữ liệu này, bạn có thể có đư ợc nhiều hiểu biết sâu sắc về nhu cầu của ngư ời tiêu dùng
Phân tích theo nhóm có th ể áp dụng trong việc tiếp thị vì nó sẽ cho phép bạn hiểu tác động của các chiến dịch của mình đ ối với các nhóm khách hàng cụ thể Để làm ví dụ, hãy tưởng tượng bạn thực hiện một chiến dịch email marketing khuy ến khích khách hàng đăng ký vào trang web c ủa bạn Bạn có thể tạo nhiều phiên b ản khác nhau cho chi ến dịch với các thiết kế, CTA và nội dung quảng cáo khác nhau Sau đó, b ạn có thể sử dụng phân tích theo nhóm để theo dõi hiệu suất của chiến dịch trong một khoảng thời gian dài hơn và hiểu loại nội dung nào đang thúc đẩy khách hàng của bạn đăng ký, mua lại hoặc tương tác theo những cách khác
Một công cụ hữu ích đ ể bắt đầu thực hiện phương pháp phâ n tích theo
nhóm là Google Analytics Trong hình dư ới cùng, bạn thấy một ví dụ về cách bạn trực quan hóa phân tích theo nhóm trong công c ụ này Các phân đoạn (lưu lượng truy cập thiết bị) được chia thành các nhóm thu ần tập theo ngày (sử dụng thiết bị) và sau đó đư ợc phân tích từng tuần để trích xu ất thông tin chi ti ết về hiệu suất
Trang 73 Regression analysis (Phân tích h ồi quy)
Phân tích h ồi quy s ử dụng dữ liệu lịch sử để hiểu giá tr ị của dữ liệu phụ thuộc bị ảnh hưởng như thế nào khi m ột (linear regression – hồi quy tuy ến tính) hoặc nhiều biến độc lập (hồi quy bội – multiple regression) thay đ ổi hoặc giữ nguyên B ằng cách hiểu mối quan hệ của từng dữ liệu và cách chúng phát tri ển trong quá kh ứ, bạn có thể dự đoán các k ết quả có thể xảy
ra và đưa ra quyết định kinh doanh tốt hơn trong tương lai
Ví dụ hãy tư ởng tư ợng bạn đã thực hiện phân tích h ồi quy về doanh số bán hàng của mình vào năm 2019 và phát hi ện ra rằng các dữ liệu như ch ất lượng sản phẩm, thiết kế cửa hàng, dịch vụ khách hàng, chiến dịch tiếp thị
và kênh bán hàng ảnh hư ởng đến kết quả chung
Bây giờ, bạn muốn sử dụng hồi quy để phân tích xem dữ liệu nào trong s ố này đã thay đổi hoặc có dữ liệu nào mới xuất hiện trong năm 2020
Ví dụ: bạn không thể bán được nhiều trong cửa hàng bán l ẻ của mình do phong tỏa COVID Do đó, doanh s ố bán hàng của bạn nói chung có th ể
Trang 8giảm hoặc tăng trong các kênh tr ực tuyến của bạn Như v ậy, bạn có thể hiểu dữ liệu độc lập nào ảnh hư ởng đến hiệu suất tổng thể của dữ liệu phụ thuộc, doanh số hàng năm
4 Neural networks (Mạng nơron)
Mạng nơ-ron tạo cơ s ở cho các thuật toán thông minh c ủa học máy Nó là một dạng phân tích theo hư ớng dữ liệu để hiểu cách bộ não con ngư ời xử lý thông tin chi ti ết và dự đoán các giá trị Mạng nơ-ron học hỏi từ mỗi và mọi giao dịch dữ liệu, có nghĩa là chú ng phát triển và tiến bộ theo thời gian
Một lĩnh vực ứng dụng điển hình c ủa mạng nơ-ron là phân tích d ữ liệu dự đoán Có 1 số công cụ báo cáo BI triển khai tính năng này, ch ẳng hạn
như Predictive Analytics Tool (Công cụ phân tích dự đoán) từ datapine
Công cụ này cho phép ngư ời dùng nhanh chóng và d ễ dàng tạo ra tất cả các loại dự đoán T
Trang 9ất cả những gì bạn phải làm là chọn dữ liệu sẽ được xử lý dựa trên KPI của bạn và phần mềm sẽ tự động tính toán dự báo dựa trên dữ liệu lịch sử và hiện tại Nhờ giao diện thân thiện với ngư ời dùng, bất kỳ ai trong t ổ chức của bạn đều có thể quản lý nó; không c ần phải là một nhà khoa học dữ liệu tiên tiến
Dưới đây là một ví dụ về cách bạn có thể sử dụng công cụ phân tích dự đoán từ datapine:
Trang 105 Factor analysis (Phân tích nhân t ố)
Phân tích nhân t ố, còn đư ợc gọi là “dimension reduction “, là m ột loại
phân tích dữ liệu được sử dụng để mô tả sự thay đổi giữa các dữ liệu quan sát, tương quan về số lượng các dữ liệu không đư ợc quan sát có kh ả năng thấp hơn đư ợc gọi là nhân tố Mục đích ở đây là phát hiện ra các dữ liệu tiềm ẩn độc lập, một phương pháp phân tích lý tư ởng để hợp lý hóa các phân đoạn dữ liệu cụ thể
Một ví dụ điển hình để hiểu phương pháp phân tích d ữ liệu này là đánh giá của khách hàng v ề sản phẩm Đánh giá ban đ ầu dựa trên các bi ến số khác nhau như màu sắc, hình dạng, khả năng mặc, xu hướng hiện tại, chất liệu,
sự thoải mái, nơi h ọ mua sản phẩm, tần suất sử dụng
Trang 11Như vậy, danh sách có thể dài vô tận, tùy thuộc vào những gì bạn muốn theo dõi Trong trường hợp này, phân tích nhân tố đưa ra bức tranh bằng cách tóm tắt tất cả các biến này thành các nhóm đ ồng nhất, ví d ụ, bằng cách nhóm các bi ến màu, v ật liệu, chất lư ợng và xu hư ớng thành một dữ liệu tiềm ẩn của thiết kế
6 Data mining (Khai thác d ữ liệu)
Phương pháp phân tích này là thu ật ngữ chung cho các chỉ số kỹ thuật và insights để có thêm giá trị, hướng và ngữ cảnh Bằng cách sử
dụng exploratory statistical evaluation ( đánh giá th ống kê khám phá),
khai thác dữ liệu nhằm xác định các yếu tố phụ thuộc, quan hệ, mô hình dữ liệu và xu hướng để có thêm hi ểu biết
Một ví dụ tiêu biểu về khai thác dữ liệu là cảnh báo dữ liệu thông minh datapine V ới sự trợ giúp của trí tuệ nhân tạo và máy h ọc, chúng cung c ấp các tín hi ệu tự động dựa trên các lệnh hoặc lần xuất hiện cụ thể trong t ập
dữ liệu
Trang 12Ví dụ: nếu bạn đang theo dõi KPI c ủa chuỗi cung ứng, bạn có th ể đặt một cảnh báo thông minh đ ể kích hoạt khi dữ liệu không hợp lệ hoặc chất lượng thấp xuất hiện Làm như vậy, bạn sẽ có thể đi sâu vào v ấn đề và khắc phục
nó một cách nhanh chóng và hi ệu quả
Trong hình sau, b ạn có th ể thấy một ví d ụ về cách thức hoạt động của các cảnh báo thông minh t ừ datapine Bằng cách thiết lập phạm vi về đơn đặt hàng, phiên và doanh thu hàng ngày, các c ảnh báo sẽ thông báo cho b ạn nếu mục tiêu không đư ợc hoàn thành hoặc nếu nó vượt quá mong đ ợi
Trang 137 Text analysis (Phân tích văn b ản)
Phân tích văn bản, còn được gọi là khai thác văn bản (Text mining), là quá
trình lấy một lư ợng lớn dữ liệu văn bản và sắp xếp nó theo cách giúp d ễ quản lý hơn Bằng cách thực hiện quá trình phân tích văn b ản, bạn có thể làm sạch văn b ản một cách chi ti ết để trích xu ất dữ liệu thực sự có liên quan đến doanh nghiệp của mình và sử dụng dữ liệu đó để phát triển thành những thông tin hữu ích
Các công cụ và kỹ thuật phân tích dữ liệu hiện đại đẩy nhanh quá trình phân tích văn bản Nhờ sự kết hợp của máy học và các thuật toán thông minh, bạn có thể thực hiện các quy trình phân tích nâng cao như phân tích cảm tính K ỹ thuật này cho phép b ạn hiểu ý định và cảm xúc của một văn bản,
ví dụ: nếu nó tích c ực, tiêu cực hoặc trung tính và sau đó đánh giá b ằng điểm số tùy thuộc vào các tiêu chí nhất định Phân tích cảm xúc thường được sử dụng để theo dõi danh tiếng của thương hiệu và sản phẩm cũng
Trang 14như để hiểu mức độ hài lòng của khách hàng khi trải nghiệm sản phẩm hoặc dịch vụ của bạn
Bằng cách phân tích d ữ liệu từ các nguồn dựa trên từ ngữ khác nhau, bao gồm đánh giá sản phẩm, bài báo, thông tin liên l ạc trên mạng xã h ội và câu trả lời khảo sát, bạn sẽ có đư ợc những hiểu biết về đối tư ợng của mình, cũng như nhu cầu, sở thích và điểm khó của họ
Điều này sẽ cho phép bạn tạo các chiến dịch, dịch vụ và thông tin liên lạc đáp ứng nhu cầu của khách hàng tiềm năng ở cấp độ cá nhân, tăng lượng khách hàng của bạn trong khi tăng cư ờng giữ chân khách hàng Đây là m ột trong những công c ụ và kỹ thuật phân tích dữ liệu hiệu quả nhất mà bạn sẽ đầu tư vào