Chương 1: Tổng quan về Big Data1.1 Khái niệm, nguồn hình thành và đặc trưng của Big Data 1.1.1 Khái niệm về dữ liệu lớn - Theo wikipedia: Dữ liệu lớn Big data là một thuật ngữ chỉ bộ
Trang 1LỜI MỞ ĐẦU
Hệ thống cơ sở hạ tầng Logistics bao gồm cơ sở hạ tầng vật lý (physical infrastructure) như hệ thống giao thông, cầu cảng… và cơ sở hạ tầng mềm (soft infrastructure) như nguồn nhân lực, hệ thống chính sách, luật lệ, thủ tục… Để
phát triển, quản lý tốt và hiệu quả tất cả hệ thống hạ tầng đó, không thể không
quan tâm vấn đề ứng dụng CNTT Cơ sở hạ tầng mềm kỹ thuật số (digital soft infrastructure) đóng vai trò rất quan trọng đối với thương mại trong thế kỷ 21
bởi các thông tin về sự di chuyển của hàng hóa hiện nay hết sức quan trọng
Theo đánh giá của VIFFAS, trình độ công nghệ trong hoạt động logistics ở VN còn thấp Việc liên lạc giữa công ty Logistics với khách hàng, hải quan chủ yếu vẫn là thủ công, giấy tờ Mặc dù những năm 2010-2011 được ghi nhận có bước đột phá trong thực hiện khai hải quan điện tử, số lượng doanh nghiệp tham gia vẫn còn chiếm tỷ lệ thấp Mặt khác, phương tiện vận tải còn lac hậu, cũ kỹ, trình
độ cơ giới hóa trong bốc dỡ hàng hóa vẫn còn yếu kém, lao động thủ công vẫn phổ biến Công tác lưu kho còn khá lạc hậu, chưa áp dụng phổ biến tin học trong quản trị kho như mã vạch, chương trình phần mềm quản trị kho.
Đặc biệt trong việc triển khai và áp dụng các cơ sở thông tin vào quản trị hệ thống Logistic thì Big Data đang là một xu hướng mới với sự triển khai rộng rãi của các doanh nghiệp Logistic lớn với quy mô toàn cầu Tuy nhiên, ở Việt Nam phần lớn các doanh nghiệp trong ngành vẫn còn chưa triển khai hoặc mới chỉ triển khai trên mức độ cơ bản nhất, thiếu đồng bộ và thiếu tối ưu các nguồn lực
Trên cơ sở đó nhóm đã thực nghiên cứu thực tế áp dụng và đưa ra những khuyến nghị trong việc ứng dụng Big Data vào các doanh nghiệp Logistic ở Việt Nam hiện tại và tương lai
Trang 2Chương 1: Tổng quan về Big Data
1.1 Khái niệm, nguồn hình thành và đặc trưng của Big Data
1.1.1 Khái niệm về dữ liệu lớn
- Theo wikipedia: Dữ liệu lớn (Big data) là một thuật ngữ chỉ bộ dữ liệu lớn hoặc phứctạp mà các phương pháp truyền thống không đủ các ứng dụng để xử lý dữ liệu này
- Theo Gartner: Dữ liệu lớn là những nguồn thông tin có đặc điểm chung khối lượnglớn, tốc độ nhanh và dữ liệu định dạng dưới nhiều hình thức khác nhau, do đó muốnkhai thác được đòi hỏi phải có hình thức xử lý mới để đưa ra quyết định, khám phá vàtối ưu hóa quy trình
1.1.2 Nguồn hình thành và phương pháp khai thác, quản lý dữ liệu lớn
Qua thống kê và tổng hợp, dữ liệu lớn được hình thành chủ yếu từ 6 nguồn:
1) Dữ liệu hành chính (phát sinh từ chương trình của một tổ chức, cóthể là chính phủ hay phi chính phủ) Ví dụ, hồ sơ y tế điện tử ở bệnh viện, hồ sơbảo hiểm, hồ sơ ngân hàng ;
2) Dữ liệu từ hoạt động thương mại (phát sinh từ các giao dịch giữahai thực thể) Ví dụ, các giao dịch thẻ tín dụng, giao dịch trên mạng, bao gồm cảcác giao dịch từ các thiết bị di động;
3) Dữ liệu từ các thiết bị cảm biến như thiết bị chụp hình ảnh vệtinh, cảm biến đường, cảm biến khí hậu;
4) Dữ liệu từ các thiết bị theo dõi, ví dụ theo dõi dữ liệu từ điện thoại
Trang 3theo các nguồn hình thành dữ liệu lớn Mỗi nguồn dữ liệu lớn khác nhau sẽ có phươngpháp khai thác và quản lý dữ liệu lớn khác nhau Tuy nhiên, hiện nay phần lớn các tổchức trên thế giới đều dùng Hadoop ecosystem là giải pháp tối ưu để khai thác và quản
lý dữ liệu lớn
1.1.3 Đặc trưng 5V của dữ liệu lớn
Dữ liệu lớn có 5 đặc trưng cơ bản như sau (mô hình 5V):
1) Khối lượng dữ liệu (Volume)
Đây là đặc điểm tiêu biểu nhất của dữ liệu lớn, khối lượng dữ liệu rất lớn Kích cỡcủa Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm trongkhoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ chomột tập hợp dữ liệu Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa mềm, đĩacứng Nhưng với dữ liệu lớn chúng ta sẽ sử dụng công nghệ “đám mây” mới đáp ứngkhả năng lưu trữ được dữ liệu lớn
2) Tốc độ (Velocity)
Tốc độ có thể hiểu theo 2 khía cạnh:
(a) Khối lượng dữ liệu gia tăng rất nhanh (mỗi giây có tới 72.9 triệu các yêu cầutruy cập tìm kiếm trên web bán hàng của Amazon);
Trang 4(b) Xử lý dữ liệu nhanh ở mức thời gian thực (real-time), có nghĩa dữ liệu được
xử lý ngay tức thời ngay sau khi chúng phát sinh (tính đến bằng mili giây) Các ứngdụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quân sự, Y tế– Sức khỏe như hiện nay phần lớn dữ liệu lớn được xử lý real-time Công nghệ xử lý
dữ liệu lớn ngày nay đã cho phép chúng ta xử lý tức thì trước khi chúng được lưu trữvào cơ sở dữ liệu
3) Đa dạng (Variety)
Đối với dữ liệu truyền thống chúng ta hay nói đến dữ liệu có cấu trúc, thì ngàynay hơn 80% dữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, vi deo, bàihát, dữ liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe ) Big data cho phépliên kết và phân tích nhiều dạng dữ liệu khác nhau Ví dụ, với các bình luận của mộtnhóm người dùng nào đó trên Facebook với thông tin video được chia sẻ từ Youtube
và Twitter
4) Độ tin cậy/chính xác (Veracity)
Một trong những tính chất phức tạp nhất của Dữ liệu lớn là độ tin cậy/chính xáccủa dữ liệu Với xu hướng phương tiện truyền thông xã hội (Social Media) và mạng xãhội (Social Network) ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ củangười dùng Mobile làm cho bức tranh xác định về độ tin cậy & chính xác của dữ liệungày một khó khăn hơn Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễuđang là tính chất quan trọng của Big data
5) Giá trị (Value)
Giá trị là đặc điểm quan trọng nhất của dữ liệu lớn, vì khi bắt đầu triển khai xâydựng dữ liệu lớn thì việc đầu tiên chúng ta cần phải làm đó là xác định được giá trị củathông tin mang lại như thế nào, khi đó chúng ta mới có quyết định có nên triển khai dữliệu lớn hay không Nếu chúng ta có dữ liệu lớn mà chỉ nhận được 1% lợi ích từ nó, thìkhông nên đầu tư phát triển dữ liệu lớn Kết quả dự báo chính xác thể hiện rõ nét nhất
Trang 5về giá trị của dữ liệu lớn mang lại Ví dụ, từ khối dữ liệu phát sinh trong quá trìnhkhám, chữa bệnh sẽ giúp dự báo về sức khỏe được chính xác hơn, sẽ giảm được chi phíđiều trị và các chi phí liên quan đến y tế
1.1.4 Sự khác biệt giữa dữ liệu lớn với dữ liệu truyền thống
Dữ liệu lớn khác với dữ liệu truyền thống (ví dụ, kho dữ liệu - Data Warehouse) ở
4 điểm cơ bản: Dữ liệu đa dạng hơn; lưu trữ dữ liệu lớn hơn; truy vấn dữ liệu nhanhhơn; độ chính xác cao hơn
1) Dữ liệu đa dạng hơn
Khi khai thác dữ liệu truyền thống (dữ liệu có cấu trúc), chúng ta thường phải trảlời các câu hỏi: Dữ liệu lấy ra kiểu gì? định dạng dữ liệu như thế nào? Đối với dữ liệulớn, không phải trả lời các câu hỏi trên Hay nói khác, khi khai thác, phân tích dữ liệulớn chúng ta không cần quan tâm đến kiểu dữ liệu và định dạng của chúng; điều quantâm là giá trị mà dữ liệu mang lại có đáp ứng được cho công việc hiện tại và tương laihay không
2) Lưu trữ dữ liệu lớn hơn
Lưu trữ dữ liệu truyền thống vô cùng phức tạp và luôn đặt ra câu hỏi lưu như thếnào? dung lượng kho lưu trữ bao nhiêu là đủ? gắn kèm với câu hỏi đó là chi phí đầu tưtương ứng Công nghệ lưu trữ dữ liệu lớn hiện nay đã phần nào có thể giải quyết đượcvấn đề trên nhờ những công nghệ lưu trữ đám mây, phân phối lưu trữ dữ liệu phân tán
và có thể kết hợp các dữ liệu phân tán lại với nhau một cách chính xác và xử lý nhanhtrong thời gian thực
3) Truy vấn dữ liệu nhanh hơn
Dữ liệu lớn được cập nhật liên tục, trong khi đó kho dữ liệu truyền thống thì lâulâu mới được cập nhật và trong tình trạng không theo dõi thường xuyên gây ra tìnhtrạng lỗi cấu trúc truy vấn dẫn đến không tìm kiếm được thông tin đáp ứng theo yêu
Trang 6cầu
4) Độ chính xác cao hơn
Dữ liệu lớn khi đưa vào sử dụng thường được kiểm định lại dữ liệu với nhữngđiều kiện chặt chẽ, số lượng thông tin được kiểm tra thông thường rất lớn, và đảm bảo
về nguồn lấy dữ liệu không có sự tác động của con người vào thay đổi số liệu thu thập
1.2 Bức tranh tổng thể ứng dụng dữ liệu lớn
Dữ liệu lớn đã được ứng dụng trong nhiều lĩnh vực như: hoạt động chính trị; giaothông; y tế; thể thao; tài chính; thương mại; thống kê dưới đây là một số ví dụ về ứngdụng dữ liệu lớn
1) Ứng dụng dữ liệu lớn trong hoạt động chính trị
nhân viên chuyên đi
thu thập thông tin và
phân tích dữ liệu thu
được trong dự án triển khai về dữ liệu lớn Đội ngũ nhân viên này thu thập tất cả thôngtin về người dân ở các khu vực, sau đó phân tích và chỉ ra một số thông tin quan trọng
về người dân Mỹ như: Thích đọc sách gì, thích mua loại thuốc gì, thích sử dụngphương tiện gì Thậm chí còn biết được cả thông tin về mẹ của cử tri đó đã bỏ phiếutín nhiệm ai ở lần bầu cử trước Trên cơ sở những thông tin này, Tổng thống Obama đã
Trang 7đưa ra kế hoạch vận động phù hợp, giúp ông tái đắc cử Tổng thống nước Mỹ lần thứ 2 Ngoài ra một số ứng dụng khác trong lĩnh vực chính trị mà dữ liệu lớn được ápdụng như: Hệ thống chính phủ điện tử; phân tích quy định và việc tuân thủ quy định;phân tích, giám sát, theo dõi và phát hiện gian lận, mối đe dọa, an ninh mạng
2) Ứng dụng dữ liệu lớn trong giao thông
Sử dụng số liệu CDR trongquá khứ để ước lượng các dònggiao thông trong thành phố vàocác giờ cao điểm, từ đó cónhững kế hoạch phân luồng giaothông chi tiết, hợp lý giúp giảmthiểu kẹt xe Ngoài ra còn đưa rathông tin cho người tham giagiao thông được biết nếu muốn
đi từ nơI này đến nơi khác thìnên đi vào giờ nào để tránh kẹt
xe, hoặc đi đường nào là ngắn nhất, v.v Ngoài ra, dữ liệu lớn còn giúp phân tích định
vị người dùng thiết bị di động, ghi nhận chi tiết cuộc gọi trong thời gian thực; và giảmthiểu tình trạng ùn tắc giao thông
3) Ứng dụng dữ liệu lớn trong y tế
Trong y học các bác sĩ dựa vào số liệu trong các bệnh án để đưa ra dự đoán vềnguy cơ mắc bệnh Đồng thời cũng đưa ra được xu hướng lây lan của bệnh Ví dụ, ứngdụng Google Flu Trend là một trong những ứng dụng hành công của Google ứng dụngnày dựa trên từ khóa tìm kiếm ở một khu vực nào đó, sau đó bộ máy phân tích củaGoogle sẽ phân tích và đối chiếu kết quả tìm kiếm đó, sau cùng là đưa ra dự báo về xuhướng dịch cúm tại khu vực đó Qua đó cho biết tình hình cúm tại khu vực đó sẽ diễn
Trang 8ra như thế nào để đưa ra các giảipháp phòng tránh Những kết quả
mà Google Flu Trend đưa ra, hoàntoàn phù hợp với báo cáo của Tổchức Y tế Thế giới WHO về tìnhhình bệnh cúm tại các khu vực đó
4) Ứng dụng dữ liệu lớn trong thể thao
Phân tích mô hình hệ thống cấu trúc sơ đồ chiến thuật của đội tuyển Đức (hìnhbên) đã đưa ra những điểm bất hợp lý trong cấu trúc của đội tuyển Đức, từ đó giúp chođội tuyển Đức khắc phục được điểm yếu và đã dành được World cup 2014
Trang 95) Ứng dụng dữ liệu lớn trong thương mại
Trong thương mại dữ liệu lớn giúp cho chúng ta thực hiện được một số công việcsau: Phân khúc thị trường và khách hàng; phân tích hành vi khách hàng tại cửa hàng;tiếp thị trên nền tảng định vị; phân tích tiếp thị chéo kênh, tiếp thị đa kênh; quản lý cácchiến dịch tiếp thị và khách hàng thân thiết; So sánh giá; Phân tích và quản lý chuỗicung ứng; Phân tích hành vi, thói quen người tiêu dùng
6) Ứng dụng dữ liệu lớn trong thống kê
Nhận thấy những lợi ích to lớn và thách thức của Bigdata đối với thống kê nhànước, Ủy ban Thống kê Liên hợp quốc cũng như các tổ chức thống kê khu vực và Cơquan thống kê quốc gia của nhiều nước đã triển khai hàng loạt các hoạt động vềBigdata như: Hàn Quốc sử dụng ảnh vệ tinh để thống kê nông nghiệp và một sốlĩnhvực khác; Australia sử dụng ảnh vệ tinh để thống kê diện tích đất nông nghiệp vànăng suất; Italia sử dụng dữ liệu điện thoại di động để thống kê di cư; Bhutan dùngthiết bị di động để tính toán chỉ số giá tiêu dùng; Estonia dùng điện thoại di động định
vị vệ tinh để thống kê du lịch; EuroStat sử dụng dữ liệu về sử dụng điện thoại di động
để thống kê du lịch
7) Ứng dụng dữ liệu lớn trong tài chính
Từ những dữ liệu chính xác, kịp thời thu thập được thông qua các giao dịch củakhách hàng, tiến hành phân tích, xếp hạng và quản lý các rủi ro trong đầu tư tài chính,tín dụng
Trang 10
CHƯƠNG 2: ỨNG DỤNG CỦA BIG DATA TRONG LOGISTICS2.1 Logistics là việc kinh doanh theo định hướng dữ liệu
Dữ liệu lớn đang cách mạng hóa nhiều lĩnh vực kinh doanh, và phân tích hậu cần
là một trong số đó Tính phức tạp và năng động của hậu cần, cùng với sự phụ thuộc vàonhiều bộ phận chuyển động có thể tạo ra sự tắc nghẽn tại bất kỳ điểm nào trong chuỗicung ứng, làm cho logistics thành một trường hợp sử dụng hoàn hảo cho dữ liệu lớn
Ví dụ, hậu cần dữ liệu lớn có thể được sử dụng để tối ưu hóa việc định tuyến, để hợp lýhóa các chức năng của nhà máy, và để cung cấp tính minh bạch cho toàn bộ chuỗi cungứng, vì lợi ích của cả hai công ty hậu cần và tàu biển Các công ty hậu cần bên thứ ba
và các công ty vận tải đều đồng ý
Lấy ví dụ về bài báo của Fleetowner, "98% 3PLs cho rằng việc ra quyết định dựatrên dữ liệu được cải thiện là" cần thiết cho sự thành công trong tương lai của các hoạtđộng và quy trình chuỗi cung ứng " Thêm vào đó, 81% các chủ hàng và 86% 3PLsđược khảo sát cho biết việc sử dụng dữ liệu lớn sẽ trở thành "năng lực cốt lõi của các tổchức chuỗi cung ứng"
Tuy nhiên, dữ liệu lớn đòi hỏi nhiều nguồn thông tin có chất lượng cao để hoạtđộng có hiệu quả Tất cả những dữ liệu đó sẽ đến từ đâu? Báo cáo về dữ liệu lớn tronglogistics cho phép doanh nghiệp lựa chọn nhiều nguồn dữ liệu có thể, bao gồm:
- Dữ liệu doanh nghiệp truyền thống từ các hệ thống hoạt động
- Dữ liệu giao thông và thời tiết từ các cảm biến, màn hình và hệ thống dự báo
- Chẩn đoán xe, mô hình lái xe và thông tin vị trí
- Dự báo kinh doanh tài chính
- Dữ liệu phản hồi quảng cáo
- Dữ liệu mẫu duyệt web
- Dữ liệu truyền thông xã hội
Trang 11Rõ ràng, có nhiều cách để các hệ thống dữ liệu có thể cung cấp thông tin họ cần.Tất cả các nguồn dữ liệu này và các trường hợp sử dụng tiềm năng đều dẫn dắt DHLnói rằng công nghệ dữ liệu và tự động hóa lớn sẽ dẫn đến "mức độ tối ưu hóa trước đâytrong sản xuất, hậu cần, kho bãi và giao hàng tận nơi"
2.2 Lợi ích và cơ hội khi ứng dụng Big Data vào Logistics
Những tiến bộ trong khía cạnh công nghệ và phương pháp ứng dụng của Big Datamang lại những lợi ích to lớn cho ngành logistics Các nhà cung cấp dịch vụ hậu cầnquản lý dòng sản phẩm khổng lồ, do đó tạo ra các bộ dữ liệu rộng lớn Nguồn gốc,điểm đến, kích cỡ, trọng lượng, nội dung và vị trí của lô hàng trên cơ sở hàng ngàyđược theo dõi qua mạng lưới phân phối toàn cầu Có rất nhiều tiềm năng không được
sử dụng như việc nâng cao hiệu quả hoạt động, kinh nghiệm của khách hàng và tạo ra
mô hình kinh doanh mới Phân tích dữ liệu lớn cung cấp lợi thế cạnh tranh đó thôngqua các thuộc tính nổi bật của Big Data có thể được áp dụng có hiệu quả trong ngànhlogistics:
1) Tối ưu hóa vận chuyển hàng hóa đến điểm đến cuối cùng
Một hạn chế trong việc đạt được hiệu quả hoạt động cao trong một mạng lướiphân phối diễn ra tại "dặm cuối cùng".24 giờ cuối cùng trong một chuỗi cung ứngthường là thứ tốn kém nhất, chi phí lên đến 28% tổng chi phí giao hàng của một góihàng Có rất nhiều trở ngại dẫn đến điều này, có thể là:
Thách thức đối với các xe tải giao hàng lớn đến công viên gần điểm đến của họ ởkhu vực thành thị Người lái xe thường phải đậu xe khá lâu, và sau đó đi bộ đến địa chỉcuối cùng Sau đó, họ có thể phải đi lên nhiều chuyến cầu thang hoặc đợi thang máy ởtòa nhà cao tầng
Một số mặt hàng phải được ký kết và nếu khách hàng không ở nhà thì không thểgiao hàng
Nhân viên giao hàng phải cẩn thận để không làm hỏng gói hàng trong chân cuốicùng này, và họ phải cung cấp cho mình một cách chuyên nghiệp đến người nhận
Trang 12Thêm vào những thách thức này, có thể rất khó để biết chính xác những gì đangxảy ra trong đợt giao hàng cuối cùng
Tuy nhiên, Dữ liệu lớn có thể giải quyết những thách thức này dễ dàng Trongmột cuộc phỏng vấn với Wall Street Journal, Matthias Winkenbach, giám đốc Phòngthí nghiệm Hoá chất Megacity của MIT, đã mô tả chi tiết cách các phân tích dữ liệucuối cùng đang mang lại những dữ liệu hữu ích Do chi phí thấp và tính phổ biến củainternet di động nhanh và điện thoại thông minh hỗ trợ GPS, cũng như sự lan truyềncủa Internet thông qua cảm biến và máy quét, các chủ hàng có thể thấy quá trình phânphối từ đầu đến dặm cuối như thế nào
Ví dụ, một chiếc xe tải giao hàng UPS có gắn một cảm biến GPS đi giao hàng ởtrung tâm thành phố Chicago Sau khi đỗ xe gần đó, điện thoại của người đàn ông nàysẽ phát tín hiệu GPS và tiếp tục truyền dữ liệu đến trung tâm UPS, cho tài khoản củakhách hàng biết về thời gian giao hàng Điều này không chỉ có giá trị đối với kháchhàng - nó cho phép các công ty logistics nhìn thấy các mô hình và có thể sử dụng để tối
ưu hóa các chiến lược phân phối của họ
2) Tăng độ tin cậy
Khi các thiết bị cảm biến ngày càng trở nên phổ biến trong các phương tiện giaothông, vận chuyển và trong suốt chuỗi cung ứng, chúng có thể cung cấp dữ liệu chophép minh bạch cao hơn bao giờ hết
Tính minh bạch này có giá trị đối với các chủ hàng, người vận chuyển và kháchhàng Nếu một lô hàng sẽ đến muộn, hãng tàu muốn biết càng sớm càng tốt để họ cóthể ngăn chặn tắc nghẽn trong chuỗi cung ứng Và các công ty vận chuyển có thể sửdụng dữ liệu này tổng hợp để đàm phán với các chủ hàng bằng cách cho biết họ thườngxuyên phân phối đúng thời hạn như thế nào
Hãy tưởng tượng điều này: các công ty logistics đã gắn cảm biến trong tất cả cácphương tiện phân phối của họ, với điện thoại thông minh hỗ trợ GPS bao phủ bất kỳkhoảng trống Một bên thứ ba hợp lệ hóa các cảm biến này với độ chính xác, và sau đócác dữ liệu độ tin cậy và thời gian từ các cảm biến này được sử dụng khi các công tylogistics đang đấu thầu cho các hợp đồng mới
Trang 13Loại nguồn mở, thông tin minh bạch hoàn toàn có thể thay đổi cách kinh doanhđược tiến hành trong khâu hậu cần.
3) Tuyến đường sẽ được tối ưu hoá
Trong cuộc khảo sát 3PL được trích dẫn ở đầu bài viết này, 70% người được hỏicho rằng "cải thiện tối ưu hóa logistic" là việc sử dụng tốt nhất các dữ liệu lớn trongLogistic Rõ ràng, tối ưu hóa là suy nghĩ của mọi người
Tại sao các công ty logistics quan tâm đến việc tối ưu hóa? Vì hai lý do: nó giúp
họ tiết kiệm tiền và tránh các lô hàng bị giao muộn Khi bạn đang quản lý một hệ thốngphân phối hoặc chuỗi cung ứng, bạn phải kết nối một đường dây giữa tài nguyên và xe
và sự thiếu sót giữa chúng Nếu bạn đặt quá nhiều xe cộ và tài nguyên trên một tuyếnđường phân phối, thì bạn đang tiêu tốn nhiều tiền hơn, và có thể sử dụng các tài sản tốthơn ở những nơi khác
Tuy nhiên, nếu bạn ước tính thấp số lượng xe mà một tuyến đường hoặc giaohàng cụ thể sẽ yêu cầu, thì bạn sẽ gặp rủi ro cho khách hàng gửi hàng muộn, ảnh hưởngtiêu cực đến các mối quan hệ khách hàng và hình ảnh thương hiệu của bạn
Để thêm vào những thách thức của việc tối ưu hoá, các yếu tố liên quan đến phân bổnguồn lực hiệu quả đang liên tục thay đổi Ví dụ:
Chi phí nhiên liệu có thể thay đổi
Các đường cao tốc và đường xá có thể tạm thời đóng cửa hoặc những đườnghầm mới có thể được xây dựng
Số lượng xe bạn sử dụng có thể thay đổi do sửa chữa hoặc mua lại mới
Điều kiện thời tiết, cả theo mùa và ngay lập tức, luôn thay đổi
Big Data và phân tích tiên đoán cho phép các công ty Logistic có thêm sức cạnhtranh mà họ cần để vượt qua những trở ngại Các bộ cảm biến về xe tải, dữ liệu thờitiết, dữ liệu bảo trì đường bộ, lịch trình bảo dưỡng đội tàu, chỉ báo tình trạng hạm độithời gian thực và lịch trình nhân sự có thể được tích hợp vào một hệ thống nhìn vào các
xu hướng lịch sử trong quá khứ và đưa ra lời khuyên phù hợp
UPS là một ví dụ thực tế của Big Data Logistic dẫn đầu về sự tiết kiệm Sau khikiểm tra dữ liệu của họ, UPS phát hiện ra rằng các xe tải rẽ trái đã khiến họ phải trả rất
Trang 14nhiều tiền Nói cách khác, UPS thấy rằng việc chuyển hướng trong giao thông đanggây ra rất nhiều sự chậm trễ, lãng phí nhiên liệu, và nguy cơ an toàn.
Theo một bài báo từ Cuộc hội thoại có tiêu đề "Tại sao các trình điều khiển củaUPS không rẽ trái và bạn cũng không nên vậy", UPS "tuyên bố nó sử dụng ít hơn 10triệu gallon nhiên liệu, phát thải ít hơn 20.000 tấn CO2 và cung cấp 350.000 gói mỗinăm" (sau khi thực hiện thay đổi) 10 triệu galon khí là rất nhiều tiền - đó là một số lợiích đáng kể và một ví dụ dữ liệu lớn trong chuỗi cung ứng
Các lái xe của UPS bây giờ chỉ được rẽ trái khoảng 10%., thay vào đó là chọn đithẳng hoặc rẽ phải Do chiến lược Chỉ rẽ trái khi cần thiết, UPS đã giảm số lượng xe tải
nó sử dụng đi 1.110 và giảm tổng quãng đường đội tàu công ty di chuyển 28,5 triệudặm
4) Hàng dễ hỏng được vận chuyển với chất lượng cao hơn
Giữ cho các sản phẩm dễ hư hỏng là một thách thức không ngừng của các công tylogistics Tuy nhiên, Big Data và Internet of Things (Mạng lưới thiết bị kết nốiInternet) có thể giúp các nhà quản lý và người giao hàng hiểu rõ hơn về cách họ có thểngăn ngừa chi phí do hàng hoá bị hư hỏng
Chẳng hạn, giả sử một chiếc xe tải đang vận chuyển một lô hàng kem và đồ trángmiệng Bạn có thể cài đặt một cảm biến nhiệt độ bên trong xe tải để theo dõi trạng tháicủa hàng hoá bên trong và đưa dữ liệu này cùng với dữ liệu giao thông và đường xácho một máy tính định tuyến trung tâm
Máy tính này có thể cảnh báo người lái xe nếu tuyến đường ban đầu đã chọn sẽ dẫnđến việc kem tan chảy và thay vào đó là các tuyến thay thế
5) Tự động hóa kho và chuỗi cung ứng
Chẳng bao lâu, Big Data kết hợp với công nghệ tự động hoá và Internet of Things
có thể làm cho logistics hoạt động hoàn toàn tự động
Big Data cho phép các hệ thống tự động hoạt động thông qua việc định tuyếnthông minh nhiều bộ dữ liệu và luồng dữ liệu khác nhau Ví dụ, Amazon đã có tự động
Trang 15hóa trong các trung tâm thực hiện của họ, sử dụng ít robot KIVA màu da cam để lấy đồvật từ kệ.
Ngoài ra, Amazon còn có các máy điện toán tự động có thể phân phối đồ vật chobạn nếu bạn ở trong vòng 30 phút của trung tâm Amazon Hay khi nhìn thấy Uber vàcác công ty khác đang chạy thử nghiệm các phương tiện tự lái, không khó để tưởngtượng rằng trong tương lai toàn bộ chuỗi cung ứng có thể được tự động hóa, từ việcxếp dỡ, lái xe, đến việc giao hàng cuối cùng
6) Duy trì trải nghiệm tốt của khách hàng
Phân tích dữ liệu lớn cung cấp nhiều dữ liệu về khách hàng và từ đó đưa ra cáccách thức phục vụ để thu hút, duy trì và cải thiện trải nghiệm của khách hàng vớinhững quyết định về sự thay đổi Big Data cũng cho phép một hệ thống hiệu quả và lớnhơn để nắm bắt dữ liệu về khách hàng và đối tượng Big Data có thể giúp xác địnhcung và cầu địa phương và được sử dụng để hiểu được sự hài lòng và nhu cầu củakhách hàng
Chi phí để thu hút một khách hàng mới luôn cao hơn chi phí duy trì sự trung thành củakhách hàng cũ, vì vậy các doanh nghiệp logistics luôn cần chú trọng vào sự trải nghiệmcủa khách hàng
Hồ sơ về các điểm tiếp xúc của khách hàng, dữ liệu về các yếu tố hoạt động củachất lượng dịch vụ, cũng như dữ liệu bên ngoài kết hợp để cung cấp cái nhìn toàn diện
về theo dõi khách hàng, để doanh nghiệp có thể đưa ra các quyết định tập trung nỗ lựckinh doanh khi thích hợp nhất Và một trải nghiệm tốt của khách hàng sẽ cung cấp chocác nhà quản lý những quyết định về hoạt động và phát triển sản phẩm hơn nữa và đolường để thiết kế các sản phẩm và dịch vụ có thể đáp ứng và vượt qua mong đợi củakhách hàng
Ví dụ UPS nhận thấy từ lịch sử cung cấp cho thấy rằng khách hàng nhận đượchai lô hàng bị trì hoãn Điều này có nghĩa là UPS phải triển khai một biện pháp giữchân khách hàng ngay lập tức
Trang 16Nhưng khi nói đến các điểm tiếp xúc của khách hàng, có vô số những thông tin
có sẵn thông qua sự ra đời của các diễn đàn trực tuyến Trước đây, các hệ thống CRM(Customer Relationship Management) đã lưu trữ dữ liệu đó và thu thập thêm được thựchiện bằng các cuộc điều tra Nhưng với các công cụ và kỹ thuật Big Data bao gồm khảnăng tự động thu hồi cảm xúc của khách hàng hiện diện trên các cơ sở dữ liệu như vănbản và âm thanh sau đó phân tích ngữ nghĩa và khai thác văn bản, điều này sẽ phản ánhtốt hơn cảm xúc của khách hàng so với các hình thức khảo sát truyền thống
Tóm lại, Big Data đã đang trên công cuộc chuyển đổi bản chất của Logistic BigData trong Logistic có thể được sử dụng để giảm sự thiếu hiệu quả trong việc phânphối dặm cuối cùng, cung cấp tính minh bạch cho chuỗi cung ứng, tối ưu hóa việc phânphối, bảo vệ hàng hoá dễ bị hư hỏng và tự động hoá toàn bộ chuỗi cung ứng hay làmtăng trai nghiệm tốt cho khách hàng
Các công ty logistics nhận thức được những khả năng này, và đang phấn đấu đưa
ra nhiều quyết định dựa trên dữ liệu hơn Sử dụng dữ liệu lớn, bộ cảm biến và Internet
of Things, kết hợp với phần mềm kinh doanh thông minh, các công ty có tư duy theo
đó đã giảm chi phí và tăng sự hài lòng của khách hàng
2.3 Thách thức khi ứng dụng Big Data vào Logistics
Việc sử dụng hiệu quả các kỹ thuật Big Data đã đem lại nhiều lợi ích cho việc chuyển đổi nền kinh tế nhưng cũng gây ra nhiều thách thức, bao gồm những khó khăn trong việc thu thập dữ liệu, lưu trữ, tìm kiếm, cắt xén, phân tích và vận dụng Những thách thức này cần phải vượt qua để có thể khai thác cao nhất khả năng của Dữ liệu lớn
1) Kiến trúc máy tính để xử lý dữ liệu
Kiến trúc máy tính là một trong những thách thức lớn nhất Theo Philip Chen và Zhang (2014), hiệu suất của bộ xử lý trung tâm (CPU) đang tăng gấp đôi mỗi 18 tháng.Hiệu năng của các ổ đĩa cũng tăng gấp đôi với cùng tốc độ, nhưng tốc độ quay của đĩa
Trang 17đã cải thiện một chút Ngoài ra, lượng thông tin tăng theo cấp số nhân Điều này có ảnhhưởng lớn đến giới hạn của việc khám phá các giá trị thời gian thực từ Big Data
2) Dữ liệu không thống nhất
Một thách thức quan trọng khác liên quan đến phân tích dữ liệu lớn bao gồm sự không thống nhất về dữ liệu và khả năng mở rộng, tính kịp thời và bảo mật dữ liệu không đầy đủ Do đó, dữ liệu phải được xây dựng phù hợp và một số tiền xử lý kỹ thuật, chẳng hạn như làm sạch dữ liệu, tích hợp dữ liệu, chuyển đổi dữ liệu và giảm thời gian cần được áp dụng để làm giảm tiếng ồn và sửa lỗi không chính xác Big Data
đã thay đổi đáng kể việc thu thập và lưu trữ dữ liệu, bao gồm thiết bị lưu trữ dữ liệu, kiến trúc lưu trữ dữ liệu, cơ chế truy cập dữ liệu Quy trình khám phá kiến thức đặt ưu tiên cao nhất vào khả năng tiếp cận của Dữ liệu lớn Theo nghĩa đó, dữ liệu lớn nên được truy cập hiệu quả và cho phép phá vỡ hoàn toàn hoặc một phần hạn chế của kiến trúc máy tính Lưu trữ trực tiếp (DAS), lưu trữ mạng (NAS), và mạng lưu trữ (SAN) thường được sử dụng kiến trúc lưu trữ Tuy nhiên, chúng có những hạn chế và hạn chế nghiêm trọng trong các hệ thống phân phối quy mô lớn Tối ưu hóa truy cập dữ liệu là cách phổ biến để cải thiện hiệu suất của máy tính dữ liệu chuyên sâu Điều này bao gồm sao chép dữ liệu, di chuyển, phân phối và truy cập song song Khi khối lượng dữ liệu là rất lớn, dung lượng băng thông mạng là nút cổ chai trong đám mây và các hệ thống phân tán
3) Bảo mật dữ liệu chưa đảm bảo
Một vấn đề khác liên quan đến lưu trữ đám mây là bảo mật dữ liệu Cấu trúc dữ liệu nhằm mục đích tìm kiếm và truy xuất dữ liệu định kỳ, đảm bảo chất lượng dữ liệu,
bổ sung giá trị, tái sử dụng và bảo quản Điều này bao gồm xác thực, lưu trữ, quản lý, bảo quản, truy xuất và đại diện
Theo Kambatla (2014): Trong các hệ thống hậu cần, một khuôn khổ phân tích toàn diện đòi hỏi phải tích hợp quản lý chuỗi cung ứng, quản lý khách hàng, hỗ trợ sau bán hàng và quảng cáo Số lượng lớn các dữ liệu đa dạng bao gồm giao dịch khách hàng, quản lý hàng tồn kho, nguồn cấp dữ liệu video trên cửa hàng, quảng cáo và quan
hệ khách hàng, sở thích và tình cảm của khách hàng, cơ sở hạ tầng quản lý bán hàng và
Trang 18dữ liệu tài chính Việc triển khai toàn diện RFIDs (Radio Frequency Identification) để theo dõi hàng tồn kho, liên kết với các cơ sở dữ liệu của nhà cung cấp, tích hợp với sở thích của khách hàng và các hệ thống tài chính tổng hợp mang lại hiệu quả được cải thiện Cách tiếp cận Big Data giúp khai thác dữ liệu sản xuất cho phép RFID để hỗ trợ các quyết định hậu cần sản xuất của Zhong và cộng sự (2015) Các ứng dụng này chủ yếu có các bộ dữ liệu được cấu trúc và tích hợp tương đối tốt Vì cơ sở hạ tầng và phân tích dữ liệu đang được thực hiện trong cùng một miền an ninh, vấn đề bảo mật và bảo mật dễ dàng hơn Các nút cổ chai lớn nhất trong lĩnh vực này là sự phát triển của các phân tích có khả năng quy mô một lượng lớn các dữ liệu đa phương thức.
Với khối lượng dữ liệu gia tăng, xác suất dữ liệu chứa các thông tin có giá trị và
bí mật tăng lên Do đó, thông tin được lưu trữ với mục đích phân tích dữ liệu lớn là dễ
bị ảnh hưởng vì tội phạm mạng Các vấn đề an ninh cũng bao gồm bảo vệ sở hữu trí tuệ, bảo vệ sự riêng tư cá nhân, bí mật thương mại và bảo vệ thông tin tài chính Luật bảo vệ dữ liệu đã được thiết lập ở hầu hết các quốc gia đang phát triển và đang phát triển Đối với các ứng dụng liên quan đến Dữ liệu Lớn, các vấn đề về bảo mật dữ liệu khó hơn vì số lượng dữ liệu cực lớn và khối lượng công việc khó khăn của an ninh
Trang 19CHƯƠNG 3: CASE-STUDY: DHL ĐÃ ÁP DỤNG BIG DATA NHƯ THẾ NÀO?
Ngày nay, các công ty trong mọi lĩnh vực đang cố gắng hết sức để thu thập và phân tích dữ liệu chính xác, để tạo ra các quyết định hiệu quả cho việc kinh doanh của họ Đây là dữ liệu có tiềm năng giúp doanh nghiệp thành công, trong tất cả các lĩnh vực màcông ty phải đưa ra quyết định Các công ty logistics cũng có dữ liệu khổng lồ thông qua truy cập mạng, các thiết bị kết nối, chẳng hạn như điện thoại thông minh, webcam, mạng cảm biến, và các khóa học ngoại tuyến, các phương tiện truyền thông xã hội Số ngôi sao trong vũ trụ ít hơn số lượng thông tin kỹ thuật số có sẵn trên mạng Các công
ty có thể có công nghệ cần thiết và các kỹ năng để tinh chỉnh dữ liệu có sẵn có thể làm tăng giá trị cho nó và có thể làm cho nó trở nên hữu ích cho việc kinh doanh kinh doanh của họ bằng cách sử dụng Phân tích Big Data Đó là lý do tại sao nhiều công ty logistics, như DHL, GE đã nhận ra rằng Big Data đang mang lại một sự thay đổi lớn cho ngành công nghiệp logistics Mục tiêu của case-study này là phân tích về việc DHL sử dụng một bộ hồ sơ dữ liệu toàn diện, cách phân tích Big Data đã giúp DHL tăng hiệu quả hoạt động (với sự trợ giúp của Resilience360) như thế nào trong việc thử nghiệm và áp dụng các mô hình kinh doanh mới (như mô hình DHL Parcel Volume Prediction hay mô hình "DHL Geovista" ) duy trì trải nghiệm của khách hàng tốt (ví dụ-bằng cách phân tích các điều kiện thời tiết) Các giải pháp dữ liệu lớn của DHL được trình bày trong tất cả ba loại trên, cho thấy các công ty logistics có thể khai thác
dữ liệu chưa sử dụng và áp dụng các kỹ thuật đúng đắn và làm cho nó trở thành một trong những ví dụ tốt nhất của công ty logistics
Trang 20Vậy DHL đã sử dụng Big Data vào việc gì và hiệu quả ra sao?
1 Tối ưu hóa tuyến đường thời gian thực
Để tối ưu hóa tuyến đường trên dặm cuối cùng nhằm tiết kiệm thời gian trong quátrình phân phối, DHL sử dụng các DHL Smart Truck, các xe tải này đều được gắn cảmbiến để mỗi khi xếp và dỡ hàng trên xe, cảm biến phát hiện lô hàng và sẽ phân phối và
sử dụng tính năng động của nó để sắp xếp lô hàng một cách tối ưu
thay vì sắp xếp thủ công Trên đường bộ, cơ sở dữ liệu bưu chính viễn thôngđược khai thác tự động thay đổi các tuyến phân phối theo điều kiện lưu thông hiện tại.Thông tin định tuyến sẽ xem xét tính sẵn có và thông tin vị trí do người nhận đăng tảitheo thứ tự để tránh tình trạng giao hàng không thành công
2 Nhận và giao hàng theo đám đông
DHL tận dụng năng lực đám đông để giảm thiểu nhân lực và đảm bảo hàng đượcgiao đến bất kể vùng miền địa lý nào Ý tưởng rất đơn giản: Người đi làm, lái xe taxi,
Khai thác dữ liệu để:
• Tăng mức độ trung thành của khách hàng và duy trì
• Thực hiện chính xác khách hàngphân khúc và nhắm mục tiêu
• Tối ưu hóa tương tác của khách hàng
và dịch vụ
Khai thác dữ liệu bằng cách:
• Mở rộng các luồng doanh thu
từ các sản phẩm hiện có
• Tạo doanh thu mới từ dòng chảy
dữ liệu của sản phẩm mới