Đào tạo nhân lực và sản xuấtthông minh thời chuyển đổi số Nguyễn Thanh Tùng Trường Đại học Thủy Lợi tungnt@tlu.edu.vn 1... Thế giới thực thể – không gian số Physical-cyber systems Thế gi
Trang 1Đào tạo nhân lực và sản xuất
thông minh thời chuyển đổi số
Nguyễn Thanh Tùng
Trường Đại học Thủy Lợi
tungnt@tlu.edu.vn
1
Trang 2Thời chuyển đổi số
Digital transformation time
Thế giới các thực thể
2
Trang 3Thế giới thực thể – không gian số Physical-cyber systems Thế giới các thực thể
Thời chuyển đổi số
3
Trang 4Tính toán, điều khiển trên không gian số
Mọi điều xảy ra trên thế giới các thực thể
Thế giới thực thể – không gian số Physical-cyber systems Thế giới các thực thể
Thí dụ: 1 triệu
xe kinh doah trên toàn quốc đã gắn
GPS,
~500GB/day.
Thời chuyển đổi số
4
Trang 5Tính toán, điều khiển trên không gian số
Mọi điều xảy ra trên thế giới các thực thể
Thế giới thực thể – không gian số Physical-cyber systems Thế giới các thực thể
Thí dụ: 1 triệu
xe kinh doah trên toàn quốc đã gắn
GPS,
~500GB/day.
Thay đổi phương thức sản xuất
Thời chuyển đổi số
5
Trang 6Tuy mọi công nghệ đều tiến bộ, cách mạng công nghiệp lần thứ tưxảy ra chủ yếu do hội tụ của các công nghệ số có nhiều đột phá.
Tuy mọi công nghệ đều tiến bộ, cách mạng công nghiệp lần thứ tưxảy ra chủ yếu do hội tụ của các công nghệ số có nhiều đột phá
Điện toán đám mây : Môi trường
Dữ liệu lớn : Năng lượng
Internet vạn vật : Thần kinh & huyết mạch
Trí tuệ nhân tạo : Chức năng thông minh
Khoa học dữ liệu :
“Bộ não” phân tích dữ liệu để hỗ trợ quyết định và hành động.
Dữ liệu lớn (kích thước rất lớn và phức tạp)
Khoa học
dữ liệu
Internet vạn vật (thu nhận và trao đổi dữ
liệu)
Trí tuệ nhân tạo
(chức năng thông minh)
Điện toán đám mây (dịch vụ lưu trữ và tính toán)
Đột phá của công nghệ số
6
Trang 7Big data
Big data refers to data sets that are too large and too
complex to manage and analyze with traditional IT techniques
Complexity of data in many different structures, ranging from relational, to logs,
to raw text Streaming data and large volume data movement
Scale from Terabytes to Petabytes (10 15 bytes)
Data Scientist: The Sexiest Job of the 21st Century
(Harvard Business Review, October 2012)
7
Trang 8Dữ liệu lớn có thể rất nhỏ.
Không phải mọi tập dữ liệu to đều lớn
Big data can be very small Not all large datasets are big
• Big liên quan tới sự phức tạp nhiều hơn tới kích
thước lớn
• Dữ liệu lớn nhưng lại nhỏ
Lò hạt nhân, máy bay… có hàng trăm nghìn
sensors sự phức tạp của việc tổ hợp dữ
liệu các sensors này tạo ra?
Dòng dữ liệu của tất cả các sensors là lớn
mặc dù kích thước của tập dữ liệu là không
lớn (một giờ bay: 100,000
sensors x 60 minutes x 60
seconds x 8 bytes < 3GB)
Tập dữ liệu to nhưng không lớn
Số hệ thống dù tăng lên và tạo ra những
lượng khổng lồ dữ liệu nhưng đơn giản
MIKE2.0
8
Trang 9Cánh mạng công nghiệp lần thứ tư
Sản xuất nông nghiệp
CMCN4Công nghệ số, AI
CMCN2Năng lượng điện
CMCN1Động cơ hơi nước
CMCN3Máy tính, internet
H.T Bảo
9
Trang 10Trí tuệ nhân tạo - Artificial Intelligence
• Lĩnh vực làm cho máy (máy tính) hoạt động như có trí thông minh của con người (suy luận, giải quyết vấn đề, nhận thức, hiểu ngôn ngữ, học tập )
• AlphaGo, hiểu ngôn ngữ, nhận dạng tiếng nói, chẩn đoán ung thư, ô-tô tự lái
1941 1949 1956 1958 1970 1972 1982 1986 1995 1997 2000 2005 … 2018
Máy tính
đầu tiên
Máy tính thương mại đầu tiên
TTNT
ra đời
Ngôn ngữ LISP
Hệ chuyên gia đầu tiên Ngôn ngữ PROLOG
Đề án máy tính thế hệ 5
Sự sống nhân tạo
AI phân tán
Tác tử thông minh
Hệ TTNT hạ vô địch cờ vua Thách thức DAPRA
Data mining Học máy thống kê
Web ngữ nghĩa Tin sinh học Mạng xã hội
đột phá
AI thăng trầm 60 năm, đột phá gần đây nhờ học máy (machine learning)
AI thăng trầm 60 năm, đột phá gần đây nhờ học máy (machine learning)
10
Trang 11Khoa học Dữ liệu
TRI THỨC CỦA LĨNH VỰC
KHOA HỌC MÁY TÍNH
TOÁN &
THỐNG KÊ
DATA SCIENCE
XỬ LÝ
DỮ LIỆU NGHIÊN CỨU
THỐNG KÊ
HỌC MÁY
“In God we trust
All others bring
Kết hợp của Toán học và Tin học là cốt lõi của Khoa học dữ liệu
Kết hợp của Toán học và Tin học là cốt lõi của Khoa học dữ liệu
Khoa học về phân tích dữ liệu
11
Trang 12Khoa học dữ liệu: Cơ sở của quyết định
12
Trang 13Hạ tầng của sự phát triển?
Hạ tầng là những thứ cần nhất phải có để trên đó ta xây dựng
và phát triển những thứ khác
Hạ tầng là những thứ cần nhất phải có để trên đó ta xây dựng
và phát triển những thứ khác
Hành động trong thế giới
vật lý của các thực thể
13
Trang 14và ta đã có
gì?
Hạ tầng là những thứ cần nhất phải có để trên đó ta xây
dựng và phát triển những thứ khác
Hạ tầng là những thứ cần nhất phải có để trên đó ta xây
dựng và phát triển những thứ khác
14
Trang 15Thành phần trọng yếu của hạ tầng số?
Thiết bị Kết nối Dữ liệu Pháp lý Nhân lực
CHÍNH PHỦ/DOANH NGHIỆP SỐ & KINH TẾ SỐ
Trang 16NHÂN LỰC SỐ
Xác suất Nghề nghiệp có khả năng tự động hóa
0.99 Nhân viên tiếp thị từ xa (telemarketers)
0.99 Nhân viên kỹ thuật thư viện
0.98 Người định giá bảo hiểm
0.98 Trọng tài thể thao, các viên chức thể thao khác
0.98 Thư ký pháp luật
0.97 Chủ khách sạn, quán ăn, quán cà-phê
0.97 Người môi giới bất động sản
0.97 Nhà thầu lao động nông nghiệp
0.0055 Nhà quản lý nguồn nhân lực0.0065 Nhà phân tích hệ máy tính0.0077 Nhà nhân chủng học và nhà khảo cổ học0.0100 Kỹ sư hàng hải và kiến trúc sư hải quân0.0130 Người quản lý kinh doanh
0.0150 Giám đốc điều hành
Tiasang.com.vn
16
Trang 17Nhân lực số
Báo cáo của Ngân hàng Thế giới vào năm 2016
Tiasang.com.vn 17
Trang 18Ngành thủy lợi và khoa học dữ liệu
• Bước đầu xây dựng được các CSDL quản lý: CSDL
thiên tai, hồ chứa, đê và công trình trên đê,
• Tương tác trực quan qua giao diện GIS
• Một số tồn tại:
• Dữ liệu khó chia sẻ, manh mún và khó tích hợp để khai thác.
• Chưa ứng dụng được AI & Khoa học dữ liệu theo xu hướng CMCN4.
• Các ứng dụng trong ngành chưa kết hợp được các mô hình thủy văn, thủy
lực và học máy để kết quả dự báo chính xác hơn.
18
Trang 19VD: Dự đoán mực nước
Ref: ICFR
Các mô hình Học máy
19
Trang 20Đào tạo và nghiên cứu KHDL
Khoa CNTT, ĐHTL có 3 Labs:
20
Trang 21Phòng thí nghiệm Khoa học dữ liệu (DS Lab)
Các Tiến sỹ nghiên cứu và đào tạo Khoa học dữ liệu
Trang 22Đào tạo Khoa học dữ liệu
• Đào tạo sinh viên chính
quy hai ngành CNTT và HTTT.
• Đào tạo các khoa học
ngắn hạn (3-6 tháng)
• Khóa học chuyên đề cho
Trường/Viện và doanh nghiệp.
1 Brief of statistics
2 Brief of linear algebra/optimization
3 Introduction to R and Python
4 Data preprocessing
5 Principles of Data Science
6 Evaluation of analysis results
14 Analysis of social networks
15 Analysis of time series data
16 Real-life problems 2
22
Trang 24DSLab Opening ceremony 13.4.2018
24
Trang 25Trao đổi chuyên môn của DS Lab
25
Trang 26 Con đường và cách đi phụ thuộc nhiều yếu tố: thể chế chính trị, chính sách
phát triển của Nhà nước, Bộ và Tổngcục, tình trạng kinh tế, xã hội, văn hoá, giáo
dục và đào tạo, khoa học và công nghệ…
Khi CMCN4 bùng nổ, mọi ngành nghề đều phải dựa nhiều hơn vào khoa
học và công nghệ, vào hạ tầng dữ liệu.
Thủy lợi hiệu quả và chính xác? Nông nghiệp vàdu lịch thông minh? Lựa chọn
và làm chủ những công nghệ số và các công nghệ cao cần chomình?
Thực hiện được đến đâu sự thay đổi phương thức sản xuất trong việc ta muốnvà cần làm?
Ta có thể và nên đi thế nào trong CMCN4?
Ngành thủy lợi và khoa học dữ liệu
26
Trang 27 Xây dựng hạ tầng dữ liệu thủy lợi, tài nguyên nước và khoa học
dữ liệu là ‘hạ tầng cơ sở’ đểngành thủy lợi tiếp cận CMCN4.
Nhanh chóng đào tạo trong thời gian 3-5 năm một lực lượng về khoa học
dữ liệu của ngành thủy lợi.
Có lộ trình hợp lý và từng bước thực hiện Trước hết cần đẩy mạnh số hoá và
tạo các nguồn dữ liệu cơbản.
Sử dụng khoa học dữ liệu hiệu quả để đưa ra các quyết định đúng và sáng
suốt trong các hoạt động của ngành.
Ngành thủy lợi và khoa học dữ liệu
27
Trang 28Một vài suy nghĩ
Câu hỏi chung là mỗi lĩnh vực quản lý của Bộ, Ngành cần và có thể
chuyển đổi thế nào trong thời chuyển đổi số?
Những mô hình,tri thức,nguyên lý, phương pháp chúng ta đang dùng tốt đến đâu và có thể tốt hơn không nếu gắn hơn với dữ liệu?
Thủylợilàlĩnh vực rất sâu vàrất rộng Liệumỗi lĩnh vực của thủy lợi có cần và có thể gắn với ‘data- driven’ thế nào để sản xuất vàquản lý điều hành “thông minh” hơn?
Khoa học dữ liệu và hạ tầng dữ liệu thủy lợi (IoT hỗ trợ thu thập tự
động) là chìa khóa để hiện đại hóa ngành trong xu thế CMCN4.
28
Trang 29Câu hỏi?
29