Việc chúng ta không th ể biết trước đư ợc cách các dữ liệu cá nhân c ủa chúng ta sẽ được sử dụng như th ế nào đặt ra một vấn đề đạo đức.. Ngày nay, câu trả lời là không, bởi vì để sử dụn
Trang 1Dữ liệu lớn (Big Data) ph ục vụ ngư ời nghèo nhất?
Thomas Roca
Dữ liệu lớn phục vụ ngư ời nghèo nh ất?
Từng lúc m ột, chúng ta tạo ra dữ liệu Từ Paris đến Dakar, từ Jakarta đến New York, các hoạt động hàng ngày của chúng ta (tiêu dùng, giao ti ếp, di chuyển ) tạo ra các dữ liệu, những "mảnh vụn dạng số" mà chúng ta đ ể lại đằng sau chúng ta Nh ững thông ti n đó tiềm tàng có ích cho s ự phát triển Như thế nào? Phỏng vấn Thomas Roca, kinh t ế gia tại AFD
"Dữ liệu lớn" là gì?
Khái niệm "dữ liệu lớn" là một tập hợp các dữ liệu không đồng nh ất - nếu không mu ốn nói là hỗn tạp Ngư ời ta thường mô tả chúng bằng ba c hữ "V"
là ba chữ viết tắt của "Vélocité (tốc độ cập nhật cao)", "Variété (đa dạng)"
(hình ảnh, dữ liệu điện thoại di động, dữ liệu cảm biến, văn b ản, v.v.) và
"Volume (khối lượng)”, khối lư ợng thông tin phát sinh c ực kì l ớn Tuy
Trang 2nhiên, mô t ả này đặt yếu tố con ngư ời đằng sau dữ liệu, nó b ỏ qua tác đ ộng của khối lượng thông tin này đ ến việc tổ chức các xã hội của chúng ta Những kiểu dữ liệu mới nêu trên đặt ra những thách thức nào?
Không nên xem nh ững thách thức do việc dữ liệu hóa thế giới đặt ra chỉ là những vấn đề thuần túy kỹ thuật Những thách thức này cũng đồng thời mang tính chính tr ị và đạo đức Ai sở hữu các dữ liệu phát sinh từ điện thoại di động của chúng ta hoặc hoạt động của chúng ta trên các m ạng xã hội? Làm th ế nào để bảo vệ sự riêng tư của công dân? Làm th ế nào để điều tiết những cách sử dụng các dữ liệu này?
Việc chúng ta không th ể biết trước đư ợc cách các dữ liệu cá nhân c ủa
chúng ta sẽ được sử dụng như th ế nào đặt ra một vấn đề đạo đức Nếu các
dữ liệu ấy đư ợc bán cho một cơ quan an ninh nư ớc ngoài, thì li ệu chúng ta
có được thông báo không? Chúng ta có th ể từ chối không? Ngày nay, câu trả lời là không, bởi vì để sử dụng các mạng xã hội, mỗi người sử dụng đều
"đồng ý rõ ràng " cho việc tái sử dụng các dữ liệu cá nhân của mình, mà
không biết là chúng sẽ được sử dụng như thế nào trong tương lai Th ật vậy, rất nhiều khi chính ngư ời điều hành cũng không bi ết! Khi được thành l ập, Facebook còn lâu m ới tưởng tư ợng hết những lợi ích thương mại một ngày nào đó của những thông tin thu thập được Vì vậy, dù không phải là mục
đích ban đầu, nó vẫn tạo ra một mô hình kinh doanh mới
Giống như đạo đức học trong sinh h ọc, cần phải xác định các quy tắc, ở cấp độ quốc tế, để xác định tính đạo đức của dữ liệu, một "đạo đức học về
dữ liệu" Do tính đa d ạng của dữ liệu, tính gần như độc quyền của khu vực
tư trong việc thu thập dữ liệu cũng như do tầm quan trọng chiến lược của
dữ liệu trong một nền kinh t ế phi vật chất, nên việc hình thành m ột "sự đồng thuận toàn cầu về dữ liệu" là điều phức tạp
Trang 3Cho đến nay những quy định của các quốc gia - hoặc của châu Âu – đã xác định một số quy tắc bảo vệ công dân, ít nhiều có hiệu quả Tuy
nhiên, những quy đ ịnh quá khắt khe có th ể gây trở ngại cho sự sáng tạo và cho việc sử dụng các dữ liệu trên ph ục vụ cho các chính sách công Vậy đặt con trỏ ở đâu?
Cho đến nay, chưa có một giải pháp mang tính thể chế nào cho phép việc hình thành một nền tảng các dữ liệu cá nhân, mở nhưng được bảo vệ (ẩn danh, với quyền truy c ập hạn chế, v.v.) có thể được sử dụng trong việc xây dựng các chính sách công Tuy nhiên, nh ững dự án như vậy đang được thảo luận tại Liên Hợp Quốc và Ngân hàng Th ế giới Về phía các doanh nghi ệp,
công ty Orange là một trong những tác nhân rất tích cực trong các cu ộc thảo luận trên Sau sự thành côn g của những thách thức Data for
Development (Dữ liệu cho sự phát tri ển)[ 1 ], công ty Orange mong mu ốn tiếp tục theo đu ổi những nỗ lực của mình và khuyến khích các doanh
nghiệp tư nhân khác cùng tham gia trong vi ệc "cung cấp có kiểm soát" một
số dữ liệu hữu ích ph ục vụ cho sự phát tri ển Dự án Data for Climate
Action (Dữ liệu cho hành đ ộng về khí hậu) là một trong nh ững dự án có th ể
làm thay đổi tình hình, nếu có một số lượng các doanh nghiệp đủ để huy động việc cung cấp các dữ liệu mới nhằm mục đích hiểu rõ hơn tác động của sự biến đổi khí hậu và của những biến đổi về môi trường trên dân cư
"Dữ liệu lớn" có th ể đóng vai trò gì trong các ngành khoa h ọc xã h ội?
Các kiểu dữ liệu mới mang l ại một cách nhìn khác v ề thế giới, bổ sung cho thế giới quan từ các số liệu thống kê hi ện hữu Cho đến nay, các dữ liệu
được sử dụng trong các ngành khoa học xã hội được "kiến tạo" trong một
quá trình thu th ập bắt nguồn từ các quan sát hoặc bản câu hỏi Trong th ời
đại của "dữ liệu lớn", các dữ liệu chủ yếu mang tính được "phát tán"
Trang 4Việc sử dụng những dữ liệu trên vào các ngành khoa h ọc xã hội không ph ải đơn giản như vậy, cũng không phải lúc nào cũng đúng đắn Nó đặt ra một
số câu hỏi Thứ nhất, là câu hỏi về tính hi ệu lực Các dữ liệu đư ợc sử dụng
theo truy ền thống là thành qu ả của một kiến tạo lý thuy ết: chúng ta mu ốn
đo lường điều gì? Làm thế nào để nắm bắt thông tin? Với "dữ liệu lớn", vấn đề được đặt ngược lại: chúng ta có nh ững dữ liệu nào? Chúng ta có th ể làm gì với chúng?
Trong thực tiễn, sự khác biệt mong manh hơn nhi ều Trong thực tế, chỉ có một số ít các nhà khoa h ọc xã hội có thể có đủ khả năng để dựng lên một
cơ sở dữ liệu đặc biệt Hầu hết các nhà nghiên cứu đều đối mặt với những câu hỏi đại thể như: chúng ta có nh ững dữ liệu nào? Chúng ta có th ể làm gì với chúng? Làm th ế nào để xử lý chúng m ột cách thích đáng?
Một số dữ liệu đồ sộ vướng phải các vấn đề cụ thể: trong thực tế chúng có
thể mang tính cục bộ - bởi vì tất cả mọi thứ không th ể định lư ợng đư ợc - và đôi khi cũng mang tính thiên vị Chúng không nhất thiết phản ánh hoạt
động của các quần thể ít được kết nối nhất, và những người nghèo nhất thường không được đại diện đầy đủ Đây có thể là trường hợp của những
dữ liệu phát sinh từ những công nghệ thông tin mới (NTIC- Nouvelles
Technologies de l’Information et de la Communication) (đ iện thoại di
động, mạng xã hội, v.v.)
Tương lai nào cho việc sử dụng những dữ liệu trên phục vụ cho sự phát triển?
Chúng ta đang sống trong giai đoạn nghiên cứu và thử nghiệm, và việc sử dụng rộng rãi "dữ liệu lớn" phục vụ cho các thống kê chính th ức sẽ còn phải mất thời gian Có hai văn hoá, hai th ế hệ đang đối mặt nhau: những
nhà thống kê và nh ững nhà “khoa học dữ liệu" Họ sử dụng một ngôn ngữ
và những công cụ đôi khi khác nhau Nh ững nhà thống kê được đào tạo về
Trang 5thống kê và xác su ất Những nhà “ khoa học dữ liệu" đến từ thế giới CNTT
và xử lý những tập hợp dữ liệu đôi khi quá l ớn mà thống kê suy luận[ 2 ] và khái niệm lấy mẫu dường như đã lỗi thời Những người thứ nhất sống với
"thời gian dài " của hệ thống tài kho ản quốc gia, những người thứ hai sống
với sự tức thời của Internet Các cu ộc tranh luận xung quanh vi ệc đo
lường các Mục tiêu phát triển bền vững (Objectifs du Développement
Durable ) cho thấy sự đối lập, và c ả sự nối khớp hai cách n hìn cho việc dữ
liệu hóa thế giới
"Dữ liệu lớn" rõ ràng không ph ải là một giải pháp k ỳ diệu cho sự thiếu thốn về năng lực, tài chính và nhân l ực, mà các Viện Thống kê qu ốc gia ở các nước nghèo nhất phải đối diện Tuy nhiên, một số những dữ liệu trên
có thể hữu ích trong vi ệc giải quyết những vấn đề mang tính cụ thể Lấy ví
dụ về những dữ liệu điện thoại di động Đây là những dữ liệu đặc biệt thích đáng khi nói đến sự hiểu biết về tính di động và để theo dõi sự di chuyển của dân cư Việc phân tích những dữ liệu trên cho phép t ối ưu hóa các
đường giao thông công cộng, điều tiết giao thông đường bộ, tạo điều kiện cho quy hoạch đô thị, v.v Ngư ời ta cũng có th ể nghĩ đến việc tiêu th ụ nước
và điện, những mạng nổi tiếng như "mạng thông minh (smart grid ou
réseaux intelligents )", nhờ vào các cảm biến trên mạng, có th ể cải thiện
công tác quản lý lưu lư ợng điện (sản lượng cung cấp, phân phối v.v.)
Khu vực tư nhân đã hư ởng lợi từ các dữ liệu trên là do đã ki ểm soát quy trình sản xuất Trong trư ờng hợp của các chính sách công còn có nh ững vấn
đề về bảo vệ quyền riêng tư và lợi ích chiến lược của một số dữ liệu trên đối với khu vực tư nhân, đặc biệt khi những dữ liệu ấy đụng đến tâm điểm ngành ngh ề của các doanh nghi ệp này Tuy nhiên không ph ải tất cả mọi dữ
liệu đều mang tính chi ến lư ợc Công ty Orange gần đây nêu trư ờng hợp của
các cảm biến khí tư ợng trên ăng-ten tiếp sóng của họ, được sử dụng để phân tích ch ất lư ợng không khí và như v ậy khả năng truy ền dẫn các tín
Trang 6hiệu của họ Hoàn toàn có th ể xem xét việc cung cấp các kiểu thông tin như vậy
Ngày nay, chúng ta hy v ọng hình thành nh ững loại hình đ ối tác mới, đối tác-công-tư-cá nhân có kh ả năng thúc đẩy việc sử dụng các dữ liệu trên để phục vụ những dân cư nghèo nh ất Như Amina Mohammed, C ố vấn đặc biệt của Tổng thư ký Liên H ợp Quốc, nhắc nhở rằng hằng ngày, nhi ều người mất mạng vì h ọ đã không đư ợc tính đến
Thomas Roca