1. Trang chủ
  2. » Thể loại khác

Dữ liệu lớn (big data) phục vụ người nghèo nhất

6 1 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Dữ liệu lớn (Big Data) phục vụ người nghèo nhất
Tác giả Thomas Roca
Trường học Unknown
Chuyên ngành Khoa học máy tính và công nghệ thông tin
Thể loại Bài báo
Năm xuất bản 2023
Thành phố Unknown
Định dạng
Số trang 6
Dung lượng 171,49 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Việc chúng ta không th ể biết trước đư ợc cách các dữ liệu cá nhân c ủa chúng ta sẽ được sử dụng như th ế nào đặt ra một vấn đề đạo đức.. Ngày nay, câu trả lời là không, bởi vì để sử dụn

Trang 1

Dữ liệu lớn (Big Data) ph ục vụ ngư ời nghèo nhất?

Thomas Roca

Dữ liệu lớn phục vụ ngư ời nghèo nh ất?

Từng lúc m ột, chúng ta tạo ra dữ liệu Từ Paris đến Dakar, từ Jakarta đến New York, các hoạt động hàng ngày của chúng ta (tiêu dùng, giao ti ếp, di chuyển ) tạo ra các dữ liệu, những "mảnh vụn dạng số" mà chúng ta đ ể lại đằng sau chúng ta Nh ững thông ti n đó tiềm tàng có ích cho s ự phát triển Như thế nào? Phỏng vấn Thomas Roca, kinh t ế gia tại AFD

"Dữ liệu lớn" là gì?

Khái niệm "dữ liệu lớn" là một tập hợp các dữ liệu không đồng nh ất - nếu không mu ốn nói là hỗn tạp Ngư ời ta thường mô tả chúng bằng ba c hữ "V"

là ba chữ viết tắt của "Vélocité (tốc độ cập nhật cao)", "Variété (đa dạng)"

(hình ảnh, dữ liệu điện thoại di động, dữ liệu cảm biến, văn b ản, v.v.) và

"Volume (khối lượng)”, khối lư ợng thông tin phát sinh c ực kì l ớn Tuy

Trang 2

nhiên, mô t ả này đặt yếu tố con ngư ời đằng sau dữ liệu, nó b ỏ qua tác đ ộng của khối lượng thông tin này đ ến việc tổ chức các xã hội của chúng ta Những kiểu dữ liệu mới nêu trên đặt ra những thách thức nào?

Không nên xem nh ững thách thức do việc dữ liệu hóa thế giới đặt ra chỉ là những vấn đề thuần túy kỹ thuật Những thách thức này cũng đồng thời mang tính chính tr ị và đạo đức Ai sở hữu các dữ liệu phát sinh từ điện thoại di động của chúng ta hoặc hoạt động của chúng ta trên các m ạng xã hội? Làm th ế nào để bảo vệ sự riêng tư của công dân? Làm th ế nào để điều tiết những cách sử dụng các dữ liệu này?

Việc chúng ta không th ể biết trước đư ợc cách các dữ liệu cá nhân c ủa

chúng ta sẽ được sử dụng như th ế nào đặt ra một vấn đề đạo đức Nếu các

dữ liệu ấy đư ợc bán cho một cơ quan an ninh nư ớc ngoài, thì li ệu chúng ta

có được thông báo không? Chúng ta có th ể từ chối không? Ngày nay, câu trả lời là không, bởi vì để sử dụng các mạng xã hội, mỗi người sử dụng đều

"đồng ý rõ ràng " cho việc tái sử dụng các dữ liệu cá nhân của mình, mà

không biết là chúng sẽ được sử dụng như thế nào trong tương lai Th ật vậy, rất nhiều khi chính ngư ời điều hành cũng không bi ết! Khi được thành l ập, Facebook còn lâu m ới tưởng tư ợng hết những lợi ích thương mại một ngày nào đó của những thông tin thu thập được Vì vậy, dù không phải là mục

đích ban đầu, nó vẫn tạo ra một mô hình kinh doanh mới

Giống như đạo đức học trong sinh h ọc, cần phải xác định các quy tắc, ở cấp độ quốc tế, để xác định tính đạo đức của dữ liệu, một "đạo đức học về

dữ liệu" Do tính đa d ạng của dữ liệu, tính gần như độc quyền của khu vực

tư trong việc thu thập dữ liệu cũng như do tầm quan trọng chiến lược của

dữ liệu trong một nền kinh t ế phi vật chất, nên việc hình thành m ột "sự đồng thuận toàn cầu về dữ liệu" là điều phức tạp

Trang 3

Cho đến nay những quy định của các quốc gia - hoặc của châu Âu – đã xác định một số quy tắc bảo vệ công dân, ít nhiều có hiệu quả Tuy

nhiên, những quy đ ịnh quá khắt khe có th ể gây trở ngại cho sự sáng tạo và cho việc sử dụng các dữ liệu trên ph ục vụ cho các chính sách công Vậy đặt con trỏ ở đâu?

Cho đến nay, chưa có một giải pháp mang tính thể chế nào cho phép việc hình thành một nền tảng các dữ liệu cá nhân, mở nhưng được bảo vệ (ẩn danh, với quyền truy c ập hạn chế, v.v.) có thể được sử dụng trong việc xây dựng các chính sách công Tuy nhiên, nh ững dự án như vậy đang được thảo luận tại Liên Hợp Quốc và Ngân hàng Th ế giới Về phía các doanh nghi ệp,

công ty Orange là một trong những tác nhân rất tích cực trong các cu ộc thảo luận trên Sau sự thành côn g của những thách thức Data for

Development (Dữ liệu cho sự phát tri ển)[ 1 ], công ty Orange mong mu ốn tiếp tục theo đu ổi những nỗ lực của mình và khuyến khích các doanh

nghiệp tư nhân khác cùng tham gia trong vi ệc "cung cấp có kiểm soát" một

số dữ liệu hữu ích ph ục vụ cho sự phát tri ển Dự án Data for Climate

Action (Dữ liệu cho hành đ ộng về khí hậu) là một trong nh ững dự án có th ể

làm thay đổi tình hình, nếu có một số lượng các doanh nghiệp đủ để huy động việc cung cấp các dữ liệu mới nhằm mục đích hiểu rõ hơn tác động của sự biến đổi khí hậu và của những biến đổi về môi trường trên dân cư

"Dữ liệu lớn" có th ể đóng vai trò gì trong các ngành khoa h ọc xã h ội?

Các kiểu dữ liệu mới mang l ại một cách nhìn khác v ề thế giới, bổ sung cho thế giới quan từ các số liệu thống kê hi ện hữu Cho đến nay, các dữ liệu

được sử dụng trong các ngành khoa học xã hội được "kiến tạo" trong một

quá trình thu th ập bắt nguồn từ các quan sát hoặc bản câu hỏi Trong th ời

đại của "dữ liệu lớn", các dữ liệu chủ yếu mang tính được "phát tán"

Trang 4

Việc sử dụng những dữ liệu trên vào các ngành khoa h ọc xã hội không ph ải đơn giản như vậy, cũng không phải lúc nào cũng đúng đắn Nó đặt ra một

số câu hỏi Thứ nhất, là câu hỏi về tính hi ệu lực Các dữ liệu đư ợc sử dụng

theo truy ền thống là thành qu ả của một kiến tạo lý thuy ết: chúng ta mu ốn

đo lường điều gì? Làm thế nào để nắm bắt thông tin? Với "dữ liệu lớn", vấn đề được đặt ngược lại: chúng ta có nh ững dữ liệu nào? Chúng ta có th ể làm gì với chúng?

Trong thực tiễn, sự khác biệt mong manh hơn nhi ều Trong thực tế, chỉ có một số ít các nhà khoa h ọc xã hội có thể có đủ khả năng để dựng lên một

cơ sở dữ liệu đặc biệt Hầu hết các nhà nghiên cứu đều đối mặt với những câu hỏi đại thể như: chúng ta có nh ững dữ liệu nào? Chúng ta có th ể làm gì với chúng? Làm th ế nào để xử lý chúng m ột cách thích đáng?

Một số dữ liệu đồ sộ vướng phải các vấn đề cụ thể: trong thực tế chúng có

thể mang tính cục bộ - bởi vì tất cả mọi thứ không th ể định lư ợng đư ợc - và đôi khi cũng mang tính thiên vị Chúng không nhất thiết phản ánh hoạt

động của các quần thể ít được kết nối nhất, và những người nghèo nhất thường không được đại diện đầy đủ Đây có thể là trường hợp của những

dữ liệu phát sinh từ những công nghệ thông tin mới (NTIC- Nouvelles

Technologies de l’Information et de la Communication) (đ iện thoại di

động, mạng xã hội, v.v.)

Tương lai nào cho việc sử dụng những dữ liệu trên phục vụ cho sự phát triển?

Chúng ta đang sống trong giai đoạn nghiên cứu và thử nghiệm, và việc sử dụng rộng rãi "dữ liệu lớn" phục vụ cho các thống kê chính th ức sẽ còn phải mất thời gian Có hai văn hoá, hai th ế hệ đang đối mặt nhau: những

nhà thống kê và nh ững nhà “khoa học dữ liệu" Họ sử dụng một ngôn ngữ

và những công cụ đôi khi khác nhau Nh ững nhà thống kê được đào tạo về

Trang 5

thống kê và xác su ất Những nhà “ khoa học dữ liệu" đến từ thế giới CNTT

và xử lý những tập hợp dữ liệu đôi khi quá l ớn mà thống kê suy luận[ 2 ] và khái niệm lấy mẫu dường như đã lỗi thời Những người thứ nhất sống với

"thời gian dài " của hệ thống tài kho ản quốc gia, những người thứ hai sống

với sự tức thời của Internet Các cu ộc tranh luận xung quanh vi ệc đo

lường các Mục tiêu phát triển bền vững (Objectifs du Développement

Durable ) cho thấy sự đối lập, và c ả sự nối khớp hai cách n hìn cho việc dữ

liệu hóa thế giới

"Dữ liệu lớn" rõ ràng không ph ải là một giải pháp k ỳ diệu cho sự thiếu thốn về năng lực, tài chính và nhân l ực, mà các Viện Thống kê qu ốc gia ở các nước nghèo nhất phải đối diện Tuy nhiên, một số những dữ liệu trên

có thể hữu ích trong vi ệc giải quyết những vấn đề mang tính cụ thể Lấy ví

dụ về những dữ liệu điện thoại di động Đây là những dữ liệu đặc biệt thích đáng khi nói đến sự hiểu biết về tính di động và để theo dõi sự di chuyển của dân cư Việc phân tích những dữ liệu trên cho phép t ối ưu hóa các

đường giao thông công cộng, điều tiết giao thông đường bộ, tạo điều kiện cho quy hoạch đô thị, v.v Ngư ời ta cũng có th ể nghĩ đến việc tiêu th ụ nước

và điện, những mạng nổi tiếng như "mạng thông minh (smart grid ou

réseaux intelligents )", nhờ vào các cảm biến trên mạng, có th ể cải thiện

công tác quản lý lưu lư ợng điện (sản lượng cung cấp, phân phối v.v.)

Khu vực tư nhân đã hư ởng lợi từ các dữ liệu trên là do đã ki ểm soát quy trình sản xuất Trong trư ờng hợp của các chính sách công còn có nh ững vấn

đề về bảo vệ quyền riêng tư và lợi ích chiến lược của một số dữ liệu trên đối với khu vực tư nhân, đặc biệt khi những dữ liệu ấy đụng đến tâm điểm ngành ngh ề của các doanh nghi ệp này Tuy nhiên không ph ải tất cả mọi dữ

liệu đều mang tính chi ến lư ợc Công ty Orange gần đây nêu trư ờng hợp của

các cảm biến khí tư ợng trên ăng-ten tiếp sóng của họ, được sử dụng để phân tích ch ất lư ợng không khí và như v ậy khả năng truy ền dẫn các tín

Trang 6

hiệu của họ Hoàn toàn có th ể xem xét việc cung cấp các kiểu thông tin như vậy

Ngày nay, chúng ta hy v ọng hình thành nh ững loại hình đ ối tác mới, đối tác-công-tư-cá nhân có kh ả năng thúc đẩy việc sử dụng các dữ liệu trên để phục vụ những dân cư nghèo nh ất Như Amina Mohammed, C ố vấn đặc biệt của Tổng thư ký Liên H ợp Quốc, nhắc nhở rằng hằng ngày, nhi ều người mất mạng vì h ọ đã không đư ợc tính đến

Thomas Roca

Ngày đăng: 30/12/2022, 07:16

w