⠀
Chủ nghĩa thực dân dữ liệu: Dữ liệu đô hộ chúng ta như thế nào?
Chủ nghĩa thực dân dữ liệu (data colonialism) là khái niệm đằng sau quyển sách đồng tác giả của Nick Couldry và Ulises Mejias mang tên ‘Cái giá của sự kết nối: Dữ liệu đang thuộc địa hóa và chiếm đoạt cuộc sống con người như thế nào’ (The Costs of Connection: How Data is Colonizing Human Life and Appropriating It), xuất bản vào năm 2019. Khái niệm chủ nghĩa thực dân dữ liệu lập luận rằng chúng ta đang sống trong một kỷ nguyên đô hộ mới, một kỷ nguyên mà bạo lực và việc cướp đoạt cưỡng chế không còn là điều cần thiết để hiện thực thực dân có thể được thi hành. Liệu lập luận này có thuyết phục hay không, và nếu Couldry và Mejias đã nhận định đúng, thì chúng ta có thể làm gì để sống chung với hiện thực thực dân này?
Bắt đầu với dữ liệu: như thế nào là dữ liệu?
Chúng ta thường nghe ví von rằng dữ liệu là nguồn tài nguyên màu mỡ đang được khối khoa học công nghệ khai thác như thể nó là một nguồn “dầu mới” (the new oil), với hàm ý rằng dữ liệu là một nguồn tài nguyên tự nhiên có sẵn, cần được mang ra chuyển hóa thành các sản phẩm mang giá trị kinh tế. Trong một ví von khác, Giám đốc tài chính Ruth Porat của tập đoàn Google ví dữ liệu như là ánh nắng mặt trời khi phát biểu tại Diễn đàn Kinh tế Thế giới (WEF) vào năm 2019, chỉ một ngày sau khi Google bị các nhà cầm quyền Pháp phạt 57 triệu USD do vi phạm về quyền riêng tư người dùng. Ngụ ý của ví von này là ngược lại với tài nguyên dầu, dữ liệu sẽ không bao giờ cạn kiệt, và chúng ta có thể mặc sức khai thác dữ liệu mà không cần phải lo ngại rằng một ngày nào đó chúng ta sẽ bị cạn kiệt dữ liệu như cách mà chúng ta đang dần cạn kiệt nguồn tài nguyên dầu, hay là các khoáng sản tự nhiên khác. Như vậy, dữ liệu đến từ đâu, do ai tạo ra, và vì sao lại có nhiều cách ví von về dữ liệu mâu thuẫn với nhau đang cùng tồn tại trong cách mà chúng ta nói về dữ liệu?
Để giải quyết bài toán này thì trước hết chúng ta cần hiểu về tính đa chiều của dữ liệu. Hãy cùng nhau nhìn vào định nghĩa về dữ liệu mà Nick Couldry và Ulises Mejias đưa ra trong quyển sách của họ. Trong quyển ‘Cái giá của sự kết nối’, dữ liệu được định nghĩa là: “Các luồng thông tin, dưới mọi hình thức định dạng, được truyền từ đời sống con người đến các cơ sở hạ tầng thu thập và xử lý dữ liệu”.
Theo như định nghĩa này, thì dữ liệu có thể là hình ảnh dưới dạng file jpeg hay png, có thể là một dòng thông tin chữ viết lưu trong file Excel, hay là một video ngắn (hoặc dài) có định dạng mp4 hay mov. Cũng theo định nghĩa này thì vì dữ liệu được truyền từ đời sống con người đến các cơ sở hạ tầng thu thập và xử lý dữ liệu, chúng ta không thể nào tách rời đời sống của dữ liệu ra khỏi đời sống xã hội. Ngoài ra, dữ liệu luôn luôn mang tính chất vật lý. Dữ liệu luôn luôn được lưu trữ ở một nơi nào đó – và nơi mà dữ liệu được lưu trữ không phải là “đám mây” như ví von mà chúng ta thường nghe trong quảng cáo về “điện toán đám mây”, mà là các trung tâm lưu trữ dữ liệu được xây dựng hết sức tốn kém và yêu cầu nguồn nhân lực quản lý và bảo trì rất nghiêm ngặt. Các trung tâm này là một mạng lưới vật chất và con người phức tạp, bao gồm: các hệ thống lưu trữ; máy chủ; thiết bị chuyển mạch và bộ định tuyến; các yếu tố bảo mật thông tin như tường lửa, nguồn điện liên tục (UPS) – pin dự phòng, máy phát điện và nguồn điện dự phòng; hệ thống kiểm soát môi trường – máy điều hòa không khí để làm giảm nhiệt cho các thiết bị này; hệ thống an ninh vật lý – sinh trắc học và hệ thống giám sát video; và đặc biệt là các nhân viên vận hành – một nguồn nhân sự sẵn sàng giám sát hoạt động và bảo trì thiết bị và cơ sở hạ tầng này suốt ngày đêm.
Như vậy, khi nói về dữ liệu, chúng ta không thể nào tách dữ liệu khỏi cơ sở hạ tầng ngoại vi lưu trữ chúng, và cũng không thể nào tách rời dữ liệu ra khỏi mục tiêu tạo ra lợi nhuận vốn đã định sẵn trong các cấu trúc thu thập dữ liệu. Dữ liệu không hề tồn tại tự nhiên như dầu hay ánh nắng mặt trời, mà được cấu trúc tạo ra và thu hoạch một cách có hệ thống bởi lực lượng kinh doanh dữ liệu mà Nick Couldry và Ulises Mejias gọi tên là ngành định lượng xã hội (social quantification sector), ngành sản xuất đằng sau việc định lượng hóa xã hội đang ngày càng trở nên sâu rộng và mang tính lợi nhuận.
Ngành định lượng xã hội
Như vậy, ngành định lượng xã hội là gì, và ai là những thành phần chủ chốt trong nhóm ngành mới đang đóng vài trò thay đổi bộ mặt xã hội của chúng ta? Nick Couldry và Ulises Mejias định nghĩa ngành định lượng xã hội bao gồm ba nhóm tổ chức chính, đó là:
1. Các nhà sản xuất thiết bị kỹ thuật số nhằm phục vụ việc kết nối của con người (điện thoại, thiết bị, và ứng dụng thông minh như Alibaba, Baidu, Facebook, Google, WeChat
2. Các nhà môi giới dữ liệu và các tổ chức xử lý dữ liệu (Acxiom, Equifax, Palantir, TalkingData)
3. Các tổ chức/cơ quan phụ thuộc vào dữ liệu lấy từ đời sống xã hội để hoạt động (các doanh nghiệp hàng tiêu dùng (Tiki, Lazada), các tổ chức chính trị (chiến dịch tranh cử của Joe Biden hay Donald Trump tại Mỹ), các dịch vụ kỹ thuật số…).
Mỗi nhóm tổ chức trong ngành định lượng xã hội này có một vai trò và chức năng khác nhau trong bộ máy giúp tạo ra, lưu trữ, và quản lý dữ liệu; tuy nhiên, điểm chung của họ là bổ trợ cho nhau trong việc tạo nên một ảo giác về sự liền mạch của quá trình khai thác dữ liệu. Nếu chúng ta vén bức màn mỏng mà sự phối hợp của các tổ chức này tạo ra, chúng ta sẽ thấy có rất nhiều sự đứt gãy trong quá trình thu thập và lưu trữ dữ liệu. Một ví dụ cho luận điểm này là sự không đồng đều trong việc các nhà sản xuất thiết bị điện thoại thu thập dữ liệu từ người dùng. Theo một báo cáo nghiên cứu từ Đại học Trinity College Dublin ở Ireland vào tháng ba năm nay, Google thu thập dữ liệu từ người dùng thiết bị Android nhiều hơn Apple thu thập dữ liệu từ người dùng thiết bị iOS 20 lần. Nhóm nghiên cứu đã so sánh dữ liệu mà điện thoại Pixel chia sẻ với Google với dữ liệu iPhone chia sẻ với Apple và nhận thấy rằng Google thu thập dữ liệu điện thoại từ người dùng nhiều hơn 20 lần so với Apple.
Thế nhưng, loại dữ liệu mà hai công ty này thu thập từ người dùng lại khác nhau. Báo cáo cho biết rằng Apple bị phát hiện thu thập vị trí của người dùng ngay cả khi người dùng không đăng nhập vào Apple ID, cũng như thu thập địa chỉ IP cục bộ của người dùng, trong khi Google thì lại không thu thập các dữ liệu này. Ngược lại, Google cũng thu thập địa chỉ MAC Wi-Fi trong khi Apple thì không. Đặc biệt, trong vòng 10 phút sau khi người dùng bỏ SIM vào điện thoại và khởi động, Google thu thập khoảng 1MB dữ liệu trong khi Apple thu thập khoảng 42KB. Khi ở chế độ rảnh, tức là khi người dùng không sử dụng điện thoại, Google thu thập khoảng 1MB dữ liệu cứ sau 12 giờ trong khi Apple thu thập khoảng 52KB.
Một điều rất đáng lo ngại mà kết quả nghiên cứu này đã cho thấy đó là trên trung bình thì giá thành của iPhone đắt hơn rất nhiều so với điện thoại Pixel của Google. Như vậy, vô hình trung, chúng ta có hai thể chế dữ liệu cho người chi nhiều tiền hơn và người chi tiền ít hơn cho các thiết bị cần thiết cho việc họ tham gia vào xã hội số. Nói cách khác, nếu không trả bằng rất nhiều tiền để có thể mua được một thiết bị di động, thì chúng ta vẫn trả bằng rất nhiều dữ liệu của cá nhân mình mà các công ty sản xuất thiết bị kỹ thuật số đang lặng lẽ thu thập một cách mặc định. Kể cả điều này diễn ra một cách tự động, chúng không hề mang tính tự nhiên hoặc bất khả kháng: việc chúng ta phải “trả giá” bằng dữ liệu để có thể tham gia vào xã hội số là một trật tự xã hội mới được xây dựng trên nền tảng tư bản chủ nghĩa công nghệ mới, một trật tự xã hội dựa trên nguyên lý khai thác triệt để đến từng ngóc ngách đời sống của con người, mà dữ liệu chính là bước đệm trung gian.
Để mô tả chi tiết hơn về trật tự xã hội này, Couldry và Mejias đã xây dựng khái niệm quan hệ dữ liệu (data relations) nhằm mục đích bổ sung cho khái niệm quan hệ lao động (labour relations) của tư tưởng Marx. Quan hệ dữ liệu được định nghĩa là cách con người tương tác với nhau và với thế giới, được hiện thực hóa nhờ vào các công cụ kỹ thuật số. Mối quan hệ này khiến cho đời sống con người không chỉ bị chủ nghĩa tư bản chiếm dụng và trực tiếp khai thác lợi nhuận, mà còn bị chúng giám sát và quản trị liên tục. Quan hệ dữ liệu khoét rỗng (hollow out) không gian dành cho bản ngã của mỗi chúng ta, khiến chúng ta dần mất đi, và nghiêm trọng hơn nữa, là dần quên đi quyền tự do cá thể của chính mình. Chúng ta đang dần đánh mất việc một cá nhân có thể tự do tồn tại như một cá thể tự chủ trong xã hội, Couldry và Mejias lập luận, vì chúng ta đang chịu khuất phục bởi việc dữ liệu về chúng ta bị khai thác liên tục để nhằm tạo ra lợi nhuận cho khối ngành định lượng xã hội. Những dữ liệu này, ngoài ra, còn đang tạo ra một loại kiến thức mới về đời sống xã hội của chúng ta. Kiến thức này được gọi tên là “bộ nhớ đệm xã hội”.
Bộ nhớ đệm xã hội (social caching)
Bộ nhớ đệm xã hội được đinh nghĩa là một dạng kiến thức mới về đời sống xã hội, hình thành dựa trên việc thu thập và lưu trữ dữ liệu cá nhân với mục đích khai thác lợi nhuận về sau. Điểm mấu chốt của khái niệm này là việc dữ liệu thu thập tự động điện toán đã và đang được chuyển hóa thành những hiểu biết của chúng ta về xã hội, và chúng ta đang ngày càng lệ thuộc vào loại kiến thức mới này để cấu trúc cuộc sống và đưa ra quyết định về cuộc sống của chúng ta.
Để có thể hiểu về loại kiến thức xã hội mới này, chúng ta hãy cùng xem xét hai ví dụ thực tiễn. Ví dụ thứ nhất là ví dụ về sự phổ biến của các ứng dụng giúp giảm cân trên điện thoại. Các ứng dụng giúp giảm cân trên điện thoại có vai trò kép là đưa ra số lượng calorie mà bạn có quyền ăn trong một ngày sau khi bạn nhập các thông tin về chiều cao, cân nặng, tuổi tác, và yêu cầu bạn theo dõi lượng calorie mà bạn dung nạp hằng ngày bằng cách liên tục báo cáo ngược vào trong ứng dụng sau mỗi bữa ăn. Nếu ứng dụng yêu cầu tôi chỉ được dung nạp 1400 calorie một ngày thông qua những thông tin mà tôi đã cung cấp, có khả năng rất cao là tôi sẽ thực hiện điều này. Con số 1400 calorie này là một kiến thức xã hội về cá nhân tôi: những gì tôi ăn trong một ngày sẽ phải tuân theo những gì mà kiến thức này đã mách bảo tôi, và việc liệu tôi có tuân thủ theo đúng những gì mà kiến thức này đã mách bảo hay không sẽ tiếp tục bổ sung vào việc thay đổi kiến thức này: con số 1400 calorie có thể tăng lên hoặc giảm xuống tùy vào những dữ liệu về cân nặng và lượng calorie dung nạp hằng ngày mà tôi cung cấp ngược lại cho các ứng dụng này trong suốt quá trình mà tôi cố gắng giảm cân.
Trong suốt quá trình này, sự tương tác duy nhất diễn ra là giữa tôi và ứng dụng đang thuyết phục tôi rằng nó sẽ giúp tôi đạt được mục đích giảm cân của mình, thông qua trung gian là dữ liệu mà tôi liên tục cung cấp cho ứng dụng. Ngoài ra, nếu tôi mang theo điện thoại bên mình mỗi khi tôi chạy bộ hoặc tập thể dục, hoặc nếu tôi đầu tư hơn và mua cho mình một chiếc đồng hồ thông minh để đo lường số bước đi hoặc bước chạy của tôi hằng ngày, thì các ứng dụng giảm cân trên còn có thể tự động dùng những dữ liệu này để điều chỉnh những lời khuyên mà chúng đưa ra cho tôi. Và một lần nữa, thì khả năng rất cao là tôi sẽ tin và làm theo những lời khuyên mà chúng đưa ra, vì tôi tin vào loại kiến thức xã hội mà những ứng dụng này đang dạy cho tôi. Như vậy, khi tôi càng quen dần với việc theo dõi và báo cáo dữ liệu để quyết định xem tôi nên làm gì trong một ngày – ăn gì, uống gì, đi bao nhiêu bước – thì tôi càng dễ chấp nhận logic của sự theo dõi như là một cơ sở hạ tầng giúp tạo nên kiến thức về các mảng đời sống xã hội mà tôi vốn tin là tôi không có, hoặc có rất ít khả năng điều khiển.
Ví dụ thứ hai là ví dụ về ứng dụng hệ thống tín dụng xã hội (hay còn gọi là social credit system) của Trung Quốc, vốn đã được mang ra thử nghiệm ở nhiều tỉnh thành, với mục đích là định nghĩa lại như thế nào là công dân tốt và công dân xấu. Trung Quốc làm điều này bằng cách theo dõi các hoạt động như liệu bạn có trả tiền điện nước hằng tháng đúng hạn hay không, liệu có trả nợ ngân hàng đúng hạn hay không, liệu khi bạn dắt chó đi dạo thì bạn có đeo dây xích cho chó một cách cẩn thận hay không. Đây là một ví dụ thật từ thành phố Jinan, tỉnh Sơn Đông ở Trung Quốc, khi mà họ thử nghiệm theo dõi hành vi người nuôi chó ở nơi công cộng vào năm 2017. Mỗi một người nuôi chó được cho 12 điểm; mỗi khi họ quên xích chó ở nơi công cộng thì họ sẽ bị trừ 3 điểm, lần thứ hai tái phạm sẽ bị trừ 6 điểm kèm với tiền phạt, và đến khi bạn bị trừ hết 12 điểm thì chó của bạn sẽ bị chính phủ tịch thu. Nếu bạn quên gia hạn giấy phép được nuôi chó thì toàn bộ 12 điểm của bạn sẽ bị trừ ngay lập tức. Trong vòng một năm đưa ra chương trình này thì chính quyền của thành phố Jinan đã báo cáo là đã xử phạt hơn 1430 người nuôi chó, và đã tạm tịch thu 120 chú chó xấu số.
Như vậy, chúng ta có thể nhìn thấy rằng, lần đầu tiên trong lịch sử, có một loại kiến thức mới về xã hội của chúng ta đang được tạo ra mỗi ngày thông qua những dữ liệu được thu thập tự động bởi các đối tượng trong khối ngành định lượng xã hội, mà các nhóm ngành này có thể bao gồm cả đối tượng chính phủ. Có hai vấn đề đáng quan tâm chính mà Nick Couldry và Ulises Mejias lập luận về bộ nhớ đệm xã hội. Thứ nhất, họ lập luận rằng chúng ta không nên xem như việc các công ty thương mại và các cơ quan chính phủ liên tục lấy dữ liệu từ chúng ta và tạo ra kiến thức xã hội về chúng ta là một việc tự nhiên bất khả kháng. Bởi vì chúng không hề tự nhiên, và cũng không hề bất khả kháng. Thứ hai, họ lập luận rằng chúng ta nên mở rộng trí tưởng tượng xã hội của chúng ta để có thể cùng nhau tái cơ cấu quan hệ quyền lực giữa các công ty công nghệ, các tổ chức tạo ra kiến thức như là trường đại học, các cơ quan chính trị như là chính phủ, và chính những người sử dụng công nghệ để có thể kết nối với nhau, chính là chúng ta.
Chủ nghĩa thực dân dữ liệu: ngôn ngữ mới và cần thiết cho kỷ nguyên công nghệ?
Như vậy, đâu là tính thực dân của dữ liệu, và vì sao chúng ta cần phải hiểu về trật tự xã hội mới mà việc khai thác dữ liệu triệt để của khối định lượng xã hội bằng ngôn ngữ của chủ nghĩa thực dân? Vào năm 1950, Carl Schmitt đã viết trong lời tựa cuốn sách ‘Quy luật của Trái đất’ (The Nomos of the Earth), rằng chủ nghĩa thực dân “là một sự kiện lịch sử không thể lặp lại. Chỉ có thể trong một thế giới tưởng tượng hoang đường, người ta mới có thể hình dung ra một sự tái diễn của chủ nghĩa thực dân thời hiện đại, chẳng hạn như việc con người lên đường khám phá Mặt trăng, hay một hành tinh hoàn toàn mới nào đó, để họ có thể thỏa mãn tự do khai thác vùng đất mới này và giải tỏa cho những tranh đấu của họ trên Trái đất.” Dưới điều kiện của chủ nghĩa thực dân lịch sử, các nguồn tài nguyên lớn được khai thác triệt để nhằm mục đích chiết xuất giá trị kinh tế cho tầng lớp thực dân. Chúng ta đang nhìn thấy một logic tương tự được tái diễn với dữ liệu, được hiểu như là một nguồn tài nguyên vô hạn (ánh nắng mặt trời) và có thể mang lại nguồn lợi kinh tế lớn (dầu tự nhiên). Vậy, liệu có phải rằng Carl Schmitt đã sai, và Nick Couldry và Ulises Mejias đang muốn thuyết phục chúng ta bằng một lập luận mang tính tiếp diễn lịch sử?
Nếu chủ nghĩa thực dân trong lịch sử thôn tính lãnh thổ, tài nguyên, và chính sức lao động con người trên lãnh thổ và tài nguyên này, thì việc chiếm đoạt quyền lực của chủ nghĩa thực dân dữ liệu vừa đơn giản hơn, vừa sâu rộng hơn: việc chiếm đoạt và kiểm soát chính cuộc sống con người thông qua quá trình chiếm đoạt dữ liệu về họ diễn ra âm thầm, không cần dùng đến bạo lực, và đã sẵn sàng trong việc chuyển hóa đời sống con người thành lợi nhuận cho giới thực dân công nghệ mới. Dù nhiều chỉ trích về chủ nghĩa tư bản công nghệ có xu hướng tập trung vào vai trò của những gã khổng lồ kỹ thuật số tại Thung lũng Silicon, Couldry và Mejias cho rằng chúng ta cần phải suy nghĩ rộng hơn, kéo dài hệ tham chiếu lịch sử của chúng ta hơn, và đặc biệt chú ý đến vai trò của Trung Quốc trong trật tự xã hội mới này. Chủ nghĩa thực dân dữ liệu mở đường cho một giai đoạn mới của chủ nghĩa tư bản mà chúng ta chỉ mới bước vào giai đoạn sơ khai; tuy chúng ta không biết trước rằng liệu giai đoạn mới này sẽ phát triển ra sao và có hình hài cuối cùng như thế nào, chúng ta có thể “chẩn bệnh” cho trật tự xã hội mới này dựa trên cách mà nó đang hoạt động: bằng sự khai thác lợi nhuận và bóc lột đời sống con người vô hạn.
Kháng cự chủ nghĩa thực dân dữ liệu – làm thế nào để đời sống con người trở nên “đáng sống” hơn dưới hiện thực thực dân dữ liệu?
Sau khi đưa ra nhận định rằng chủ nghĩa tư bản đương đại được đặc trưng bởi một dạng chủ nghĩa thực dân dữ liệu mới, Couldry và Mejias chuyển sang thảo luận về câu hỏi cấp bách là làm thế nào để thách thức và chống lại hiện thực thực dân đáng lo ngại này. Trong phần cuối của cuốn sách, trong chương “Tái kết nối”, hai tác giả lập luận rằng chúng ta cần phản đối việc thực hành và bình thường hóa chủ nghĩa thực dân dữ liệu trong cuộc sống hằng ngày. Dựa trên công trình trước đó của Mejias về tính “siêu giao điểm” (paranodal), hai tác giả ủng hộ chủ trương “đứng về một phía của các giao điểm kết nối kỹ thuật số… giữ vững vị trí ở bên ngoài mạng lưới xã hội số ngay cả khi vẫn chính thức ở bên trong nó”, để có thể phát triển những cách hiểu và hành động mới đối với chủ nghĩa thực dân dữ liệu. Sự phản kháng này có thể bao gồm việc hợp tác với nhiều đối tượng xã hội khác nhau để có thể xây dựng các giải pháp thay thế cho chủ nghĩa thực dân dữ liệu, thông qua các hoạt động như chiến dịch giáo dục kỹ năng thông tin và kỹ năng dữ liệu, hỗ trợ luật thúc đẩy quyền riêng tư dữ liệu, và tẩy chay việc tham gia vào các nền tảng mạng xã hội, chẳng hạn như Facebook. Ngoài ra, hai tác giả còn khuyến khích từng quốc gia cần phải dựa vào lịch sử chống thực dân của chính họ để có thể đưa ra những bài học chống thực dân dữ liệu phù hợp nhất.
Bằng cách đặt dữ liệu vào trong lịch sử lâu dài hơn về việc các thế lực thực dân chiếm đoạt lãnh thổ và tài nguyên thiên nhiên trên quy mô toàn cầu, khái niệm chủ nghĩa thực dân dữ liệu là thành quả của việc Nick Couldry và Ulises Mejias tìm cách giải quyết một cách hiệu quả hơn những vấn đề không bền vững về tính bành trướng của chủ nghĩa giám sát thông qua các hoạt động tiếp thị, trí tuệ nhân tạo, và internet vạn vật. Nói cách khác, can thiệp lý thuyết của hai tác giả trong khái niệm này giúp chúng ta nhận ra những thiếu sót của các phương pháp tiếp cận pháp lý và phê bình pháp lý hiện tại, giúp mở ra một điểm xuất phát phê bình rộng rãi và đầy đủ hơn. Gắn liền những phát triển hiện thời của dữ liệu với khái niệm lịch sử chủ nghĩa thực dân có thể sẽ giúp chúng ta nhìn nhận thấu đáo hơn về hiện thực xã hội mang đầy những hậu quả khó lường này.
Theo NGUYỄN HỒNG HẢI ĐĂNG / TẠP CHÍ TIA SÁNG
Tags: Tư bản, Thế giới số, Công nghệ, Chủ nghĩa đế quốc, Bảo mật