Đi tìm căn nhà cho thế giới khổng lồ của Byte

Sự ra đời của linh kiện bán dẫn và vi mạch tích hợp những năm 1950 đã đưa xã hội loài người hiện đại lên một tầm cao mới.

Đi tìm căn nhà cho thế giới khổng lồ của Byte

Hơn sáu thập kỷ sau đó, chúng ta liên tiếp chứng kiến những “cơn sóng thần” công nghệ, trải nghiệm nhiều đột phá khoa học quan trọng, mở đường cho thời đại 4.0 với sự lên ngôi của công nghệ không dây. Trong đó, đáng phải nhắc tới dấu mốc 1996 khi “sự kiện chuyển tiếp” đã thay đổi hoàn toàn phương thức chúng ta lưu trữ dữ liệu.

Từ giấy đến dữ liệu số

Nhà nghiên cứu Melvin Vopson lật tới chương 5 cuốn “Trang viên Mansfield” của Jane Austen. Tác phẩm nhiều tham vọng nhất của nữ văn sĩ người Anh khiến anh cảm thấy nhiều hoài niệm. Văn học không chỉ đem lại xúc cảm đa chiều cho Vopson; với anh, những cuốn sách tựa sứ giả thời gian, ẩn chứa nhiều dấu ấn quan trọng trên con đường phát triển của nhân loại, là phương thức giúp con người lưu trữ thông tin. Vopson nhìn kỹ bức ảnh chụp bản gốc “Trang viên Mansfield”, tâm trí bị khuấy động bởi những con chữ màu đen, in trên nền giấy trắng, xuất bản cách đây hai thế kỷ.

Thời điểm đó, con người đã sáng chế ra máy in chạy bằng hơi nước, cho phép in ấn với tốc độ ấn tượng 1.100 trang/giờ, rồi tiếp tục được cải tiến để có thể in lên cả hai mặt tờ giấy. “Ông tổ nghề in” thế kỷ 15, JulianGutenberg, hẳn sẽ rất tự hào khi biết thế hệ sau đã nâng cấp công nghệ in ấn gần như không thay đổi trong suốt 300 năm, cho phép sản xuất hàng loạt sách báo và phổ biến kiến thức nhanh chóng trên toàn cầu.

Quay ngược về quá khứ, hàng triệu năm trước đây bản thân tổ tiên của chúng ta cũng biết cách để lại “thông điệp quá khứ” cho hậu thế. Người cổ đại vẽ từng hình thù lạ lẫm lên hang động, với niên đại lên tới 40.000-50.000 năm. Cho đến thời điểm ngôn ngữ và chữ viết xuất hiện, con người sử dụng nhiều dạng thức viết tay để ghi lại mọi biến động cuộc sống, các lễ nghi hay thậm chí dự báo tương lai cho con cháu. Giấy ra đời như một kết quả tất yếu, trở thành phương tiện lưu trữ thông tin độc đáo, tạo nền móng cho cả một ngành công nghiệp xuất bản.

Một thiên niên kỷ, sách thống trị loài người, là “cái kho tri thức” như lời Melvin Vopson miêu tả. Mãi cho tới năm 1996, lưu trữ số, sau vài chục năm “thăng tiến” nhờ hàng loạt phát minh về công cụ lưu trữ dữ liệu, đã soán ngôi sách giấy, trở thành chỗ dựa cho chúng ta cất giấu hàng tỷ dung lượng thông tin cho đến tận bây giờ. Vẫn còn nhiều tranh cãi về thành tựu công nghệ hiện đại quan trọng nhất, nhưng Vopson tin vào quan điểm của đa số nghiên cứu: điện tử số là “chìa khóa” mở ra cánh cửa lưu trữ thông tin thời đại mới.

Thay đổi diễn ra chóng mặt. Cách đây tầm chục năm, mấy cô cậu sinh viên 8X còn loay hoay với bộ nhớ từ (HDD) dung lượng lớn, mày mò lắp ghép cây máy tính để bàn rồi khoe với chúng bạn. Melvin Vopson không ngoại lệ, anh bị cuốn vào trò chơi “ai tải nhiều phim nhất”, tìm khắp nơi để sưu tầm đĩa quang như CD, DVD hay Blu-Ray. Sách khi ấy không thể giữ lại nhiều thông tin như bộ nhớ, nên Vopson thậm chí phát cuồng bởi bộ nhớ bán dẫn bên trong ổ SSD và USB, sao chép trò chơi và hình ảnh để giải trí mỗi ngày.

Ký ức về thế giới vô hình của byte (đơn vị lưu trữ dữ liệu cho máy tính viết tắt là B) dần định hình trong tâm trí mỗi người. Byte bao quanh chúng ta bằng máy tính, điện thoại hay các thiết bị đeo thông minh. Không ai ngăn byte ngừng lớn. Theo ước tính, mỗi ngày chúng ta viết ra 500 triệu dòng tweet, gửi đi 300 tỷ email, tạo ra 4 triệu gigabyte dữ liệu Facebook, và tải lên Youtube gần 800.000 giờ nội dung mới.

Năm 2020, con người “sở hữu” 59 zettabytes (ZB) dữ liệu, và 5 năm nữa con số này sẽ đạt mức 175ZB. Con số này thật khủng khiếp: 1ZB tương đương 1021B, và mỗi byte tựa một đồng xu dày cỡ 0,3mm thì 1ZB sẽ dài chừng… hơn 3.000 năm ánh sáng, đủ để xây đường cho chúng ta phi xe hơi đến chòm sao Alpha Centauri gần nhất với Hệ Mặt trời của Trái Đất. Rõ ràng, hang động hay sách báo chẳng thế lưu nổi khối lượng dữ liệu khổng lồ đến vậy.

Chuyên gia Thomas Swift tiết lộ con người hiện đại phải tìm đến ba “địa điểm” quan trọng của kỷ nguyên thông tin. Đầu tiên, một tập hợp toàn cầu các thiết bị đầu cuối dữ liệu, kết nối tất cả hệ thống mạng Internet, máy tính, điện thoại cùng thiết bị lưu trữ. Tiếp đó, xuất hiện các phần thiết bị dùng để truyền dữ liệu, tạo nên mạng lưới cơ sở hạ tầng trung gian như văn phòng, ngân hàng, nhà máy hay trường học. Điều quan trọng nhất nằm ở “địa điểm” thứ ba: vùng trung tâm dữ liệu, bao gồm máy chủ cơ sở dữ liệu truyền thống và trung tâm dữ liệu đám mây.

Không có quá nhiều thông tin về các “đầu não” lưu trữ dữ liệu số, chỉ biết rằng có khoảng 600 “quái vật khổng lồ” hyperscale (trung tâm dữ liệu có công suất 10.000 MgW) trên khắp thế giới, trong đó gần 50% đặt tại Mỹ, còn Trung Quốc, Nhật Bản, Anh, Đức và Úc chiếm chừng 30%. Cứ hai năm sẽ có thêm 100 trung tâm dữ liệu mới, vì vậy sau 150 năm, thế giới byte sẽ đạt ngưỡng không thể đếm nổi, vượt qua tổng số nguyên tử trên Trái Đất.

Kho lưu trữ siêu nhỏ

Lưu trữ sẽ tiến xa tới đâu, Melvin Vopson không thể trả lời. Thời thơ ấu anh vui thích với những trang giấy thì giờ đây, đứa con gái lại không thể rời mắt khỏi chiếc ipad đầy hình ảnh. Ngay cả tác phẩm của Jane Austen cũng có thể đọc trên mạng, vốn là điều không thể từ trước những năm 2000. Sách báo không còn là lựa chọn tối ưu, theo thời gian mực sẽ phai, còn giấy thì nhàu nát. Trong khi đó, dữ liệu số ngày càng gia tăng, và giới chuyên gia đùa rằng nếu ai đó cố gắng tải xuống toàn bộ thông tin “trên mây” bằng tốc độ Internet hiện giờ, họ sẽ phải làm liên tục trong… hai tỉ năm.

Thomas Swift từng bày tỏ quan ngại về khả năng quá tải ở các trung tâm lưu trữ dữ liệu trên toàn cầu, vốn sử dụng băng từ lưu giữ tín hiệu. Dường như cải tiến về phần cứng và phần mềm vẫn chưa đủ, trong bối cảnh yêu cầu cần phải gia tăng tốc độ xử lý, đồng thời nhiều dụng cụ lưu trữ hiện nay tỏ ra kém hiệu quả. Swift nhắc lại lý thuyết “nút thắt cổ chai” – điểm tắc nghẽn trong quy trình lưu trữ thông tin hiện đại, khi mà khối lượng đầu vào quá khủng khiếp, dần vượt quá khả năng xử lí của thiết bị.

Nếu một dự tính về khoa học sụp đổ, bản tính con người là xoay tìm cái khác. Cuộc đua tìm kiếm “nơi trú ẩn” cho dữ liệu hướng đến những căn nhà siêu nhỏ. Cách đây vài năm, Thomas Swift đề xuất sử dụng ADN làm cỗ máy lưu trữ thông tin. Chúng ta bị sốc khi biết rằng 1 gam ADN có thể “ôm” tới 10 triệu gigabyte (GB), tương đương 1 muỗng cà phê chứa toàn bộ nội dung trên Youtube – một trong những thế lực thống trị Internet. ADN tồn tại nửa triệu năm nếu được bảo quản đúng cách, bền vô đối nếu so sánh với giấy hay mực in, không gian siêu rộng và không cồng kềnh như các cỗ máy chủ.

Tất nhiên, Thomas Swift nhận được nhiều ánh mắt hoài nghi với ý nghĩ rất khó để can thiệp hoàn toàn vào vật chất di truyền. Một ý tưởng độc đáo, nhưng không hề đơn giản, đòi hỏi năng lực bảo quản hoàn hảo, vô cùng đắt đỏ và nghiên cứu chuyên sâu nếu muốn khai thác tối đa tiềm năng lưu trữ của ADN. Giới khoa học đang tính đến việc thử nghiệm kỹ thuật CRISPR để giúp ADN dễ dàng lưu trữ thông tin hơn vào một ngày nào đó, nhưng “ngày nào đó” vẫn còn rất xa vời.

Trong một buổi học, Melvin Vopson đặt câu hỏi “cái gì sống lâu nhất?”, và nhận được câu trả lời đầy bất ngờ từ sinh viên: đồ nhựa. Nhựa tổng hợp hiện đại ra đời vào khoảng hơn 100 năm trước, có thể “thọ” hơn cả ADN. Anh nghĩ tới viễn cảnh ứng dụng các hợp chất cao phân tử polymer để chứa từng byte thông tin bên trong mỗi đơn phân, như thể mỗi căn chung cư có một gia đình nhỏ tạo nên cả một toà nhà rộng lớn. Polymer cho khoa học nhiều hơn bốn đơn phân A, U, G, X cấu thành ADN, lọt vào “mắt xanh” của giới công nghệ.

Dễ sản xuất, siêu bền, cộng với giá thành rẻ, polymer được kì vọng tăng năng lực chứa dữ liệu cho loài người theo cấp số nhân. Thành công bước đầu vô cùng ấn tượng khi nhóm nghiên cứu đại học Texas (Austin) mã hóa thành công dòng văn của Jane Austen lên một phân tử nhựa. Các chuỗi đơn phân liên kết với nhau tương tự các chữ cái, chữ càng dùng nhiều thì đơn phân mã hóa càng phổ biến để hạ giá thành. Điều này cho phép Melvin Vopson gặp lại những ngôn từ khiến anh hoài niệm “nếu một dự tính về hạnh phúc sụp đổ, bản tính con người là xoay tìm cái khác” ở một mẩu nhựa, thay vì trên giấy trắng hay mạng Internet.

Có thể ban đầu, chúng ta chỉ nghĩ tới việc sản xuất nhựa hàng loạt để đựng vật chất lớn như nước uống hay đồ ăn. Sự linh hoạt của các chuỗi polymer dần trở thành một phần thiết yếu của cuộc sống, cùng với tiến bộ của công nghệ cho phép khoa học kiểm soát các đơn phân để tạo nên các polymer theo ý muốn. Rõ ràng, chúng ta hoàn toàn có cơ hội mã hóa dữ liệu lên từng chuỗi phân tử tựa ADN, thậm chí tận dụng công nghệ di truyền để khai thác “căn nhà” polymer khổng lồ, giúp chứa hàng tỷ GB thông tin của tương lai.

Phiên bản giấy của “Trang viên Mansfield” sẽ phai dần theo năm tháng, nhưng một phần của tác phẩm ấy vẫn còn lưu lại trên những chuỗi polymer tồn tại hàng thế kỷ. Chúng ta loay hoay tìm cách lưu giữ tri thức cho con cháu, trải qua nhiều thử nghiệm để chạm tới cách thức hoàn hảo nhất. Suy cho cùng, như Jane Austen đã viết, “nếu tính toán ban đầu là sai, thì chúng ta làm lần thứ hai tốt hơn, khi ấy chúng ta sẽ tìm thấy nguồn an ủi sau cuối…”

Theo LÊ NAM / AN NINH THẾ GIỚI

Tags: ,