Cựu kỹ sư Google tố Chính phủ Mỹ ‘bảo kê’ các cartel chuyên lấy dữ liệu người dùng rồi bán cho chính họ

30/05/2026 16:30

Một cáo buộc gây chấn động vừa được đưa ra từ ông Zach Vorhies, cựu kỹ sư Google từng nổi tiếng với vụ rò rỉ hàng trăm tài liệu nội bộ của gã khổng lồ tìm kiếm Mỹ. Cáo buộc được đưa ra sau khi lãnh đạo OpenAI tuyên bố: “Tương lai sẽ là nơi trí tuệ trở thành một tiện ích giống như điện hoặc nước, và mọi người sẽ mua nó từ chúng tôi theo mức sử dụng”.

Trong cuộc phỏng vấn độc quyền với hãng tin Nga RT ngày 29/5, ông Vorhies nhận định, Chính phủ Mỹ đang bảo vệ các “cartel dữ liệu” trong lĩnh vực trí tuệ nhân tạo (AI), cho phép những tập đoàn như OpenAI và Anthropic kiểm soát khối tri thức khổng lồ được thu thập từ Internet.

Theo ông, các công ty AI hàng đầu đã âm thầm thu thập gần như toàn bộ dữ liệu công khai của nhân loại từ thư viện, kho lưu trữ, diễn đàn trực tuyến và vô số nguồn thông tin khác, sau đó biến chúng thành tài sản độc quyền để bán lại cho chính những người đã tạo ra dữ liệu đó.

“Họ đã tải dữ liệu về cho riêng mình trước khi mọi người nhận ra điều gì đang diễn ra. Và ngay khi hoàn tất việc thu thập, họ đóng sập cánh cửa phía sau, ngăn các nhà nghiên cứu và các công ty khởi nghiệp cạnh tranh với họ”, ông Vorhies nói.

Người tố giác Zachary Vorhies nói chuyện với Project Veritas, tiết lộ Google đã đưa một số trang tin tức vào danh sách đen và có một ‘chương trình nghị sự biên tập’ riêng. Ảnh: Project Veritas.

“Trí tuệ trở thành một tiện ích giống như điện hoặc nước”

Những cáo buộc của ông Vorhies xuất hiện chỉ vài tuần sau khi Giám đốc điều hành OpenAI, ông Sam Altman, gây tranh cãi tại một sự kiện do BlackRock tổ chức ở Washington.

Tại đây, ông Altman mô tả tầm nhìn về tương lai mà ông gọi là “trí tuệ như một tiện ích công cộng”.

“Tương lai sẽ là nơi trí tuệ trở thành một tiện ích giống như điện hoặc nước, và mọi người sẽ mua nó từ chúng tôi theo mức sử dụng”, ông Altman phát biểu.

Đối với nhiều người, đó là dấu hiệu cho thấy một mô hình kinh doanh mới đang hình thành: các công ty AI thu thập dữ liệu miễn phí từ toàn bộ Internet, sau đó tính phí người dùng để tiếp cận lại nguồn tri thức đã được đóng gói trong các mô hình AI.

CEO OpenAI, ông Sam Altman, phát biểu tại Hội nghị thượng đỉnh Snowflake 2025 ở California, Mỹ ngày 2/6/2026. Ảnh: Getty Images.

“Thư viện Alexandria thời hiện đại đang bị thiêu rụi”

Ông Vorhies cho rằng, vai trò của Chính phủ Mỹ không chỉ dừng ở việc đứng ngoài quan sát.

Theo ông, Washington đang sử dụng hệ thống pháp lý để triệt tiêu những nền tảng cung cấp dữ liệu mở, qua đó củng cố vị thế độc quyền của các tập đoàn AI.

Ông dẫn chứng trường hợp Anna’s Archive, trang web tự nhận là “thư viện mở lớn nhất trong lịch sử nhân loại”, vừa bị buộc bồi thường hàng trăm triệu USD trong một vụ kiện liên quan việc thu thập dữ liệu. Trong khi đó, Z-Library, một trong những thư viện số lớn nhất thế giới, đã bị Cục Điều tra Liên bang Mỹ (FBI) đánh sập từ năm 2022.

Ông Vorhies không giấu được sự bức xúc: “Đây thực chất là những Thư viện Alexandria của thời đại chúng ta. Và hiện nay nước Mỹ đang đốt chúng thành tro bụi”.

Theo ông, việc các nguồn dữ liệu mở bị hạn chế trong khi các tập đoàn AI tiếp tục được tiếp cận lượng dữ liệu khổng lồ đã tạo ra một “độc quyền thông tin trên thực tế”.

Thư viện Alexandria là thư viện nổi tiếng nhất của thế giới cổ đại, được xây dựng vào khoảng thế kỷ III trước Công nguyên tại thành phố Alexandria thuộc Ai Cập ngày nay. Đây từng là trung tâm tri thức lớn nhất thời cổ đại, lưu giữ hàng trăm nghìn bản thảo về khoa học, triết học, toán học, thiên văn học và văn học từ khắp thế giới Địa Trung Hải. Sự suy tàn và phá hủy của Thư viện Alexandria được xem là một trong những tổn thất văn hóa lớn nhất lịch sử nhân loại, khiến nó trở thành biểu tượng cho sự mất mát của tri thức và di sản học thuật.

Trung Quốc nổi lên như đối thủ phá vỡ thế độc quyền

Tuy nhiên, ông Vorhies tin rằng, quyền lực của các tập đoàn AI Mỹ không phải bất khả chiến bại.

Ông cho rằng sự nổi lên của các công ty AI Trung Quốc như DeepSeek hay Qwen đang tạo ra sức ép cạnh tranh đáng kể đối với OpenAI và các đối thủ khác đến từ Mỹ.

Theo ông Vorhies, các doanh nghiệp Trung Quốc cũng đã tiếp cận và thu thập khối lượng dữ liệu tương tự các công ty Mỹ.

“Khi các cartel dữ liệu từ những quốc gia khác tham gia cuộc chơi, chi phí sẽ được kéo xuống thấp hơn. Tôi hy vọng đó là điều sẽ xảy ra”, ông nói.

Trong bối cảnh cuộc đua AI ngày càng mang màu sắc địa chính trị, cạnh tranh Mỹ-Trung không chỉ còn là cuộc chiến về chip bán dẫn hay siêu máy tính, mà đang chuyển thành cuộc chiến giành quyền kiểm soát nguồn tri thức số của nhân loại.

Các tập đoàn AI tiếp tục được tiếp cận lượng dữ liệu khổng lồ đã tạo ra độc quyền thông tin trên thực tế. Minh họa: Getty Images.

Bí mật bên trong các mô hình AI

Ông Vorhies cũng cảnh báo rằng, nguy cơ lớn nhất có thể không nằm ở dữ liệu được thu thập, mà ở cách dữ liệu đó bị xử lý bên trong các mô hình AI.

Ông nhắc lại kinh nghiệm của bản thân tại Google, nơi ông từng tiết lộ hơn 950 trang tài liệu nội bộ vào năm 2019. Các tài liệu này cho thấy Google đã sử dụng nhiều cơ chế để hạ thứ hạng hoặc hạn chế khả năng tiếp cận của một số trang web và nội dung bị xem là “không phù hợp”.

Theo ông Vorhies, điều tương tự hoàn toàn có thể xảy ra với các hệ thống AI thế hệ mới nếu chúng hoạt động như những “hộp đen” mà không chịu sự giám sát độc lập.

“Chúng ta cuối cùng sẽ phải mở những mô hình này ra và nhìn vào bên trong chúng”, ông nói. “Mọi người cần biết liệu chúng có thực sự công bằng hay không”.

Cuộc chiến mới: Ai sở hữu tri thức của nhân loại?

Những phát biểu của ông Vorhies phản ánh một cuộc tranh luận ngày càng gay gắt trong ngành công nghệ toàn cầu.

Một bên cho rằng các công ty AI cần quyền tiếp cận lượng dữ liệu khổng lồ để phát triển các mô hình ngày càng mạnh mẽ. Bên còn lại cảnh báo rằng nếu toàn bộ tri thức số của nhân loại bị tập trung vào tay một số ít tập đoàn, AI có thể trở thành hình thức độc quyền lớn nhất trong lịch sử Internet.

Và khi AI đang dần trở thành hạ tầng thiết yếu của thế kỷ XXI, câu hỏi không còn là ai tạo ra công nghệ tốt nhất.

Câu hỏi thực sự là: ai sẽ kiểm soát kho tri thức của nhân loại trong kỷ nguyên AI?

Các công ty AI thu thập dữ liệu miễn phí từ toàn bộ Internet, sau đó tính phí người dùng để tiếp cận lại nguồn tri thức đã được đóng gói trong các mô hình AI. Minh họa: Thái An/AI.