DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

25/04/2026 12:30

Với sự ra mắt của DeepSeek V4, các công cụ AI đang chứng kiến mức giảm giá mạnh mẽ trong khi hiệu năng và khả năng xử lý vẫn được cải thiện đáng kể.

DeepSeek chính thức phát hành và mở mã nguồn phiên bản xem trước của dòng model mới DeepSeek V4 vào ngày 24 tháng 4, gồm hai phiên bản Pro và Flash. Đây là động thái đáng chú ý khi diễn ra chỉ một ngày sau khi OpenAI ra mắt GPT-5.5, nhưng hai sản phẩm có chiến lược định giá hoàn toàn trái ngược nhau.

Trong khi GPT-5.5 được bán với giá 30 USD mỗi triệu token đầu ra, trong khi DeepSeek V4 được phát hành theo giấy phép MIT hoàn toàn miễn phí, cho phép nhà phát triển tải xuống, chạy cục bộ và chỉnh sửa mã nguồn.

Về mặt định giá dịch vụ API, DeepSeek V4-Pro có giá 3,48 USD mỗi triệu token đầu ra, chỉ bằng khoảng 1/8 so với GPT-5.5. Một nhà phát triển tên Enrico nhận xét rằng DeepSeek V4 "thực sự ấn tượng, nhanh và thông minh", tuy nhiên ông cho rằng mức giá 3,48 USD vẫn "không rẻ" nhưng tin rằng LocalAI sẽ giúp phổ biến model này đến nhiều người dùng hơn.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 1.

Chi phí API của DeepSeek V4 chỉ 3,48 USD cho 1 triệu token, rẻ bằng 1/8 GPT-5.5 của OpenAI 

Sự chênh lệch giá khổng lồ này buộc mọi công ty sản phẩm AI phải đánh giá lại cấu trúc lợi nhuận của mình, khi ngưỡng chi phí cho trí thông minh AI vừa bị sụp đổ.

Về hiệu năng, DeepSeek định vị V4-Pro là phiên bản hàng đầu với khả năng cạnh tranh với các model thương mại đóng nguồn tốt nhất. Trong đánh giá toán học, khoa học kỹ thuật và lập trình thi đấu, V4-Pro tuyên bố vượt qua tất cả các model mã nguồn mở hiện có.

Về kiến thức toàn cầu, V4-Pro vượt xa các model mã nguồn mở khác, chỉ thua nhẹ so với Gemini Pro 3.1 của Google. Điểm đáng chú ý là khả năng Agent của V4-Pro đã được cải thiện rõ rệt so với thế hệ trước, đạt mức cao nhất trong các model mã nguồn mở hiện nay.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 2.

Thông số hiệu năng ngang ngửa với các mô hình AI hàng đầu thế giới hiện nay

Thông tin nội bộ từ DeepSeek tiết lộ rằng V4 đã trở thành model lập trình AI được nhân viên công ty sử dụng trong công việc hàng ngày. Theo phản hồi từ người dùng nội bộ, trải nghiệm của V4 vượt qua Claude Sonnet 4.5, với chất lượng đầu ra gần bằng Opus 4.6 ở chế độ không suy luận sâu.

Tuy nhiên, ở chế độ suy luận sâu, V4 vẫn thua Opus 4.6. Đây là tín hiệu quan trọng cho thấy khoảng cách công nghệ giữa DeepSeek và các gã khổng lồ phương Tây đang thu hẹp nhanh chóng, mặc dù vẫn chưa hoàn toàn bằng nhau ở các tác vụ phức tạp nhất.

Phiên bản V4-Flash được định vị là lựa chọn nhẹ hơn, nhanh hơn và tiết kiệm chi phí hơn. So với V4-Pro, Flash có hiệu năng thấp hơn một chút về kiến thức toàn cầu nhưng khả năng suy luận tương đương. Nhờ quy mô tham số và kích hoạt nhỏ hơn, dịch vụ API của Flash có ưu thế rõ rệt về tốc độ và chi phí.

Trong đánh giá về Agent, V4-Flash hoạt động ngang ngửa V4-Pro ở các tác vụ đơn giản nhưng có khoảng cách ở các tác vụ khó. Điều này khiến V4-Flash phù hợp hơn cho các kịch bản ứng dụng doanh nghiệp nhạy cảm về độ trễ và chi phí, với độ phức tạp nhiệm vụ ở mức trung bình.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 3.

Hiệu năng Agent của DeepSeek V4 

Về mặt kỹ thuật, DeepSeek V4 giới thiệu một cơ chế attention hoàn toàn mới ở tầng kiến trúc nền tảng. Công ty thực hiện nén trên chiều token, kết hợp với công nghệ attention thưa riêng có tên DSA (DeepSeek Sparse Attention), cho phép đạt được khả năng xử lý ngữ cảnh dài hàng đầu thế giới trong khi giảm đáng kể yêu cầu về tài nguyên tính toán và bộ nhớ GPU so với phương pháp truyền thống.

Kết quả trực tiếp của cải tiến kiến trúc này là cửa sổ ngữ cảnh 1 triệu token sẽ trở thành tiêu chuẩn trên tất cả dịch vụ chính thức của DeepSeek. Đối với người dùng doanh nghiệp cần xử lý tài liệu dài, hội thoại kéo dài hoặc các tác vụ nhiều bước phức tạp, việc phổ biến khả năng này có ý nghĩa thực tiễn đáng kể.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 4.

Cả 2 phiên bản DeepSeek V4 pro và flash đều hỗ trợ cửa sổ ngữ cảnh 1 triệu token

DeepSeek cho biết dòng V4 đã trải qua quá trình thích ứng và tối ưu hóa chuyên biệt cho các sản phẩm Agent chính thống như Claude Code, OpenClaw, OpenCode và CodeBuddy, mang lại cải thiện hiệu năng trong các tác vụ liên quan đến code và tạo tài liệu.

Ở cấp độ API, cả hai model đều có độ dài ngữ cảnh tối đa 1 triệu token, hỗ trợ cả chế độ không suy luận và chế độ suy luận sâu. DeepSeek khuyến nghị bật chế độ suy luận sâu và đặt cường độ ở mức tối đa cho các kịch bản Agent phức tạp.

Một câu hỏi lớn xung quanh việc phát hành DeepSeek V4 là chip nào được sử dụng để huấn luyện. Huawei xác nhận vào hôm thứ Sáu rằng cụm tính toán AI mới nhất của họ, chạy trên bộ xử lý AI Ascend, có thể hỗ trợ model V4 của DeepSeek. Tuy nhiên, vẫn chưa rõ chip của Huawei được sử dụng rộng rãi đến mức nào trong quá trình huấn luyện so với chip của NVIDIA.

DeepSeek cũng tiết lộ rằng do bị hạn chế về nguồn cung sức mạnh tính toán cao cấp, thông lượng hiện tại của phiên bản Pro rất hạn chế, nhưng dự kiến giá của phiên bản Pro sẽ giảm đáng kể vào nửa cuối năm sau khi Huawei Ascend 950 được tung ra thị trường hàng loạt.