DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

Với sự ra mắt của DeepSeek V4, các công cụ AI đang chứng kiến mức giảm giá mạnh mẽ trong khi hiệu năng và khả năng xử lý vẫn được cải thiện đáng kể.

DeepSeek chính thức phát hành và mở mã nguồn phiên bản xem trước của dòng model mới DeepSeek V4 vào ngày 24 tháng 4, gồm hai phiên bản Pro và Flash. Đây là động thái đáng chú ý khi diễn ra chỉ một ngày sau khi OpenAI ra mắt GPT-5.5, nhưng hai sản phẩm có chiến lược định giá hoàn toàn trái ngược nhau.

Trong khi GPT-5.5 được bán với giá 30 USD mỗi triệu token đầu ra, trong khi DeepSeek V4 được phát hành theo giấy phép MIT hoàn toàn miễn phí, cho phép nhà phát triển tải xuống, chạy cục bộ và chỉnh sửa mã nguồn.

Về mặt định giá dịch vụ API, DeepSeek V4-Pro có giá 3,48 USD mỗi triệu token đầu ra, chỉ bằng khoảng 1/8 so với GPT-5.5. Một nhà phát triển tên Enrico nhận xét rằng DeepSeek V4 "thực sự ấn tượng, nhanh và thông minh", tuy nhiên ông cho rằng mức giá 3,48 USD vẫn "không rẻ" nhưng tin rằng LocalAI sẽ giúp phổ biến model này đến nhiều người dùng hơn.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 1.

Sự chênh lệch giá khổng lồ này buộc mọi công ty sản phẩm AI phải đánh giá lại cấu trúc lợi nhuận của mình, khi ngưỡng chi phí cho trí thông minh AI vừa bị sụp đổ.

Về hiệu năng, DeepSeek định vị V4-Pro là phiên bản hàng đầu với khả năng cạnh tranh với các model thương mại đóng nguồn tốt nhất. Trong đánh giá toán học, khoa học kỹ thuật và lập trình thi đấu, V4-Pro tuyên bố vượt qua tất cả các model mã nguồn mở hiện có.

Về kiến thức toàn cầu, V4-Pro vượt xa các model mã nguồn mở khác, chỉ thua nhẹ so với Gemini Pro 3.1 của Google. Điểm đáng chú ý là khả năng Agent của V4-Pro đã được cải thiện rõ rệt so với thế hệ trước, đạt mức cao nhất trong các model mã nguồn mở hiện nay.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 2.

Thông tin nội bộ từ DeepSeek tiết lộ rằng V4 đã trở thành model lập trình AI được nhân viên công ty sử dụng trong công việc hàng ngày. Theo phản hồi từ người dùng nội bộ, trải nghiệm của V4 vượt qua Claude Sonnet 4.5, với chất lượng đầu ra gần bằng Opus 4.6 ở chế độ không suy luận sâu.

Tuy nhiên, ở chế độ suy luận sâu, V4 vẫn thua Opus 4.6. Đây là tín hiệu quan trọng cho thấy khoảng cách công nghệ giữa DeepSeek và các gã khổng lồ phương Tây đang thu hẹp nhanh chóng, mặc dù vẫn chưa hoàn toàn bằng nhau ở các tác vụ phức tạp nhất.

Phiên bản V4-Flash được định vị là lựa chọn nhẹ hơn, nhanh hơn và tiết kiệm chi phí hơn. So với V4-Pro, Flash có hiệu năng thấp hơn một chút về kiến thức toàn cầu nhưng khả năng suy luận tương đương. Nhờ quy mô tham số và kích hoạt nhỏ hơn, dịch vụ API của Flash có ưu thế rõ rệt về tốc độ và chi phí.

Trong đánh giá về Agent, V4-Flash hoạt động ngang ngửa V4-Pro ở các tác vụ đơn giản nhưng có khoảng cách ở các tác vụ khó. Điều này khiến V4-Flash phù hợp hơn cho các kịch bản ứng dụng doanh nghiệp nhạy cảm về độ trễ và chi phí, với độ phức tạp nhiệm vụ ở mức trung bình.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 3.

Về mặt kỹ thuật, DeepSeek V4 giới thiệu một cơ chế attention hoàn toàn mới ở tầng kiến trúc nền tảng. Công ty thực hiện nén trên chiều token, kết hợp với công nghệ attention thưa riêng có tên DSA (DeepSeek Sparse Attention), cho phép đạt được khả năng xử lý ngữ cảnh dài hàng đầu thế giới trong khi giảm đáng kể yêu cầu về tài nguyên tính toán và bộ nhớ GPU so với phương pháp truyền thống.

Kết quả trực tiếp của cải tiến kiến trúc này là cửa sổ ngữ cảnh 1 triệu token sẽ trở thành tiêu chuẩn trên tất cả dịch vụ chính thức của DeepSeek. Đối với người dùng doanh nghiệp cần xử lý tài liệu dài, hội thoại kéo dài hoặc các tác vụ nhiều bước phức tạp, việc phổ biến khả năng này có ý nghĩa thực tiễn đáng kể.

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6- Ảnh 4.

DeepSeek cho biết dòng V4 đã trải qua quá trình thích ứng và tối ưu hóa chuyên biệt cho các sản phẩm Agent chính thống như Claude Code, OpenClaw, OpenCode và CodeBuddy, mang lại cải thiện hiệu năng trong các tác vụ liên quan đến code và tạo tài liệu.

Ở cấp độ API, cả hai model đều có độ dài ngữ cảnh tối đa 1 triệu token, hỗ trợ cả chế độ không suy luận và chế độ suy luận sâu. DeepSeek khuyến nghị bật chế độ suy luận sâu và đặt cường độ ở mức tối đa cho các kịch bản Agent phức tạp.

Một câu hỏi lớn xung quanh việc phát hành DeepSeek V4 là chip nào được sử dụng để huấn luyện. Huawei xác nhận vào hôm thứ Sáu rằng cụm tính toán AI mới nhất của họ, chạy trên bộ xử lý AI Ascend, có thể hỗ trợ model V4 của DeepSeek. Tuy nhiên, vẫn chưa rõ chip của Huawei được sử dụng rộng rãi đến mức nào trong quá trình huấn luyện so với chip của NVIDIA.

DeepSeek cũng tiết lộ rằng do bị hạn chế về nguồn cung sức mạnh tính toán cao cấp, thông lượng hiện tại của phiên bản Pro rất hạn chế, nhưng dự kiến giá của phiên bản Pro sẽ giảm đáng kể vào nửa cuối năm sau khi Huawei Ascend 950 được tung ra thị trường hàng loạt.

Bình luận

ĐỐI TÁC

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

Với sự ra mắt của DeepSeek V4, các công cụ AI đang chứng kiến mức giảm giá mạnh mẽ trong khi hiệu năng và khả năng xử lý vẫn được cải thiện đáng kể.

TIN TỨC

Chuyển khoản thành công 499.000.000 đồng vào tài khoản, người phụ nữ SN 1976 phải trình báo công an

Bên trong những biệt thự thông minh của giới siêu giàu: Khi AI định nghĩa lại khái niệm sống xa xỉ!

Nhân viên Google tự tay làm tool AI giúp dùng Gmail và Drive ngon hơn, lãnh đạo khen rầm rộ rồi bị sa thải

Tin cực vui: Google đã chính thức cho phép đổi tên địa chỉ Gmail cho tất cả người Việt Nam - Vào làm ngay

THIẾT BỊ SỐ

Đông đảo tín đồ công nghệ mang Ultra cũ đổi Oppo Find X9 Ultra ở TGDĐ

Mức giá gây sốc của iPhone 18 Pro

Tin vui cho người muốn mua iPhone Air

Apple có thể gây bất ngờ

NGHE-NHÌN

Kinh nghiệm mua xe máy thông minh và tiết kiệm dịp Tết 2024

Yamaha NVX 155 VVA 2024 trình làng, thêm nhiều màu mới ấn tượng

Trình làng xe máy điện Vida V1 Plus - đối thủ sẽ khiến Honda Vision phải "đau đầu"

Hãng công nghệ Apple dừng dự án xe điện vì lý do gì?

XE 360

Đại gia Sài Gòn chi triệu USD mua siêu xe Lamborghini Revuelto màu độc

Ô tô van Toyota Hiace 32 năm tuổi vẫn gây sốt vì có cả phòng tắm trên xe

Bộ phận ô tô đắt tiền bị đánh cắp nhiều nhất, trộm nhắm nhiều ở xe hybrid

Va chạm giao thông, cửa sổ trời toàn cảnh có gây nguy hiểm cho người ngồi trong?

ĐỜI SỐNG

Mẫu iPhone mới đáng trông đợi của Apple

Phát hiện GPS trên khắp châu Âu có tình trạng lạ: Chuyên gia xác minh, nguyên nhân có liên quan đến Nga

iPhone 18 Pro có thể tăng thêm 200 USD, CEO Tim Cook thừa nhận tăng giá là "không thể tránh khỏi"

4 chiếc iPhone cũ đáng mua nhất 2026

GIẢI TRÍ

Quốc gia “nghiện” điều hòa gần Việt Nam: Ngoài trời nóng gần 40 độ, trong nhà bật điều hòa rét đến nỗi phải mặc áo len

Chỉ cần nhìn robot Trung Quốc "rán quả trứng" này thôi là tất cả chúng ta có thể thở phào nhẹ nhõm

Suốt 17 năm qua, Apple luôn tặng kèm một món quà nhỏ trong hộp khi mua iPhone – Sao giờ không còn nữa?

Chiếc xe bị "sưng đầu" gây khó hiểu trong chuyến thăm Trung Quốc của ông Trump: Không ai rõ có mục đích gì

Quốc tế

MoEngage Mua Lại Aampe, Mang Giải Pháp Ra Quyết Định Dựa Trên Tác Nhân Tỷ Lệ 1:1 đến các Đội Ngũ Tiếp Thị B2C

DuPont ra mắt Tyvek® APX™ tại thị trường ASEAN

Jack Technology ra mắt SmartLink Master tại Việt Nam

Sungrow Master 2026 nâng cao năng lực chuyên môn của đội ngũ lắp đặt, vì một ngành điện mặt trời vững mạnh hơn tại Philippines

ĐỐI TÁC

DeepSeek V4 ra mắt: giá rẻ bằng 1/8 GPT-5.5 nhưng hiệu năng vượt mặt Claude Sonnet 4.5, tiệm cận Opus 4.6

Với sự ra mắt của DeepSeek V4, các công cụ AI đang chứng kiến mức giảm giá mạnh mẽ trong khi hiệu năng và khả năng xử lý vẫn được cải thiện đáng kể.

Cùng chuyên mục

Mới cập nhật