DeepSeek R1 ra mắt AI ‘thu nhỏ’ chạy với chỉ 1 GPU duy nhất

Trong bối cảnh cuộc đua AI ngày càng khốc liệt, startup Trung Quốc DeepSeek vừa tạo nên làn sóng mới khi phát hành phiên bản “distilled” (cô đọng) của mô hình R1 AI reasoning có khả năng vận hành trên chỉ một GPU duy nhất.

DeepSeek R1 ra mắt AI 'thu nhỏ' chạy với chỉ 1 GPU duy nhất

DeepSeek-R1-0528-Qwen3-8B, tên gọi chính thức của phiên bản mới, được tạo ra bằng cách sử dụng dữ liệu từ mô hình R1 đầy đủ để fine-tune trên nền tảng Qwen3-8B của Alibaba. Điều đặc biệt là model này chỉ yêu cầu GPU có dung lượng RAM từ 40-80GB như Nvidia H100, thay vì cần đến khoảng 12 GPU 80GB như phiên bản gốc khổng lồ 685 tỷ tham số.

Theo công bố từ DeepSeek trên nền tảng Hugging Face, phiên bản cô đọng này vẫn duy trì được khả năng reasoning mạnh mẽ đáng kể. Trong các bài kiểm tra benchmark AIME 2025 về toán học phức tạp, DeepSeek-R1-0528-Qwen3-8B đã vượt qua Google Gemini 2.5 Flash và gần như sánh ngang với Microsoft Phi 4 reasoning model trong các bài test HMMT toán học.

Sự ra đời của phiên bản này đánh dấu một bước ngoặt quan trọng trong việc dân chủ hóa công nghệ AI. Nếu như trước đây, để chạy được các mô hình AI reasoning tiên tiến, các nhà phát triển cần đầu tư hàng trăm ngàn đô la cho hạ tầng phần cứng, thì giờ đây chỉ cần một GPU gaming cao cấp là có thể trải nghiệm được sức mạnh tương tự.

Câu chuyện thành công của DeepSeek không chỉ dừng lại ở việc tối ưu hóa phần cứng. Công ty này đã chứng minh rằng với những đột phá về software và kỹ thuật huấn luyện, họ có thể tạo ra model reasoning sánh ngang với OpenAI o1 mà không cần truy cập vào chip Nvidia tiên tiến nhất như các đối thủ Mỹ.

Điểm đáng chú ý khác là DeepSeek phát hành model này dưới giấy phép MIT mở, cho phép sử dụng thương mại không hạn chế. Điều này tạo cơ hội lớn cho các startup công nghệ Việt Nam có thể tích hợp và phát triển sản phẩm AI mà không phải trả phí bản quyền đắt đỏ.

Nhiều nền tảng hosting như LM Studio đã nhanh chóng hỗ trợ model mới thông qua API, giúp developer dễ dàng thử nghiệm. Tại Việt Nam, sự kiện này được cộng đồng AI địa phương đón nhận tích cực, đặc biệt trong bối cảnh chính phủ đang đẩy mạnh chương trình chuyển đổi số và phát triển công nghệ AI.

Phiên bản DeepSeek R1 distilled không chỉ là bước tiến kỹ thuật mà còn thể hiện xu hướng democratization trong ngành AI. Khi các mô hình reasoning mạnh mẽ trở nên accessible hơn, cơ hội cho innovation từ các thị trường mới nổi như Việt Nam sẽ được mở rộng đáng kể, góp phần tạo nên một hệ sinh thái AI đa dạng và sáng tạo hơn trên toàn cầu.