OpenAI ra mắt GPT-5.2 phản công Google sau bản ghi nhớ "code red"

OpenAI đã chính thức ra mắt mô hình tiên tiến nhất của mình, GPT-5.2, trong bối cảnh cạnh tranh khốc liệt với Google, nhằm định vị lại vị thế dẫn đầu trong cuộc đua AI sau khi CEO Sam Altman phát động bản ghi nhớ nội bộ “code red” vào đầu tháng này.

GPT-5.2 được triển khai đến người dùng ChatGPT trả phí và nhà phát triển qua API với ba phiên bản: Instant tối ưu tốc độ cho các tác vụ thông thường như tìm kiếm thông tin, viết lách và dịch thuật; Thinking chuyên xử lý công việc phức tạp như lập trình, phân tích tài liệu dài, toán học và lập kế hoạch; và Pro, phiên bản cao cấp nhất nhằm đảm bảo độ chính xác và độ tin cậy tối đa cho các vấn đề khó.

“Chúng tôi thiết kế 5.2 để mở khóa nhiều giá trị kinh tế hơn cho mọi người,” Fidji Simo, giám đốc sản phẩm của OpenAI, cho biết trong buổi họp báo hôm thứ Năm. “Nó tốt hơn trong việc tạo bảng tính, xây dựng bản trình bày, viết code, nhận diện hình ảnh, hiểu ngữ cảnh dài, sử dụng công cụ và liên kết các dự án nhiều bước phức tạp.”

Sự ra mắt của GPT-5.2 diễn ra giữa cuộc chạy đua vũ trang với Gemini 3 của Google, mô hình đang dẫn đầu bảng xếp hạng LMArena ở hầu hết các tiêu chí đánh giá, ngoại trừ lập trình vẫn do Claude Opus-4.5 của Anthropic giữ vị trí số một. Đầu tháng này, The Information đưa tin rằng Sam Altman đã phát hành bản ghi nhớ nội bộ “code red” cho nhân viên giữa lúc lưu lượng truy cập ChatGPT sụt giảm và lo ngại mất thị phần người tiêu dùng vào tay Google. Bản ghi nhớ kêu gọi chuyển hướng ưu tiên, bao gồm tạm hoãn các cam kết như triển khai quảng cáo để thay vào đó tập trung cải thiện trải nghiệm ChatGPT.

GPT-5.2 là nỗ lực của OpenAI để giành lại vị trí dẫn đầu, mặc dù một số nhân viên theo báo cáo đã yêu cầu trì hoãn việc phát hành mô hình để có thêm thời gian cải thiện. Và mặc dù có dấu hiệu OpenAI sẽ tập trung vào các use case người tiêu dùng bằng cách thêm nhiều tính năng cá nhân hóa và tùy chỉnh cho ChatGPT, nhưng sự ra mắt GPT-5.2 lại hướng đến việc củng cố cơ hội doanh nghiệp.

Công ty đang nhắm cụ thể đến các nhà phát triển và hệ sinh thái công cụ, với mục tiêu trở thành nền tảng mặc định để xây dựng ứng dụng được hỗ trợ bởi AI. Đầu tuần này, OpenAI công bố dữ liệu mới cho thấy việc sử dụng công cụ AI của họ trong doanh nghiệp đã tăng vượt bậc trong năm qua.

Điều này diễn ra khi Gemini 3 đã được tích hợp chặt chẽ vào hệ sinh thái sản phẩm và đám mây của Google cho các quy trình làm việc đa phương thức và tác nhân. Google tuần này đã ra mắt máy chủ MCP được quản lý giúp các dịch vụ Google và Cloud như Maps và BigQuery dễ dàng kết nối với các tác nhân hơn.

OpenAI tuyên bố GPT-5.2 đạt điểm benchmark mới trong lập trình, toán học, khoa học, thị giác, suy luận ngữ cảnh dài và sử dụng công cụ, có thể dẫn đến “quy trình làm việc tác nhân đáng tin cậy hơn, code cấp độ sản xuất và các hệ thống phức tạp hoạt động trên ngữ cảnh lớn và dữ liệu thực tế”. Những khả năng này đặt GPT-5.2 vào cuộc cạnh tranh trực tiếp với chế độ Deep Think của Gemini 3, được ca ngợi là bước tiến lớn về suy luận nhắm vào toán học, logic và khoa học.

Theo biểu đồ benchmark của chính OpenAI, GPT-5.2 Thinking vượt trội hơn Gemini 3 và Claude Opus 4.5 của Anthropic trong hầu hết các bài kiểm tra suy luận được liệt kê, từ các tác vụ kỹ thuật phần mềm thực tế, kiến thức khoa học cấp độ tiến sĩ đến suy luận trừu tượng và khám phá mẫu.

Trưởng nhóm nghiên cứu Adain Clark cho biết điểm toán cao hơn không chỉ là giải phương trình. Suy luận toán học là thước đo liệu mô hình có thể tuân theo logic nhiều bước, giữ các con số nhất quán theo thời gian và tránh các lỗi tinh vi có thể tích lũy theo thời gian hay không. “Đây đều là các thuộc tính thực sự quan trọng trên nhiều loại khối lượng công việc khác nhau,” Clark nói. “Những thứ như mô hình hóa tài chính, dự báo, phân tích dữ liệu.”

Trong buổi họp báo, trưởng nhóm sản phẩm Max Schwarzer cho biết GPT-5.2 “cải thiện đáng kể khả năng tạo và gỡ lỗi code” và có thể thực hiện từng bước logic và toán học phức tạp. Các startup lập trình như Windsurf và CharlieCode báo cáo “hiệu suất lập trình tác nhân tốt nhất” và các cải tiến đo lường được trên quy trình làm việc nhiều bước phức tạp.

Ngoài lập trình, Schwarzer cho biết phản hồi GPT-5.2 Thinking có ít lỗi hơn 38% so với phiên bản trước, giúp mô hình đáng tin cậy hơn cho việc ra quyết định, nghiên cứu và viết lách hàng ngày.

GPT-5.2 dường như không phải là một cuộc cách mạng mà là sự hợp nhất của hai bản nâng cấp gần đây nhất của OpenAI. GPT-5 ra mắt vào tháng 8 đã đặt nền móng cho hệ thống thống nhất với bộ định tuyến để chuyển đổi mô hình giữa mô hình mặc định nhanh và chế độ “Thinking” sâu hơn. GPT-5.1 tháng 11 tập trung vào việc làm cho hệ thống ấm áp hơn, có tính đối thoại cao hơn và phù hợp hơn với các tác vụ tác nhân và lập trình. Mô hình mới nhất, GPT-5.2, dường như tăng cường tất cả những tiến bộ đó.

Đối với OpenAI, mức độ cạnh tranh chưa bao giờ cao hơn. Công ty đã cam kết đầu tư 1,4 nghìn tỷ đô la cho xây dựng cơ sở hạ tầng AI trong vài năm tới để hỗ trợ tăng trưởng, những cam kết được thực hiện khi họ vẫn còn lợi thế đi đầu trong các công ty AI. Nhưng giờ Google, vốn tụt hậu lúc ban đầu, đang vượt lên phía trước, và khoản đầu tư đó có thể là điều đang thúc đẩy “code red” của Altman.

Việc OpenAI tập trung lại vào các mô hình suy luận cũng là một động thái mạo hiểm. Các hệ thống đằng sau chế độ Thinking và Deep Research tốn kém hơn để vận hành so với chatbot tiêu chuẩn vì chúng tiêu thụ nhiều tài nguyên tính toán hơn. Bằng cách nhân đôi loại mô hình đó với GPT-5.2, OpenAI có thể đang thiết lập một vòng tuần hoàn: chi nhiều hơn cho tính toán để giành thắng lợi trên bảng xếp hạng, sau đó chi nhiều hơn nữa để giữ cho các mô hình chi phí cao đó chạy ở quy mô lớn.

OpenAI theo báo cáo đang chi tiêu cho tính toán nhiều hơn so với những gì họ đã công bố trước đây. Gần đây, hầu hết chi phí inference của OpenAI, số tiền họ chi cho tính toán để chạy mô hình AI đã được huấn luyện, đang được thanh toán bằng tiền mặt thay vì thông qua tín dụng đám mây, cho thấy chi phí tính toán của công ty đã tăng vượt mức mà các quan hệ đối tác và tín dụng có thể trợ cấp.

Với tất cả sự tập trung vào suy luận, một điều vắng mặt trong bản phát hành hôm nay là trình tạo hình ảnh mới. Altman theo báo cáo đã nói trong bản ghi nhớ “code red” rằng tạo hình ảnh sẽ là ưu tiên chính trong tương lai, đặc biệt sau khi Nano Banana của Google, biệt danh cho mô hình Gemini 2.5 Flash Image, đã có khoảnh khắc viral sau khi ra mắt vào tháng 8.

Tháng trước, Google ra mắt Nano Banana Pro, hay còn gọi là Gemini 3 Pro Image, phiên bản nâng cấp với khả năng kết xuất văn bản tốt hơn, kiến thức về thế giới và cảm giác thực tế, sống động đến rùng rợn trong các bức ảnh. Nó cũng tích hợp tốt hơn trên các sản phẩm của Google, như được thể hiện trong tuần qua khi nó xuất hiện trong các công cụ và quy trình làm việc như Google Labs Mixboard để tạo bản trình bày tự động.

OpenAI theo báo cáo dự định phát hành một mô hình mới khác vào tháng 1 với hình ảnh tốt hơn, tốc độ cải thiện và tính cách tốt hơn, mặc dù công ty chưa xác nhận các kế hoạch này hôm thứ Năm. OpenAI cũng cho biết hôm thứ Năm họ đang triển khai các biện pháp an toàn mới xung quanh việc sử dụng sức khỏe tâm thần và xác minh độ tuổi cho thanh thiếu niên, nhưng không dành nhiều thời gian trong buổi ra mắt để quảng bá những thay đổi đó.