OpenAI được cho là không hài lòng với khả năng suy luận của một số chip Nvidia và đang tìm giải pháp thay thế.

Trích dẫn 8 nguồn tin nội bộ, Reuters cho biết OpenAI đang tìm giải pháp chip AI mới nhằm phục vụ quá trình suy luận. Chip xử lý đồ họa (GPU) của Nvidia mạnh ở khâu huấn luyện mô hình trí tuệ nhân tạo, nhưng khả năng suy luận yếu hơn so với một số đối thủ.

Có 7 trong 8 nguồn tin tiết lộ, OpenAI không đánh giá cao tốc độ phần cứng của Nvidia trong việc giúp ChatGPT xử lý phản hồi nhanh, đặc biệt với các vấn đề cụ thể như khả năng phát triển phần mềm hay AI giao tiếp với phần mềm khác. Nguồn còn lại nói OpenAI rất cần phần cứng mới, mục tiêu trước mắt có thể đáp ứng khoảng 10% nhu cầu tính toán.

Cũng theo nguồn tin, từ năm ngoái, công ty của Sam Altman đã liên hệ Cerebras và Groq - hai startup nổi tiếng trong lĩnh vực phần cứng AI suy luận. Tuy nhiên, thỏa thuận trị giá 14 tỷ USD giữa OpenAI và Groq bị hủy do Nvidia đang trong quá trình thâu tóm tài sản của startup này với giá 20 tỷ USD.

Giới chuyên gia đánh giá, thương vụ 20 tỷ USD giữa Nvidia và Groq được xem là sự thừa nhận rằng giai đoạn tiếp theo của AI không chỉ do GPU quyết định.

Ngành công nghiệp AI đang chuyển từ huấn luyện mô hình (training) sang tương tác trực tiếp trong thế giới thực. Sự chuyển đổi này gọi là suy luận (inference) - quá trình diễn ra khi mô hình trả lời câu hỏi, tạo hình ảnh hay tham gia vào cuộc hội thoại với người dùng. Theo RBC Capital, bộ phận ngân hàng đầu tư và thị trường vốn thuộc Royal Bank of Canada (RBC), khả năng suy luận đang trở thành nhiệm vụ chủ đạo trong điện toán AI, có thể làm lu mờ thị trường huấn luyện trí tuệ nhân tạo đơn thuần.

OpenAI được cho là đã tìm kiếm giải pháp thay thế GPU thông qua giải pháp SRAM - bộ nhớ bán dẫn tốc độ cao, sử dụng mạch flip-flop (thường là 4-6 bóng bán dẫn) để lưu trữ dữ liệu mà không cần làm mới liên tục như DRAM. Với đặc điểm lưu trữ dữ liệu ổn định khi có điện, tốc độ truy cập nhanh, độ trễ thấp, việc tích hợp nhiều SRAM vào mỗi chip mang lại lợi thế về tốc độ cho chatbot và các hệ thống AI khác khi xử lý yêu cầu từ hàng triệu người dùng.

Theo TechCrunch, quá trình suy luận AI yêu cầu nhiều bộ nhớ hơn so với huấn luyện, vì chip cần dành nhiều thời gian lấy dữ liệu từ bộ nhớ so với việc thực hiện các phép toán. Công nghệ GPU của Nvidia và AMD dựa vào bộ nhớ ngoài, làm tăng thời gian xử lý và làm chậm tốc độ tương tác của người dùng với chatbot.

Với OpenAI, vấn đề càng quan trọng sau khi công ty giới thiệu và tích cực quảng bá Codex - công cụ AI giúp tự lập trình. Tuy nhiên, nguồn tin cho biết một số điểm yếu của Codex là do phần cứng Nvidia gây ra. Hiện tại, đối thủ của Codex như Claude của Anthropic và Gemini của Google đều sử dụng chip AI riêng, chủ yếu là bộ xử lý Tensor (TPU) do Google sản xuất.

Khi OpenAI bày tỏ sự thận trọng về công nghệ của Nvidia, công ty của Jensen Huang lập tức tiếp cận một số doanh nghiệp đang phát triển chip dùng SRAM, như Cerebras và Groq.

Nvidia hồi tháng 9/2025 cũng công bố kế hoạch đầu tư 100 tỷ USD vào OpenAI. Nếu diễn ra, thỏa thuận sẽ mang lại nguồn tài chính lớn cho OpenAI, cũng như khả năng tiếp cận nguồn chip tiên tiến để duy trì vị thế thống trị về AI.

WSJ ngày 30/1 dẫn nguồn tin cho hay kế hoạch của Nvidia đang bị đình trệ, sau khi một số lãnh đạo tập đoàn bày tỏ hoài nghi. Một nguồn nói ông Huang những tháng gần đây "không hài lòng với OpenAI", khẳng định thỏa thuận 100 tỷ USD không mang tính ràng buộc và chưa hoàn thiện. Ông cũng chỉ trích "tình trạng thiếu kỷ luật trong cách tiếp cận kinh doanh của OpenAI", bày tỏ lo lắng với sự cạnh tranh từ Google và Anthropic.

CEO Nvidia sau đó lập tức phủ nhận: "Sam đang chuẩn bị hoàn tất vòng gọi vốn đầu tư và chắc chắn chúng tôi sẽ tham gia với lượng tiền rất lớn, có thể là khoản đầu tư lớn nhất lịch sử của Nvidia".

OpenAI đặt mục tiêu huy động 100 tỷ USD và tự định giá ở mức 830 tỷ USD. Công ty cũng đang đàm phán với nhiều hãng lớn khác, trong đó có Amazon, với thỏa thuận có thể tới 50 tỷ USD, theo Reuters.

