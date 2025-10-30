Các nhà sản xuất chip AI Trung Quốc được đánh giá "đổi mới một cách thông minh" và đạt một số bước tiến sau nhiều năm bị Mỹ giới hạn.

Cuộc chiến vi mạch giữa Mỹ và Trung Quốc diễn ra mạnh mẽ từ 2018, kéo dài từ nhiệm kỳ đầu của Tổng thống Donald Trump đến nay. Theo Economist, lệnh cấm vận công nghệ cao của Mỹ nhằm ngưn tham vọng tạo dựng ngành công nghiệp sản xuất chip tiên tiến của riêng Trung Quốc, nhưng thực tế lại đang thúc đẩy nước này tự chủ hơn.

Hồi tháng 1, DeepSeek khiến thế giới ngạc nhiên khi tung ra mô hình AI với sức mạnh được đánh giá tương đương sản phẩm hàng đầu nhưng chi phí đào tạo thấp hơn nhiều. Các nhà sản xuất chip Trung Quốc cũng đang đặt mục tiêu tương tự. Dù chưa thể bằng phương Tây, họ cố gắng đẩy mạnh các công cụ đang có trong tay, xây dựng cụm xử lý lớn để bù đắp sức mạnh, hợp nhất phần cứng và phần mềm để "vắt từng giọt hiệu suất".

Các bảng mạch được trình diễn tại một sự kiện công nghệ ở Bắc Kinh năm 2021. Ảnh: Global Times

Trong mảng chip, dữ liệu do công ty đầu tư mạo hiểm Edgerunner Ventures thu thập cho thấy, hiệu suất trung bình của chip AI Trung Quốc là 114 teraflop (nghìn tỷ phép tính mỗi giây), thấp hơn đáng kể so với đối thủ Mỹ. Chẳng hạn, Huawei Ascend 910C được xem là đầu bảng đạt 800 teraflop, trong khi B200 của Nvidia là 2.500 teraflop.

Trong hàng chục năm qua, các hãng tăng hiệu suất chip bằng cách thu nhỏ bóng bán dẫn. B200 sở hữu 208 tỷ bóng bán dẫn, chia thành hàng nghìn lõi riêng lẻ "nhồi nhét" vào một dải silicon mỏng chỉ vài chục milimét. Rất ít công ty có thể thực hiện công đoạn này, ví dụ TSMC hay Samsung Semiconductor - những bên phải hạn chế cho Trung Quốc tiếp cận công nghệ tiên tiến theo yêu cầu của Mỹ.

Do đó, Trung Quốc phải dựa vào năng lực sản xuất nội địa, chủ yếu là SMIC. Dù vậy, việc bị Mỹ giới hạn khiến họ chỉ được sử dụng máy quang khắc cực tím sâu (DUV) đời cũ thay vì máy quang khắc siêu cực tím (EUV) hiện đại. ASML của Hà Lan hiện là công ty duy nhất phát triển được hệ thống EUV, nhưng không thể bán cho Trung Quốc.

Để vượt khó, những công ty Trung Quốc như SMIC cố gắng tận dụng DUV - cỗ máy quang khắc hiện sử dụng bước sóng 193 nm - bằng cách đẩy công suất đến cực hạn. Một kỹ thuật phổ biến là multi-patterning (in nhiều mẫu), tức thay vì đặt wafer một lần dưới nguồn sáng, kỹ sư lặp lại quy trình này nhiều lần nhằm khắc nhiều chi tiết nhỏ hơn. Multi-patterning làm tăng chi phí và giảm hiệu suất (tỷ lệ chip không bị lỗi trên mỗi tấm wafer). Dù vậy, với Trung Quốc giai đoạn này, theo các chuyên gia, khả năng tự cung tự cấp quan trọng hơn hiệu suất.

Dù đi sau về chất lượng, Trung Quốc đang chuyển hướng sang số lượng. Trong điện toán AI, phương pháp "song song hóa" (chia nhỏ tác vụ thành nhiều phần để nhiều chip xử lý cùng lúc) được ưa chuộng. Hồi tháng 4, Huawei tận dụng triệt để cách này khi tung ra CloudMatrix 384 trang bị 384 chip Ascend 910C, được giới thiệu có sức mạnh tương đương Nvidia GB200 NVL72 - hệ thống dùng 72 chip B200.

Công ty phân tích SemiAnalysis ước tính mỗi chip Ascend có hiệu năng chỉ bằng một phần ba so với B200. Việc Huawei sử dụng số lượng chip gấp năm lần khiến mức tiêu thụ điện năng cao hơn hẳn. Nhưng chuyên gia Ryan Cunningham của Edgerunner Ventures nhận định đó là "sự đánh đổi hợp lý" và năng lượng "không phải vấn đề ở Trung Quốc".

Việc kết nối nhiều chip song song cũng phát huy thế mạnh của Huawei. Thay vì điện, CloudMatrix 384 chuyển đổi dữ liệu dưới dạng xung ánh sáng, gọi là mạng quang học (optical-networking), vốn sử dụng ít điện năng và tạo ít nhiệt thải hơn so với dùng điện.

"Trước đây, phương pháp này chủ yếu dùng trong cáp quang đường dài, nhưng hiện được ứng dụng vào trung tâm dữ liệu", Qingyuan Lin, nhà phân tích bán dẫn tại công ty đầu tư Bernstein, nói với Economist. "Phương pháp của Huawei đang thay đổi căn bản cách thức xây dựng cơ sở hạ tầng AI".

Bước tiếp theo trong chiến lược của Trung Quốc là điều chỉnh phần cứng phù hợp với phần mềm. Các hệ thống vi xử lý đa năng hiện đại thường sử dụng kiến trúc 32-bit hoặc 64-bit, nhưng công ty Trung Quốc cố gắng "chia nhỏ" bằng 16-bit, 8-bit hoặc 4 bit, đồng thời chấp nhận lỗi có thể xảy ra. Rakesh Kumar, kỹ sư điện tại Đại học Illinois (Mỹ), gọi đây là một cách "đơn giản nhưng hiệu quả" để tối ưu hóa phần cứng.

Thực tế, hồi tháng 8, DeepSeek phát hành định dạng đánh số mới, lưu trữ số 8-bit không phân biệt số dương, số âm và hoàn toàn không có thành phần phân số. Sơ đồ này không thể biểu diễn một dải số lớn và phức tạp, cũng như thiếu độ chính xác, nhưng có thể áp dụng cho một số công việc cụ thể. Cổ phiếu của Cambricon Technologies, nhà thiết kế chip Trung Quốc, đã tăng vọt sau thông báo áp dụng giải pháp từ DeepSeek.

Trong khi đó, tháng trước, Tencent cho biết đã điều chỉnh cơ sở hạ tầng điện toán nhằm hỗ trợ bộ xử lý AI do Trung Quốc thiết kế, động thái được đánh giá có thể giúp doanh nghiệp trong nước tăng tiếp cận phần cứng nội địa. Qiu Yuepeng, Chủ tịch Tencent Cloud, xác nhận công ty hiện sử dụng "các chip nội địa chính thống" và xây dựng cơ sở hạ tầng xung quanh chúng. Phó chủ tịch Dowson Tong Tao-sang thêm rằng họ đang hợp tác với nhiều công ty chip trong nước nhằm áp dụng phần cứng phù hợp cho từng kịch bản, với chiến lược dài hạn tập trung vào tối ưu hóa thiết kế đồng bộ phần cứng - phần mềm nhằm giảm chi phí tính toán.

Bên cạnh phần cứng, nỗ lực xây dựng nền tảng AI nội địa của Trung Quốc cũng có khởi đầu hứa hẹn, dù chỉ bằng giải pháp riêng lẻ. Trong khi đó, các công cụ lập trình bán dẫn mà doanh nghiệp nước này sử dụng chủ yếu là Nvidia Cuda hay chương trình thiết kế chip từ Synopsys hoặc Cadence.

Theo CNBC, giới chuyên gia đánh giá Trung Quốc đang ngày càng giảm mạnh sự phụ thuộc vào công nghệ Mỹ. Hồi tháng 4, Mỹ hạn chế bán chip Nvidia H20 cho thị trường Trung Quốc, nhưng nới lỏng vào tháng 7. Tuy nhiên, sau khi được nhượng bộ, thay vì phản ứng "nhẹ nhõm", Bắc Kinh thúc giục các công ty công nghệ trong nước tăng cường đầu tư, "nên từ bỏ hoàn toàn" sản phẩm của Nvidia, thay vào đó sử dụng sản phẩm trong nước.

Bảo Lâm tổng hợp