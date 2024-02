Tianhe-3 là siêu máy tính bí mật của Trung Quốc, sử dụng CPU lai tự sản xuất và có thể đạt hiệu suất cao nhất tới 1,57 exaflop.

Ra mắt ngày 6/12 năm ngoái, Tianhe-3, còn gọi là Xingyi, không được tiết lộ nhiều thông số kỹ thuật ngoài việc "vượt qua Tianhe-2 về nhiều mặt" như năng lực tính toán, hiệu quả kết nối, khả năng lưu trữ và hiệu suất ứng dụng. Trước đó, Tianhe-2 có nhiều năm dẫn đầu TOP500 - tổ chức chuyên xếp hạng 500 siêu máy tính nhanh nhất thế giới, trước khi bị Frontier (Mỹ) hay Fugaku (Nhật Bản) vượt qua.

Tuy nhiên, The Next Platform đã tìm hiểu được một số thông số chính trong Xingyi. Cụ thể, siêu máy tính sử dụng bộ xử lý MT-3000 do Đại học Công nghệ Quốc phòng Quốc gia (NUDT) của Trung Quốc phát triển, có cấu trúc đa vùng gồm 16 vùng CPU đa năng, 96 lõi điều khiển và 1.536 lõi tăng tốc ma trận. Hiệu suất trên lõi được cho là đạt mức cao nhất 11,6 teraflop (11,6 nghìn tỷ phép tính động mỗi giây), hiệu suất năng lượng đạt 45,4 gigaflop (45,4 tỷ phép tính động mỗi giây) mỗi watt ở tần số 1,20 GHz.

Một nhà khoa học làm việc tại Trung tâm Siêu máy tính Quốc gia ở Vô Tích tháng 8/2020. Ảnh: CNS Photo

Khía cạnh quan trọng nhất của kiến trúc dùng trên MT-3000 là bao gồm gói chứa cả lõi tăng tốc ma trận và lõi đa năng tích hợp cùng một chip. Ở mức độ nào đó, giải pháp này phản ánh triết lý thiết kế mới tương tự Instinct MI300A của AMD bằng cách kết hợp CPU-GPU trên một khối silicon. Đây cũng là xu hướng thay đổi từ các hệ thống CPU và GPU rời rạc thông thường sang thiết kế gắn kết nhằm mang lại hiệu quả hơn.

Nhưng không như Instinct MI300A với nhiều chiplet của AMD kết nối với nhau và nằm trong một "gói", có vẻ MT-3000 thiết kế nguyên khối. The Next Platform dự đoán chip có thể được sản xuất trên tiến trình từ 14 nm đến 10 nm, thậm chí 7 nm. SMIC có thể là công ty sản xuất chip này.

Với việc sử dụng MT-3000 làm yếu tố cốt lõi, Xingyi được cho là đạt được hiệu suất tính toán chưa từng có là 1,57 eẽaflop (tỷ tỷ phép tính mỗi giây) trên điểm chuẩn LINPACK, tiêu chuẩn dùng để xây dựng bảng xếp hạng TOP500. Exaflop là đơn vị đo sức mạnh tính toán tổng hợp của hệ thống máy tính, tương đương một tỷ tỷ phép tính dấu phẩy động mỗi giây.

Trong bảng xếp hạng 500 siêu máy tính mạnh nhất năm ngoái của TOP500, hệ thống Frontier tại Phòng thí nghiệm Quốc gia Oak Ridge (Mỹ) là siêu máy tính duy nhất vượt ngưỡng exaflop với 1,19 exaflop. Trong khi đó, Sunway TaihuLight của Trung Quốc đứng thứ bảy với sức mạnh 93 petaflop (93 triệu tỷ phép tính mỗi giây). Do đó, nếu thông tin trên là chính xác, Xingyi có thể là máy tính mạnh nhất thế giới hiện tại.

"MT-3000 thể hiện bước nhảy vọt về công nghệ điện toán hiệu năng cao (HPC) của Trung Quốc. Với kiến trúc lai, hiệu suất cao và có khả năng là một nút sản xuất rất phức tạp, đây có vẻ là một chip cạnh tranh, có khả năng đưa Trung Quốc đi đầu trong phát triển HPC toàn cầu", Tom's Hardware bình luận.

Trung Quốc hiện đẩy mạnh phát triển siêu máy tính. Theo ITHome đầu tháng 1, nước này đã đưa vào vận hành trung tâm siêu máy tính Central Intelligent Computing Center (CICC) ở Vũ Hán, chủ yếu phục vụ huấn luyện AI và mô hình ngôn ngữ lớn (LLM) trong nước với "sức mạnh ở cấp độ exaflop". Đây cũng là cỗ máy đầu tiên sử dụng hoàn toàn linh kiện và phần mềm tự sản xuất - cột mốc mới cho thấy bước tiến mạnh mẽ về công nghệ của nước này.

Dù vậy, cũng không có nhiều thông tin về thông số kỹ thuật của CICC. Theo Tom's Hardware, sức mạnh của hai siêu máy tính mới từ Trung Quốc vẫn khó xác định thời gian tới, do nước này thường ít gửi thông tin cho TOP500. Sự thận trọng này chủ yếu liên quan đến những lo ngại về việc bị thu hút sự chú ý, đặc biệt là phía Mỹ, nơi đang áp nhiều lệnh cấm về công nghệ lên Trung Quốc.

Riêng CICC, một số nguồn tin dự đoán cỗ máy có thể sử dụng CPU dành cho máy chủ KaiSheng KH-40000 của Zhaoxin, công ty đang cung cấp lượng lớn chip máy chủ cho các công ty trong nước. Tuy nhiên, cỗ máy của China Telecom cũng có thể dùng 3D5000 32 lõi của Loongson hay Feiteng Tengyun S2500 64 lõi của Phytium. Cả ba khác nhau về kiến trúc: Zhaoxin dùng x86 giống Intel và AMD, Loongson dùng phiên bản biến thể của MIPS và Phytium chạy trên kiến trúc của ARM. Ngoài ra, chip từ Moore Threads hay Biren cũng có khả năng được dùng cho CICC.

Bất kể việc dùng phần cứng nào, giới chuyên gia cho rằng việc bắt đầu tự chủ công nghệ trên siêu máy tính mới là điều quan trọng nhất. Với việc tự chủ cả phần cứng và phần mềm, Trung Quốc cho thấy nước này có thể sản xuất được các thành phần, từ đó lệnh trừng phạt của Mỹ sẽ không có nhiều tác động trong tương lai.

Siêu máy tính hiện là lĩnh vực được Trung Quốc tăng cường phát triển để đào tạo AI và các mô hình máy học khổng lồ. Theo Bộ Công nghiệp và Công nghệ thông tin (MIIT) Trung Quốc hồi tháng 8/2023, sức mạnh tính toán tổng hợp của nước này đã đạt 197 exaflop, tăng từ 180 của năm 2022. Bộ cho biết họ đang xếp sau Mỹ, nhưng không nêu chi tiết về quy mô sức mạnh tính toán của đối thủ.

Theo kế hoạch, Trung Quốc đặt mục tiêu xây dựng thêm nhiều trung tâm dữ liệu ở các khu vực rộng lớn và thưa dân cư để tạo điều kiện thuận lợi cho các doanh nghiệp tiếp cận sức mạnh tính toán. "Trung Quốc đang có tốc độ tăng trưởng nhanh hơn so với Mỹ về sức mạnh tính toán", Ma Jihua, nhà phân tích trong ngành viễn thông, nói với Global Times năm ngoái. "Những năm gần đây, Trung Quốc đạt tốc độ tăng trưởng hàng năm hai con số, trong khi của Mỹ là khoảng 5%".

Bảo Lâm