Tác giả: Claude, Shenchao TechFlow
Dẫn nhập của Shenchao: Vào ngày 14 tháng 4, NVIDIA đã ra mắt gia đình mô hình AI lượng tử nguồn mở đầu tiên trên thế giới có tên Ising, với tốc độ giải mã sửa lỗi tăng 2,5 lần và độ chính xác tăng 3 lần so với tiêu chuẩn ngành.
Các cổ phiếu lượng tử cùng tăng mạnh trong ngày, IonQ tăng 18%, D-Wave tăng 15%. Cùng ngày, nhà khoa học trưởng William Dally tiết lộ tại GTC 2026 rằng AI đã rút ngắn thời gian di chuyển thư viện ô tiêu chuẩn chip từ 8 người trong 10 tháng xuống còn một GPU chỉ trong một đêm, với kết quả thiết kế tốt hơn so với con người.
NVIDIA đang sử dụng AI để tăng tốc hai vấn đề kỹ thuật khó nhất: làm cho máy tính lượng tử thực sự có thể sử dụng được và làm cho chính thiết kế GPU nhanh hơn và tốt hơn.
Ngày 14 tháng 4, "Ngày Quantum Thế giới", NVIDIA đã ra mắt gia đình mô hình AI mã nguồn mở đầu tiên trên toàn cầu dành cho máy tính lượng tử NVIDIA Ising, khiến các cổ phiếu lượng tử đồng loạt tăng mạnh. Cùng thời điểm này, nhà khoa học trưởng của công ty, William Dally, đã tiết lộ những tiến bộ mới nhất về AI trong quy trình thiết kế chip nội bộ của NVIDIA tại sự kiện GTC 2026, trong đó hiệu suất của một nhiệm vụ đã được cải thiện lên tới hàng trăm lần.
Hai manh mối đều chỉ ra một kết luận chung: AI đang chuyển từ “công cụ cấp ứng dụng” thành “nền tảng của nền tảng”, vừa thúc đẩy các ngành công nghiệp hạ lưu (tính toán lượng tử), vừa đẩy nhanh sự lặp lại phần cứng của chính AI.
Mô hình AI lượng tử mã nguồn mở đầu tiên trên toàn cầu, nhắm vào hai điểm nghẽn chính trong tính toán lượng tử
Theo thông cáo báo chí ngày 14 tháng 4 của NVIDIA, họa gia Ising đầu tiên bao gồm hai lĩnh vực mô hình: Ising Calibration và Ising Decoding, lần lượt nhắm vào hai điểm nghẽn cốt lõi trong việc ứng dụng máy tính lượng tử.
Các qubit trong bộ xử lý lượng tử vốn mang nhiễu; bộ xử lý lượng tử tốt nhất hiện nay trung bình mắc lỗi một lần sau mỗi nghìn phép tính. Để máy tính lượng tử trở nên hữu dụng, tỷ lệ lỗi cần được giảm xuống dưới một phần nghìn tỷ.
Ising Calibration là một mô hình thị giác - ngôn ngữ với 35 tỷ tham số, có khả năng tự động giải mã dữ liệu đo lường từ bộ xử lý lượng tử và đưa ra quyết định hiệu chuẩn, rút ngắn quy trình hiệu chuẩn trước đây mất vài ngày xuống còn vài giờ. Ising Decoding là một cặp mô hình mạng thần kinh tích chập 3D (tối ưu hóa tốc độ và độ chính xác riêng biệt), được sử dụng để giải mã thời gian thực cho sửa lỗi lượng tử, nhanh hơn 2,5 lần và chính xác hơn 3 lần so với tiêu chuẩn ngành mã nguồn mở hiện tại là pyMatching.
Sam Stanwyck, Giám đốc sản phẩm lượng tử của NVIDIA, đã giải thích logic của chiến lược mã nguồn mở tại sự kiện: Các nhà sản xuất phần cứng lượng tử có đặc điểm nhiễu riêng biệt, và mô hình mã nguồn mở cho phép họ tinh chỉnh tại chỗ bằng dữ liệu của riêng mình, vừa nâng cao hiệu suất vừa bảo vệ dữ liệu sở hữu.
CEO của NVIDIA, Huang Renxun, đã phát biểu trực tiếp hơn. Trong tuyên bố của mình, ông cho biết AI đang trở thành mặt phẳng điều khiển của máy lượng tử, chuyển đổi các qubit dễ tổn thương thành hệ thống GPU lượng tử có thể mở rộng và đáng tin cậy.
Theo thông tin từ NVIDIA, nhiều tổ chức đã率先 áp dụng mô hình Ising, bao gồm Trường Kỹ thuật và Khoa học Ứng dụng Harvard, Phòng thí nghiệm Năng lượng Quốc gia Fermi, IQM Quantum Computers, Phòng thí nghiệm Quốc gia Lawrence Berkeley, và Phòng thí nghiệm Vật lý Quốc gia Anh.
Các cổ phiếu lượng tử đồng loạt tăng mạnh, IonQ tăng 18% trong một ngày
Ngày Ising ra mắt, các cổ phiếu lượng tử của thị trường chứng khoán Mỹ đồng loạt tăng mạnh. Theo dữ liệu từ Yahoo Finance, IonQ tăng khoảng 18%, D-Wave Quantum tăng khoảng 15%, Rigetti Computing tăng khoảng 12%.
Bối cảnh của đợt tăng giá này là các cổ phiếu lượng tử từ đầu năm đến nay đều trải qua đợt điều chỉnh sâu. Tính đến ngày 14 tháng 4, IonQ giảm khoảng 22%, D-Wave giảm khoảng 35%, Rigetti giảm khoảng 23%. Sự phục hồi hai con số trong ngày không làm thay đổi xu hướng giảm trong năm, nhưng mức độ đồng loạt tăng vẫn đáng chú ý.

Cần lưu ý rằng, các yếu tố thúc đẩy đợt biến động này không chỉ riêng việc Ising công bố thông tin. Cùng ngày, IonQ thông báo về những tiến bộ quan trọng trong mạng lượng tử và một hợp đồng từ DARPA, trong khi Rigetti cũng nhận được tin tức về đơn đặt hàng 8,4 triệu USD từ Trung tâm Phát triển Tính toán Cao cấp của Ấn Độ (C-DAC). Sự kết hợp của nhiều chất xúc tác đã khuếch đại hiệu ứng ngành.
Cơ quan phân tích Resonance dự đoán quy mô thị trường máy tính lượng tử toàn cầu sẽ vượt quá 11 tỷ USD vào năm 2030. Trong báo cáo được công bố cùng ngày, Liên minh Phát triển Kinh tế Lượng tử (QED-C) cho biết thị trường lượng tử toàn cầu năm 2025 đã đạt 1,9 tỷ USD, với số nhân viên tại các doanh nghiệp lượng tử thuần túy tăng 14%.
Giảm 80 người-tháng xuống chỉ còn một đêm: AI tái định hình quy trình thiết kế chip NVIDIA
Ising hướng đến việc tăng tốc các ngành công nghiệp bên ngoài, trong khi NVIDIA sử dụng AI để tái thiết quy trình thiết kế chip của chính mình.
Trong cuộc trò chuyện tại GTC 2026 giữa William Dally, nhà khoa học trưởng của NVIDIA, và Jeff Dean, nhà khoa học trưởng của Google, đã tiết lộ nhiều trường hợp cụ thể. Dữ liệu ấn tượng nhất đến từ việc chuyển đổi thư viện ô tiêu chuẩn: mỗi khi NVIDIA chuyển sang quy trình bán dẫn mới (ví dụ: từ 7nm sang 5nm), cần thiết kế lại khoảng 2.500 đến 3.000 ô tiêu chuẩn để phù hợp với quy trình mới, trước đây mất khoảng 8 kỹ sư trong 10 tháng. NVIDIA đã phát triển một công cụ học tăng cường mang tên NVCell, hiện nay có thể hoàn thành toàn bộ quá trình này trong một đêm trên một GPU, với các ô đầu ra đạt mức hiệu suất về diện tích, công suất và độ trễ tương đương hoặc vượt trội so với thiết kế thủ công.
Theo Tom's Hardware, Dally mô tả quá trình này giống như một “trò chơi điện tử sửa lỗi quy tắc thiết kế”, chính là lĩnh vực mà học tăng cường giỏi nhất.
Ở cấp độ trừu tượng cao hơn, NVIDIA đã phát triển các mô hình ngôn ngữ lớn chuyên dụng nội bộ là Chip Nemo và Bug Nemo. Các mô hình này được tinh chỉnh dựa trên dữ liệu độc quyền tích lũy trong 30 năm của NVIDIA, bao gồm tất cả mã RTL, tài liệu thiết kế phần cứng và thông số kiến trúc của các GPU trong lịch sử công ty. Theo Dally chia sẻ, các kỹ sư cấp thấp có thể trực tiếp đặt câu hỏi cho Chip Nemo, giúp tiết kiệm thời gian không phải liên tục làm phiền các nhà thiết kế giàu kinh nghiệm. Ông mô tả Chip Nemo là “một người hướng dẫn rất kiên nhẫn”.
Ở cấp độ tối ưu hóa mạch, NVIDIA còn áp dụng học tăng cường vào các vấn đề thiết kế mạch cổ điển như chuỗi dự đoán ghi nhớ. Dally cho biết, các giải pháp thiết kế do AI tạo ra “hoàn toàn là những phương án kỳ lạ mà con người không bao giờ nghĩ đến, nhưng hiệu suất thực tế tốt hơn 20% đến 30% so với thiết kế của con người”.
Vẫn còn một chặng đường dài trước khi AI có thể tự thiết kế chip
Tuy nhiên, Dally cũng đã xác định rõ ranh giới kỳ vọng. Anh nói rằng mình rất muốn đạt được trạng thái end-to-end, nhưng hiện tại vẫn còn rất xa mục tiêu đó.
Thiết kế chip AI hiện tại của NVIDIA vẫn là hỗ trợ chứ chưa thay thế. AI đang phát huy tác dụng ở các giai đoạn như chuyển đổi ô tiêu chuẩn, phân loại và tóm tắt lỗi, dự đoán bố trí và định tuyến, khám phá không gian kiến trúc, nhưng vẫn chưa tạo thành quy trình tự động hóa đầu đến cuối hoàn chỉnh. Hướng đi dài hạn mà Dally hình dung là mô hình đa tác nhân, trong đó các hệ thống AI khác nhau chịu trách nhiệm cho từng giai đoạn thiết kế khác nhau, tương tự cách phân công trong đội ngũ kỹ sư con người.
Theo Computer Weekly, Dally và Dean cũng thảo luận trong cuộc trò chuyện về tác động của các tác nhân AI đối với các công cụ phần mềm truyền thống: khi tốc độ hoạt động của các tác nhân AI nhanh hơn nhiều so với con người, các công cụ phần mềm được thiết kế cho người dùng con người sẽ trở thành điểm nghẽn hiệu năng, đòi hỏi phải thiết kế lại từ các công cụ lập trình đến các ứng dụng kinh doanh.
