ChainThink thông báo, ngày 22 tháng 4, theo thông báo chính thức, công ty mô hình thế giới Odyssey ra mắt Odyssey-2 Max.
Mô hình này có số lượng tham số gấp 3 lần so với thế hệ trước Odyssey-2 Pro và lượng tính toán huấn luyện gấp 10 lần, là mô hình thế giới tổng quát lớn nhất mà công ty từng phát triển.
Khác với các mô hình video hai chiều như Sora và Veo, Odyssey-2 Max sử dụng kiến trúc tự hồi quy nhân quả, dự đoán từng khung hình tiếp theo và chấp nhận đầu vào tương tác thời gian thực, cho phép tạo ra các cảnh mô phỏng kéo dài hơn 120 giây mà không bị sập.
Về độ chính xác của mô phỏng vật lý, Odyssey-2 Max đạt điểm 58.52 trong mục con vật lý của VBench 2, cao hơn so với 49.67 của Odyssey-2 Pro và 44.92 của NVIDIA Cosmos-Predict2.5-14B;
Đạt điểm 93.02 trong PAI-Bench vật lý.
Mô hình này dựa trên kiến trúc AR DiT (Autoregressive Diffusion Transformer), sử dụng liên tục dòng khớp để tạo và thực hiện suy luận thời gian thực thông qua tinh luyện loại bỏ nhiễu ít bước, được huấn luyện qua ba giai đoạn trên hàng trăm GPU NVIDIA B200, bao gồm tiền huấn luyện video quy mô lớn, tương tác và điều kiện hóa nhiệm vụ, cũng như huấn luyện ổn định chuỗi dài.
Odyssey được thành lập bởi CEO Oliver Cameron và CTO Jeff Hawke, cả hai đều có nền tảng trong ngành tự lái, trước đó đã huy động được tổng cộng 27 triệu USD.
Odyssey-2 Max hiện đã mở Private Beta cho các đối tác trong lĩnh vực robot, trò chơi, mô phỏng, quốc phòng và hệ thống tương tác.

