Tin tức từ ME News, ngày 14 tháng 4 (UTC+8), theo giám sát của 1M AI News, nhóm liên hợp gồm Đại học Bắc Kinh, Đại học Carnegie Mellon, Đại học Thượng Hải, Đại học California, Los Angeles và Đại học Michigan đã công bố VGHuman trên arXiv — một khung AI thể chất cho phép nhân vật số tự chủ hành động trong các cảnh 3D mới mẻ chỉ dựa trên nhận thức thị giác. Trước đây, các hệ thống nhân vật số thường dựa vào kịch bản được định sẵn hoặc thông tin trạng thái đặc quyền để điều khiển; VGHuman hướng đến việc trang bị cho nhân vật số đôi mắt thực sự, để chúng tự nhìn đường, lập kế hoạch và hành động. Khung này gồm hai lớp. Lớp World tái tạo cảnh 3D với các ghi chú ngữ nghĩa và lưới va chạm từ video đơn nhãn, thiết kế nhận thức che khuất giúp nó vẫn nhận diện được các vật thể nhỏ bị che khuất trong môi trường ngoài trời phức tạp. Lớp Agent trang bị cho nhân vật số cảm nhận RGB-D (màu sắc + độ sâu) từ góc nhìn thứ nhất, sử dụng các gợi ý thị giác nhận thức không gian và suy luận lặp lại để tạo kế hoạch, sau đó chuyển đổi thành chuỗi hành động toàn thân thông qua mô hình khuếch tán để điều khiển chuyển động nhân vật. Trong bộ chuẩn định hướng với 200 cảnh thử nghiệm, vượt qua ba cấp độ khó khăn: đường đi đơn giản, tránh chướng ngại vật và người đi bộ động, VGHuman đạt tỷ lệ thành công cao nhất, vượt trội khoảng 30 điểm phần trăm so với các nền tảng cơ sở mạnh nhất như NaVILA, NaVid, Uni-NaVid, đồng thời tỷ lệ va chạm tương đương hoặc thấp hơn. Khung còn hỗ trợ nhiều phong cách chuyển động như chạy, nhảy, cũng như lập kế hoạch dài hạn để truy cập liên tiếp nhiều mục tiêu. Mã nguồn và mô hình sẽ được mở nguồn, kho GitHub đã được tạo sẵn. (Nguồn: BlockBeats)
Nhóm gồm năm trường đại học phát triển khung dẫn đường hình ảnh 3D cho người kỹ thuật số
KuCoinFlashChia sẻ






Một đội ngũ liên hợp gồm Đại học Bắc Kinh, Đại học Carnegie Mellon, Đại học Đồng Kế, UCLA và Đại học Michigan đã phát triển VGHuman, một khung AI dẫn hướng thị giác giúp các nhân vật kỹ thuật số định hướng trong môi trường 3D. Hệ thống đạt mức cải thiện 30 điểm phần trăm trong tỷ lệ thành công nhiệm vụ so với các mô hình nền tảng hàng đầu trong 200 trường hợp kiểm tra. Dự án này phù hợp với các nỗ lực đang diễn ra nhằm xây dựng khung tuân thủ cho quy định tài sản kỹ thuật số mới nổi.
Nguồn:Hiển thị bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này.
Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụng và Tiết lộ rủi ro của chúng tôi.