AIMPACT mesajı, 14 Nisan (UTC+8), MiniMax, Pocket işlevini (Beta) ve Computer Use'u resmen duyurdu.
Pocket, WeChat, Feishu, Enterprise WeChat, Slack gibi ana akım IM platformlarına entegre olur; kullanıcı IM içinde komut verdiğinde, Agent bilgisayarında görevi tamamlar ve sonucu orijinal sohbete geri iletir. Computer Use, Agent'in ekranı görebilmesine, fare ve klavyeyi kullanabilmesine ve yerel yazılımlar, sistem ayarları ile grafik arayüz görevlerini doğrudan işlemesine olanak tanır. İki yetenek birlikte çalışır: telefon üzerinden komut verilir, Agent bilgisayarda çalıştırır, bilgisayarın önünde oturmanıza gerek kalmaz.
Teknik olarak, MiniMax masaüstü işlemlerini dört araç alanına ayırır: Desktop Control (ekran görüntüsü, fare ve klavye girişi), Window Manager (pencere yönetimi ve uygulama başlatma), Browser Engine (DOM işlemleri ve CSS seçiciler), Clipboard (pano okuma/yazma). Feishu, WeCom vb. platformların CLI ve Bash araçları ile birlikte toplam 60'tan fazla araç sağlanır.
Görsel algıda, Agent 0 ile 1 arasında göreli koordinatlar çıkarır; sistem bu koordinatları ekran gerçek piksellerine dönüştürerek Retina ekran ve 4K monitörlerde işlem doğruluğunu garanti altına alır. Her adım sonrası otomatik ekran görüntüsü alınarak doğrulama yapılır; başarısızlık durumunda alternatif çözümler denenir (örneğin, fare tıklaması yerine klavye kısayolları kullanılır). Birden fazla kez çözüm bulunamazsa, sistem kullanıcıya takılılan konumu aktif olarak bildirir.
Yetki yönetimi, IM'ye senkronize edilmiştir: Agent, dosya silme gibi hassas işlemleri gerçekleştirmeden önce durur ve onay isteği, Feishu ve Slack'te et tương etkileşimli kartlar olarak, WeChat'te metin komutuyla yetkilendirme şeklinde gönderilir; kullanıcı her zaman bir komut göndererek görevi durdurabilir.(来源:MiniMax)
