A startup indiana de IA, Avataar AI, lançou o modelo de geração de vídeos Varya, voltado para cenários de e-commerce e produção de vídeos corporativos. A empresa afirma que o novo modelo foca em resolver dois tipos de problemas: velocidade e custo de geração, e a capacidade de reconhecer conteúdo cultural local da Índia.
Custo e velocidade reduzidos
Varya não foi treinada do zero. O Avataar AI é baseado no modelo de vídeo open-source da Alibaba, Wan 2.2, e utiliza o método de distilação para comprimir a capacidade do modelo, criando uma versão mais leve para uso em cenários próprios.
A empresa afirma que o processo de geração da Varya exige apenas 4 etapas, enquanto o Wan 2.2 requer 50 etapas. Em uma GPU NVIDIA H200, a Varya leva cerca de 45 segundos para gerar um vídeo de 5 segundos em 720p, enquanto o Wan 2.2 leva 1230 segundos.
Com base no preço do serviço de hospedagem, a Avataar AI planeja definir o preço de Varya em 0,48 rúpias indianas por segundo de vídeo, aproximadamente 0,005 dólares americanos. Segundo o TechCrunch, esse preço é significativamente inferior aos níveis comuns de mais de 0,10 dólar por segundo encontrados em produtos similares como Veo, Kling, Luma e Runway.
Principal identificação de conteúdo local da Índia
Modelos de geração de imagens e vídeos frequentemente produzem conteúdo estereotipado ou genérico devido à falta de contexto cultural. A Avataar AI afirma que o Varya foi treinado com dados selecionados, com foco em melhorar a capacidade de reconhecer elementos da culinária, vestuário, arquitetura e festividades indianas.
A empresa afirma que os usuários já podem usar o modelo por meio do site oficial, utilizando dicas de texto ou imagens de referência. Além de seus próprios serviços, a Avataar AI planeja disponibilizar seu acesso a clientes corporativos e busca parcerias com ferramentas de vídeo como Higgsfield e Adobe Firefly.
Será lançado na forma de pesos abertos
Varya também será lançada na plataforma AI Kosh do governo indiano na forma de modelo de pesos abertos, com dados de treinamento disponíveis simultaneamente. Os desenvolvedores podem implantar o modelo por conta própria ou modificá-lo conforme necessário.
Este lançamento também reflete o caminho real da indústria de IA na Índia. Em vez de competir diretamente com os Estados Unidos, China e outros mercados em modelos básicos, a indústria indiana enfatiza mais a implementação de aplicações e o desenvolvimento de ecossistemas de desenvolvedores. Uma das razões é que o desenvolvimento de modelos locais tem sido historicamente limitado pela falta de poder computacional e pela escassez de dados de alta qualidade.
O governo da Índia anteriormente lançou a India AI Mission, com um orçamento de aproximadamente 1,2 bilhão de dólares, oferecendo subsídios de poder de computação para startups selecionadas e exigindo a publicação aberta dos modelos. A Avataar AI é uma das 12 empresas selecionadas. O governo da Índia também declarou no início deste ano que tem como objetivo atrair 200 bilhões de dólares em investimentos em IA até 2028 e dobrar a capacidade de GPU em menos de seis meses.
