La startup de IA vocal AethexAI, enfocada en los mercados de África y Oriente Medio, ha completado una ronda de financiación previa a la semilla de 3 millones de dólares y ha lanzado simultáneamente una plataforma de prueba empresarial, API y SDK para ingresar al mercado local de atención al cliente y automatización de llamadas.
La financiación fue liderada por 4DX Ventures
Esta ronda de financiación fue liderada por 4DX Ventures, con la participación de Enza Capital, Dorm Room Fund, Mojo Ventures y Stanford GSB 26 Fund. Los inversores individuales incluyen profesores de Stanford, ejecutivos de la industria de telecomunicaciones y investigadores de IA de Anthropic.
AethexAI se fundó el año pasado por Mariama Diallo y Ayooluwa Odemuyiwa. Diallo trabajó anteriormente en Goldman Sachs y luego se unió a ModelML, respaldado por YC, como responsable de producto y crecimiento. Odemuyiwa se graduó en el Instituto de Tecnología de California, trabajó en Meta y posteriormente ingresó a la Escuela de Negocios Stanford.
Modelo pequeño desarrollado internamente para reducir la latencia en las llamadas
La empresa no utilizó herramientas de orquestación listas para usar como Vapi o LiveKit, sino que construyó sus propios modelos pequeños y una capa de orquestación, enfocándose en los dialectos locales comunes del mercado objetivo: inglés, francés y árabe.
Los dos fundadores indicaron que, en su investigación, descubrieron que algunas empresas de África y Oriente Medio intentaron automatizar sus centros de llamadas, pero debido a resultados insatisfactorios, volvieron a los procesos manuales. Otras empresas enfrentan problemas para contratar ingenieros de automatización y controlar los costos.
AethexAI considera que uno de los principales desafíos del AI de voz local es la latencia. Si se depende de modelos grandes implementados fuera de la región, los tiempos de espera y la variabilidad durante las llamadas serán más notorios. Por ello, la empresa optó por utilizar modelos más pequeños para reducir el tiempo de respuesta en cada etapa.
Se han procesado más de 17,000 llamadas diarias
La empresa desarrolló sus propios modelos de la serie Kora, con un tamaño de parámetros entre 300 millones y 1700 millones, significativamente menor que los modelos de lenguaje grandes principales. AethexAI considera que este tamaño es más adecuado para equilibrar velocidad y precisión en el mercado objetivo.
En la recopilación de datos, la empresa utiliza grabaciones anónimas proporcionadas por partners de centros de llamadas y envía discos duros a emisoras de radio en múltiples regiones de África para recopilar más datos de audio. Al mismo tiempo, la empresa organiza a estudiantes universitarios para participar en la etiquetación de datos y la organización de la pronunciación de nombres locales, con el fin de reducir los costos de entrenamiento.
AethexAI indica que actualmente su sistema maneja más de 17.000 llamadas diarias. Las aplicaciones principales actuales incluyen cobranza, activación de clientes y verificación de identidad KYC comunes en los sectores bancario y de telecomunicaciones.
Comience con un solo escenario para clientes empresariales
En términos de comercialización, la empresa ayuda a las empresas a identificar escenarios adecuados para la automatización mediante demostraciones en vivo y talleres, en lugar de abordar todos los procesos de una sola vez. El equipo fundador indica que actualmente pide a los clientes que elijan el escenario más importante para iniciar la implementación.
La empresa también está contratando ingenieros orientados al mercado local mediante contratos y estableciendo colaboraciones canal con operadoras de telecomunicaciones para manejar la infraestructura telefónica necesaria para las llamadas de IA vocal. AethexAI considera que copiar directamente soluciones de tipo plug-and-play de los mercados europeos y estadounidenses resulta difícil de adaptar a las condiciones locales de red, idioma y costos.
El líder de la ronda, 4DX Ventures, indicó que el volumen de interacciones de voz en empresas africanas y del Medio Oriente sigue siendo claramente superior al de los mercados occidentales, y que las empresas locales necesitan sistemas capaces de manejar dialectos, código mezclado y expresiones informales, lo que deja espacio para el crecimiento de empresas regionales de IA de voz.
