Африкано-ближневосточная голосовая ИИ-стартап-компания AethexAI завершила предсемейное финансирование на сумму 3 миллиона долларов США и одновременно запустила корпоративную платформу для пробной версии, API и SDK, стремясь занять нишу рынка автоматизации обслуживания клиентов и колл-центров.
Финансирование возглавило 4DX Ventures
Данный раунд финансирования возглавил 4DX Ventures, в нем также приняли участие Enza Capital, Dorm Room Fund, Mojo Ventures и Stanford GSB 26 Fund. Среди частных инвесторов — преподаватели Стэнфорда, топ-менеджеры телекоммуникационной отрасли и исследователи ИИ из Anthropic.
AethexAI была основана в прошлом году Мариамой Дьяло и Айолувой Одемуйивой. Дьяло ранее работала в Goldman Sachs, а затем присоединилась к ModelML, поддерживаемой YC, где отвечала за продукт и рост. Одемуйива окончила Калифорнийский технологический институт, работала в Meta, а затем поступила в Стэнфордскую школу бизнеса.
Собственная небольшая модель снижает задержку при звонках
Компания не использовала готовые инструменты оркестрации, такие как Vapi и LiveKit, а создала собственные небольшие модели и уровень оркестрации, сосредоточившись на обработке местных диалектов английского, французского и арабского языков, распространенных на целевых рынках.
Основатели отметили, что в ходе исследований выяснилось, что некоторые компании из Африки и Ближнего Востока, попытавшись автоматизировать колл-центры, вернулись к ручным процессам из-за неудовлетворительных результатов. Другие компании столкнулись с трудностями в найме инженеров по автоматизации и контроле затрат.
AethexAI считает, что одной из ключевых сложностей локального голосового ИИ является задержка. Если использовать крупные модели, развернутые за пределами региона, задержки и джиттер в ходе разговора будут более заметны. Поэтому компания выбрала более компактные модели для сокращения времени отклика на каждом этапе.
Обработано более 17 000 ежедневных звонков
Компания разработала собственные модели серии Kora с параметрами от 300 миллионов до 1,7 миллиарда, что значительно меньше, чем у основных крупных языковых моделей. AethexAI считает, что такой масштаб лучше всего балансирует скорость и точность на целевом рынке.
В области сбора данных компания использует анонимные аудиозаписи от партнеров колл-центров, а также отправляет жесткие диски на множество радиостанций по всей Африке для сбора дополнительных аудиоданных. Одновременно компания привлекает студентов-университетов к аннотированию данных и систематизации произношения местных имен, чтобы снизить затраты на обучение.
AethexAI сообщает, что сегодня его система обрабатывает более 17 000 звонков в день. Основные текущие сценарии применения включают взыскание долгов, активацию клиентов и верификацию личности KYC, распространенные в банковской и телекоммуникационной отраслях.
Начните с одного сценария для корпоративных клиентов
В коммерческом плане компания помогает предприятиям выбирать подходящие сценарии для автоматизации через живые демонстрации и воркшопы, а не пытается автоматизировать все процессы сразу. Основатели заявляют, что на текущем этапе они просят клиентов выбрать один наиболее важный сценарий для начала развертывания.
Компания также нанимает инженеров для локальных рынков по контрактной основе и устанавливает каналы сотрудничества с телекоммуникационными операторами для обеспечения телефонной инфраструктуры, необходимой для голосовых AI-звонков. AethexAI считает, что прямое копирование решений «вставь и работай» с рынков Европы и США трудно адаптировать к местным сетевым, языковым и стоимостным условиям.
Лидер инвестиционного раунда 4DX Ventures отметил, что объем голосового взаимодействия с предприятиями в Африке и на Ближнем Востоке по-прежнему значительно выше, чем на западных рынках, и местным компаниям необходимы системы, способные обрабатывать диалекты, код-свичинг и неформальные выражения, что создает возможности для региональных компаний в сфере голосового ИИ.
