Африканська та близькосхідна стартап-компанія AethexAI, що розробляє голосовий ІІ, завершила пре-сідінгове фінансування на 3 мільйони доларів США та одночасно запустила платформу для корпоративного тестування, API та SDK, щоб увійти на ринок автоматизації служб підтримки та дзвінків.
Фінансування очолює 4DX Ventures
Цей раунд фінансування очолив 4DX Ventures, участь взяли Enza Capital, Dorm Room Fund, Mojo Ventures та Stanford GSB 26 Fund. Серед індивідуальних інвесторів — викладачі Стенфорду, топ-менеджери телекомунікаційної галузі та дослідники з Anthropic.
AethexAI була заснована минулого року Маріамо Діалло та Айолуво Одемуйіва. Діалло працювала в Goldman Sachs, а потім приєдналася до ModelML, яку підтримує YC, де відповідала за продукт і рост. Одемуйіва закінчила Каліфорнійський технологічний інститут, працювала в Meta, а потім вступила до Стандфордської школи бізнесу.
Власні невеликі моделі зменшують затримку розмови
Компанія не використовувала готові інструменти оркестрації, такі як Vapi або LiveKit, а замість цього створила власні невеликі моделі та шар оркестрації, зосереджуючись на обробці місцевих діалектів англійської, французької та арабської мов, поширених у цільових ринках.
Оба засновники зазначили, що в ході дослідження виявили, що деякі африканські та середньоазіатські компанії, намагаючись автоматизувати центри викликів, повернулися до ручних процесів через поганий результат. Інші компанії стикаються з труднощами у пошуку інженерів з автоматизації та контролю витрат.
AethexAI вважає, що однією з основних складностей місцевого голосового ІІ є затримка. Якщо використовувати великі моделі, розгорнуті за межами регіону, очікування та джитер під час розмови будуть більш помітними. Тому компанія вибрала менші моделі, щоб скоротити час відповіді на кожному етапі.
Оброблено понад 17 000 щоденних дзвінків
Компанія розробила власні моделі серії Kora з параметрами від 300 мільйонів до 1,7 мільярда, що значно менше, ніж у основних великих мовних моделей. AethexAI вважає, що такий розмір краще підходить для балансу швидкості та точності на цільових ринках.
Щодо збору даних, компанія використовує анонімні аудіозаписи від партнерів центру викликів, а також надсилає жорсткі диски на багато радіостанцій по всій Африці для збору додаткових аудіоданих. Крім того, компанія залучає студентів до анотування даних та структурування вимови місцевих імен, щоб знизити витрати на навчання.
AethexAI повідомляє, що зараз їхня система обробляє більше 17 000 дзвінків щодня. Основні застосування на цьому етапі включають стягнення боргів, активізацію клієнтів та верифікацію KYC, поширених у банківській та телекомунікаційній галузях.
Почніть з одного сценарію для корпоративних клієнтів
У комерціалізації ця компанія допомагає підприємствам вибирати найбільш підходящі сценарії для автоматизації за допомогою живих демонстрацій та воркшопів, а не намагається автоматизувати всі процеси одразу. Засновники стверджують, що на даний момент вони просить клієнтів спочатку вибрати один найважливіший сценарій для початку розгортання.
Компанія також наймає інженерів для локальних ринків за контрактами та встановлює канали співпраці з телекомунікаційними операторами для забезпечення телефонної інфраструктури, необхідної для голосових AI-дзвінків. AethexAI вважає, що прямий копіювання готових рішень з Європи та США важко адаптувати до місцевих мереж, мови та витрат.
Лідер інвестицій 4DX Ventures зазначив, що обсяг голосової взаємодії з боку підприємств Африки та Близького Сходу залишається значно вищим, ніж на західних ринках, і місцеві підприємства потребують систем, здатних обробляти діалекти, міксовані мови та неформальні вирази, що створює простір для розвитку регіональних компаній з голосового ІІ.
