Perusahaan rintisan AI suara AethexAI yang berfokus pada pasar Afrika dan Timur Tengah menyelesaikan pendanaan pra-seed senilai $3 juta, sekaligus meluncurkan platform uji coba perusahaan, API, dan SDK untuk memasuki pasar otomatisasi layanan pelanggan dan panggilan di wilayah tersebut.
Pembiayaan dipimpin oleh 4DX Ventures
Putaran pendanaan ini dipimpin oleh 4DX Ventures, dengan partisipasi dari Enza Capital, Dorm Room Fund, Mojo Ventures, dan Stanford GSB 26 Fund. Investor individu meliputi dosen Stanford, eksekutif industri telekomunikasi, serta peneliti AI dari Anthropic.
AethexAI didirikan tahun lalu oleh Mariama Diallo dan Ayooluwa Odemuyiwa. Diallo sebelumnya bekerja di Goldman Sachs, lalu bergabung dengan ModelML yang didukung YC, bertanggung jawab atas produk dan pertumbuhan. Odemuyiwa lulus dari California Institute of Technology, pernah bekerja di Meta, kemudian masuk Stanford Graduate School of Business.
Model kecil buatan sendiri menurunkan latensi panggilan
Perusahaan tidak menggunakan alat orkestrasi siap pakai seperti Vapi atau LiveKit, melainkan membangun model kecil dan lapisan orkestrasi sendiri, dengan fokus pada dialek lokal bahasa Inggris, Prancis, dan Arab yang umum di pasar target.
Dua pendiri menyatakan bahwa dalam penelitian mereka, mereka menemukan bahwa sebagian perusahaan di Afrika dan Timur Tengah mencoba mengotomatisasi pusat panggilan, tetapi kembali ke proses manual karena hasilnya tidak memuaskan. Perusahaan lain menghadapi masalah sulit merekrut insinyur otomatisasi dan kesulitan mengendalikan biaya.
AethexAI percaya bahwa salah satu tantangan utama dalam AI suara lokal adalah latensi. Jika mengandalkan model besar yang di部署 di luar wilayah, waktu tunggu dan jitter dalam panggilan akan lebih terasa. Untuk itu, perusahaan memilih menggunakan model yang lebih kecil untuk memperpendek waktu respons di setiap tahap.
Telah menangani lebih dari 17.000 panggilan harian
Perusahaan mengembangkan model Kora seri milik sendiri, dengan ukuran parameter antara 300 juta hingga 1,7 miliar, jauh lebih kecil dibandingkan model bahasa besar utama. AethexAI percaya bahwa ukuran seperti ini lebih cocok untuk menyeimbangkan kecepatan dan akurasi di pasar target.
Dalam pengumpulan data, perusahaan menggunakan rekaman anonim dari mitra pusat panggilan, serta mengirimkan hard disk ke berbagai stasiun radio di berbagai wilayah Afrika untuk mengumpulkan lebih banyak data audio. Secara bersamaan, perusahaan mengorganisasi mahasiswa untuk berpartisipasi dalam pelabelan data dan pengumpulan pelafalan nama lokal, guna mengurangi biaya pelatihan.
AethexAI menyatakan bahwa sistemnya saat ini menangani lebih dari 17.000 panggilan per hari. Aplikasi utama saat ini mencakup penagihan, aktivasi pelanggan, serta verifikasi identitas KYC yang umum di industri perbankan dan telekomunikasi.
Mulailah dengan satu skenario tunggal untuk pelanggan perusahaan
Dalam hal komersialisasi, perusahaan ini membantu perusahaan memilih skenario yang cocok untuk otomatisasi melalui demonstrasi langsung dan lokakarya, bukan mencakup seluruh proses sekaligus. Tim pendiri menyatakan bahwa saat ini mereka terlebih dahulu meminta klien untuk memilih satu skenario paling penting untuk dimulai peluncurannya.
Perusahaan juga sedang merekrut insinyur yang fokus pada pasar lokal melalui kontrak, serta membangun kolaborasi saluran dengan operator telekomunikasi untuk menangani infrastruktur telepon yang diperlukan untuk panggilan AI suara. AethexAI percaya bahwa menyalin langsung solusi plug-and-play dari pasar Eropa dan Amerika sulit disesuaikan dengan kondisi jaringan, bahasa, dan biaya setempat.
Investor utama 4DX Ventures menyatakan bahwa volume interaksi suara di perusahaan Afrika dan Timur Tengah masih jauh lebih tinggi dibandingkan pasar Barat, sehingga perusahaan lokal membutuhkan sistem yang mampu menangani dialek, campur kode, dan ekspresi tidak formal, yang menciptakan ruang berkembang bagi perusahaan AI suara yang terfokus pada regional.
