अफ्रीका और मध्य पूर्व बाजारों के लिए ध्वनि AI स्टार्टअप AethexAI ने 300 डॉलर की सीड पूर्व फंडिंग पूरी की है और साथ ही उद्योग के लिए ट्रायल प्लेटफॉर्म, API और SDK लॉन्च किए हैं, जिससे वह स्थानीय कस्टमर सपोर्ट और कॉल ऑटोमेशन बाजार में प्रवेश करना चाहता है।
Financing led by 4DX Ventures
इस फंडिंग राउंड की नेतृत्व भूमिका 4DX Ventures ने निभाई, जिसमें Enza Capital, Dorm Room Fund, Mojo Ventures और Stanford GSB 26 Fund शामिल हैं। व्यक्तिगत निवेशकों में स्टैनफोर्ड के शिक्षक, टेलीकॉम उद्योग के अधिकारी और Anthropic के AI शोधकर्ता शामिल हैं।
AethexAI का स्थापना पिछले वर्ष Mariama Diallo और Ayooluwa Odemuyiwa द्वारा की गई। Diallo ने गोल्डमैन सैक्स में काम किया, उसके बाद YC द्वारा समर्थित ModelML में उत्पाद और वृद्धि के लिए जुड़े। Odemuyiwa ने कैलिफोर्निया इंस्टीट्यूट ऑफ टेक्नोलॉजी से स्नातक किया, जहां उन्होंने Meta में काम किया, और फिर स्टैनफोर्ड बिजनेस स्कूल में शामिल हुए।
अपने छोटे मॉडल के साथ कॉल लेटेंसी कम करें
कंपनी ने Vapi, LiveKit आदि तैयार ऑर्केस्ट्रेशन टूल्स का उपयोग नहीं किया, बल्कि अपने छोटे मॉडल और ऑर्केस्ट्रेशन लेयर का निर्माण किया, जिसका ध्यान मुख्य रूप से लक्षित बाजार में आम अंग्रेजी, फ्रेंच और अरबी स्थानीय बोलियों को संभालने पर केंद्रित है।
दोनों संस्थापकों ने कहा कि उनके अनुसंधान में पता चला कि कुछ अफ्रीकी और मध्य पूर्वी उद्यमों ने कॉल सेंटर को स्वचालित करने की कोशिश की, लेकिन परिणाम खराब होने के कारण वे फिर से मानवीय प्रक्रियाओं पर लौट गए। अन्य उद्यमों को स्वचालन इंजीनियरों को भर्ती करने और लागत नियंत्रित करने में कठिनाई का सामना करना पड़ा।
AethexAI का मानना है कि स्थानीय भाषा AI की प्रमुख चुनौतियों में से एक लेटेंसी है। यदि कोई क्षेत्रीय बाहर स्थापित बड़े मॉडल पर निर्भर करता है, तो कॉल के दौरान प्रतीक्षा समय और जिटर अधिक स्पष्ट होते हैं। इसके लिए, कंपनी ने प्रत्येक चरण में प्रतिक्रिया समय को कम करने के लिए छोटे मॉडल का चयन किया है।
दिन में 17,000 से अधिक कॉल संसाधित किए गए
कंपनी ने अपने स्वयं के कोरा श्रृंखला मॉडल विकसित किए हैं, जिनका पैरामीटर स्केल 300 मिलियन से 1700 मिलियन के बीच है, जो प्रमुख बड़े भाषा मॉडल्स से स्पष्ट रूप से कम है। AethexAI का मानना है कि ऐसा स्केल लक्ष्य बाजार में गति और सटीकता के बीच संतुलन बनाने के लिए अधिक उपयुक्त है।
डेटा संग्रह के लिए, कंपनी कॉल सेंटर साझेदारों से अनामिक रिकॉर्डिंग्स का उपयोग करती है और अधिक ऑडियो डेटा इकट्ठा करने के लिए अफ्रीका के कई स्थानीय रेडियो स्टेशनों को हार्ड डिस्क भेजती है। इसके अलावा, कंपनी डेटा लेबलिंग और स्थानीय नामों के उच्चारण को संगठित करने के लिए कॉलेज के छात्रों को शामिल करती है, ताकि प्रशिक्षण लागत कम हो।
AethexAI ने बताया कि वर्तमान में उनकी प्रणाली दिन में 17,000 से अधिक कॉल्स को संभाल रही है। वर्तमान में मुख्य उपयोग के मामले शामिल हैं: वसूली, ग्राहक सक्रियण, और बैंकिंग और टेलीकॉम उद्योगों में सामान्य KYC पहचान प्रमाणीकरण।
एकल परिदृश्य से उद्यम ग्राहकों में प्रवेश करें
व्यावसायिक रूप से, यह कंपनी पूरी प्रक्रिया को एक साथ कवर करने के बजाय, स्थानीय प्रदर्शन और कार्यशालाओं के माध्यम से उद्यमों को स्वचालन के लिए उपयुक्त परिदृश्य चुनने में मदद कर रही है। संस्थापक टीम का कहना है कि वर्तमान में ग्राहकों से सबसे महत्वपूर्ण एक परिदृश्य चुनकर इसके लिए लागू करना शुरू करने का अनुरोध किया जाएगा।
कंपनी अभी भी स्थानीय बाजार के लिए इंजीनियरों को कॉन्ट्रैक्ट आधार पर भर्ती कर रही है और वॉइस एआई कॉल के लिए टेलीकॉम ऑपरेटरों के साथ चैनल साझेदारी स्थापित कर रही है। AethexAI का मानना है कि यूरोप और अमेरिका के बाजारों के प्लग-एंड-प्ले समाधानों को सीधे नकल करना स्थानीय नेटवर्क, भाषा और लागत की स्थितियों के अनुकूल बनाने में कठिन होगा।
लीड इन्वेस्टर 4DX Ventures ने कहा कि अफ्रीका और मध्य पूर्व के व्यवसायों की आवाज़ी बातचीत की मात्रा अभी भी पश्चिमी बाजारों की तुलना में स्पष्ट रूप से अधिक है, और स्थानीय व्यवसायों को बोलियों, मिश्रित भाषाओं और अनौपचारिक अभिव्यक्तियों को संभालने में सक्षम प्रणालियों की आवश्यकता है, जिससे क्षेत्रीय आवाज़ी AI कंपनियों के लिए स्थान बचा है।
