Công ty khởi nghiệp AI giọng nói AethexAI nhắm đến thị trường châu Phi và Trung Đông đã huy động được 3 triệu USD trong vòng tài trợ trước hạt giống và đồng thời ra mắt nền tảng dùng thử doanh nghiệp, API và SDK nhằm thâm nhập thị trường tự động hóa dịch vụ khách hàng và cuộc gọi địa phương.
Đợt huy động vốn do 4DX Ventures dẫn đầu
Đợt huy động vốn này do 4DX Ventures dẫn đầu, với sự tham gia của Enza Capital, Dorm Room Fund, Mojo Ventures và Stanford GSB 26 Fund. Các nhà đầu tư cá nhân bao gồm các giảng viên Stanford, các nhà quản lý ngành viễn thông và các nhà nghiên cứu AI từ Anthropic.
AethexAI được thành lập vào năm ngoái bởi Mariama Diallo và Ayooluwa Odemuyiwa. Diallo từng làm việc tại Goldman Sachs, sau đó gia nhập ModelML được YC hỗ trợ, phụ trách sản phẩm và tăng trưởng. Odemuyiwa tốt nghiệp California Institute of Technology, từng làm việc tại Meta, sau đó nhập học tại Stanford Business School.
Mô hình nhỏ tự phát triển giúp giảm độ trễ cuộc gọi
Công ty không sử dụng các công cụ sắp xếp sẵn có như Vapi hay LiveKit, mà tự xây dựng các mô hình nhỏ và lớp sắp xếp, tập trung xử lý các phương ngữ địa phương phổ biến ở thị trường mục tiêu như tiếng Anh, tiếng Pháp và tiếng Ả Rập.
Hai nhà sáng lập cho biết, trong quá trình nghiên cứu, họ phát hiện một số doanh nghiệp ở châu Phi và Trung Đông sau khi cố gắng tự động hóa trung tâm cuộc gọi đã quay lại quy trình thủ công do hiệu quả không như mong đợi. Một số doanh nghiệp khác lại gặp vấn đề về khó tuyển dụng kỹ sư tự động hóa và khó kiểm soát chi phí.
AethexAI cho rằng một trong những thách thức chính của AI giọng nói địa phương là độ trễ. Nếu dựa vào các mô hình lớn được triển khai ngoài khu vực, thời gian chờ và độ rung trong cuộc gọi sẽ rõ rệt hơn. Vì vậy, công ty lựa chọn sử dụng các mô hình nhỏ hơn để rút ngắn thời gian phản hồi ở từng giai đoạn.
Đã xử lý hơn 17.000 cuộc gọi mỗi ngày
Công ty đã phát triển các mô hình Kora riêng, với quy mô tham số từ 300 triệu đến 1,7 tỷ, rõ ràng nhỏ hơn các mô hình ngôn ngữ lớn phổ biến. AethexAI cho rằng quy mô này phù hợp hơn để cân bằng tốc độ và độ chính xác trên thị trường mục tiêu.
Về thu thập dữ liệu, công ty sử dụng các bản ghi âm ẩn danh từ các đối tác trung tâm cuộc gọi và gửi ổ cứng đến nhiều đài phát thanh tại các khu vực khác nhau ở châu Phi để thu thập thêm dữ liệu âm thanh. Đồng thời, công ty tổ chức sinh viên đại học tham gia gán nhãn dữ liệu và sắp xếp cách phát âm tên địa phương nhằm giảm chi phí huấn luyện.
AethexAI cho biết hiện tại hệ thống của họ xử lý hơn 17.000 cuộc gọi mỗi ngày. Các ứng dụng chính hiện nay bao gồm thu hồi nợ, kích hoạt khách hàng và xác minh danh tính KYC phổ biến trong ngành ngân hàng và viễn thông.
Hãy bắt đầu từ một kịch bản đơn lẻ để tiếp cận khách hàng doanh nghiệp
Về mặt thương mại, công ty này đang giúp các doanh nghiệp lựa chọn các kịch bản phù hợp để tự động hóa thông qua các buổi trình diễn trực tiếp và hội thảo, thay vì bao phủ toàn bộ quy trình ngay lập tức. Đội ngũ sáng lập cho biết hiện tại sẽ yêu cầu khách hàng chọn ra một kịch bản quan trọng nhất để bắt đầu triển khai.
Công ty vẫn đang tuyển dụng kỹ sư phục vụ thị trường địa phương thông qua hợp đồng và thiết lập hợp tác kênh với các nhà cung cấp viễn thông để xử lý cơ sở hạ tầng điện thoại cần thiết cho các cuộc gọi AI giọng nói. AethexAI cho rằng việc sao chép trực tiếp các giải pháp plug-and-play từ thị trường Mỹ và Âu khó có thể thích nghi với điều kiện mạng, ngôn ngữ và chi phí địa phương.
Đối tác dẫn đầu 4DX Ventures cho biết, lượng tương tác bằng giọng nói của các doanh nghiệp ở châu Phi và Trung Đông vẫn rõ ràng cao hơn so với các thị trường phương Tây, và các doanh nghiệp địa phương cần các hệ thống có thể xử lý phương ngữ, mã hỗn hợp và các biểu đạt không trang trọng, tạo ra không gian phát triển cho các công ty AI giọng nói địa phương hóa.
