ME সংবাদের মতে, ১৮ এপ্রিল (UTC+8), অ্যানালিসিস বিটিং-এর মনিটরিং অনুযায়ী, xAI দুটি স্বতন্ত্র অডিও API চালু করেছে: Grok Speech to Text এবং Grok Text to Speech। এই দুটি API গ্রক ভয়েস, টেসলা কার সিস্টেম এবং স্টারলিঙ্ক কাস্টমার সাপোর্টকে সমর্থন করে এমন একই অডিও স্ট্যাক থেকে আসে, এবং এখন এগুলি স্বতন্ত্র endpoint হিসেবে উন্মুক্ত করা হয়েছে, যাতে ডেভেলপাররা ভয়েস এজেন্ট, রিয়েল-টাইম ট্রান্সক্রিপশন, অ্যাক্সেসিবিলিটি টুলস এবং পডকাস্টসহ বিভিন্ন অ্যাপ্লিকেশনে সরাসরি ইন্টিগ্রেট করতে পারে। STT-এ দুটি মোড রয়েছে। REST API-এর মাধ্যমে বড় অডিও ফাইলগুলির ব্যাচ-ভিত্তিক ট্রান্সক্রিপশন করা যায়, যা মিলিসেকেন্ডেরও কম সময়ে ফলাফল দেয়; WebSocket API-টি রিয়েল-টাইম ভয়েস স্ট্রিমের জন্য। অতিরিক্ত ক্ষমতা হলো: শব্দ-স্তরের টাইমস্ট্যাম্প, স্পিকার ডায়ারিজেশন, মাল্টি-চ্যানেলের আলাদা শনাক্তকরণ, এবং Inverse Text Normalization—যা কথোপকথনের মধ্যে থাকা সংখ্যা, তারিখ, মুদ্রা সহজভাবে সুসংগঠিত, প্রমিতটিরূপে রূপান্তরিত করে। 25-এরওবেশি ভাষা সমর্থন করা হয়,এবংকথোপকথনেরমধ্যেঅবিরতভাবেসুইচকরাযায়। xAIএকইসময়েএকটিবারপদমূল্য (WER,যতকমহবেততভাল)এরতুলনামুখস্থকরেছে:সমগ্রপরিস্থিতিতেGrok6.9%,ElevenLabs9.0%,Deepgram11.0%,AssemblyAI12.9%; “ফোনকলসহবস্তুশনাক্তকরণ”-এরক্ষেত্রেফারকপরিষ্কারভাবেবড়:Grok5.0%,প্রতিপক্ষগুলিরযথাক্রমে12.0%,13.5%,21.3%।মিটিং,ভিডিওপডকাস্টএবংফোনকল—এইতিনটিসাধারণব্যবসায়িকপরিস্থিতিতেGrokসবক্ষেত্রেহালকভাবেঅগ্রগতিরপরিচয়দিয়েছে।এইসংখ্যাগুলিxAIদ্বারাসম্পন্নকরাহয়েছেএবংপ্রকাশকরাহয়েছে,এখনওকোনওতৃতীয়পক্ষদ্বারাপুনরায়পরীক্ষা(retest)হয়নি।দাম:STT-এরজন্যব্যাচপ্রসেসিং0.10ডলার/ঘণ্টা,স্ট্রিমিং0.20ডলার/ঘণ্টা;TTS4.20ডলার/100হাজারঅক্ষর।TTS-এবহুমুখীSpeechTagsব্যবহারকরেভাবঅধিগতকরণএবংছন্দনিরনির্ধারণকরাযায়,যেমন:[laugh],[sigh],[whisper], (উৎস: BlockBeats)
xAI গ্রক এসটিটি এবং টিটিএস এপিআই চালু করেছে যার ৬.৯% শব্দ ত্রুটি হার
KuCoinFlashশেয়ার






এপ্রিল ১৮ (UTC+৮)-এ xAI গ্রক এসটিটি এবং টিটিএস এপিআই প্রকাশ করেছে, যার শব্দ ভুলের হার ৬.৯%, যা ইলেভেনল্যাবস, ডিপগ্রাম এবং অ্যাসেম্বলিএআই-এর চেয়ে ভালো। এপিআইগুলি REST এবং WebSocket-এর মাধ্যমে ব্যাচ এবং রিয়েল-টাইম ট্রান্সক্রিপশন সমর্থন করে। টিটিএস-এ আবেগ এবং ছন্দ নিয়ন্ত্রণ রয়েছে। এসটিটির মূল্যনির্ধারণ ব্যাচের জন্য ঘন্টায় $০.১০ এবং স্ট্রিমিংয়ের জন্য ঘন্টায় $০.২০, যখন টিটিএস-এর মূল্য ১ মিলিয়ন অক্ষরের জন্য $৪.২০। এই লঞ্চটি বৃদ্ধি পাওয়া সুদের হারের খবর এবং বাড়তি অন-চেইন খবরের কার্যকলাপের মধ্যে ঘটেছে।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।