قامت OpenAI للتو بفصل ذكائها الصوتي إلى ثلاثة أدوات منفصلة، وهذه الخطوة لها أهمية تتجاوز عالم الروبوتات المحادثة. أطلقت الشركة GPT-Realtime-2 وGPT-Realtime-Translate وGPT-Realtime-Whisper في 7 مايو، حيث تستهدف كل أداة شريحة محددة من معالجة الصوت في الوقت الفعلي بدلاً من دمج كل شيء في منتج واحد ضخم.
في أسواق العملات المشفرة، جاء الإعلان كعامل محفز. ارتفع البيتكوين إلى 122 ألف دولار، ووصل الإيثيريوم إلى 4.3 ألف دولار، حيث رفع المتداولون أسعار الأصول المرتبطة بالذكاء الاصطناعي بفضل تجدد الحماس لبناء البنية التحتية للقطاع.
ما أطلقته OpenAI فعليًا
يقدم GPT-Realtime-2 تفكيرًا على مستوى GPT-5 للتفاعلات الصوتية المعقدة. يعالج GPT-Realtime-Translate الترجمة في الوقت الفعلي عبر أكثر من 70 لغة. يركز GPT-Realtime-Whisper على النسخ.
تدعم هذه النماذج نوافذ سياقية تصل إلى 256K رمز، وهي قفزة هائلة تسمح للحوارات بالتدفق دون الانقطاعات الاصطناعية التي عانت منها الإصدارات السابقة.
الأسعار تتبع فلسفة الوحدات. يُحسب تكلفة GPT-Realtime-2 لكل رمز، بينما تُفرض تكاليف نماذج الترجمة والتحويل النصي حسب الدقيقة من المعالجة في الوقت الفعلي. هذا التمييز مهم للشركات التي تحاول التنبؤ بالتكاليف على نطاق واسع، حيث يسمح التسعير القائم على الرموز لها بتحسين الكفاءة، بينما يوفر التسعير القائم على الدقائق ميزانيات متوقعة للمهام الصوتية ذات الحجم العالي.
جميع النماذج الثلاثة متاحة من خلال واجهة برمجة تطبيقات Realtime الخاصة بـ OpenAI، وتُدمج في مجموعات الوكلاء الحالية كعناصر توجيه منفصلة.
لماذا تهتم أسواق التشفير بالذكاء الاصطناعي الصوتي
شهدت العملات البديلة المرتبطة بالذكاء الاصطناعي ارتفاعات ملحوظة في الحجم بعد الإعلان. وقد تكرر هذا النمط طوال عام 2025 وحتى عام 2026، حيث أرسل كل إصدار رئيسي للبنية التحتية للذكاء الاصطناعي من OpenAI أو Google أو Anthropic موجة جديدة من رؤوس الأموال إلى تقاطع الذكاء الاصطناعي والعملات المشفرة.
دعم العملاء لبروتوكولات DeFi هو تطبيق آخر واضح. يمكن لواجهات الصوت الأولى المدعومة بنماذج ذات نوافذ سياقية بحجم 256K معالجة جلسات استكشاف الأخطاء وإصلاحها متعددة المراحل دون فقدان سياق ما حدث قبل ست رسائل.
ما يعنيه ذلك للمستثمرين
نموذج التسعير لكل دقيقة لـ GPT-Realtime-Translate و GPT-Realtime-Whisper يخلق ديناميكية مثيرة لشبكات الحوسبة اللامركزية. إذا ظلت تكاليف واجهات برمجة التطبيقات المركزية مرتفعة عند التوسع، فقد تستوعب المشاريع التي تقدم أسعار استنتاج تنافسية على البنية التحتية اللامركزية الطلب من المطورين الحساسين للتكلفة.
من حيث المخاطر، يجب على المستثمرين مراقبة سياسات حوكمة OpenAI وحدود المعدلات بنفس القدر الذي يراقبون به أسعار الرموز، حيث يمكن أن تمنع القيود الأشد أو طبقات التسعير المخصصة للشركات المطورين العاملين في التقاطع بين التشفير والذكاء الاصطناعي.


