إنفاق 500 مليون دولار في شهر واحد!
في الآونة الأخيرة، كُشف عن خطأ فادح في عالم التكنولوجيا. وفقًا لتقرير Axios، أنفقت شركة ما ما مجموعه 500 مليون دولار على Claude خلال شهر واحد فقط!
السبب مثير للضحك والبكاء في آنٍ واحد: نسي الإدارة عند تفعيل صلاحيات حسابات Claude للموظفين ضبط حدود الاستخدام.

في الواقع، هناك أكثر من شركة واحدة تعرّضت لإفلاس بسبب الذكاء الاصطناعي.
في أبريل من هذا العام، تلقى مستخدم لـ Google Cloud فاتورة قدرها 18 ألف دولار بسبب استغلال مفتاح API متروك في خدمة عامة، بينما كان ميزانيته الأصلية لا تتجاوز 7 دولارات.

اسم المستخدم المحظوظ هذا هو Jesse Davies، وهو مستشار ذكاء اصطناعي أسترالي ومؤسس Agentic Labs. قام بتعيين حمايتين لحسابه على Google Cloud: تنبيه ميزانية بقيمة 10 دولارات أسترالية (حوالي 7 دولارات)، وحد أقصى للإنفاق قدره 1400 دولار.
وفقًا لتومز هاردوير، اكتشف المهاجمون خدمة Cloud Run نُشرت منذ عدة أشهر من قبل AI Studio، وأرسلوا أكثر من 60 ألف طلب، ولم تتمكن طبقتا الحماية من منعها: كان هناك تأخير في حساب الفاتورة، وعندما استجاب النظام، ارتفع المبلغ إلى 18 ألف دولار.
في منتصف مايو، نشر بيتر شتاينبرغر، مؤسس المشروع مفتوح المصدر OpenClaw، لقطة شاشة على X: فاتورة OpenAI API لمدة 30 يومًا بقيمة 1.3 مليون دولار.

فريقه يتكون من ثلاثة أشخاص فقط، لكنهم يسيطرون على 100 عامل Codex تعمل بالتوازي: حيث تم حرق 60.3 مليار رمز خلال 30 يومًا، وتنفيذ 7.6 مليون طلب. لحسن الحظ، لم يكن هذا المبلغ البالغ 1.3 مليون دولار من ماله الخاص.
انضم شتاينبرغر إلى OpenAI في فبراير من هذا العام، وكان هذا المبلغ البالغ 1.3 مليون دولار تجربة داخلية:
اختبار ما إذا كان الترميز بالذكاء الاصطناعي يمكنه الوصول إلى أي حدود دون أخذ تكلفة الرموز في الاعتبار. وأضاف أن هذا نتيجة وضع "السرعة العالية" (Fast Mode) لـ Codex، والذي عند إيقافه يبلغ حوالي 300 ألف دولار.
في وقت سابق، اعترف رئيس التكنولوجيا في أوبر، برافين نيبالي ناغا، لـ The Information أن الشركة استهلكت ميزانية Claude Code السنوية بالكامل في أبريل، كما أشار الرئيس التنفيذي للعمليات إلى أن تكاليف الذكاء الاصطناعي أصبحت أكثر "صعوبة في التبرير".
500 مليون، 1.3 مليون، 18 ألفًا، على الرغم من أن المبالغ تختلف بعدة درجات من الحجم، إلا أنها تشير إلى نفس الحقيقة:
في عصر الوكلاء، يمكن لأي من المفاتيح غير الخاضعة للرقابة، أو جيوش الوكلاء التي تعمل على مدار الساعة، أو الحسابات التي نسيت تحديد حدودها، أن تُفرغ ميزانيتك من الرموز في ليلة واحدة.
لماذا تنفجر فواتير الذكاء الاصطناعي؟
الإجابة مخفية أساسًا في تغييرات طريقة التسعير.
منذ أبريل من هذا العام، انتقلت خطة التسعير الشهرية لـ OpenAI إلى التسعير حسب استخدام Token.
في 2 أبريل، تغير نظام فواتير Codex من التقدير حسب الرسائل إلى التحصيل حسب استخدام الرموز: يتم حساب أنواع الرموز الثلاثة (المدخلات، المدخلات المخزنة مؤقتًا، والمخرجات) بشكل منفصل. وفي 23 أبريل، تم توسيع هذه القواعد لتشمل جميع خطط Enterprise وEdu وHealth وGov: تم إزالة الخصم الخفي المضمن في الرسوم الشهرية.
كما تبع جيثب، وأُعلن للتو: ستنتقل جميع حزم Copilot اعتبارًا من 1 يونيو 2026 إلى نموذج التسعير حسب الاستخدام. سيتم إلغاء منطق الطلبات المتقدمة القديم واستبداله برصيد ذكاء اصطناعي، حيث يتم حساب التكلفة بناءً على استهلاك فعلي لـ Token المدخلة والمخرجة والمخزنة، وفقًا لأسعار واجهة برمجة التطبيقات لكل نموذج.

شرح GitHub رسميًا السبب وراء هذا الإجراء:
يُنفق المستخدمون نفس المبلغ على محادثة سريعة ومهام برمجية ذاتية تستغرق عدة ساعات. كان GitHub يتحمل تكاليف المستخدمين الذين ينفذون مهامًا ثقيلة، لكن هذا النموذج لم يعد مستدامًا.
قبل ظهور الوكلاء الذكاء الاصطناعي، كانت تكاليف المحادثة والتكملة متشابهة، وكانت تغطيها الرسوم الشهرية.
بعد صعود الوكلاء، يمكن لمهام واحدة أن تعمل لساعات متواصلة وتُعدّل كامل قاعدة الكود، مما يُوسع فرق التكلفة بين المستخدمين المكثفين والمستخدمين الخفيفين بعدّة درجات من الحجم. نظام الاشتراك الشهري ينهار تمامًا أمام هذا الفرق.
بعد إصدار الرسالة، اندلعت ضجة على Reddit وX.
أظهر مطور برمز ID JBusu لقطة شاشة لفواتيره، ووصف التسعير الجديد بأنه "مضحك". فبدلاً من تكلفة 28.12 دولارًا شهريًا سابقًا، سيتعين عليه دفع 746.01 دولارًا وفقًا للهيكل الجديد، وقد قرر إلغاء اشتراكه، قائلًا: "بهذا السعر، سيكون أرخص لي أن أستأجر خادم سحابي بنفسي."


قطعة شاشة من مستخدم آخر كانت أكثر إثارة، حيث ارتفعت الرسوم من 50 دولارًا إلى 3000 دولارًا، وقال إنه لم يتوقع أن تكون التسعيرات بهذا السوء: "هل لا يزال هناك أحد يتابع الاشتراك؟"

لكن ظهر بعض المستخدمين القدامى لـ Copilot للرد: هذه الفواتير المتطرفة ناتجة على الأرجح عن "vibe-coders" (المبرمجين الذين يعتمدون على الإحساس) الذين لا يهتمون بحرق الرموز، ولا تمثل الاستخدام العادي بالضرورة.
تعليق من مستخدم قديم: "أنا أستخدمه طوال اليوم، وفي نهاية الشهر لا أتجاوز الحد، من الصعب أن أصدق أن هذا فرق في تعقيد العمل." وتعليق آخر أكثر مباشرة: "هناك من يريد تطوير نمط YOLO آلي بالكامل، ليترك الذكاء الاصطناعي يجري بحرية. إزالة هذا الهدر هي ميزة للآخرين."
يجب أن يكون واضحًا一點: لم يُلغِ GitHub الرسوم الشهرية، ولم يتغير سعر الاشتراك الأساسي. ما تغيّر حقًا هو الاستخدام الإضافي، ومهمات الوكلاء، واستدعاء النماذج الأغلى، مما يدخلنا الآن في نظام التسعير حسب الاستخدام.
الأكثر تأثراً هم المستخدمون المكثفون للوكلاء الذين يعتمدون على Copilot لمهام السلسلة الطويلة.
التصنيف الذي تم تدميره من قبل أعضاء الفريق أنفسهم
تم تجاوز رسوم الشهر، من ناحية تم تغيير قواعد التسعير من قبل المنصة، ومن ناحية أخرى، الأشخاص الذين يستخدمون الذكاء الاصطناعي يبذلون جهدًا كبيرًا في الإنفاق.
في مايو، أفاد Business Insider أن أمازون أوقفت قائمة ترتيب داخلية تُسمى KiroRank لاستخدام الذكاء الاصطناعي.
استشهد التقرير بمصادر مطلعة قائلةً إن هذا التصنيف أنشأ سرًا أسلوب عمل غريب: حيث يقوم بعض الموظفين بزيادة استهلاك رموز غير محلّة لمشاكل فعلية، فقط لتحسين مراكزهم في التصنيف.

بعد كشف الأمر، وجه ديف تريدويل، النائب التنفيذي الأول في أمازون، نداءً مباشرًا لجميع الموظفين: "لا تستخدم الذكاء الاصطناعي فقط من أجل استخدامه. استخدمه لحل مشكلات العملاء، وحل مشكلات الأعمال، والابتكار."
رغم أن هذا الأمر يبدو سخيفًا قليلاً، إلا أنه ليس مفاجئًا. عندما يمكن لـ "حرق الرموز" أن يتصدر القائمة، سيقوم الموظفون تلقائيًا بحرق الرموز.
أطلق خبراء وادي السيليكون اسمًا مخصصًا على هذه الظاهرة: Tokenmaxxing (حرق التوكنات إلى أقصى حد)، حيث يُعتبر الاستهلاك إنتاجية.
كما أشار تقرير Axios إلى أن مهندسًا رئيسيًا للتقنية وجد أن الموظفين يستخدمون نماذج الذكاء الاصطناعي للتحقق من الطقس وكتابة رسائل البريد الإلكتروني اليومية، وأمور بسيطة جدًا، لكنهم يستخدمون أحدث النماذج الأكثر تكلفة، مما يؤدي إلى ارتفاع فواتيرهم بصمت.
KiroRank ليس نظام تقييم رسمي من أمازون، بل أداة غير رسمية أنشأها الموظفون بأنفسهم. لكنه كشف بوضوح قاعدة إدارية كلاسيكية: عندما تُحدد مؤشرات الأداء الخاطئة، يبدأ الناس في استغلال الثغرات بأذكى الطرق الممكنة.
اعتبار "كم استُخدم" مساويًا لـ "هل تم القيام به جيدًا" — هذا هو الجذر المؤسسي الأساسي لإهدار الذكاء الاصطناعي في هذه الدورة.
الأشخاص الذين يحسبون رصيد التوكنات، يربحون بالفعل
وجهة أخرى من قلق فواتير الرموز، شخص ما حوّلها سرًا إلى عمل.
الطريق الأول: إطعام الذكاء الاصطناعي بالسياق.
Glean هي الشركة الخاصة بارفيند نفسها. وهي تقدم مساعدًا ذكيًا للشركات يوحد المعرفة الموزعة عبر الشركة، مما يسمح للذكاء الاصطناعي الخاص بالموظفين بالوصول المباشر إلى السياق دون الحاجة إلى البحث في كل مكان. وبذلك، يقلل الذكاء الاصطناعي من المسارات الزائدة، مما يقلل من استهلاك الرموز.
هذه الآلية جعلت إيرادات Glean السنوية تضاعف ثلاثة أضعاف خلال 15 شهرًا، وتجاوزت 300 مليون دولار، مع عملاء مثل Databricks و Reddit و Samsung.
الطريق الثاني: توزيع المهام على النماذج المناسبة.
الشركة الناشئة في مجال توجيه النماذج، Factory AI، تقوم بهذا بالضبط: توزيع كل مهمة تلقائيًا على النموذج الأنسب — المهام البسيطة تُرسل إلى النموذج الأقل تكلفة، بينما المهام المعقدة تُرسل إلى النموذج الأعلى مواصفات. كما أشار أرفيند: عندما يتم توجيه المهام بشكل صحيح، يمكن توفير 10 أضعاف.
كلا الطريقين يقودان إلى نفس الوجهة: اجعل الذكاء الاصطناعي يعمل، لكن لا تدعه يُهدر الموارد بشكل عشوائي.
الأبحاث الأكاديمية تُرسي الأساس لهذا التحول.

https://arxiv.org/pdf/2604.22750
ورقة بحثية من arXiv في أبريل 2026، قامَت لأول مرة بتفكيك منهجي لمعرفة كيفية إنفاق الأموال في مهام ترميز الوكلاء.
الاستنتاج الأول: استهلاك رموز مهام الوكلاء يمكن أن يصل إلى آلاف المرات أكثر من استهلاك رموز الاستدلال البرمجي والحوار البرمجي، والسبب الرئيسي لارتفاع التكلفة هو رموز الإدخال.
الاستنتاج الثاني: عند تشغيل نفس المهمة عدة مرات، يمكن أن يختلف استهلاك الرموز بمقدار 30 مرة.
الاستنتاج الثالث: استهلاك رموز أعلى لا يعني بالضرورة دقة أعلى. غالبًا ما تصل الدقة إلى ذروتها عند تكلفة متوسطة — فكلما زاد الإنفاق أكثر، فإن المال يُنفق ولكن الأداء يصبح مشبعًا.
كما وجدت الورقة أن النماذج الرائدة لا تستطيع حتى التنبؤ بعدد الرموز التي ستستهلكها، وتحتقر بشكل عام التكلفة الحقيقية.
تظن أن إنفاق المزيد من المال يعني إنجاز المزيد من المهام. في الواقع، قد يُنفق المال دون تحسين الأداء، ولا يُحسب الميزانية بدقة.
عندما تبدأ فواتير الذكاء الاصطناعي في تجاوز تكاليف القوى العاملة
هذا هو أول مرة أتذكرها، حيث بدأت تكاليف التقنية في المساواة مع تكاليف القوى العاملة.
في 29 مايو، قال أرفيند جاين، الرئيس التنفيذي لشركة Glean، في مقابلة مع مراسلة CNBC ديردري بوسا.

كما يؤكد ملاحظات برايان كاتانزارو، نائب رئيس نيفيديا للتطبيق العميق للتعلم.
ذكر في مقابلة مع Axios أن تكلفة قوة الحوسبة لفريقه تجاوزت بكثير رواتب الموظفين.
تظهر ظواهر مشابهة لدى عدة شركات: من Glean التي تعمل في الذكاء الاصطناعي للشركات، إلى NVIDIA التي تبيع قوة الحوسبة للذكاء الاصطناعي، وحتى Uber التي تستخدم الذكاء الاصطناعي، جميعها تعيد النظر في هذه الحسابات.
في رأي أرفيند، كانت التكنولوجيا تاريخيًا جزءًا صغيرًا فقط من التكاليف العامة للشركات، لكن تكاليف الذكاء الاصطناعي الآن وصلت إلى مستوى رواتب الموظفين، وغالبًا ما تنفق ميزانيات الذكاء الاصطناعي السنوية للعديد من الشركات خلال شهر أو شهرين فقط.

خلال العام الماضي، كان استخدام الذكاء الاصطناعي مؤشرًا يُحتفى به: كلما زاد الاستخدام، كان ذلك أكثر تقدمًا، وكلما تم حرق الرموز، كان ذلك تبنيًا للمستقبل. الآن، بدأت العديد من الشركات في إعادة التفكير في تلك الجملة البسيطة: ما الذي حصلنا عليه حقًا مقابل هذه الرموز المحروقة؟
ينغلق نافذة الاستخدام المجاني الشهري بالضبط في هذا الوقت.
بعد ذلك، يواجه جميع المطورين السؤال التالي: كيف يمكنهم التخطيط بحكمة لاستغلال كل رمز بأقصى قدر من القيمة؟
الفائز الحقيقي في المستقبل، بلا شك، سيكون أول من تعلم حساب التوكنات.
المراجع:
https://x.com/dee_bosa/status/2060791500049613306%20
https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20
https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20
https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5
هذا المقال من حساب WeChat "New Intelligence Yuan"، المؤلف: Apocalypses of ASI
