بقلم: Sleepy،思维怪怪
في ديسمبر 2025، ظهر أخيرًا "هاتف دوباء" بعد انتظار طويل. تم تثبيت إصدار تجريبي تقني من مساعد هاتف دوباء على جهاز نويا M153 التجريبي، وتم تحديد سعره الإطلاقي بـ 3499 يوانًا، وتم بيع جميع الوحدات الأولى البالغ عددها حوالي 30,000 وحدة في يوم الإطلاق.
في الأيام الأولى بعد إطلاقه، بلغ سعره في سوق السمك عدة أضعاف سعره الأصلي. كما اشترت فريق تحرير Dongcha Beating جهازين.

ليس لأنه هاتف ممتاز الاستخدام، بل على العكس، فإن هاتف DouBao الأول كـ "نسخة تجريبية تقنية" لم يكن تجربته جيدة. لكن ما يثيرنا بشكل خاص هو أنه لأول مرة أخرج الذكاء الاصطناعي من مربع الدردشة، وحوله من روبوت دردشة إلى وكيل ذكاء اصطناعي قادر على التحكم بهاتف.
على هاتف دوباب، يمكن للذكاء الاصطناعي رؤية الشاشة، وفهم المحتوى الذي تتصفحه، وسماع كلامك، والتنقل بين التطبيقات المختلفة، ويمكنه مباشرةً مساعدتك في العديد من المهام، مثل التحقق من تذاكر القطارات، والمقارنة بين الأسعار عند التسوق، واستلام القسائم ووضع الطلبات، وتحرير الصور. على الرغم من أن المراحل الحساسة مثل الدفع لا تزال تتطلب تأكيدًا من المستخدم، إلا أنه قادر بالفعل على إنجاز العديد من المهام التي كانت في الماضي تتطلب منا النقر عليها يدويًا خطوة بخطوة.
على الرغم من أنه لا يزال يعاني من بعض البطء، أحيانًا يتأخر في الاستجابة، وأحيانًا يتوقف، مثل شخص تعلم للتو استخدام هاتف ذكي، إلا أنه جعلنا نشعر لأول مرة بشكل مباشر بمدى الراحة التي يمكن أن توفرها الذكاء الاصطناعي في حياتنا اليومية.
بعد ذلك، ظهر السرطان وحقق شعبية عالمية، وأصبح وكيل الذكاء الاصطناعي لحظة iPhone أخرى في مجال الذكاء الاصطناعي بعد ظهور ChatGPT، فبدأ عدد كبير من الشركات والرواد في بيع أجهزة حاسوب وهواتف مُثبّتة مسبقًا بـ OpenClaw. لقد تقدم هاتف DouBao عليهم بمراحل على الأقل، ويمكن القول إن هاتف DouBao كان رائدًا في هذه الموجة من وكالات الذكاء الاصطناعي.
لكن للأسف، واجه دو باو بسرعة حملة قمع من الشركات الكبرى. ظهرت مشكلات في الوصول أو التشغيل تدريجيًا في سيناريوهات مثل ويه تشين، وتاوباو، وعلي باي، وتطبيقات البنوك. يقول البعض إن هذا "حظر"، بينما يرى آخرون أنه مجرد تفعيل لإجراءات المخاطر، لكن بالنسبة للمستخدمين، لا فرق بينهما — فهو ببساطة لم يعد قابلاً للاستخدام.

نأسف جدًا. لا يُعد هاتف دوباب منتجًا استهلاكيًا ناضجًا، لكنه أظهر للصناعة بأكملها نموذجًا أوليًا للبوابة التالية.
لذلك، حتى بعد أن تراجع حماس هاتف دو باو، لم نستسلم تمامًا لهذا الأمر. حتى مؤخرًا، اكتشفنا عبر جمع المعلومات اليومية آلاف الإعلانات الوظيفية، وعند تحليلها، تبين أن ByteDance تبدو على وشك استئناف تطوير الهواتف.
ثلاثة مقاييس، خيط واحد
قمنا بالاستخراج من صفحة التوظيف الرسمي لـ ByteDance ثلاث فئات: أعمال الابتكار في الذكاء الاصطناعي، ونظام التشغيل المحمول، ومساعد هاتف DouBao.
بعد إزالة التكرارات بناءً على معرف الوظيفة، قمنا باستخراج معلومات صفحة التفاصيل وتنظيمها عبر تقاطع الكلمات المفتاحية من اسم الوظيفة، ووصف الوظيفة، ومتطلبات التوظيف.

على عكس توظيف فرق تطبيقات الذكاء الاصطناعي العادية، ظهرت في هذه المجموعة من وظائف التوظيف الخارجي لـ ByteDance وظائف مثل نظام الهاتف، الكاميرا، التحكم باللمس، الاتصال، استهلاك البطارية، التسخين، توافق الرقاقة، تصميم الهيكل، عمليات التجميع، واختبار خط الإنتاج.
هذه المصطلحات غير شائعة في شركات الإنترنت، بل هي ما تتعامل معه يوميًا شركات الهواتف المحمولة وشركات سلسلة التوريد وفرق الهندسة.
تخطط ByteDance لتوظيف أشخاص للعمل في المصنع.
لكن هذا لا يؤكد أن بايت دانس ستطلق علامة تجارية خاصة بها للهواتف، لكنه على الأقل يؤكد أنهم يعيدون تشغيل تطوير الأجهزة من فئة الهواتف.
دعونا الآن نلقي نظرة على ما تشير إليه هذه الوظائف نفسها.
مساعد豆包 للهاتف: من الإجابة على الأسئلة إلى تنفيذ المهام نيابةً عنك
راجع أولاً مساعد الهاتف دو باو.
أجرينا عملية فلترة أكثر تركيزًا، وبحثنا في البيانات الأصلية عن الوظائف التي تحتوي على "مساعد هاتف دوباء" في الاسم أو الوصف أو المتطلبات، ووجدنا 83 وظيفة، ويمكن تقسيم هذه الوظائف إلى ثلاث فئات، والتي تشكل معًا شكل وكيل ذكي على مستوى النظام.

الفئة الأولى من الوظائف، مسؤولة عن تمكين الذكاء الاصطناعي من القدرة على العمل كوكيل.
على سبيل المثال، الوظيفة "مهندس تطوير عامل Agent - مساعد هاتف دوباء" تتطلب من الذكاء الاصطناعي تنفيذ تقسيم المهام، وتنظيم السياق، واستدعاء الأدوات، واسترجاع الذاكرة، وإدارة الحالة، والتحقق من النتائج، واستعادة الاستثناءات. وهي جميعها القدرات الأساسية لجميع عوامل الذكاء الاصطناعي المستخدمة حاليًا.
الفئة الثانية من الوظائف، مسؤولة عن جعل وكيل الذكاء الاصطناعي يتذكر جيدًا.
ظهرت وظائف تتعلق بـ "الإدراك والذاكرة" و"ذاكرة المستخدم" و"خريطة المعرفة الشخصية" و"التفضيلات طويلة الأجل". إذا أردنا أن يندمج وكيل الذكاء الاصطناعي حقًا في حياتنا، فلا يمكن أن يعاملنا كأنه يلتقي بنا لأول مرة كل يوم؛ بل يحتاج إلى ذاكرة طويلة الأجل موثوقة ومستقرة.
بالطبع، هذا يمس بسهولة قضايا الخصوصية والحدود، لكن من حيث وثائق التوظيف، يبدو أن ByteDance بدأت على الأقل في اعتبار "الذاكرة" واحدة من أهم القدرات لمساعد豆包 على الهاتف.
الوظيفة من الفئة الثالثة، وهي مسؤولة عن تمكين وكيل الذكاء الاصطناعي من أداء تلك القدرات داخل الهاتف المحمول.
لا يمكن لمساعد هاتف دوباب أن يعمل عن طريق تشغيل الهاتف نيابةً عن المستخدمين إذا كان مقتصرًا على السحابة فقط أو مجرد تطبيق. فهو يحتاج إلى مجموعة كاملة من القدرات، بما في ذلك النموذج، والذاكرة، وتنفيذ المهام، والنشر على الجانب النهائي، وتطبيقات النظام، والصوت والفيديو، والاتصال، والاختبار وضمان الجودة، ليتمكن من فهم كلام المستخدم، وفهم البيئة، والتعاون عبر الأجهزة، والبقاء جاهزًا في أي وقت، دون التسبب في أي فوضى.
نظام التشغيل المتنقل: الأساسيات الخاصة بالهاتف هي التحدي الحقيقي للوكيل
انظر مرة أخرى إلى نظام التشغيل المحمول.
هناك 236 وظيفة مرتبطة بنظام التشغيل المحمول، وتركز المواقع المكتبية الرئيسية في بكين وشنغهاي وشنتشن. تظهر الكلمات المتكررة في وصف الوظائف بشكل متكرر: النواة، الرقاقة، السائق، الكاميرا، العرض، الصوت، الشبكة، استهلاك الطاقة، إدارة الحرارة، الإنتاج الضخم والتوصيل. هذه تقريبًا جميعها كلمات تتعلق بالعتاد وأنظمة الهاتف الأساسية.

على سبيل المثال، تنص مسؤوليات الوظيفة "القائد الداخلي - نظام التشغيل المحمول" على قيادة فريق الذاكرة والتخزين لتأهيل وتطوير النواة لمنصات Qualcomm الجديدة، بحيث يمكن للنظام التوافق مع شرائح الهواتف الرئيسية، بالإضافة إلى إدارة الذاكرة والتخزين داخل الهاتف. هذه القدرات ضرورية لأي وكيل ذكاء اصطناعي ليتمكن من الاستجابة في الوقت الفعلي ومعالجة المهام في الخلفية.
على سبيل المثال، ظهرت أيضًا مصطلحات مثل SoC وBSP وRTOS في الوظائف. يمكن فهم SoC تقريبًا على أنها الشريحة الأساسية للهاتف، وBSP هي مجموعة من البرمجيات الأساسية التي تسمح للنظام والعتاد بالتعرف على بعضهما البعض والعمل معًا، بينما تُستخدم RTOS عادةً في السيناريوهات التي تتطلب استجابة عالية وكفاءة طاقة.
إذًا، فإن الإشارة الصادرة عن وظائف نظام التشغيل المحمول هي أن بايت دانس تبحث عن أشخاص يفهمون أنظمة طرفية على مستوى الهاتف، ويجب أن يعرفوا على الأقل أين ستتعثر واجهات الذكاء الاصطناعي عند التشغيل على الهاتف بسبب مشاكل الصلاحيات، وأين ستتعثر بسبب مشاكل استهلاك الطاقة، وأين ستتعثر بسبب استقرار النظام، وأي المشكلات تحتاج إلى حلها بالتعاون مع فرق الرقائق والشركات المصنعة واختبار النظام.
من متطلبات الوظائف التي تُوظف حاليًا، يبدو أن ByteDance قد دخلت مرحلة متقدمة في مجال الهواتف.
موقع شنتشن: إشارات للعتاد والإنتاج الضخم
بالإضافة إلى ذلك، من الضروري التحقق بشكل منفصل من الوظائف التي تقع في شنتشن.
إذا كانت الوظائف في بكين تركز بشكل أكبر على النماذج والخوارزميات والمنصات، وكانت الوظائف في شنغهاي تركز بشكل أكبر على المنتجات والهندسة، فإن الوظائف في شنتشن غالبًا ما ترتبط بالأجهزة وسلسلة التوريد والاختبار والإنتاج الضخم.

إذا كان المشروع مجرد خدمة سحابية، فليس من المهم جدًا أن يكون في شنتشن؛ لكن بمجرد أن يتطلب الأمر التعامل مع منتجات مادية، تصبح شنتشن مهمة جدًا.
ما رأيناه في الوظائف ذات الصلة في شنتشن هو بالضبط هذه الأشياء.
بعض الوظائف تُذكر كتصميم التفاعل بين الإنسان والحاسوب، وتشمل التفاعل المادي مع الأجهزة، وواجهات البرمجيات، وتجربة التكامل عبر المنصات المتعددة. لا تقتصر هذه الوظائف على تصميم الواجهات داخل الشاشة فحسب، بل تأخذ في الاعتبار أيضًا إحساس الجهاز المادي، والأزرار، وطرق تفعيله، وكيفية تكامله مع الأجهزة الأخرى.
هناك أيضًا وظائف أخرى أقرب إلى موقع الهندسة، مثل التوصيل، والاستهلاك الطاقي، والاتصالات قصيرة المدى، والقاعدة الأساسية، وتقنيات الجهاز الكامل، والهيكل، وتقنيات الاختبار.
بالمقارنة مع كلمات مثل "الوكيل الذكي" و"متعدد الوسائط" و"نموذج العالم"، فهي ليست أكثر جاذبية. لكن في النهاية، فإن هذه الأشياء هي التي تحدد مصير الإلكترونيات الاستهلاكية.
إذا كان بايت دانس只想 جعل دو باو تطبيق هاتف أفضل، فلن تحتاج إلى تحمل كل هذه المهام الشاقة. بمجرد أن تبدأ في توظيف هذه الوظائف، فهذا يعني أنها مستعدة للصعود على هذه السفينة.
لا يمكن لـ ByteDance أن تقتصر فقط على التطبيق
في الماضي، كانت الهواتف المحمولة وعاءً للتطبيقات؛ وفي عصر الذكاء الاصطناعي، قد تصبح الهواتف المحمولة جسمًا للوكلاء.
إذا كان الهاتف مجرد حاوية للتطبيقات، فبإمكان شركات مثل بايت دانس بناء ممالكها من خلال تطبيقات فردية تعتمد على المحتوى والخوارزميات وقدرات المنتج. لكن إذا أصبح الهاتف جسمًا للوكيل، فسيكون المستخدم هو من يُطلق المهمة أولًا، ومن يقبل المهمة سيكون لديه فرصة لتحديد المسار التالي.
في هذا المسار، سيتم تخفيض التطبيق إلى أداة قابلة للدعوة. وهذا سيجعل جميع التطبيقات الفائقة تشعر بعدم الارتياح، لأن الوكلاء مصممون أصلاً للتجاوز المباشر للطبقات الوسيطة.
إذًا، الجزء الحقيقي الصعب قد لا يكون في قدرة دوباء على فتح تطبيق، بل في رغبة الآخرين في السماح له بذلك. ولا يمكن لذكاء اصطناعي قادر على اتخاذ قرارات نيابة عن المستخدم أن يُسمح له بالمرور بسهولة مثل التطبيقات العادية.

يجب على الوكيل أن ينتقل من مربع الدردشة إلى طبقة التشغيل، ويتعامل مع مجموعة كبيرة من المهام الشاقة التي لم تكن من مسؤوليات فريق الذكاء الاصطناعي من قبل. يجب أن يعرف متى سيُقتل الخلفية من قبل النظام، ومتى ستُفعّل إجراءات المخاطر، ولماذا يسخن الهاتف، ولماذا لا تتحسن نسبة المنتجات المقبولة في المصنع. في الماضي، لم تكن هذه الأمور من مسؤولية فريق الذكاء الاصطناعي، لكنها الآن لا يمكن تجنبها.
لذلك يجب على بايت دانس توظيف هذه الوظائف. قد لا تطلق بالفعل هاتفًا، لكن بايت دانس لا يمكنها أن تظل مجرد تطبيق داخل هواتف الآخرين.
لا يمكن لشركة النموذج الكبير أن تصبح مدخل المستخدم في الجيل القادم إذا ظلت تعتمد دائمًا على أنظمة تشغيل الآخرين.
