واجهة سطر الأوامر قد تكون الواجهة الأكثر ودية لـ AI Agent

كاتب المقال، المصدر: Minority Report

بين عامي 2025 و2026، أطلقت شركات الذكاء الاصطناعي الرائدة توالياً فئة من أدوات الوكلاء بتنسيق CLI.

أطلقت Anthropic Claude Code، وهو مساعد برمجي يعمل في طرفية. وأطلقت OpenAI Codex CLI، وأطلقت Google Gemini CLI. في هذه الموجة، استثمرت تقريبًا كل شركة ذكاء اصطناعي مهمة في الطرفية.

هذا غير بديهي. سطر الأوامر هو منتج من عقد السبعينات، وظهور واجهات المستخدم الرسومية جعل الحواسيب في متناول الجماهير، والآن جعل الإنترنت المتنقل من عملية اللمس الافتراضية الوضع الافتراضي. وفقًا للمنطق المعتاد، يجب أن يكون اتجاه التكنولوجيا أكثر "مرئية" وأكثر "سهولة في الاستخدام" على مر الزمن. لماذا في عصر الذكاء الاصطناعي، تعود أقدم أشكال التفاعل مرة أخرى؟

The answer is not sentiment, it's engineering logic.

الواجهة الرسومية ليست ودية بالنسبة للذكاء الاصطناعي

تم تصميم واجهة المستخدم الرسومية لتسهيل التنقل البصري للإنسان. الأزرار، النوافذ المنبثقة، السحب والإفلات، تأثيرات التأشير — هذه أنماط التفاعل مبنية على الحدس البصري البشري. ينظر الإنسان إلى الواجهة نظرة واحدة، ويفحص مواقع الأزرار، ويحدد الخطوة التالية بشكل غريزي. هذه الآلية طبيعية جدًا للإنسان، وتتطلب تقريبًا تكلفة تعلم شبه معدومة.

لكن طريقة عمل نماذج اللغة الكبيرة ليست بهذه الطريقة على الإطلاق. مدخلات نموذج اللغة الكبيرة هي وحدات ترميز، ومخرجاتها أيضًا وحدات ترميز. "تفكيرها" يحدث في فضاء اللغة، وليس في فضاء البكسل.

جعل الذكاء الاصطناعي يتحكم في واجهة المستخدم الرسومية يعني عبور شق كبير:

تكلفة الفهم مرتفعة جدًا. يحتاج الذكاء الاصطناعي إلى الاعتماد على الرؤية الحاسوبية أو شجرة الوصول لـ"فهم" الواجهة—أي زر يمكن النقر عليه، وأين توجد حقول الإدخال، وما معنى النافذة المنبثقة الحالية. هذا ليس من نقاط قوة الذكاء الاصطناعي، بل هو عبء إضافي.

الحالة ضمنية وغير قابلة للتنبؤ. نفس الزر، اليوم يمكن النقر عليه، وغدًا قد يصبح رماديًا بسبب شرط ما. هذه الحالة الضمنية هي "سياق" للإنسان، ولكنها عدم يقين للذكاء الاصطناعي — فهو لا يستطيع الاستدلال بشكل موثوق بشأن "في أي ظروف يكون هذا الإجراء متاحًا".

العمليات غير قابلة للتركيب. لا توجد طريقة لربط عمليتي واجهة مستخدم رسومية بواسطة أنبوب. "نتائج البحث → تصفية → تصدير" تتطلب ثلاث نقرات في واجهة المستخدم الرسومية، ولا يمكن نقلها أو إعادة استخدامها أو أتمتتها كوحدة واحدة.

صعوبة الاختبار والتحقق. نفذ الذكاء الاصطناعي عملية واجهة مستخدم، كيف تؤكد أنه نجح؟ تحتاج إلى لقطة شاشة، وتحليل حالة الواجهة، وكل دورة ملاحظة بطيئة وهشة.

على النقيض، فإن كل ميزة في CLI تبدو وكأنها مصممة خصيصًا للذكاء الاصطناعي.

المزايا الثلاثة لـ CLI بالنسبة لوكيل الذكاء الاصطناعي: القابلية للتركيب

الفلسفة الأساسية لـ Unix هي: "كل برنامج يقوم بعمل واحد فقط، ويفعله بشكل ممتاز؛ اجعل البرامج قادرة على العمل معًا."

مبدأ التصميم هذا من عقود مضت، يكتسب معنى جديدًا في عصر الذكاء الاصطناعي.

تُربط أدوات CLI عبر الإدخال والإخراج القياسيين. يمكن لـ linkly search "React 性能优化" | head -5 إرسال نتائج البحث إلى الأمر التالي. يمكن لـ linkly search "架构设计" --json | jq '.results[].doc_id' استخراج جميع معرفات المستندات للمعالجة اللاحقة.

بالنسبة لوكيل الذكاء الاصطناعي، يعني التوافق القدرة على ربط عدة أوامر لتشكيل سير عمل معقد متعدد الخطوات، حيث يكون إخراج كل خطوة نصًا منظمًا يمكن استهلاكه من قبل الخطوة التالية. لا توجد دورة "النقر → الانتظار → التقاط صورة شاشة → التحليل" عبر واجهة المستخدم الرسومية، بل فقط مدخلات ومخرجات نظيفة.

Predictability

سلوك كل أمر يُحدَّد بالكامل بواسطة المعلمات. إذا نفّذت linkly search "قاعدة بيانات" --limit 10 اليوم، فستحصل على هذا الناتج، وغدًا (بافتراض أن قاعدة البيانات لم تتغير) ستظل النتيجة نفسها. لا توجد حالة ضمنية، ولا أي لبس حول "لماذا كان هذا الميزة تعمل سابقًا ولا تعمل الآن".

هذا أمر بالغ الأهمية للذكاء الاصطناعي. عندما يُفكّر الذكاء الاصطناعي في أداة، يحتاج إلى بناء نموذج عقلي: ما هي مدخلات هذه الأداة، وما هي مخرجاتها، وما هي الآثار الجانبية لها. الحالة الضمنية لواجهة المستخدم الرسومية تجعل هذا النموذج العقلي مليئًا بعدم اليقين. المعلمات الصريحة لواجهة سطر الأوامر تجعل هذا النموذج العقلي موثوقًا ودقيقًا.

linkly read 42 --offset 80 --limit 100——معنى هذا الأمر يتحدد بالكامل بواسطة المعلمات. يمكن للذكاء الاصطناعي استنتاج سلوكه بدقة، دون الحاجة إلى التخمين حول أي سياق ضمني.

قابلية التدقيق

جميع عمليات CLI هي تسلسلات نصية قابلة للتسجيل. الأوامر التي نفذها الذكاء الاصطناعي والنتائج التي حصل عليها هي نصوص قابلة للقراءة من قبل البشر.

هذا الشفافية له فائدتان.

بالنسبة للذكاء الاصطناعي نفسه: يمكنه إجراء فحص ذاتي. "الخطوة السابقة، أجرت linkly بحثًا عن 'قالب عقد' وعادت بـ 0 نتائج، مما يشير إلى أن الكلمات المفتاحية غير صحيحة؛ جرّب استخدام 'نموذج عقد' بدلًا منها." هذا النوع من التصحيح الذاتي القائم على النص هو أساس عمل وكيل الذكاء الاصطناعي بشكل موثوق.

للإنسان: يمكن إجراء مراجعة لاحقة. يمكنك عرض الأوامر التي نفّذها الذكاء الاصطناعي، ومعرفة المدخلات والمخرجات في كل خطوة، مع وضوح كامل لسلسلة الاستدلال. من الصعب تتبع "ما الذي تم النقر عليه" في واجهة المستخدم الرسومية، بينما تسجيلات أوامر سطر الأوامر هي بشكل طبيعي سجلات مراجعة.

ممارسات تصميم Linkly AI CLI

LinklyAI هو محرك بحث محلي وأداة لإنشاء قاعدة معرفة طورناها بأنفسنا. عند تصميم أداة CLI الخاصة بـ Linkly AI، اعتبرنا وكيل الذكاء الاصطناعي كواحد من المستخدمين الرئيسيين منذ البداية.

4 أوامر أساسية مصممة بعناية

ال الأوامر الأساسية لـ Linkly AI CLI هي أربعة فقط:

هذه الأوامر الأربعة تتماشى تمامًا مع فلسفة Unix: كل منها يقوم بعمل واحد فقط، ولديها عقد واضح للمدخلات والمخرجات. يمكن لوكيل الذكاء الاصطناعي دمجها بأي طريقة لتكوين عمليات استرجاع معقدة.

تتمثل عملية عمل وكيل نموذجية على النحو التالي:

كل مخرجات الخطوة هي نص مُهيكل يمكن استهلاكه واستنتاجه مباشرة من قبل الذكاء الاصطناعي. لا توجد عمليات واجهة رسومية، ولا أي عبء تحليل بصري.

الدمج مع الأنابيب وغيرها

ميزة أخرى لـ CLI هي إمكانية دمجه بحرية مع أوامر أخرى في النظام، مما يوفر قدرات جديدة تتجاوز حدود الأداة الفردية.

تصفية واستخراج: يمكن توصيل الإخراج --json مباشرة بـ jq لاستخراج الحقول، ثم إرسال النتيجة إلى الأداة التالية:

ابحث في المستندات، وخذ قائمة doc_id فقط، ثم احصل على المخططات بشكل جماعي
linkly ابحث عن "تصميم قاعدة البيانات" --json | jq -r '.results[].doc_id' | xargs -I{} linkly outline {}

الدمج مع grep للتصفية الثانوية: أولاً استخدم البحث الدلالي لتضييق النطاق، ثم استخدم كلمات مفتاحية دقيقة للتصفية:

linkly search "架构设计" | grep -i "微服务|分布式"

الإحصاء والتحليل: تعاون مع wc وsort وuniq لإجراء إحصاءات المستندات:

احسب عدد ملفات PDF في قاعدة المعرفة
linkly search "" --json | jq '.results[].type' | sort | uniq -c

مع دمج النص البرمجي: معالجة دفعية في نصوص shell لأتمتة المهام المتكررة:

لا يمكن لأدوات الواجهة الرسومية المشاركة في هذه التوليفات. إن مخرجات أدوات سطر الأوامر هي تدفق نصي، ويمكن استهلاكها بشكل طبيعي من قبل أي أداة أخرى، مما يجعل قدرة النظام بأكمله أكبر بكثير من مجموع قدرات الأدوات الفردية.

CLI هو أيضًا أبسط طريقة لربط MCP

CLI وMCP ليسا متعارضين. يمكن لـ linkly mcp أمر واحد تحويل CLI إلى خادم MCP stdio، ليُستخدم من قبل أي عميل AI يدعم MCP:

Json：

هذا أسهل بكثير من تكوين خادم HTTP MCP مباشرة — لا يحتاج المستخدمون إلى معرفة رقم المنفذ أو كتابة URL يدويًا في ملف JSON، بل فقط إخبار عميل الذكاء الاصطناعي بـ"تشغيل هذا الأمر".

أصبح CLI باب الدخول إلى نظام MCP البيئي، مع احتكاك تكوين شبه صفري للمستخدمين.

الاتجاه الأوسع نطاقًا

اختر Claude Code نشر النسخة CLI بدلاً من إضافة IDE، وهذا القرار يعتمد على منطق هندسي واضح: فإن إضافات IDE محدودة ببيئة الاستضافة، بينما يمكن لأدوات CLI العمل في أي مكان يحتوي على طرفية، ويمكن استدعاؤها من قبل أي عامل، ويمكن دمجها مع أي أداة أخرى.

هذا يكشف قاعدة أكثر جوهرية: جوهر استدعاء وكيل الذكاء الاصطناعي للأدوات هو تنفيذ الأوامر. استدعاء الأدوات (function call / tool use) من الناحية الدلالية هو CLI — إعطاء الاسم والمعلمات، وعودة النتيجة. الأدوات CLI هي بشكل طبيعي وظائف يمكن للوكيل استدعاؤها، دون الحاجة إلى أي طبقة تحويل.

تم طرح العبارة "الطرفية كـ IDE الجديد" قبل ظهور الذكاء الاصطناعي، لكنها اكتسبت معنىً جديدًا تمامًا في عصر الذكاء الاصطناعي. إنها ليست مجرد "كتابة الكود داخل الطرفية"، بل "تفاعل الوكلاء مع العالم من خلال الطرفية".

في الماضي، كانت واجهة سطر الأوامر أداة حصرية للمختصين التقنيين. في المستقبل، قد تصبح واجهة سطر الأوامر اللغة الشائعة للوكلاء — حيث يتحدث البشر مع الوكلاء بلغة طبيعية، ويتفاعل الوكلاء مع النظام عبر واجهة سطر الأوامر.

ملخص

لن تتأثر مكانية GUI بشكل كبير، فهي لا تزال الواجهة المثلى للإنسان للتفاعل المباشر مع الحاسوب. لكن عندما تحتاج أداة الذكاء الاصطناعي الخاصة بك إلى استدعاء أداة أخرى، فإن CLI هو الجسر الأكثر طبيعية، وسيتم إطلاق المزيد من البرمجيات لأدوات CLI تماشيًا مع عادات الوكلاء.

هل ترغب في تجربة البحث عن مستنداتك من خلال الطرفية؟ اطلع على هاتين المقالتين: لا تغادر الطرفية، اجعل الذكاء الاصطناعي يبحث في مستنداتك، وامر واحد، اجعل أكثر من 30 أداة ذكاء اصطناعي تقرأ الملفات المحلية.