Ang command line ay maaaring ang pinakamadaling interaksyon na interface para sa AI AgentMay-akda ng artikulo, pinagkunan: Shaoshu Pai
Sa pagitan ng 2025 at 2026, ang mga pinakamataas na kompanya sa AI ay naglabas nang isang uri ng produkto: mga kasangkapan sa anyo ng CLI.
Ipinakilala ng Anthropic ang Claude Code, isang AI programming assistant na tumutugon sa terminal. Ipinakilala ng OpenAI ang Codex CLI, at ng Google ang Gemini CLI. Sa alon na ito, halos lahat ng mahalagang AI company ay nagtaya sa command line.
Ito ay laban sa intuisyon. Ang command line ay produkto ng dekada ng 1970, at ang pagkakaroon ng GUI ay nagdala ng mga computer sa mas malawak na publiko, at ngayon ay ginawa ng mobile internet ang touch interface bilang default. Ayon sa karaniwang lohika, ang direksyon ng teknolohiya ay dapat na lalong "visual" at lalong "madaling gamitin". Bakit sa panahon ng AI, ang pinakamatandang anyo ng interaksyon ang bumabalik?
Hindi ito tungkol sa damdamin, kundi sa inhenyerong lohika.
Hindi kaaya-aya ang GUI para sa AI
Ang GUI ay disenyo para sa visual navigation ng tao. Ang mga button, popup, drag-and-drop, at hover effects—ang mga interactive paradigm na ito ay batay sa visual intuition ng tao. Kapag tingnan ng tao ang interface, iskannin nito ang posisyon ng mga button at agad na natutukoy ang susunod na hakbang gamit ang intuisyon. Ang mekanismo na ito ay napakalikas para sa tao, halos walang gastos sa pag-aaral.
Ngunit hindi ganito ang paraan ng paggana ng LLM. Ang input ng LLM ay mga token, at ang output nito ay mga token rin. Ang kanyang “pag-iisip” ay nangyayari sa language space, hindi sa pixel space.
Ang pagpapatakbo ng GUI ng AI ay nangangahulugan ng paglilipas ng isang malaking pagkakaiba:
Sobrang mataas ang gastos sa pag-unawa. Kailangan ng AI ang paggamit ng computer vision o Accessibility Tree upang “masabayan” ang interface—alin ang button na pwedeng i-click, saan ang input box, at ano ang kahulugan ng kasalukuyang popup. Ito ay hindi ang lakas ng AI, kundi isang karagdagang bigat.
Ang estado ay implicit at hindi makikita. Ang parehong pindutan, maaaring i-click ngayon, ngunit maaaring maging gray bukas dahil sa isang kondisyon. Ang implicit na estado ay isang “konteksto” para sa tao, ngunit isang pagkakaroon ng kakaibang pagkakataon para sa AI—hindi ito makakapag-推理 kung saan mga kondisyon maaaring gamitin ang operasyong ito.
Hindi kombinable ang mga aksyon. Walang paraan upang i-pipe ang dalawang GUI aksyon. Ang "Mga Resulta ng Paghahanap → Filtrado → I-export" ay tatlong pag-click sa GUI at hindi maaaring ipasa, muling gamitin, o automatisin bilang isang buong unit.
Mahirap subukan at patunayan. Nag-execute ang AI ng isang GUI operation, paano matitiyak na tagumpay ito? Kailangan ng screenshot, kailangan ng pagpapaliwanag ng estado ng interface, ang buong feedback loop ay mabagal at madaling masira.
Sa kumpara, ang bawat tampok ng CLI ay parang disenyo nang espesyal para sa AI.
Tatlong pangunahing kahusayan ng CLI sa AI Agent: komposability
Ang core ng Unix philosophy ay: “Gawin lamang ng bawat programa ang isang bagay, at gawin ito nang maayos; gawing posible ang pagkakasundo ng mga programa.”
Ang prinsipyong ito mula sa mga dekada na ang nakalipas ay nagkakaroon ng bagong kahulugan sa panahon ng AI.
Ang CLI tool ay nag-uugnay sa pamamagitan ng standard input at output. Ang linkly search "React performance optimization" | head -5 ay maaaring magpadala ng mga resulta sa susunod na command. Ang linkly search "architectural design" --json | jq '.results[].doc_id' ay maaaring mag-extract ng lahat ng doc_id para sa karagdagang pagproseso.
Para sa isang AI Agent, ang komposability ay nangangahulugan na maaaring i-link ang mga maraming utos upang stablishin ang mga kumplikadong multi-step workflow, kung saan ang output ng bawat hakbang ay isang structured text na maaaring konsumuhin ng susunod na hakbang. Walang siklo ng “click → wait → screenshot → parse” na nangangailangan ng GUI, lamang malinis na input at output.
Predictability
Ang bawat utos ay ganap na nakadepende sa mga parameter. Kapag ginagawa ang linkly search "database" --limit 10 ngayon, ang resulta ay ito; kapag ginagawa ito bukas (kung ang database ay hindi nagbago), ang resulta ay pareho pa rin. Walang implicit na estado, walang pagkakalito kung bakit gumana ang feature na iyon kahapon ngunit hindi ngayon.
Sobrang mahalaga ito para sa AI. Kapag tinutukoy ng AI ang isang tool, kailangan itong bumuo ng isang mental model: ano ang input ng tool, ano ang output, at ano ang mga side effect. Ang implicit state ng GUI ay nagiging sanhi ng kawalan ng tiyak sa mental model na ito. Ang explicit parameters ng CLI ay nagiging mapagkakatiwalaan at tumpak na mental model.
linkly read 42 --offset 80 --limit 100——ang kahulugan ng utos na ito ay ganap na nakadepende sa mga parameter. Maaari ng tumpak na i推理 ang kanyang pag-uugali ang AI, walang kailangang maghula ng anumang implicit na konteksto.
Auditability
Ang lahat ng CLI operations ay isang sequence ng tekstong nakarehistro. Ano ang mga utos na isinagawa ng AI at ano ang mga output na natanggap, lahat ay tekstong maaaring basahin ng tao.
May dalawang benepisyo ang transparensya na ito.
Sa sarili ng AI: Maaaring mag-gawa ng sariling pagsusuri. "Ang nakaraang hakbang na linkly search ng 'contract template' ay bumalik na may 0 resulta, na nagpapakita na ang mga keyword ay mali; palitan ito ng contract sample at subukan muli." Ang ganitong uri ng self-correction batay sa teksto ay ang pundasyon kung paano maaaring magtrabaho nang maaasahan ang AI Agent.
Para sa mga tao: Maaari mong gawin ang pagrereview pagkatapos. Maaari mong tingnan kung anong mga utos ang pinagana ng AI, ano ang bawat input at output sa bawat hakbang, at ang buong chain ng pag-iisip ay malinaw. Mahirap masuri ang “ano ang pinindot” sa GUI na paggamit, ngunit ang mga log ng CLI na paggamit ay naturally ang mga rekord ng audit.
Mga Pagsasagawa sa Disenyo ng Linkly AI CLI
Ang LinklyAI ay isang lokal na search engine at software para sa pagbuo ng knowledge base na aming sariling dinisenyo. Habang inililikha ang CLI tool ng Linkly AI, isinama namin ang AI Agent bilang isa sa mga pangunahing gumagamit mula sa simula.
4 na mabuting disenyo na pangunahing utos
Ang mga pangunahing utos ng Linkly AI CLI ay apat lamang:

Ang apat na command na ito ay ganap na sumusunod sa Unix philosophy: bawat isa ay nagagawa ng isang bagay lamang, may malinaw na contract ng input at output. Ang AI Agent ay maaaring mag-combine ng anumang mga ito upang lumikha ng komplikadong proseso ng paghahanap.
Ang isang karaniwang workflow ng Agent ay sumusunod:

Ang bawat hakbang ay naglalabas ng structured text na direktang maaaring kinsumo at i-rereason ng AI. Walang GUI operation, walang负担 ng visual parsing.
Icombine sa mga pipe at iba pa
Ang isa pang kahusayan ng CLI ay ang kakayahang i-combine ito nang libre sa iba pang mga utos sa sistema, na nagdadala ng mga bagong kakayahan na labas sa hangganan ng isang solong kasangkapan.
Filtra at i-extract: Ang --json output ay maaaring direktang gamitin ng jq upang i-extract ang mga field, at ang resulta ay ipapasa sa susunod na tool:
- Hanapin ang dokumento, kunin lamang ang listahan ng doc_id, pagkatapos ay kumuha nang buong balangkas sa pamamagitan ng batch
- linkly search "database design" --json | jq -r '.results[].doc_id' | xargs -I{} linkly outline {}
Gumamit ng grep para sa pangalawang pag-filter: unang gamitin ang semantic search para maliit ang sakop, pagkatapos ay filtarin gamit ang eksaktong mga keyword:
- linkly search "arkitekturang disenyo" | grep -i "microservices|distributed"
Pagsusuri at pagsusumay: Gamitin kasama ang wc, sort, uniq para sa pagsusuri ng dokumento:
- Ilang mga PDF ang nasa knowledge base?
- linkly search "" --json | jq '.results[].type' | sort | uniq -c
Magkakasama sa iskrip: Gamitin sa iskrip ng shell para sa batch processing at awtomatikong pagtratrabaho ng paulit-ulit na gawain:

Hindi makakapag-ambag ang GUI tool sa mga kombinasyong ito. Ang output ng CLI tool ay isang stream ng teksto, na natural na maaaring konsumuhin ng anumang iba pang tool, na nagpapalakas sa kakayahan ng buong sistema kaysa sa simpleng kabuuan ng mga tool.
Ang CLI ay ang pinakasimpleng paraan ng pag-ugnay ng MCP
Hindi magkakasalungat ang CLI at ang MCP. Ang isang utos ng linkly mcp ay maaaring gawing isang stdio MCP server ang CLI, na magagamit ng anumang AI client na sumusuporta sa MCP:
Json:

Mas simple ito kaysa direktang i-configure ang HTTP MCP Server—hindi kailangan ng user ang port number, hindi kailangan ng manual na pagsulat ng URL sa JSON, kailangan lang ipaalam sa AI client na “patakbuhin ang utos na ito.”
Ang CLI ay naging pinto sa ekosistema ng MCP, na may halos walang pagkakamali sa konfigurasyon para sa mga user.
Mas malawak na trend
Pinili ng Claude Code na unang ilabas ang CLI form kaysa IDE plugin, at may malinaw na inhinyeriyang lohika sa desisyong ito: limitado ang IDE plugin sa host environment, samantalang ang CLI tool ay maaaring mag-run sa anumang lugar na may terminal, maaaring i-call ng anumang Agent, at maaaring i-combine sa anumang iba pang tool.
Ito ay nagpapakita ng isang mas pangunahing batayan: Ang paggamit ng mga kasangkapan ng AI Agent ay nangangahulugan ng pagpapatupad ng mga utos. Ang pagtawag sa kasangkapan (function call/tool use) ay mula sa kahulugan ay CLI—binibigyan ng pangalan at mga parameter, ibinabalik ang resulta. Ang mga kasangkapan ng CLI ay likas na mga function na maaaring tawagan ng Agent, walang kailangang layer ng pagpapalit.
Ang pahayag na “Terminal as the new IDE” ay binanggit na bago pa ang pag-usbong ng AI, ngunit sa panahon ng AI ay nakuha nito ang bagong kahulugan. Hindi lamang “pagsusulat ng code sa terminal,” kundi “ang Agent ay nakikipag-ugnayan sa mundo sa pamamagitan ng terminal.”
Noong nakaraan, ang CLI ay isang eksklusibong kasangkapan para sa mga teknikal na tao. Sa hinaharap, ang CLI ay maaaring maging pangkalahatang wika ng Agent—ang mga tao ay makikipag-usap sa Agent gamit ang natural na wika, habang ang Agent ay nakikipag-ugnayan sa sistema gamit ang CLI.
Buod
Hindi malaki ang epekto sa posisyon ng GUI, ito ay patuloy na pinakamahusay na interface para sa direkta ng tao sa paggamit ng computer. Ngunit kapag kailangan ng iyong AI tool na i-call ang isang iba pang tool, ang CLI ay ang pinakamalikhaing tulay, at mas maraming software ang maglalabas ng higit pang CLI tools upang sumunod sa mga gawi ng Agent.
Gusto mo bang subukan ang paghahanap ng iyong dokumento sa terminal? Tingnan ang dalawang artikulong ito: Huwag umalis sa terminal, gamitin ang AI para hanapin ang iyong dokumento at isang command line, pabuksan ang 30+ AI tools para basahin ang lokal na files.
