Ang bagong konsepto sa industriya ng AI na tinatawag na "Harness Engineering" ay nagdulot ng malawak na pagmamasid. Ang terminong ito ay tumutukoy sa buong sistemang kontrol na binubuo ng mga patakaran, mekanismo ng pagsusuri, mga kasangkapan, at mga feedback loop na ginagawa paligid sa AI model, na nagtutulong sa AI na maging "nakakagawa" hanggang sa "tama ang paggawa." Sa katotohanan, ito ay ang pagpapalagay ng mga kamalian na ginawa ng AI sa permanente sa environment ng pagpapatakbo upang maiwasan ang pag-uulit ng mga kamalian. Ayon sa pananaliksik ng Stanford at Tsinghua University, ang parehong model ay maaaring magkaroon ng pagkakaiba sa performance hanggang 6 beses dahil sa iba’t ibang disenyo ng Harness. Ang industriya ay nagbabago mula sa "paghahambing ng lakas ng model" patungo sa "paghahambing ng kakayahan sa pagbuo ng Harness," at ang konseptong ito ay nagbabago sa pinagmumulan ng pangunahing kompetitibong advantage sa aplikasyon ng AI.

May-akda ng artikulo, pinagkukunan: Kelly Peng

Gumawa ulit ng isang bagong salita

Kung ikaw ay nakikinig sa AI, baka madalas mong marinig ang isang salitang ito sa nakaraan: Harness Engineering.

Buksan ang Twitter, isipin ang WeChat official account, doon lang ito. Ipinahayag ni OpenAI ang artikulo, sinundan ni Anthropic, inilathala ng founder ng HashiCorp sa blog, isinulat ni Martin Fowler sa kolumn. Sa loob ng dalawang buwan, naging pangunahing salita sa industriya ng AI ang salitang ito mula sa pagiging walang kilala.

Ang unang reaksyon ko ay: Isa pa ring konsepto na hindi ko naabot.

Seryoso lang, medyo nakakaiwas na ako sa ganitong damdamin. Lalo na sa dalawang taong ito, ang AI ay talagang mahusay sa paggawa ng mga salita: Prompt Engineering, Context Engineering, Agent, RAG, MCP…

Sa bawat ilang panahon, lumalabas ang isang bagong salita, kasama ang isang impluwensyang mensahe: "Kung hindi mo maintindihan ito, naiiwan ka."

Pagkatapos ng pag-aaral sa Harness Engineering, gustong sabihin ko sa iyo:

Hindi ito ganun kalalim. Sa katotohanan, malamang ay nagsasagawa ka na nito, ngunit hindi mo alam na ganito ang pangalan nito.

Sa aring na ito, tatalakayin natin nang detalyado ang usaping ito.

01、 Unang i-translate ang salitang ito sa madaling salita

Ang salitang "Harness" ay may orihinal na kahulugan sa Ingles na tapis ng kabayo, na tumutukoy sa buong set ng kagamitan na isusulong sa kabayo: mga tali, saddle, bit, at headstall.

Ano ang mga katangian ng kabayo? May lakas, mabilis magtakbo. Kung papaya mo itong magtakbo nang mag-isa, sasakay ito sa hardin ng kapitbahay, mawawala, o mababangga sa pader. Ngunit kapag isinuot ang mga kagamitan nito, maaari mong i-direct ito nang tumpak upang tarikin ang karwahe sa daan na iyong nais.

Tandaan ang larawang ito, dahil ginagamit ngayon ng AI community ang metapora na ito.

Lalo na laloang pinapahalagahan ng industriya ang isang pormula upang ilarawan ang kasalukuyang AI system:

Isang totoong nagagawa na AI assistant = ang modelo mismo + buong sistemang kontrol na binuo palibot sa modelo

Ang modelo ay ang "kabayo." Halimbawa, ang GPT, Claude, at Gemini ay nagbibigay ng intelektuwal na kakayahan, kakayahang mag-isip at mag-generate.

Ang Harness naman ay ang buong "harness" na isinusuot sa palibot ng modelo: mga patakaran, mga mekanismo ng pagsusuri, mga available na kasangkapan, mga ma-access na impormasyon, at mga feedback loop kapag may error.

Ito ay nagpapaliwanag sa AI kung ano ang maaari at hindi maaaring gawin, upang malaman ng AI kung tama o mali ang kanyang ginagawa, at upang makapag-ayos ng sarili nito kapag nagkakaroon ng kamalian.

Ang model ay responsable sa "paggawa", habang ang Harness ay responsable sa "tamang paggawa".

Isang mas nakakarelasyong halimbawa: ang modelo ay parang isang napakatalino, ngunit ganap na hindi pamilyar sa sitwasyon ng iyong kumpanyang intern. Ang Harness ay ang "manual ng empleyado + mga patakaran sa trabaho + awtomatikong checklist + alarm na magkikinig kapag may mali" na ibinibigay mo sa intern na iyon.

Hindi sapat ang isang matalinong intern dahil hindi niya alam ang mga patakaran ng inyong kumpanya, hindi niya alam kung ano ang hindi dapat gawin, at walang nagpapaalala sa kanya kapag nagkakamali siya. Kailangan mong bigyan siya ng buong set ng mga patakaran upang talagang makatulong siya sa paggawa ng trabaho.

02、Isang pangungusap na depinisyon

Nakapaghanda na tayo, ipapaliwanag natin ito sa isang pangungusap:

Harness Engineering: Hindi ka nagpapagod sa "gawin tama ng AI ito ngayon," kundi sa "gawin na hindi na ulit mali ng AI ito sa susunod, sa susunod pa, at lagi."

O kaya, mas tiyak pa: i-record ang isang partikular na pagkakamali ng AI sa kanyang runtime environment nang permanenteng paraan, upang imposible na maulit ang parehong pagkakamali sa mekanismo.

Mayroong tatlong mahahalagang salita sa definisyon na ito, at kailangan lahat ng tatlo.

Una, ito ay tumutukoy sa paulit-ulit na problema, hindi sa isang beses na mali.

Dalawa, ang solusyon ay ang pagbabago ng kapaligiran, patakaran, at mga kasangkapan, hindi ang pagpapaliwanag muli sa AI.

Tatlo, ang epekto ay permanenteng mekanikal, hindi kailangang sabihin muli sa susunod na pagkakataon.

03. Isang pamantayan na maaari mong gamitin kahit kailan

Next time you interact with AI and it makes a mistake, try asking yourself one more question:

Nag-aayos ako ng kasalukuyang sakit, o tinatanggal ko ang ugat nito?

Iwasan ang sakit na ito = Ibang-baguhin, ibang-pag-utos, at hilingin na gawin muli. Hindi ito Harness.

Sagutin ang sakit na ito = baguhin ang kanyang kapaligiran ng paggawa, upang hindi na ito maulit. Ito ang Harness.

Sa punto na ito, naniniwala ako ay may nararamdaman ka nang kaunting pagkakaintindi

Ang industriya ng AI ay nakatuon sa “harness engineering” upang mapabuti ang accuracy ng model

01、 Unang i-translate ang salitang ito sa madaling salita

02、Isang pangungusap na depinisyon

03. Isang pamantayan na maaari mong gamitin kahit kailan