Галузь ШІ зосереджується на «інженерії контексту» для покращення точності моделей

iconMetaEra
Поділитися
AI summary iconКороткий зміст
Нове поняття з індустрії ШІ — «Harness Engineering» (інженерія манжет) — привернуло велику увагу. Цей термін означає сукупність систем керування, побудованих навколо моделей ШІ, включаючи правила, механізми перевірки, інструменти та петлі зворотного зв’язку, які допомагають ШІ перейти від «вміння робити» до «правильного виконання». Суть полягає у постійному внесені помилок, зроблених раніше, до середовища виконання, щоб уникнути їх повторення. Спільне дослідження Стенфорда та Цинхуа показало, що та сама модель може мати різницю в продуктивності до 6 разів залежно від дизайну Harness. Галузь переходить від «порівняння сили моделей» до «порівняння здатності створювати Harness», і це поняття змінює джерело ключової конкурентоспроможності в застосуванні ШІ.

Автор статті, джерело: Келлі Пен

Знову винайшов слово

Якщо ви стежите за AI, то, ймовірно, останнім часом часто почуваєте це слово: Harness Engineering.

Відкрийте Twitter, читайте публікації в мікроблогах — він повсюди. OpenAI публікує статтю, Anthropic слідує за ним, засновник HashiCorp просуває його у своєму блозі, а Martin Fowler пише про нього у своїх колонках. За два місяці це слово перетворилося з невідомого на ключовий термін індустрії ШІ.

Перша реакція, яку я побачив: ще одна концепція, яку я не встиг відстежити.

Чесно кажучи, я трохи втратив чутливість до таких відчуттів. За останні два роки ШІ особливо добре вміє вигадувати слова: Prompt Engineering, Context Engineering, Agent, RAG, MCP…

З певною періодичністю з’являються нові терміни, супроводжувані прихованим повідомленням: «Якщо ти не розумієш цього, ти відстаєш».

Після дослідження Harness Engineering я хочу сказати тобі:

Це слово не таке таємниче. Насправді, ви, швидше за все, вже це робили, просто не знали, що це так називається.

Сьогодні у цій статті ми детально розглянемо цей питання.

01、Спочатку перекладіть це слово зрозумілою мовою

Харнесс — це слово англійською мовою означає сбрую, тобто повний комплект обладнання, який надягається на кінь: поводи, сідло, щипці та головний убір.

Які особливості мають кіні? Сила, швидкість. Якщо відпустити його самотужки, він вріжеться в огород сусіда, загубиться або вріжеться в стіну. Але коли на нього накинути упряж, він зможе точно тягнути воза тією дорогою, яку ви вибрали.

Запам’ятайте цю картинку, бо зараз у світі ШІ використовують цю метафору.

У галузі все більше людей використовують формулу, щоб описати сучасні AI-системи:

Справжній AI-асистент, який справді працює = сама модель + повна система контролю, побудована навколо моделі

Модель — це та «кінь». Наприклад, GPT, Claude, Gemini надають інтелект, здатність міркувати та генерувати.

А Harness — це та сама «сідло», тобто сукупність усього, що оточує модель: правила, механізми перевірки, доступні інструменти, доступні матеріали, зворотні зв’язки при виникненні помилок.

Він повідомляє ШІ, що можна робити, а що ні, дозволяє ШІ зрозуміти, чи він діє правильно, і дозволяє йому виправляти помилки самостійно.

Модель відповідає за «вміння робити», а Harness — за «правильне виконання».

Зробімо більш зрозумілий порівняння: модель — це дуже розумний, але повністю незнайомий з ситуацією вашої компанії стажер. Harness — це ваша «інструкція для працівника + правила роботи + автоматичний контрольний список + сигнал тривоги, який увімкнеться при помилці».

Лише розумний стажер — це недостатньо, бо він не знає правил вашої компанії, не знає, чого не можна робити, і ніхто не нагадує йому, коли він робить помилки. Ви повинні надати йому цілий набір правил, щоб він міг справді допомогти вам добре виконати роботу.

02. Одне речення визначення

Після всіх підготовчих дій, ось одне речення, що визначає:

Harness Engineering: ви не витрачаєте зусиль на те, щоб зараз за допомогою ШІ зробити це правильно, а на те, щоб ШІ ніколи більше не робив цієї помилки — ні в наступний, ні в післянадходящий раз.

Або, щоб бути точнішим: назавжди вписати певну помилку, допущену ШІ, у його середовище виконання, щоб така ж помилка була неможливою з механічної точки зору.

У цьому визначенні є три ключових слова, жодне з яких не може бути пропущене.

По-перше, він стосується повторюваних проблем, а не разових помилок.

Друге: рішення полягає у зміні середовища, правил і інструментів, а не у повторному поясненні AI.

Три, ефект є постійним і механічним, а не таким, що потрібно повторювати кожного разу.

03. Один критерій, який ви можете використовувати будь-коли

Наступного разу, коли ви взаємодієте з ШІ, і він щось зробив неправильно, спробуйте задати собі ще одне питання:

Я лікую цю хворобу чи виправляю її коріння?

Лікування цієї хвороби = повторно пояснити, повторно запропонувати та попросити зробити це знову. Це не Harness.

Вилікувати цю хворобу корінно = змінити її робоче середовище, щоб вона більше ніколи не повторювалася. Ось що таке Harness.

До цього моменту, я вважаю, ви вже трохи відчули

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.