- Ibinawi ng Anthropic ang Fable 5 nang buong mundo pagkatapos mawala ang mga kontrol sa pag-export ng U.S. noong Hunyo 30.
- Ang mga bagong pagsasagawa ay nagbawal sa nareportang pagbubypass sa higit sa 99% ng mga nasubok na kaso.
- Ang Anthropic at ang mga kasamahan ng Project Glasswing ay nagtatayo ng isang karaniwang framework upang masukat ang mga AI jailbreak.
Ibinawi ng Anthropic ang pandaigdigang pag-access sa kanyang Claude Fable 5 model pagkatapos tanggalin ng pamahalaan ng Estados Unidos ang mga kontrol sa pag-export na nagdulot ng pansamantalang paglimita sa availability. Sinabi ng kumpanya na ang mga kontrol, na ipinakilala noong Hunyo 12, ay nangangailangan sa kanila na suspendihin ang pag-access dahil hindi sila makapag-verify nang agad ng nationality ng mga user sa real time.
Matapos ang pag-alis ng mga paghihigpit noong Hunyo 30, ang Fable 5 ay available na sa buong Claude Platform, Claude.ai, Claude Code, at Claude Cowork, habang ang pag-access sa Mythos 5 ay muli nang nagsimula para sa isang limitadong grupo ng mga aprobadong U.S. organisasyon.
Kasabay ng pagpapalit, detalye ni Anthropic ang mga bagong pagsisiguro sa cybersecurity, isinampa ang mga plano para sa isang komon na industriyal na framework tungkol sa AI jailbreaks, at ilarawan ang pinalawig na pakikipagtulungan sa mga ahensya ng pamahalaan ng Estados Unidos.
Nailibing ang mga kontrol sa pag-export pagkatapos ng dalawang linggong paghinto
Sinabi ni Anthropic said na ang Fable 5 at Mythos 5 ay inilunsad noong June 9 gamit ang parehong underlying model, bagaman bawat isa ay disenyo para sa iba’t ibang layunin. Ang Fable 5 ay inilabas na may mas malakas na cybersecurity safeguards para sa mga karaniwang gumagamit, habang ang Mythos 5 ay available lamang sa mga napiling kasapi ng Project Glasswing na nagtatrabaho sa defensive cybersecurity.
Ang mga kontrol sa pag-export ay sumunod sa isang ulat na naglalarawan ng isang paraan na naglilipas sa ilang mga pagsisiguro ng Fable 5. Ayon sa Anthropic, ang pagsubok na ginawa kasama ang mga ahensya at kasosyo ng gobyerno ay nakakita na ang ilang iba pang AI models ay makakakilala sa mga parehong software vulnerabilities na nabanggit sa ulat, at ang bawat tested model ay kaya ring mag-generate ng parehong demonstrasyon para sa pagpapakita ng pagpapabaya sa isang vulnerability.
Sinabi ng Anthropic na ang nareportong pag-uugali ay hindi nag-expose ng mga kakayahan na natatangi sa Mythos 5 at kung saan ay nagsasangkot sa isang cybersecurity task na binalewala bilang bahagi ng mga panatag na pagsasagawa ng Fable 5’s.
Bagong mga Pagsisiguro at Koordinasyon sa Industriya
Upang tugunan ang inihayag na pagbubypass, ipinakilala ni Anthropic ang isang updated na safety classifier na nagbublock sa natuklasang teknik sa higit sa 99% ng mga nasubok na kaso. Kapag hinaharang ang mga hiling, ang mga user ay iiralin sa Claude Opus 4.8. Dagdag pa ng kumpanya, maaaring magdulot ang updated na sistema ng mas maraming false positives habang nagpapatuloy ang karagdagang pagpapabuti sa mga pang-araw-araw na coding at debugging tasks.
Hiwalay dito, sinabi ni Anthropic na nagtatrabaho sila kasama ang Amazon, Microsoft, Google, at iba pang mga kasapi ng Project Glasswing upang lumikha ng isang karaniwang framework para sa pag-evaluate ng AI jailbreaks. Ang ipinaproposang sistema ay magtataya ng mga jailbreak batay sa pagkakaroon ng kakayahan, saklaw ng kakayahan, kaligayahan ng pagpapakilala, at pagkakakilala upang matukoy ang kalalabasan ng mga bagong natuklasang teknik.
Paalala: Ang impormasyon na nakapaloob sa artikulong ito ay para sa impormasyon at edukasyon lamang. Ang artikulo ay hindi nagtataglay ng abiso sa pananalapi o anumang uri ng abiso. Ang Coin Edition ay hindi responsable sa anumang pagkawala na naganap bilang resulta ng paggamit ng nilalaman, produkto, o serbisyo na nabanggit. Inirerekomenda sa mga mambabasa na magpakatotoo bago gumawa ng anumang aksyon na may kinalaman sa kumpanya.
