Anthropic Mengusulkan Kerangka Peraturan untuk Model AI Terkini

Laman web berita kripto melaporkan:

Anthropic telah menerbitkan satu set dasar bagi model AI terkini. Syarikat menyatakan bahawa peraturan transparansi semasa sukar mengikuti kelajuan peningkatan kemampuan model, dan kerajaan perlu mendapat kuasa campur tangan yang lebih jelas untuk mengambil tindakan sebelum sistem berisiko tinggi memasuki pasaran awam.

Pihak yang ditadbir ditentukan berdasarkan kuasa pengiraan dan pendapatan

Rancangan ini dibahagikan kepada dua bahagian, satu berfokus pada teknologi dan keperluan pengawasan model terkuat, manakala bahagian lain membincangkan isu pembahagian ekonomi di bawah kesan automatik. Berdasarkan maklumat yang telah diumumkan, bahagian pertama jelas lebih lengkap.

Anthropic mempersempit lingkup pengawasan kepada beberapa pengembang terkemuka, bukan keseluruhan industri. Perusahaan mengusulkan agar model yang melatih lebih dari 10²⁵ operasi titik mengambang dimasukkan ke dalam kerangka; syarat yang berlaku juga perlu diterapkan kepada perusahaan yang memperoleh pendapatan berkaitan AI melebihi 500 juta dolar AS setahun, atau mengeluarkan perbelanjaan penyelidikan AI melebihi 1 miliar dolar AS.

Reka bentuk ini bertujuan untuk menumpukan perhatian kepada model yang paling berpusat sumber dan paling cekap, serta mengelakkan pengawasan yang setara terhadap pembangun dan institut penyelidikan berskala kecil dan sederhana.

Mengusulkan bahawa kerajaan boleh menghalang pelancaran berisiko tinggi

Syarikat menyatakan bahawa perubahan paling penting ialah memberikan kuasa undang-undang kepada kerajaan untuk menghalang atau mengawal penyebaran model berisiko tinggi. Sehingga kini, Amerika Syarikat belum mempunyai mekanisme yang lengkap untuk menghalang secara substantif model sebelum ia dilancarkan kepada awam.

Dalam persyaratan khusus, pembangun model terkini perlu menyelesaikan pengujian sebelum pelancaran, serta mempublikasikan ringkasan pengujian, kerangka keselamatan, dan system card untuk menjelaskan prestasi perilaku model dan cara pengawasan risiko. Syarikat juga perlu menghantar laporan risiko secara berkala untuk mengungkapkan status keseluruhan risiko dan kemajuan kerja keselamatan.

Anthropic juga mencadangkan pengenalan agensi penilaian bebas untuk mengulas semula ujian yang dilakukan oleh syarikat sendiri, serta mengeluarkan kesimpulan risiko model secara berasingan. Dengan cara ini, saluran maklumat untuk pihak pengawal dan awam tidak lagi bergantung semata-mata pada pernyataan syarikat.

Hukuman dan keperluan keselamatan diperketat secara serentak

Dalam reka bentuk penegakan undang-undang, Anthropic mencadangkan agar denda sivil dikaitkan dengan pendapatan tahunan global perusahaan, bukan denda tetap. Syarikat percaya bahawa hanya dengan cara ini denda akan memberikan kesan pengawalan yang sebenar terhadap perusahaan AI berskala besar. Bagi pihak yang mengulangi pelanggaran, kadar denda harus ditingkatkan lagi.

Selain pengujian dan pengungkapan, skema ini juga memerlukan perusahaan untuk membangun sistem keselamatan yang lebih kuat, melindungi timbangan model dan sistem latihan, serta mencegah serangan luar dan penyalahgunaan dalaman. Perusahaan boleh mengumumkan struktur umum rancangan keselamatan, dengan butiran yang lebih terperinci hanya diberikan apabila diminta oleh agensi kerajaan.

Anthropic juga mencadangkan bahawa kerajaan dan industri perlu bersama-sama menetapkan standard bagi penilai bebas, serta memastikan penilai-penilai ini mendapat pendanaan yang mencukupi dan akses yang diperlukan. Oleh kerana model terkini biasanya merupakan aset paling sensitif perusahaan, siapa yang akan menilai dan bagaimana mendapatkan akses akan menjadi salah satu cabaran utama dalam pelaksanaannya.

Nyatakan empat kategori risiko utama

Anthropic menyenaraikan empat kategori risiko utama dalam dokumen tersebut: risiko biologi, risiko keselamatan siber, risiko kehilangan kawalan, dan risiko AI yang secara automatik mempercepatkan pembangunan dirinya sendiri. Syarikat percaya bahawa risiko-risiko ini bukanlah saling berasingan, dan boleh saling memperkuatkan.

Sebagai contoh, model yang memiliki kemampuan untuk mengesan kelemahan perisian dalam skala besar mungkin secara langsung mempengaruhi infrastruktur penting seperti hospital dan rangkaian tenaga; dan dalam keadaan pengawasan yang tidak mencukupi, kemampuan semacam ini juga boleh bergabung dengan risiko biologi.

Dalam langkah-langkah penyokong, Anthropic mencadangkan penguatan perlindungan internet dan infrastruktur penting, mendorong penggantian sistem lama dalam perkhidmatan penting, serta membentuk fungsi kerajaan khas untuk memantau secara berterusan perubahan kemampuan rangkaian AI terkini. Mengenai risiko kehilangan kawalan dan pembangunan automatik, syarikat mengakui bahawa alat tatacara yang berkaitan masih belum matang dan masih perlu diperbaiki lagi dalam kemampuan pengesanan, pengasingan, dan penutupan sistem yang tidak selamat.

Maklumat tambahan: Anthropic dalam fail tersebut menyatakan bahawa peraturan kejelasan yang sedia ada di California, New York, dan tempat-tempat lain mempunyai kesan tertentu, tetapi hanya dengan pengungkapan awam sahaja tidak mencukupi untuk mengatasi risiko yang dibawa oleh pengulangan pantas model terkini.