การรั่วไหลของ Claude Code เปิดเผยโค้ดHarness 46,000 บรรทัด พร้อมเปิดเผยข้อมูลเชิงลึกด้านความปลอดภัยของ AI และการออกแบบผลิตภัณฑ์

iconMetaEra
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
การรั่วไหลด้านความปลอดภัยเมื่อเร็วๆ นี้เปิดเผยไฟล์ 1,900 ไฟล์และโค้ด 512,000 บรรทัดจาก Claude Code รวมถึงระบบฮาร์เนส 46,000 บรรทัดที่เพิ่มประสิทธิภาพการใช้งานโมเดล เหตุการณ์ข่าว AI + คริปโตเปิดเผยระบบการอนุญาตแบบหลายชั้น โครงสร้างหน่วยความจำสำหรับความชอบของผู้ใช้ และคุณสมบัติ KAIROS ที่ทำหน้าที่เป็นพนักงานดิจิทัลตลอด 24 ชั่วโมง การรั่วไหลนี้เน้นย้ำถึงความเสี่ยงในห่วงโซ่อุปทาน AI และเพิ่มความมองเห็นผลิตภัณฑ์ของ Anthropic อย่างไม่คาดคิด
ไฟล์ 1,900 ไฟล์ รหัส 512,000 บรรทัด การตั้งค่าไฟล์ .map ผิดพลาด และสิ่งต่างๆ ที่ไม่มีใครสังเกตเห็น

ผู้เขียนบทความ: Kea จาก Jia Yan

ที่มาของบทความ: Silicon Valley Alan Walker

7:02 น. ตอนเช้า มิชชั่นดิสทริกต์ ริมหน้าต่าง Zombie Coffee

วันนี้เป็นเช้าที่แปลกประหลาด ทวีตของ Chaofan Shou บน X ได้รับการดูมากกว่า 3.1 ล้านครั้ง และกลุ่มต่างๆ กำลังวุ่นวาย

เมื่อดื่มแก้วที่สอง อลัน วอล์คเกอร์ จากซิลิคอนแวลลีย์ ดึงไฟล์ 1,900 ไฟล์ลงมาและเริ่มอ่านอย่างจริงจัง

หลังจากอ่านเสร็จ Alan ได้คุยกับบางคน — Kai (อดีตพนักงาน Google ปัจจุบันเริ่มต้นธุรกิจด้านโครงสร้างพื้นฐาน), Marcus (พื้นหลังด้าน PE ช่วงนี้กำลังดูดีล AI) และ Sarah (วิศวกรเดิมของ Anthropic ปัจจุบันเป็นอิสระ) นี่คือสิ่งที่ได้พูดคุยกันวันนี้

อลัน วอล์คเกอร์ จากซิลิคอนแวลลีย์รู้สึกว่ามุมมองการวิเคราะห์ของคนส่วนใหญ่ไม่ลึกพอ นี่คือบันทึกและการจัดระเบียบของฉัน

01 เคล็ดลับที่หนึ่ง: แบบจำลองเป็นเพียงวัตถุดิบ แต่ harness คือกำแพงป้องกัน—และตัวเลขนี้คือ 46,000 บรรทัด

คำแรกที่คนส่วนใหญ่พูดเมื่อเห็นการรั่วไหลครั้งนี้คือ: "ว้าว เครื่องมือ Claude Code ซับซ้อนจริงๆ" ผิดนะ ควรพูดกลับกัน: เหตุผลที่ Claude Code ใช้งานได้ดี ไม่ใช่เพราะมันเรียกใช้ Claude ที่ฉลาดกว่า แต่เพราะมันสร้างเครื่องมือค้นหาที่มีโค้ด 46,000 บรรทัดไว้นอกโมเดล

อัลัน: ไค คุณดู QueryEngine.ts แล้วไหม? แค่ไฟล์เดียวนี้ มี 46K บรรทัด นี่ไม่ใช่แค่ "AI wrapper" แต่เป็นระบบปฏิบัติการ

ไค: ฉันดูแล้ว น่าสนใจกว่านั้นคือพวกเขาใช้ Bun แทน Node — พิจารณาจากเวลาเริ่มต้น ซึ่งแสดงว่าพวกเขาทดสอบประสิทธิภาพการเริ่มต้นแบบเย็นอย่างรอบคอบ ไม่ใช่เขียนแบบสุ่ม

จากหลักการพื้นฐาน: ความสามารถของโมเดลคือขีดจำกัดสูงสุด ส่วนการใช้งานจะกำหนดว่าคุณจะใช้ได้ถึงระดับใดของขีดจำกัดนั้น

การเรียกใช้ API โดยตรงสามารถใช้ความสามารถของโมเดลได้ 20%

ชุด harness ของ Claude Code — การจัดการบริบท การกำหนดเส้นทางเครื่องมือ และการแบ่งระดับสิทธิ์ — ทำให้คุณสามารถใช้งานได้ใกล้เคียง 80% ช่องว่าง 40% นี้คือผลลัพธ์จากการแลกเปลี่ยนด้วยโค้ด 46,000 บรรทัด

ผู้ที่จะครองตำแหน่งผู้พิชิต ChatGPT ต่อไป ไม่จำเป็นต้องเป็นทีมที่สร้างโมเดลที่ดีกว่า แต่อาจเป็นทีมที่สร้างเครื่องมือจัดการที่ดีกว่า

02 เคล็ดลับที่สอง: จุดประสงค์ที่แท้จริงของระบบสิทธิ์ — ไม่ใช่เพื่อทำให้ AI กลัวที่จะลงมือ แต่เพื่อให้ AI กล้าลงมือ

ทุกคนเมื่อเห็นระบบสิทธิ์ระดับสี่ มักคิดทันทีว่าเป็น “มาตรการรักษาความปลอดภัย” แต่ความเข้าใจนี้กลับตรงข้ามกับความเป็นจริง

อัลัน: ซาร่าห์،คุณเคยทำงานที่ Anthropic มาก่อน ระบบการอนุญาตเหล่านี้ถูกออกแบบมาเพื่อ “ความปลอดภัย” จริงๆ หรือ?

ซาร่าห์: ไม่ใช่แบบนั้นทั้งหมด แต่เพื่อให้โมเดลมีความกล้าในการดำเนินการ ถ้าไม่มีขอบเขตชัดเจน ตัวแทนจะต้องลังเลทุกขั้นตอนว่า “ฉันสามารถทำสิ่งนี้ได้ไหม” เมื่อมีขอบเขตแล้ว ภายในขอบเขตให้ดำเนินการทันที นอกขอบเขตให้หยุดและถาม

โปรดสังเกตรายละเอียดนั้น:

คำสั่งอันตรายไม่ได้ถูกบล็อกด้วยรายการกฎ แต่ใช้ AI ตัวที่สองในการตัดสินเชิงความหมาย

นี่หมายความว่า Anthropic รู้ว่ารายการกฎจะมีบางอย่างหลุดรอดไป จึงใช้ AI ตรวจสอบ AI — นี่คือระบบป้องกัน ไม่ใช่กฎการป้องกัน

เปรียบเทียบกับองค์กรใดๆ: ขอบเขตการมอบอำนาจที่ชัดเจนไม่ได้ทำให้คนกลัวที่จะทำอะไร แต่ช่วยให้คนกล้าตัดสินใจอย่างรวดเร็วภายในขอบเขตที่กำหนด

การให้สิทธิ์ที่ไม่ชัดเจนทำให้เกิดความเฉื่อยชา

03 เคล็ดลับที่สาม: ระบบความจำ — จำเฉพาะความชอบ ไม่ต้องจำรหัส นี่คือการลดทอนอย่างรอบคอบ

อัลัน: คุณได้ดูไดเรกทอรี memdir/ แล้วไหม? ข้อมูลที่ระบบความจำของมันเก็บไว้น้อยกว่าที่ฉันคิดไว้มาก

ไค: ใช่ มันไม่จดรหัส ไม่จดประวัติการสนทนา ก็แค่จดความชอบของผู้ใช้และข้อจำกัดของโปรเจกต์ ตอนดูครั้งแรกคิดว่ามันขี้เกียจ แต่คิดทีหลังกลับรู้ว่ามันถูกต้อง

หน้าต่างบริบทเป็นทรัพยากรที่มีจำกัด ประมาณ 200K tokens

บริบทที่เต็มไปด้วยรหัสยุคเก่า เหมือนวิศวกรที่มีรายละเอียดโครงการก่อนหน้าเต็มสมอง—งานวันนี้ไม่มีที่ว่างให้ใส่

วิธีการของ Anthropic คือ: ความจำระยะยาวเก็บเฉพาะ "วิธีการทำงานร่วมกับฉัน" ส่วนเนื้อหาเฉพาะเจาะจงจะดึงมาใหม่ทุกครั้ง

สนามรบถัดไปของผลิตภัณฑ์ AI ไม่ใช่ใครมีความจำมากกว่า แต่คือใครมีความจำแม่นยำกว่า—จดสิ่งที่ถูกต้อง และลืมสิ่งที่ไม่ควรจด

04 เคล็ดลับที่สี่: KAIROS — สิ่งที่ Anthropic ต้องการขายจริงๆ ไม่ใช่เครื่องมือ แต่เป็นพนักงานดิจิทัลที่ไม่เคยเลิกงาน

อัลัน: มาร์คัส ในฐานะนักลงทุน คุณรู้สึกอย่างไรกับฟีเจอร์ KAIROS นี้?

มาร์คัส: ฉันเห็นโมเดลธุรกิจที่ต่างอย่างสิ้นเชิง คุณไม่ได้จ่ายค่าสมัครใช้งาน SaaS แต่คุณจ่ายเงินเดือนให้กับผู้รับเหมาที่ทำงานตลอด 24 ชั่วโมง สิ่งนี้เปลี่ยนตรรกะการตั้งราคาทั้งหมด

การจัดการขอบเขตของเวลาเที่ยงคืน เป็นรายละเอียดที่สำคัญ—มีคนเคยคิดอย่างจริงจังหรือไม่ว่า “ถ้ากระบวนการ dreaming เริ่มขึ้นที่ 11:58 น. และข้ามเที่ยงคืนจะเกิดอะไรขึ้น”

นี่แสดงว่า KAIROS ไม่ใช่การพิสูจน์แนวคิด แต่เป็นฟีเจอร์ที่ออกแบบเสร็จและพร้อมเปิดใช้งาน

รูปแบบธุรกิจของ SaaS จะพัฒนาไปสู่ “การเสริมกำลังแรงงานด้วย AI” คุณจ้างพนักงานดิจิทัลที่ไม่เคยลาหยุดและต้นทุนเพิ่มเติมเข้าใกล้ศูนย์

นี่ไม่ใช่การกำหนดราคาเครื่องมือ นี่คือการกำหนดราคาทรัพยากรมนุษย์

05 เคล็ดลับที่ห้า: โครงสร้างหลายเอเจนต์ — บริษัท AI กำลังคัดลอกโครงสร้างองค์กรของบริษัทมนุษย์

ไค: คุณดูโครงสร้างไดเรกทอรีไหม? coordinator/, tasks/, skills/, services/ —— มันเหมือนกับแผนผังองค์กรของบริษัทสตาร์ทอัพเลย

อัลัน: ใช่ และในโหมด Coordinator หนึ่ง Claude สามารถสร้างตัวแทนงานหลายตัวขึ้นมา—นี่คือแบบจำลองที่ผู้จัดการควบคุมชุดของ IC

ขีดจำกัดของ AI เดี่ยวคือขนาดของ context window (200K tokens)

วิธีเดียวที่จะข้ามขีดจำกัดนี้คือการให้ AI หลายตัวทำงานร่วมกันโดยแต่ละตัวจัดการบริบทของตนเอง

นี่คือวิธีการเดียวกันที่บริษัทมนุษย์ใช้เพื่อแก้ไขข้อจำกัดทางการรับรู้ของแต่ละบุคคลผ่านการแบ่งงาน ความแตกต่างคือ:

ต้นทุนในการประสานงานของทีม AI เข้าใกล้ศูนย์ ขณะที่ต้นทุนที่ใหญ่ที่สุดของบริษัทมนุษย์คือการสื่อสารและการประสานงาน

เส้นทางการขยายขนาดของ AI กำลังทำซ้ำเส้นทางวิวัฒนาการขององค์กรมนุษย์—แต่ตัดต้นทุนการประสานงานออกไป 90%

หัวข้อลับที่ 6: BUDDY — Anthropic รู้ว่าความผูกพันทางอารมณ์คืออาวุธสุดท้ายที่ทำให้ผลิตภัณฑ์มีความเหนียวแน่น

ซาร่าห์: ฉันไม่เห็นด้วยกับที่หลายคนมองว่าฟีเจอร์ BUDDY เป็นเพียงการโฆษณาเกินจริง Duolingo สามารถสร้างอัตราส่วน DAU/MAU ที่สูงที่สุดระดับโลกได้ด้วยนกฮูกสีเขียวเพียงตัวเดียว

อัลัน: ประเด็นสำคัญคือ seed ที่กำหนดได้ — สายพันธุ์ของคุณถูกกำหนดโดย hash ของ user ID ของคุณ ซึ่งจะเป็นมังกรตัวเดิมเสมอ ไม่ใช่ของคนอื่น นี่แหละคือสิ่งที่ทำให้ติดใจ

ชื่อสายพันธุ์ถูกซ่อนไว้ในโค้ดแหล่งที่มาโดยใช้ Array ของ String.fromCharCode()

Anthropic ตั้งใจไม่ให้มันปรากฏในผลลัพธ์การค้นหาข้อความ

แผนเริ่มต้นการโปรโมตวันที่ 1 เมษายน (วันแกล้งคน) และเปิดตัวอย่างเป็นทางการในเดือนพฤษภาคม เส้นทางการเติบโตแบบไวรัสที่สมบูรณ์แบบ

อารมณ์คือกลไกการล็อกที่แข็งแกร่งที่สุด แข็งแรงกว่าต้นทุนการย้ายข้อมูลใดๆ

คุณสามารถย้ายรหัสฐานข้อมูล ย้ายไฟล์การตั้งค่า แต่คุณไม่สามารถย้ายมังกรตำนานที่อยู่กับคุณมาสองปี ซึ่ง Claude ตั้งชื่อว่า "Mochi"

ข้อลับที่ 7: การรั่วไหลของ Sourcemap นั้นเป็นภาพตัดขวางของความเปราะบางในห่วงโซ่อุปทานของอุตสาหกรรม AI

มาร์คัส: คุณรู้ไหมว่าในวันเดียวกันที่เหตุการณ์นี้เกิดขึ้น Axios ก็ถูกแฮกเช่นกัน? แพ็กเกจ npm ที่มีผู้ดาวน์โหลด 83 ล้านครั้งต่อสัปดาห์ บัญชีผู้ดูแลถูกยึดครองและติดตั้ง RAT ข้ามแพลตฟอร์ม

อัลัน: วันที่ 31 มีนาคมเป็นวันที่แปลกสำหรับ npm การที่สองเรื่องนี้เกิดขึ้นพร้อมกัน แสดงให้เห็นถึงปัญหาเดียวกัน: ห่วงโซ่การเปิดตัวผลิตภัณฑ์ AI สมัยใหม่มีความเปราะบางอย่างยิ่ง

ในปี 2025 มีแพ็กเกจที่เป็นอันตราย 454,000 แพ็กเกจถูกเผยแพร่บน npm

โครงการ npm แต่ละโครงการมีการดึงขึ้นมาเฉลี่ย 79 ขึ้นอยู่กับการพึ่งพาแบบถ่ายทอด

สนามรบด้านความปลอดภัยของ AI กำลังเปลี่ยนจาก "ความปลอดภัยของโมเดลเอง" เป็น "ความปลอดภัยในการปรับใช้และห่วงโซ่อุปทาน" อย่างรวดเร็ว

Claude Code ถือเป็นหนึ่งในระบบ AI ที่ซับซ้อนที่สุดในปัจจุบัน แต่พวกเขาก็ยังอาจทำผิดพลาดเช่นนี้ได้

ความลับที่ 8: การรั่วไหลครั้งนี้เอง คือการตลาดผลิตภัณฑ์ที่ไม่ตั้งใจที่ดีที่สุดของ Anthropic

ถ้วยที่ห้า เย็นแล้ว ตอนเช้าของย่าน Mission District นอกหน้าต่างเพิ่งเริ่มต้น

มาร์คัส: ฉันลงทุนมา 20 ปี ครั้งนี้มีจังหวะเวลาที่ละเอียดอ่อนมาก หลังจาก Anthropic ระดมทุนรอบก่อนหน้าเพียงหกเดือน โค้ดนี้ทำให้นักพัฒนาทั่วโลกตรวจสอบเทคโนโลยีของพวกเขาด้วยตัวเองโดยสมัครใจ สิ่งนี้ไม่มีทางซื้อได้ด้วยงบโฆษณาใดๆ

อัลัน: พูดให้แม่นยำกว่านั้น: คู่แข่งตอนนี้รู้แล้วว่าต้องทำอะไร แต่นั่นไม่ได้หมายความว่าพวกเขาทำได้จริง Google มีงานวิจัยการค้นหาที่ดีที่สุด แต่ไม่ได้สร้างผลิตภัณฑ์ AI ที่ดีที่สุด

ชุมชนนักพัฒนาทั่วโลกวิเคราะห์ แพร่กระจาย และอภิปรายเชิงลึกทางเทคนิคของ Claude Code ภายในไม่กี่ชั่วโมง — 3.1 ล้านครั้งในการดูบน X, มากกว่า 1,100 ดาว, มากกว่า 1,900 Fork

ในกระบวนการนี้ วิศวกรแต่ละคนต่างกลายเป็นผู้ให้การรับรองอย่างสมัครใจของ Anthropic

Anthropic สูญเสียอะไรบางอย่าง? โค้ด TypeScript บางส่วน

โครงสร้างเป็นแผนที่ แต่การดำเนินการคือภูมิประเทศ

สิ่งที่พวกเขากำลังสร้างจริงๆ คือระบบปฏิบัติการสำหรับพนักงานดิจิทัลตัวแรกของมนุษยชาติ ที่มีความจำ ระบบสิทธิ์ อินเทอร์เฟซด้านอารมณ์ ความสามารถในการดำเนินการด้วยตนเอง และเครือข่ายการทำงานร่วมกันของตัวแทนหลายตัว

คำถามที่รอคำตอบไม่ใช่ "AI จะแทนที่งานของมนุษย์หรือไม่" โค้ดแหล่งที่มาได้ให้คำตอบแล้ว:

KAIROS ไม่เคยหยุดนิ่ง, BUDDY สร้างความสัมพันธ์ทางอารมณ์, Coordinator จัดการทีม

คำถามที่แท้จริงคือ: คุณต้องการเป็นคนที่ออกแบบ harness หรือเป็นคนที่ถูก harness จัดการ?

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา