ไฟล์ 1,900 ไฟล์ รหัส 512,000 บรรทัด การตั้งค่าไฟล์ .map ผิดพลาด และสิ่งต่างๆ ที่ไม่มีใครสังเกตเห็น

ผู้เขียนบทความ: Kea จาก Jia Yan

ที่มาของบทความ: Silicon Valley Alan Walker

7:02 น. ตอนเช้า มิชชั่นดิสทริกต์ ริมหน้าต่าง Zombie Coffee

วันนี้เป็นเช้าที่แปลกประหลาด ทวีตของ Chaofan Shou บน X ได้รับการดูมากกว่า 3.1 ล้านครั้ง และกลุ่มต่างๆ กำลังวุ่นวาย

เมื่อดื่มแก้วที่สอง อลัน วอล์คเกอร์ จากซิลิคอนแวลลีย์ ดึงไฟล์ 1,900 ไฟล์ลงมาและเริ่มอ่านอย่างจริงจัง

หลังจากอ่านเสร็จ Alan ได้คุยกับบางคน — Kai (อดีตพนักงาน Google ปัจจุบันเริ่มต้นธุรกิจด้านโครงสร้างพื้นฐาน), Marcus (พื้นหลังด้าน PE ช่วงนี้กำลังดูดีล AI) และ Sarah (วิศวกรเดิมของ Anthropic ปัจจุบันเป็นอิสระ) นี่คือสิ่งที่ได้พูดคุยกันวันนี้

อลัน วอล์คเกอร์ จากซิลิคอนแวลลีย์รู้สึกว่ามุมมองการวิเคราะห์ของคนส่วนใหญ่ไม่ลึกพอ นี่คือบันทึกและการจัดระเบียบของฉัน

01 เคล็ดลับที่หนึ่ง: แบบจำลองเป็นเพียงวัตถุดิบ แต่ harness คือกำแพงป้องกัน—และตัวเลขนี้คือ 46,000 บรรทัด

คำแรกที่คนส่วนใหญ่พูดเมื่อเห็นการรั่วไหลครั้งนี้คือ: "ว้าว เครื่องมือ Claude Code ซับซ้อนจริงๆ" ผิดนะ ควรพูดกลับกัน: เหตุผลที่ Claude Code ใช้งานได้ดี ไม่ใช่เพราะมันเรียกใช้ Claude ที่ฉลาดกว่า แต่เพราะมันสร้างเครื่องมือค้นหาที่มีโค้ด 46,000 บรรทัดไว้นอกโมเดล

อัลัน: ไค คุณดู QueryEngine.ts แล้วไหม? แค่ไฟล์เดียวนี้ มี 46K บรรทัด นี่ไม่ใช่แค่ "AI wrapper" แต่เป็นระบบปฏิบัติการ

ไค: ฉันดูแล้ว น่าสนใจกว่านั้นคือพวกเขาใช้ Bun แทน Node — พิจารณาจากเวลาเริ่มต้น ซึ่งแสดงว่าพวกเขาทดสอบประสิทธิภาพการเริ่มต้นแบบเย็นอย่างรอบคอบ ไม่ใช่เขียนแบบสุ่ม

จากหลักการพื้นฐาน: ความสามารถของโมเดลคือขีดจำกัดสูงสุด ส่วนการใช้งานจะกำหนดว่าคุณจะใช้ได้ถึงระดับใดของขีดจำกัดนั้น

การเรียกใช้ API โดยตรงสามารถใช้ความสามารถของโมเดลได้ 20%

ชุด harness ของ Claude Code — การจัดการบริบท การกำหนดเส้นทางเครื่องมือ และการแบ่งระดับสิทธิ์ — ทำให้คุณสามารถใช้งานได้ใกล้เคียง 80% ช่องว่าง 40% นี้คือผลลัพธ์จากการแลกเปลี่ยนด้วยโค้ด 46,000 บรรทัด

ผู้ที่จะครองตำแหน่งผู้พิชิต ChatGPT ต่อไป ไม่จำเป็นต้องเป็นทีมที่สร้างโมเดลที่ดีกว่า แต่อาจเป็นทีมที่สร้างเครื่องมือจัดการที่ดีกว่า

02 เคล็ดลับที่สอง: จุดประสงค์ที่แท้จริงของระบบสิทธิ์ — ไม่ใช่เพื่อทำให้ AI กลัวที่จะลงมือ แต่เพื่อให้ AI กล้าลงมือ

ทุกคนเมื่อเห็นระบบสิทธิ์ระดับสี่ มักคิดทันทีว่าเป็น “มาตรการรักษาความปลอดภัย” แต่ความเข้าใจนี้กลับตรงข้ามกับความเป็นจริง

อัลัน: ซาร่าห์،คุณเคยทำงานที่ Anthropic มาก่อน ระบบการอนุญาตเหล่านี้ถูกออกแบบมาเพื่อ “ความปลอดภัย” จริงๆ หรือ?

ซาร่าห์: ไม่ใช่แบบนั้นทั้งหมด แต่เพื่อให้โมเดลมีความกล้าในการดำเนินการ ถ้าไม่มีขอบเขตชัดเจน ตัวแทนจะต้องลังเลทุกขั้นตอนว่า “ฉันสามารถทำสิ่งนี้ได้ไหม” เมื่อมีขอบเขตแล้ว ภายในขอบเขตให้ดำเนินการทันที นอกขอบเขตให้หยุดและถาม

โปรดสังเกตรายละเอียดนั้น:

คำสั่งอันตรายไม่ได้ถูกบล็อกด้วยรายการกฎ แต่ใช้ AI ตัวที่สองในการตัดสินเชิงความหมาย

นี่หมายความว่า Anthropic รู้ว่ารายการกฎจะมีบางอย่างหลุดรอดไป จึงใช้ AI ตรวจสอบ AI — นี่คือระบบป้องกัน ไม่ใช่กฎการป้องกัน

เปรียบเทียบกับองค์กรใดๆ: ขอบเขตการมอบอำนาจที่ชัดเจนไม่ได้ทำให้คนกลัวที่จะทำอะไร แต่ช่วยให้คนกล้าตัดสินใจอย่างรวดเร็วภายในขอบเขตที่กำหนด

การให้สิทธิ์ที่ไม่ชัดเจนทำให้เกิดความเฉื่อยชา

03 เคล็ดลับที่สาม: ระบบความจำ — จำเฉพาะความชอบ ไม่ต้องจำรหัส นี่คือการลดทอนอย่างรอบคอบ

อัลัน: คุณได้ดูไดเรกทอรี memdir/ แล้วไหม? ข้อมูลที่ระบบความจำของมันเก็บไว้น้อยกว่าที่ฉันคิดไว้มาก

ไค: ใช่ มันไม่จดรหัส ไม่จดประวัติการสนทนา ก็แค่จดความชอบของผู้ใช้และข้อจำกัดของโปรเจกต์ ตอนดูครั้งแรกคิดว่ามันขี้เกียจ แต่คิดทีหลังกลับรู้ว่ามันถูกต้อง

หน้าต่างบริบทเป็นทรัพยากรที่มีจำกัด ประมาณ 200K tokens

บริบทที่เต็มไปด้วยรหัสยุคเก่า เหมือนวิศวกรที่มีรายละเอียดโครงการก่อนหน้าเต็มสมอง—งานวันนี้ไม่มีที่ว่างให้ใส่

วิธีการของ Anthropic คือ: ความจำระยะยาวเก็บเฉพาะ "วิธีการทำงานร่วมกับฉัน" ส่วนเนื้อหาเฉพาะเจาะจงจะดึงมาใหม่ทุกครั้ง

สนามรบถัดไปของผลิตภัณฑ์ AI ไม่ใช่ใครมีความจำมากกว่า แต่คือใครมีความจำแม่นยำกว่า—จดสิ่งที่ถูกต้อง และลืมสิ่งที่ไม่ควรจด

04 เคล็ดลับที่สี่: KAIROS — สิ่งที่ Anthropic ต้องการขายจริงๆ ไม่ใช่เครื่องมือ แต่เป็นพนักงานดิจิทัลที่ไม่เคยเลิกงาน

อัลัน: มาร์คัส ในฐานะนักลงทุน คุณรู้สึกอย่างไรกับฟีเจอร์ KAIROS นี้?

มาร์คัส: ฉันเห็นโมเดลธุรกิจที่ต่างอย่างสิ้นเชิง คุณไม่ได้จ่ายค่าสมัครใช้งาน SaaS แต่คุณจ่ายเงินเดือนให้กับผู้รับเหมาที่ทำงานตลอด 24 ชั่วโมง สิ่งนี้เปลี่ยนตรรกะการตั้งราคาทั้งหมด

การจัดการขอบเขตของเวลาเที่ยงคืน เป็นรายละเอียดที่สำคัญ—มีคนเคยคิดอย่างจริงจังหรือไม่ว่า “ถ้ากระบวนการ dreaming เริ่มขึ้นที่ 11:58 น. และข้ามเที่ยงคืนจะเกิดอะไรขึ้น”

นี่แสดงว่า KAIROS ไม่ใช่การพิสูจน์แนวคิด แต่เป็นฟีเจอร์ที่ออกแบบเสร็จและพร้อมเปิดใช้งาน

รูปแบบธุรกิจของ SaaS จะพัฒนาไปสู่ “การเสริมกำลังแรงงานด้วย AI” คุณจ้างพนักงานดิจิทัลที่ไม่เคยลาหยุดและต้นทุนเพิ่มเติมเข้าใกล้ศูนย์

นี่ไม่ใช่การกำหนดราคาเครื่องมือ นี่คือการกำหนดราคาทรัพยากรมนุษย์

05 เคล็ดลับที่ห้า: โครงสร้างหลายเอเจนต์ — บริษัท AI กำลังคัดลอกโครงสร้างองค์กรของบริษัทมนุษย์

ไค: คุณดูโครงสร้างไดเรกทอรีไหม? coordinator/, tasks/, skills/, services/ —— มันเหมือนกับแผนผังองค์กรของบริษัทสตาร์ทอัพเลย

อัลัน: ใช่ และในโหมด Coordinator หนึ่ง Claude สามารถสร้างตัวแทนงานหลายตัวขึ้นมา—นี่คือแบบจำลองที่ผู้จัดการควบคุมชุดของ IC

ขีดจำกัดของ AI เดี่ยวคือขนาดของ context window (200K tokens)

วิธีเดียวที่จะข้ามขีดจำกัดนี้คือการให้ AI หลายตัวทำงานร่วมกันโดยแต่ละตัวจัดการบริบทของตนเอง

นี่คือวิธีการเดียวกันที่บริษัทมนุษย์ใช้เพื่อแก้ไขข้อจำกัดทางการรับรู้ของแต่ละบุคคลผ่านการแบ่งงาน ความแตกต่างคือ:

ต้นทุนในการประสานงานของทีม AI เข้าใกล้ศูนย์ ขณะที่ต้นทุนที่ใหญ่ที่สุดของบริษัทมนุษย์คือการสื่อสารและการประสานงาน

เส้นทางการขยายขนาดของ AI กำลังทำซ้ำเส้นทางวิวัฒนาการขององค์กรมนุษย์—แต่ตัดต้นทุนการประสานงานออกไป 90%

หัวข้อลับที่ 6: BUDDY — Anthropic รู้ว่าความผูกพันทางอารมณ์คืออาวุธสุดท้ายที่ทำให้ผลิตภัณฑ์มีความเหนียวแน่น

ซาร่าห์: ฉันไม่เห็นด้วยกับที่หลายคนมองว่าฟีเจอร์ BUDDY เป็นเพียงการโฆษณาเกินจริง Duolingo สามารถสร้างอัตราส่วน DAU/MAU ที่สูงที่สุดระดับโลกได้ด้วยนกฮูกสีเขียวเพียงตัวเดียว

อัลัน: ประเด็นสำคัญคือ seed ที่กำหนดได้ — สายพันธุ์ของคุณถูกกำหนดโดย hash ของ user ID ของคุณ ซึ่งจะเป็นมังกรตัวเดิมเสมอ ไม่ใช่ของคนอื่น นี่แหละคือสิ่งที่ทำให้ติดใจ

ชื่อสายพันธุ์ถูกซ่อนไว้ในโค้ดแหล่งที่มาโดยใช้ Array ของ String.fromCharCode()

Anthropic ตั้งใจไม่ให้มันปรากฏในผลลัพธ์การค้นหาข้อความ

แผนเริ่มต้นการโปรโมตวันที่ 1 เมษายน (วันแกล้งคน) และเปิดตัวอย่างเป็นทางการในเดือนพฤษภาคม เส้นทางการเติบโตแบบไวรัสที่สมบูรณ์แบบ

อารมณ์คือกลไกการล็อกที่แข็งแกร่งที่สุด แข็งแรงกว่าต้นทุนการย้ายข้อมูลใดๆ

คุณสามารถย้ายรหัสฐานข้อมูล ย้ายไฟล์การตั้งค่า แต่คุณไม่สามารถย้ายมังกรตำนานที่อยู่กับคุณมาสองปี ซึ่ง Claude ตั้งชื่อว่า "Mochi"

ข้อลับที่ 7: การรั่วไหลของ Sourcemap นั้นเป็นภาพตัดขวางของความเปราะบางในห่วงโซ่อุปทานของอุตสาหกรรม AI

มาร์คัส: คุณรู้ไหมว่าในวันเดียวกันที่เหตุการณ์นี้เกิดขึ้น Axios ก็ถูกแฮกเช่นกัน? แพ็กเกจ npm ที่มีผู้ดาวน์โหลด 83 ล้านครั้งต่อสัปดาห์ บัญชีผู้ดูแลถูกยึดครองและติดตั้ง RAT ข้ามแพลตฟอร์ม

อัลัน: วันที่ 31 มีนาคมเป็นวันที่แปลกสำหรับ npm การที่สองเรื่องนี้เกิดขึ้นพร้อมกัน แสดงให้เห็นถึงปัญหาเดียวกัน: ห่วงโซ่การเปิดตัวผลิตภัณฑ์ AI สมัยใหม่มีความเปราะบางอย่างยิ่ง

ในปี 2025 มีแพ็กเกจที่เป็นอันตราย 454,000 แพ็กเกจถูกเผยแพร่บน npm

โครงการ npm แต่ละโครงการมีการดึงขึ้นมาเฉลี่ย 79 ขึ้นอยู่กับการพึ่งพาแบบถ่ายทอด

สนามรบด้านความปลอดภัยของ AI กำลังเปลี่ยนจาก "ความปลอดภัยของโมเดลเอง" เป็น "ความปลอดภัยในการปรับใช้และห่วงโซ่อุปทาน" อย่างรวดเร็ว

Claude Code ถือเป็นหนึ่งในระบบ AI ที่ซับซ้อนที่สุดในปัจจุบัน แต่พวกเขาก็ยังอาจทำผิดพลาดเช่นนี้ได้

ความลับที่ 8: การรั่วไหลครั้งนี้เอง คือการตลาดผลิตภัณฑ์ที่ไม่ตั้งใจที่ดีที่สุดของ Anthropic

ถ้วยที่ห้า เย็นแล้ว ตอนเช้าของย่าน Mission District นอกหน้าต่างเพิ่งเริ่มต้น

มาร์คัส: ฉันลงทุนมา 20 ปี ครั้งนี้มีจังหวะเวลาที่ละเอียดอ่อนมาก หลังจาก Anthropic ระดมทุนรอบก่อนหน้าเพียงหกเดือน โค้ดนี้ทำให้นักพัฒนาทั่วโลกตรวจสอบเทคโนโลยีของพวกเขาด้วยตัวเองโดยสมัครใจ สิ่งนี้ไม่มีทางซื้อได้ด้วยงบโฆษณาใดๆ

อัลัน: พูดให้แม่นยำกว่านั้น: คู่แข่งตอนนี้รู้แล้วว่าต้องทำอะไร แต่นั่นไม่ได้หมายความว่าพวกเขาทำได้จริง Google มีงานวิจัยการค้นหาที่ดีที่สุด แต่ไม่ได้สร้างผลิตภัณฑ์ AI ที่ดีที่สุด

ชุมชนนักพัฒนาทั่วโลกวิเคราะห์ แพร่กระจาย และอภิปรายเชิงลึกทางเทคนิคของ Claude Code ภายในไม่กี่ชั่วโมง — 3.1 ล้านครั้งในการดูบน X, มากกว่า 1,100 ดาว, มากกว่า 1,900 Fork

ในกระบวนการนี้ วิศวกรแต่ละคนต่างกลายเป็นผู้ให้การรับรองอย่างสมัครใจของ Anthropic

Anthropic สูญเสียอะไรบางอย่าง? โค้ด TypeScript บางส่วน

โครงสร้างเป็นแผนที่ แต่การดำเนินการคือภูมิประเทศ

สิ่งที่พวกเขากำลังสร้างจริงๆ คือระบบปฏิบัติการสำหรับพนักงานดิจิทัลตัวแรกของมนุษยชาติ ที่มีความจำ ระบบสิทธิ์ อินเทอร์เฟซด้านอารมณ์ ความสามารถในการดำเนินการด้วยตนเอง และเครือข่ายการทำงานร่วมกันของตัวแทนหลายตัว

คำถามที่รอคำตอบไม่ใช่ "AI จะแทนที่งานของมนุษย์หรือไม่" โค้ดแหล่งที่มาได้ให้คำตอบแล้ว:

KAIROS ไม่เคยหยุดนิ่ง, BUDDY สร้างความสัมพันธ์ทางอารมณ์, Coordinator จัดการทีม

คำถามที่แท้จริงคือ: คุณต้องการเป็นคนที่ออกแบบ harness หรือเป็นคนที่ถูก harness จัดการ?