วิชัล มิสรา หารือเกี่ยวกับ Transformers, ความสัมพันธ์เชิงเหตุและผล และการอัปเดตแบบเบย์เซียนใน AI

iconCryptoBriefing
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
วิชัล มิสรา ศาสตราจารย์จากมหาวิทยาลัยโคลัมเบีย ชี้ให้เห็นว่า transformers มีข้อจำกัดในการจัดการกับความสัมพันธ์เชิงเหตุและผล แม้จะเชี่ยวชาญในการจับคู่ความสัมพันธ์ ท่านชี้ให้เห็นการอัปเดตแบบเบย์เซียนเป็นทางเลือกเพื่อขับเคลื่อนความก้าวหน้าของ AI การเรียนรู้ในบริบทและกรอบงาน Bayesian wind tunnel อาจช่วยลดช่องว่างสู่ AGI นักเทรดที่ติดตาม altcoin ที่ควรจับตาอาจพบข้อมูลเหล่านี้มีความเกี่ยวข้องในช่วงที่อารมณ์ตลาดเปลี่ยนแปลง ดัชนีความกลัวและความโลภยังคงเป็นตัวชี้วัดสำคัญสำหรับนักเทรดคริปโต

ประเด็นสำคัญ

  • Transformer เรียนรู้ความสัมพันธ์มากกว่าความเป็นเหตุเป็นผล ซึ่งจำกัดความสามารถของมันในการบรรลุปัญญาที่แท้จริง
  • การบรรลุ AGI ต้องการโมเดลที่สามารถเปลี่ยนจากการเรียนรู้ความสัมพันธ์ไปสู่การเข้าใจความเป็นเหตุเป็นผล
  • โมเดลภาษาขนาดใหญ่สร้างข้อความโดยการคาดการณ์โทเค็นถัดไปจากการแจกแจงความน่าจะเป็น
  • บริบทที่ให้มาในคำสั่งมีอิทธิพลอย่างมากต่อผลลัพธ์ของโมเดลภาษา
  • โมเดลภาษาทำงานบนเมทริกซ์แบบกระจายซึ่งการรวมกันของโทเค็นหลายชุดไม่มีความหมาย
  • การเรียนรู้ในบริบทช่วยให้ LLMs สามารถแก้ปัญหาแบบเรียลไทม์โดยใช้ตัวอย่าง
  • ภาษาเฉพาะโดเมน (DSLs) สามารถลดความซับซ้อนของคำสั่งฐานข้อมูลให้กลายเป็นภาษาธรรมชาติ
  • การเรียนรู้ในบริบทใน LLM คล้ายกับการอัปเดตแบบเบย์เซียน ซึ่งปรับความน่าจะเป็นตามหลักฐานใหม่
  • การอภิปรายระหว่างวิธีการแบบเบย์เซียนและวิธีการแบบความถี่ส่งผลต่อการรับรู้เกี่ยวกับโมเดลการเรียนรู้ของเครื่องใหม่ๆ
  • แนวคิดห้องลมเบย์เซียนเสนอสภาพแวดล้อมที่ควบคุมได้สำหรับการทดสอบสถาปัตยกรรมการเรียนรู้ของเครื่อง
  • การเข้าใจกลไกของ LLM มีความสำคัญต่อการใช้งานอย่างมีประสิทธิภาพ
  • การเปลี่ยนจากความสัมพันธ์ไปสู่ความเป็นเหตุเป็นผลเป็นอุปสรรคสำคัญในการพัฒนาปัญญาประดิษฐ์
  • ความเกี่ยวข้องตามบริบทใน LLM ชี้ให้เห็นถึงความสำคัญของการเลือกคำสั่ง
  • เมทริกซ์ที่มีค่าเบาบางในโมเดลภาษาช่วยเพิ่มประสิทธิภาพโดยการกรองคู่โทเค็นที่ไม่เกี่ยวข้อง
  • ห้องลมเบย์เซียนให้กรอบงานใหม่ในการประเมินโมเดลการเรียนรู้ของเครื่อง

คำแนะนำจากแขก

วิชัล มิสรา เป็นศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์และวิศวกรรมไฟฟ้า และรองคณบดีด้านการคำนวณและปัญญาประดิษฐ์ ที่โรงเรียนวิศวกรรมศาสตร์ มหาวิทยาลัยโคลัมเบีย เขาหวนกลับมาที่พอดีกของ a16z เพื่อพูดคุยเกี่ยวกับงานวิจัยล่าสุดของเขาที่เปิดเผยถึงวิธีการที่ตัวแปลงในโมเดลภาษาขนาดใหญ่ปรับปรุงการคาดการณ์อย่างแม่นยำและสามารถคาดเดาได้ทางคณิตศาสตร์เมื่อประมวลผลข้อมูลใหม่ งานของเขาเน้นช่องว่างระหว่างปัจจุบันกับ AGI โดยเน้นความจำเป็นในการเรียนรู้อย่างต่อเนื่องหลังการฝึกอบรมและการเข้าใจเชิงเหตุและผล แทนที่จะเป็นเพียงการจับรูปแบบ

การเข้าใจ transformers และ LLMs

  • Transformers อัปเดตการคาดการณ์ของตนในลักษณะที่สามารถคาดเดาได้ทางคณิตศาสตร์

    — วิชัล มิสรา

  • LLMs ส่วนใหญ่เรียนรู้ความสัมพันธ์มากกว่าความเป็นเหตุเป็นผล ซึ่งจำกัดความฉลาดของพวกเขา
  • การจับรูปแบบไม่ใช่ปัญญา; แบบจำลองภาษาขนาดใหญ่เรียนรู้ความสัมพันธ์ ไม่ใช่ความสัมพันธ์เชิงเหตุและผล

    — วิชัล มิสรา

  • การบรรลุ AGI ต้องการโมเดลที่สามารถเรียนรู้ความสัมพันธ์เชิงเหตุและผล ไม่ใช่แค่ความสัมพันธ์เชิงสหสัมพันธ์
  • เพื่อไปถึง AGI เราจำเป็นต้องมีความสามารถในการเรียนรู้ต่อไปหลังจากการฝึกอบรม

    — วิชัล มิสรา

  • LLMs สร้างข้อความโดยการสร้างการแจกแจงความน่าจะเป็นสำหรับโทเค็นถัดไป
  • เมื่อให้คำสั่ง มันจะสร้างการแจกแจงของโทเค็นถัดไปที่ควรจะเป็น

    — วิชัล มิสรา

  • การเข้าใจกลไกของ LLM มีความสำคัญต่อการใช้งานอย่างมีประสิทธิภาพ

บทบาทของบริบทในโมเดลภาษา

  • พฤติกรรมของโมเดลภาษาได้รับอิทธิพลจากบริบทก่อนหน้าที่ให้ไว้ในคำสั่ง
  • ขึ้นอยู่กับว่าคุณเลือกการสังเคราะห์หรือการเขย่า แถวถัดไปจะดูต่างกันมาก

    — วิชัล มิสรา

  • ความเกี่ยวข้องตามบริบทใน LLM ชี้ให้เห็นถึงความสำคัญของการเลือกคำสั่ง
  • โมเดลภาษาทำงานบนเมทริกซ์แบบกระจายซึ่งการรวมกันของโทเค็นจำนวนมากไม่มีความหมาย
  • โชคดีที่เมทริกซ์นี้มีค่าเป็นศูนย์มากเพราะการรวมกันแบบสุ่มของโทเค็นเหล่านี้เป็นข้อความที่ไม่มีความหมาย

    — วิชัล มิสรา

  • เมทริกซ์ที่มีค่าเบาบางช่วยเพิ่มประสิทธิภาพโดยการกรองคู่โทเค็นที่ไม่เกี่ยวข้อง
  • บริบทที่ให้มาสามารถเปลี่ยนแปลงผลลัพธ์ของโมเดลภาษาได้อย่างมาก
  • การเข้าใจว่าโมเดลภาษาสร้างข้อความจากคำสั่งป้อนเข้าอย่างไรเป็นสิ่งสำคัญ

การเรียนรู้ในบริบทและการแก้ปัญหาแบบเรียลไทม์

  • การเรียนรู้ในบริบทช่วยให้ LLMs สามารถเรียนรู้และแก้ปัญหาแบบเรียลไทม์
  • การเรียนรู้ในบริบทคือเมื่อคุณแสดงสิ่งที่ LLM ยังไม่เคยเห็นมาก่อน

    — วิชัล มิสรา

  • LLMs ประมวลผลและเรียนรู้จากข้อมูลใหม่ผ่านตัวอย่าง
  • การเรียนรู้ในบริบทคล้ายกับการอัปเดตแบบเบย์เซียน ซึ่งปรับความน่าจะเป็นตามหลักฐานใหม่
  • LLMs กำลังทำสิ่งที่คล้ายกับการอัปเดตแบบเบย์เซียน

    — วิชัล มิสรา

  • cơ chếนี้มีความสำคัญอย่างยิ่งต่อการเข้าใจความสามารถของ LLMs
  • การแก้ปัญหาแบบเรียลไทม์ใน LLMs ทำได้โดยการเรียนรู้ในบริบท
  • ความสามารถในการเรียนรู้จากตัวอย่างแสดงให้เห็นถึงความยืดหยุ่นของ LLMs

ภาษาเฉพาะโดเมนและการเข้าถึงข้อมูล

  • ภาษาเฉพาะโดเมน (DSLs) แปลงคำสั่งภาษาธรรมชาติให้เป็นรูปแบบที่สามารถประมวลผลได้
  • ฉันออกแบบ DSL ซึ่งเป็นภาษาเฉพาะโดเมน ที่แปลงคำสอบถามเกี่ยวกับสถิติคริกเก็ต

    — วิชัล มิสรา

  • DSLs ช่วยลดความซับซ้อนของคำสั่งฐานข้อมูลให้เป็นภาษาที่เข้าใจง่าย
  • การสร้าง DSL แสดงถึงนวัตกรรมในการใช้ AI สำหรับการประยุกต์ใช้งานเฉพาะทาง
  • การเข้าใจความท้าทายในการสอบถามฐานข้อมูลที่ซับซ้อนนั้นจำเป็น
  • DSLs ช่วยปรับปรุงการมีปฏิสัมพันธ์ของผู้ใช้กับข้อมูลโดยการลดความซับซ้อนของกระบวนการสอบถาม
  • การพัฒนา DSL แสดงให้เห็นบทบาทของ AI ในการเข้าถึงข้อมูล
  • แนวทางนี้ให้โซลูชันทางเทคนิคสำหรับปัญหาทั่วไปในการเข้าถึงข้อมูล

การอัปเดตแบบเบย์เซียนและแนวทางทางสถิติในปัญญาประดิษฐ์

  • การเรียนรู้ในบริบทในโมเดลภาษาคล้ายกับการอัปเดตแบบเบย์เซียน
  • คุณเห็นบางสิ่ง คุณเห็นหลักฐานใหม่ คุณอัปเดตความเชื่อของคุณเกี่ยวกับสิ่งที่กำลังเกิดขึ้น

    — วิชัล มิสรา

  • การเข้าใจการอนุมานแบบเบย์เซียนมีความสำคัญต่อการเข้าใจวิธีที่ LLM ประมวลผลข้อมูล
  • ความแตกต่างระหว่างวิธีการแบบเบย์เซียนและวิธีการแบบความถี่ส่งผลต่อการรับรู้ของโมเดลปัญญาประดิษฐ์
  • มีกลุ่มของเบย์เซียนและความถี่ในความน่าจะเป็นและการเรียนรู้ของเครื่อง

    — วิชัล มิสรา

  • การอภิปรายระหว่างแนวทางเหล่านี้ส่งผลต่อการรับรู้งานวิจัยใหม่
  • การอัปเดตแบบเบย์เซียนให้กลไกที่ชัดเจนสำหรับการเรียนรู้ในบริบทใน LLMs
  • แนวคิดทางสถิตินี้เชื่อมโยงวิธีการที่ได้รับการพิสูจน์แล้วกับกระบวนการปัญญาประดิษฐ์สมัยใหม่

ห้องลมเบย์สและทดสอบโมเดล

  • แนวคิดห้องลมเบย์สสามารถใช้ทดสอบสถาปัตยกรรมการเรียนรู้ของเครื่อง
  • เราคิดไอเดียนี้ขึ้นมาเป็นห้องลมเบย์เซียน

    — วิชัล มิสรา

  • แนวคิดนี้ให้สภาพแวดล้อมที่ควบคุมได้สำหรับการประเมินโมเดล
  • เฟรมเวิร์กนี้ช่วยให้การทดสอบสถาปัตยกรรมเช่น transformers, MAMBA, LSTMs และ MLPs เป็นไปได้ง่ายขึ้น
  • การเข้าใจแนวคิดของอุโมงค์ลมในอวกาศช่วยให้เข้าใจการประยุกต์ใช้งานในปัญญาประดิษฐ์
  • ห้องลมเบย์เซียนเสนอกรอบงานใหม่เพื่อผลักดันการเรียนรู้ของเครื่อง
  • วิธีการนี้มีความสำคัญอย่างยิ่งต่อการประเมินและปรับปรุงโมเดลปัญญาประดิษฐ์
  • สภาพแวดล้อมการทดสอบที่ควบคุมช่วยเพิ่มความน่าเชื่อถือของการประเมินโมเดล
แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา