AI โมเดลขนาดใหญ่และ Web3 สามารถสังคมอยู่ร่วมกันได้อย่างไร? |All Creation Camp AI+คริปโต สตูดิโอ

บทความนี้อธิบายถึงวิธีที่เทคโนโลยีบล็อคเชนสามารถแก้ปัญหาข้อจำกัดในการฝึกโมเดล AI ขนาดใหญ่ในปัจจุบัน เช่น: ปริมาณข้อมูลและการสมดุลในเรื่องความเป็นส่วนตัว ต้นทุนและพลังการคำนวณ เป็นต้น และสำรวจความสัมพันธ์ระหว่าง AI และสังคมอย่างประทับใจ

เป็นเทคโนโลยีไฮเทคที่เติบโตที่สุดในประวัติศาสตร์มนุษย์ โมเดลขนาดใหญ่ได้ดึงดูดความสนใจของทุกคน เว็บ 3 ซึ่งเป็นสิ่งที่เพิ่งเกิดขึ้นเมื่อวานนี้ก็ถูกท้าทานทางกฎหมายมากขึ้น แต่เมื่อพูดถึงเทคโนโลยีที่แตกต่างอย่างสิ้นเชิง ไม่มีการแทนที่กันระหว่างทั้งสอง ผู้ที่รับผิดชอบทีม “AI+Crypto Studio” บนเกาะ All Things - นายเทียน ฮ่องเฟย จะพูดคุยกับคุณเกี่ยวกับปัญหาที่พบในการพัฒนาโมเดลขนาดใหญ่และว่า บริษัทในด้านเว็บ 3 มุ่งมั่นที่จะแก้ปัญหาเหล่านี้

ปัญหาใหญ่ของอุตสาหกรรมโมเดลและวิธีการรวม Web3 เพื่อแก้ไข

ตามทุกคนทราบกันดีว่าวงการอินเทอร์เน็ตได้เข้าสู่ระยะของออลิโกโปลีหลังจากปี 2015 และประเทศต่าง ๆ ทั่วโลกได้ดำเนินการตรวจสอบการกดขายของบริษัทพลัตฟอร์ม การเกิดขึ้นของโมเดลขนาดใหญ่ยิ่งทำให้ตำแหน่งของออลิโกโปลีมีความเป็นอโลโกโปรลีมากขึ้น โมเดลขนาดใหญ่รวมไปถึงอัลกอริทึม พลังคำนวณ และข้อมูล:

  • ในด้านของอัลกอริทึม ในขณะที่มีการครอบครองอย่างมาก อัลกอริทึมสามารถยังคงเปิดเผยอย่างมากเนื่องจากแรงจูงใจจากแหล่งออเพน การแข่งขันของมหาวิทยาลัยในการวิจัย รวมถึงความไม่ไว้วางใจในโอลิการ์ค;
  • จากมุมมองด้านพลังคำนวณ ด้วยค่าใช้จ่ายสูงมากในการฝึกโมเดลขนาดใหญ่ พลังคำนวณสามารถรับได้เฉพาะโดยองค์กรขนาดใหญ่เท่านั้น ดังนั้นสิ่งสำคัญคือการผลิตอัลกอริทึมถูกควบคุมโดยองค์กรขนาดใหญ่โดยสิ้นเชิง
  • ในเชิงข้อมูล ในขณะที่การฝึกโมเดลขนาดใหญ่พึงอ้างอิงถึงข้อมูลสาธารณะ ข้อมูลสาธารณะจะหมดเร็วตามการเติบโตของพารามิเตอร์ของโมเดลขนาดใหญ่ และดังนั้น การเติบโตต่อไปของโมเดลขนาดใหญ่พึงอ้างอิงถึงข้อมูลส่วนบุคคล ในขณะที่ปริมาณของข้อมูลอย่างแน่นอนที่เป็นเจ้าของโดยจำนวนมากของธุรกิจขนาดเล็กใหญ่มาก มันยากที่จะใช้ในการเลิกจำหน่าย ดังนั้น ธุรกิจขนาดใหญ่ยังคงมีการครองช่องสูงในข้อมูล

ด้วยผลลัพธ์ที่ได้ ยุค Big Model มีการควบคุมที่สำคัญมากกว่าที่เคยเป็นมาก่อน และโลกในอนาคตจะมีแนวโน้มที่จะถูกควบคุมโดยกลุ่มเล็กหรือแม้กระทั่งคอมพิวเตอร์เพียงเครื่องเดียว ( แม้ในโลก Web3 ที่ไม่มีการควบคุมจากศูนย์ End Game ที่พลวัตของ Vitalik สำหรับ Ethereum ก็จะถูกดำเนินการโดยเครื่องจักรขนาดใหญ่นอกเหนือจากบล็อก )

นอกจากนี้ บริษัท OpenAI ที่พัฒนา ChatGPT มีเพียงไม่กี่คนในทีมหลัก ๆ เนื่องจากเหตุผลต่าง ๆ อัลกอริทึมของ ChatGPT ยังไม่ได้เปิดเผยแบบโอเพน จนถึงตอนนี้ ธรรมชาติขององค์กรไม่แสวงหากำไรการประยุกต์ใช้ที่หลากหลายของ ChatGPT ได้เปลี่ยนแปลงชีวิตของมนุษย์ การปรับเปลี่ยนบางอย่างของโมเดล ChatGPT จะมีผลกระทบอย่างมากต่อมนุษย์ ในทางตรงกันข้ามกับหลักการของ Google ที่ไม่ทำความชั่วร้าย ChatGPT มีผลกระทบลึก ๆ ต่อคน

ดังนั้นความน่าเชื่อถือในการคำนวณของโมเดลจะกลายเป็นประเด็นสำคัญ แม้ว่า OpenAI สามารถดำเนินการเป็นองค์กรไม่แสวงหาผลกำไร การควบคุมพลังโดยบุคคลบางรายก็ยังมีผลกระทบที่เลวร้ายมากมาย (ในทวีความต่างกัน Ethereum End Game ที่เสนอโดย Vitalik ถูกสร้างขึ้นโดยเครื่องจะรักษาความโปร่งใสผ่านการตรวจสอบได้อย่างง่ายดายโดยสาธารณชน)

ในขณะเดียวกัน ยังมีปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่: ขาดกำลังคำนวณ ข้อมูลการฝึกที่มีพร้อมก็กำลังจะหมด และการแบ่งปันโมเดล ตามสถิติ ก่อนปี 2021 ปัญหาในอุตสาหกรรมปัญญาประดิษฐ์คือขาดข้อมูล และบริษัทดีพลีนนิ่งทั้งหมดกำลังมองหาข้อมูลในอุตสาหกรรมแนวตั้ง และหลังจากโมเดลขนาดใหญ่ ขาดกำลังคำนวณกลายเป็นอุปสรรค

การพัฒนาโมเดลขนาดใหญ่ถูกแบ่งออกเป็นหลายขั้นตอน: การเก็บข้อมูล การประมวลผลข้อมูล การฝึกโมเดล การปรับปรุงโมเดล และการสืบค้นการคำนวณการใช้งาน จากขั้นตอนเหล่านี้เราจะอธิบายอย่างสั้นเรื่องการมีส่วนร่วมของบล็อกเชนในโมเดลขนาดใหญ่และวิธีการต่อต้านความเสียหายจากความ-concentration มากเกินไปของโมเดลขนาดใหญ่

  • ในเชิงข้อมูล โดยเนื่องจากข้อมูลสาธารณะจะถูกใช้บริโภคหลัง 2030 จำนวนข้อมูลส่วนบุคคลที่มีค่าและมากขึ้นจะต้องถูกใช้ให้เหมาะสม พร้อมกับการปกป้องความเป็นส่วนตัวผ่านเทคโนโลยีบล็อกเชน
  • ในเชิงข้อมูลป้ายกำกับ โทเค็นสามารถใช้เป็นสิ่งสร้างสรรค์ให้กับการป้ายกำกับข้อมูลในขอบเขตของข้อมูลและการตรวจสอบข้อมูลขนาดใหญ่
  • ในขณะที่อยู่ในขั้นตอนการฝึกโมเดล การแบ่งปันพลังการคำนวณถูกบรรลุผ่านการแบ่งปันโมเดลและการฝึกอบรมร่วมกัน;
  • ในช่วงขั้นตอนการปรับโมเดลให้ดีขึ้น, การมีส่วนร่วมของชุมชนสามารถถูกสร้างสรรค์ผ่านโทเค็น;
  • ในขั้นตอนการคิดค้นและการคำนวณเหตุผลของผู้ใช้ บล็อกเชนสามารถป้องกันความเป็นส่วนตัวของข้อมูลผู้ใช้

โดยเฉพาะ

1) พลังงานคอมพิวเตอร์ที่ขาดแคลน

พลังงานคำนวณเป็นปัจจัยการผลิตที่จำเป็นสำหรับโมเดลขนาดใหญ่ และเป็นปัจจัยการผลิตที่แพงที่สุดในปัจจุบัน ถึงขนาดที่ สตาร์ทอัพที่เพิ่งระดมทุนได้จะต้องโอน 80% ของทุนของพวกเขาไปยัง NVIDIA เพื่อซื้อ GPU บริษัทที่ผลิตโมเดลขนาดใหญ่ของตนเองต้องใช้เงินอย่างน้อย 50 ล้านเหรียญเพื่อสร้างศูนย์ข้อมูลของตนเอง ในขณะที่ สตาร์ทอัพขนาดเล็กต้องซื้อบริการคอมพิวเตอร์คลาวด์ที่แพง

อย่างไรก็ตาม ความนิยมในระยะสั้นของโมเดลขนาดใหญ่และการใช้ทรัพยากรคอมพิวเตอร์โดยโมเดลขนาดใหญ่เองได้เกินกว่าความสามารถในการจัดหาของ NVIDIA ตามสถิติ ความต้องการในด้านพลังการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้นสองเท่าทุกๆ หลายเดือน ระหว่างปี 2012 ถึง 2018 ความต้องการในด้านพลังการคำนวณเพิ่มขึ้นถึง 300,000 เท่า และค่าใช้จ่ายในการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้น 31 เท่าทุกปี

สำหรับบริษัทอินเทอร์เน็ตจีน พวกเขาต้องเผชิญกับการขัดข้องจากสหรัฐต่อ GPU ระดับสูง สามารถบอกได้ว่าค่าฝึกอบรมที่มากมายเป็นเหตุผลหลักที่เทคโนโลยีโมเดลใหญ่ถูกควบคุมโดยผู้เรียนเพียงเพียงไม่กี่คน

ดังนั้นวิธีการแก้ปัญหาพลังการคำนวณของโมเดลขนาดใหญ่ผ่านบล็อกเชนคืออะไรครับ?

การพิจารณาถึงการผลิตโมเดลขนาดใหญ่ มันสามารถแบ่งออกเป็นการฝึกโมเดลขนาดใหญ่ การปรับปรุงแก้ไขอย่างละเอียดและการคำนวณการสืบค้นของผู้ใช้ แม้ว่าการฝึกโมเดลขนาดใหญ่จะเป็นที่รู้จักว่าเป็นค่าใช้จ่ายที่สูง แต่เวอร์ชันของโมเดลขนาดใหญ่เพียงเพียงต้องสร้างขึ้นมาเพียงครั้งเดียว ในส่วนมากของเวลา สำหรับผู้ใช้บริการโมเดลขนาดใหญ่ การคำนวณการสืบค้นเท่านั้นที่จำเป็น ตามสถิติของ AWS ก็ยืนยันว่า 80% ของพลังการคำนวณจริงๆถูกใช้ไปในการคำนวณการสืบค้น

การฝึกอบรมของโมเดลขนาดใหญ่ต้องใช้ความสามารถในการสื่อสารที่เร็วระหว่าง GPU แต่ไม่สามารถทำเสร็จบนเครือข่ายได้ (นอกจากว่าคุณจะเลือกแลกเวลาให้ต่ออายุเพื่อลดต้นทุน). แต่การคำนวณการอ่านค่าทำได้บน GPU เดียว. การปรับแต่งละเอียดจะขึ้นอยู่กับโมเดลขนาดใหญ่ที่ได้รับและข้อมูลที่มีคุณภาพ เพราะฉะนั้นจึงต้องใช้ทรัพยากรคำนวณน้อยกว่าการฝึกอบรมโมเดลขนาดใหญ่มากๆ

เมื่อพูดถึงการเรนเดอร์กราฟิกเป็นที่ชัดเจนว่า GPU ของผู้บริโภคทํางานได้ดีกว่า GPU ขององค์กรและไม่ได้ใช้งานเกือบตลอดเวลา ตั้งแต่มหาวิทยาลัยแคลิฟอร์เนียเบิร์กลีย์เปิดตัว SETI เพื่อค้นหามนุษย์ต่างดาวในปี 1999 และ Grid Computing ได้รับความนิยมในปี 2000 มีสถาปัตยกรรมทางเทคนิคบางอย่างที่ใช้ทรัพยากรคอมพิวเตอร์ที่ไม่ได้ใช้งานเพื่อทํางานร่วมกันเพื่อทํางานคอมพิวเตอร์ขนาดใหญ่ให้เสร็จ ก่อนการเกิดขึ้นของบล็อกเชนความร่วมมือเหล่านี้มักจะมุ่งเน้นไปที่งานทางวิทยาศาสตร์และอาศัยความกระตือรือร้นและการมีส่วนร่วมด้านสวัสดิการสาธารณะของผู้เข้าร่วม ตอนนี้ใช้เทคโนโลยีบล็อกเชนแอปพลิเคชันที่หลากหลายสามารถจูงใจผ่านโทเค็น

เช่นเดียวกับโครงการคลาวด์คอมพิวติ้งแบบกระจายอํานาจ Akash เครือข่ายคอมพิวเตอร์ทั่วไปได้รับการจัดตั้งขึ้นและผู้ใช้สามารถปรับใช้โมเดลแมชชีนเลิร์นนิงสําหรับการคํานวณเหตุผลและการแสดงภาพ นอกจากนี้ยังมีโครงการ AI ที่ใช้บล็อกเชนเช่น Bittensor, Modulus Lab, Giza และ ChainML ซึ่งทั้งหมดนี้มุ่งเป้าไปที่การคํานวณการอนุมานแบบสอบถาม

โปรโตคอลการคำนวณ AI บล็อกเชน Gensyn และแพลตฟอร์ม AI แบบสร้างสรรค์โอเพนซอร์ส Together มุ่งมั่นที่จะสร้างเครือข่ายการคำนวณที่จำกัดที่บริการการฝึกโมเดลขนาดใหญ่

ความท้าทาย: สำหรับเครือข่ายการคำนวณแบบกระจาย ความยากลำบากไม่ได้อยู่เฉพาะ อย่างเครื่องคอมพิวเตอร์ที่มีความเร็วต่ำและเครือข่ายการสื่อสารที่ไม่เชื่อถือได้ ความไม่สามารถในการซิงโครไนซ์สถานะการคำนวณ การจัดการกับสภาพแวดล้อมการคำนวณประเภท GPU หลายแบบ แต่ยังต้องจัดการกับกระตุ้นเศรษฐกิจ การโกงของผู้เข้าร่วม การพิสูจน์ภาระงาน ความปลอดภัย การป้องกันความเป็นส่วนตัว และการโจมตีแอนติสแปม

2) ข้อมูลที่ขาดแคลนและการแก้ไขข้อมูล

อัลกอริทึมหลักของโมเดลขนาดใหญ่ การเรียนรู้แบบเสริม (RLHF) ต้องการความมีส่วนร่วมของมนุษย์ในการปรับปรุงการฝึกอบรมเพื่อแก้ไขข้อผิดพลาดและกำจัดความลำเอียงและข้อมูลที่เป็นอันตราย OpenAI ใช้ RLHF ในการปรับปรุง GPT3 เพื่อสร้าง ChatGPT ในขั้นตอนนี้ OpenAI พบว่ามีผู้เชี่ยวชาญจากกลุ่ม Facebook และจ่ายค่าแรงแก่คนงานเคนย่า 2 ดอลลาร์ต่อชั่วโมง การฝึกอบรมเพื่อปรับปรุงในบางครั้งต้องการความมีส่วนร่วมของผู้เชี่ยวชาญด้านข้อมูลจากสาขาที่เฉพาะเจาะจง และการนำไปใช้งานสามารถรวมกับวิธีการสร้างสติ๊กเกอร์เพื่อส่งเสริมการมีส่วนร่วมของชุมชนได้อย่างเต็มที่

อุตสาหกรรมระบบพื้นฐานทางกายภาพที่ไม่มีการกำหนด (DePINs) ใช้โทเค็นเพื่อกระตุ้นผู้คนให้แบ่งปันข้อมูลจริง ๆ แบบ real-time จากโลกทางกายตามเซ็นเซอร์สำหรับการฝึกโมเดลต่าง ๆ รวมถึง: React รวบรวมข้อมูลการใช้พลังงาน, DIMO รวบรวมข้อมูลการขับขี่รถ, WeatherXM รวบรวมข้อมูลอากาศ, และ Hivemapper รวบรวมข้อมูลแผนที่ผ่านการกระตุ้นโทเค็นเพื่อกระตุ้นผู้คนให้ทำเครื่องหมายป้ายจราจรและช่วยให้อัลกอริทึมการเรียนรู้ของ RLHF ของตนปรับปรุงความแม่นยำ

ในขณะเดียวกันเมื่อพารามิเตอร์ของโมเดลขนาดใหญ่เพิ่มขึ้นข้อมูลสาธารณะที่มีอยู่จะหมดลงภายในปี 2030 และความคืบหน้าอย่างต่อเนื่องของโมเดลขนาดใหญ่จะต้องพึ่งพาข้อมูลส่วนตัว จํานวนข้อมูลส่วนตัวเป็น 10 เท่าของข้อมูลสาธารณะ แต่กระจัดกระจายอยู่ในมือขององค์กรและบุคคลและเป็นส่วนตัวและเป็นความลับในธรรมชาติทําให้ยากต่อการแสวงหาประโยชน์ ภาวะที่กลืนไม่เข้าคายไม่ออกสองครั้งเกิดขึ้น ในอีกด้านหนึ่งโมเดลขนาดใหญ่ต้องการข้อมูล แต่แม้ว่าฝ่ายที่มีข้อมูลต้องการโมเดลขนาดใหญ่ แต่ก็ไม่ต้องการส่งมอบข้อมูลให้กับโมเดลขนาดใหญ่ ปัญหาคู่นี้สามารถแก้ไขได้ด้วยเทคโนโลยีในสาขาบล็อกเชน

สำหรับโมเดลการอ่านแบบโอเพนซอร์ส โดยเนื่องจากว่าต้องใช้ทรัพยากรคำนวณน้อยกว่า จึงสามารถดาวน์โหลดโมเดลไปยังส่วนข้อมูลเพื่อดำเนินการ สำหรับโมเดลที่ไม่สาธารณะหรือโมเดลขนาดใหญ่ ต้องทำการตกความไว้ก่อนและอัปโหลดไปยังส่วนจบของโมเดล วิธีการตกความไว้รวมถึงข้อมูลสังเคราะห์และพิสูจน์ความรู้ศูนย์

ไม้มีส่วนไหนว่าโมเดลถูกดาวน์โหลดไปที่ด้านข้อมูลหรือว่าข้อมูลถูกอัปโหลดไปที่ด้านโมเดล ปัญหาเกี่ยวกับอำนาจจำเป็นต้องแก้ไขเพื่อป้องกันการโกงโมเดลหรือข้อมูล

ท้าทาย: หรือ ถึงแม้ว่าการกระตุ้นโทเค็นของ Web3 สามารถช่วยในการแก้ไขปัญหานี้ ปัญหาการโกงกลับต้องถูกแก้ไข

3) ความร่วมมือในการสร้างแบบจำลอง

ในชุมชน Civitai แห่งนี้ โลกของแพลตฟอร์มการแบ่งปันโมเดลการวาด AI ที่ใหญ่ที่สุดในโลก ผู้คนแบ่งปันโมเดลและสามารถคัดลอกโมเดลได้ง่าย และปรับเปลี่ยนโมเดลเพื่อสร้างโมเดลที่ตอบสนองตามความต้องการของตนเองได้อย่างง่ายดาย

Bittensor, โครงการบล็อกเชน AI แห่งรุ่นใหม่ที่เปิดเป็นโอเพนซอร์สและมีความเห็นร่วม ได้ออกแบบรูปแบบของโมเดลที่กระตุ้นโทเคน โดยอ้างอิงจากกลไกความร่วมมือของผู้เชี่ยวชาญหลายคน โดยร่วมกันสร้างโมเดลในการแก้ปัญหาและสนับสนุนการจำแนกองค์ความรู้ ซึ่งสามารถแบ่งปันระหว่างโมเดล ข้อมูล การฝึกอบรมที่เร่งด่วน ซึ่งมุ่งเน้นการให้โอกาสแก่ธุรกิจรุ่นใหม่มากมายในการเข้าร่วมโมเดลขนาดใหญ่

เป็นเครือข่ายรวมสำหรับบริการออฟเชน เช่น การอัตโนมัติ ออรัคเทล และ AI ร่วม ออโตโนลัส ออกแบบกรอบความร่วมมือสำหรับตัวแทนเพื่อเดินทางสู่การตกลงผ่าน Tendermint

ท้าทาย: การฝึกอบรมของโมเดลมากมายยังต้องการการสื่อสารมากมาย และความเชื่อถือได้และประสิทธิภาพทางเวลาของการฝึกอบรมแบบกระจายยังเป็นอุปสรรคที่ใหญ่

โมเดลขนาดใหญ่และนวัตกรรมใน Web3

ในการร่วมมือกับที่กล่าวถึงข้างต้นว่า Web3 สามารถใช้เพื่อแก้ไขบางปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่ การผสมผสานของแรงกระทบสองสิ่งสำคัญจะส่งผลให้เกิดประยุกต์ใช้ที่น่าสนใจบ้าง

1) ใช้ ChatGPT เขียนสัญญาอัจฉริยะ

เร็ว ๆ นี้ศิลปิน NFT ใช้ทักษะเพื่อดำเนินการ ChatGPT โดยไม่มีความรู้ในการเขียนโปรแกรมเพื่อเปิดตัวสัญญาอัจฉริยะของตัวเองและออกโทเค็น Turboner ศิลปินใช้ YouTube เพื่อบันทึกรายการสร้างของเขาเป็นเวลา 1 สัปดาห์ และทำให้ทุกคนได้รับแรงบันดาลใจที่จะใช้ ChatGPT มาร่วมสร้างสัญญาอัจฉริยะ

2) การชำระเงินด้วยคริปโตเสริมพลังการบริหารอย่างฉลาด

การพัฒนาโมเดลขนาดใหญ่ได้ปรับปรุงความฉลาดของผู้ช่วยอัจฉริยะอย่างมากและเมื่อรวมกับการชําระเงินที่เข้ารหัสผู้ช่วยอัจฉริยะจะสามารถประสานงานทรัพยากรได้มากขึ้นและทํางานร่วมกันมากขึ้นในตลาดผู้ช่วยอัจฉริยะ AutoGPT แสดงให้เห็นถึงการพึ่งพาบัตรเครดิตที่ผู้ใช้จัดหาให้และเขาสามารถช่วยให้ผู้ใช้ซื้อทรัพยากรการประมวลผลแบบคลาวด์และการจองเที่ยวบินโดยอัตโนมัติ แต่ถูก จํากัด ด้วยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ และความสามารถของ AutoGPT ถูก จํากัด อย่างรุนแรงโดยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ การออกแบบ Multi Agent System (MAS) รวมถึง Contract Net Protocol รวมถึงการทํางานร่วมกันของผู้ช่วยอัจฉริยะหลายคนในตลาดเปิดและหากได้รับการสนับสนุนจากโทเค็นการทํางานร่วมกันดังกล่าวจะทําลายการทํางานร่วมกันที่ จํากัด บนพื้นฐานของความไว้วางใจและกลายเป็นความร่วมมือขนาดใหญ่ตามเศรษฐกิจตลาดเช่นเดียวกับที่สังคมมนุษย์ย้ายจากสังคมดั้งเดิมไปสู่สังคมการเงิน

3) zkML(Zero Knowledge Machine Learning)

การประยุกต์ใช้เทคโนโลยี zkp (Zero Knowledge Proof) ในบล็อกเชนแบ่งออกเป็นสองประเภท หนึ่งคือการแก้ปัญหาประสิทธิภาพของบล็อกเชนโดยการถ่ายโอนข้อกําหนดการประมวลผลไปยัง off-chain จากนั้นไปยังการรับรองแบบ on-chain ผ่าน zkp ประเภทที่สองใช้เพื่อปกป้องความเป็นส่วนตัวของธุรกรรม การประยุกต์ใช้ zkp ในรุ่นขนาดใหญ่รวมถึงการคํานวณแบบจําลองที่เชื่อถือได้ (เพื่อพิสูจน์ความสอดคล้องและความถูกต้องของการคํานวณแบบจําลอง) และการคํานวณความเป็นส่วนตัวของข้อมูลการฝึกอบรม ในสภาพแวดล้อมแบบกระจายอํานาจผู้ให้บริการของโมเดลจําเป็นต้องพิสูจน์ให้ลูกค้าเห็นว่าโมเดลที่ขายเป็นโมเดลที่สัญญาไว้กับลูกค้าโดยไม่ต้องตัดมุม สําหรับคู่ค้าข้อมูลการฝึกอบรมพวกเขาจําเป็นต้องมีส่วนร่วมในการฝึกอบรมหรือใช้แบบจําลองบนสมมติฐานของการปกป้องความเป็นส่วนตัวของตนเอง . แม้ว่า zkp จะมีความเป็นไปได้อยู่บ้าง แต่ก็ยังมีความท้าทายมากมาย และโซลูชันต่างๆ เช่น การประมวลผลแบบโฮโมมอร์ฟิกและการประมวลผลความเป็นส่วนตัวแบบรวมศูนย์ยังไม่บรรลุนิติภาวะ

โซลูชันที่ใช้โครงสร้าง BEC (Blockchain Edge Client) เป็นพื้นฐาน

นอกจากมีโรงเรียนที่กล่าวถึงข้างต้น ยังมีโรงเรียนอีกหนึ่งโรงเรียนที่ไม่ได้รับความสนใจอย่างแพร่หลายเนื่องจากขาดของสิทธิแรงจูงใช้โทเเคนและการใช้งานแอปพลิเคชันบล็อกเชนแบบมินิมอลิสต์

สถาปัตยกรรมที่ใช้ BEC มีความคล้ายคลึงกับแนวคิดของ Web5 ที่ Jack Dorsey กล่าวถึงและ Solid โดย Tim Berners-Lee ในหลายด้าน

พวกเขาคิดว่าทั้งหมด

  • แต่ละคนมีจุดปล่อยสัญญาณควบคุมที่สอดคล้องกัน;
  • การคำนวณและการจัดเก็บในสถานการณ์ในข้อประยุกต์ส่วนใหญ่ควรจะถูกจัดการที่ตรงขอบ;
  • ความร่วมมือระหว่างโหนดบุคคลเสร็จสิ้นผ่านบล็อกเชน;
  • การสื่อสารระหว่างโหนดเสร็จสิ้นผ่าน P2P;
  • บุคคลสามารถควบคุมโหนดของตนเองได้เองหรือให้ความไว้วางใจกับบุคคลที่น่าเชื่อถือเพื่อให้บริหารโหนด (เรียกว่าเซิร์ฟเวอร์เชื่อมต่อในบางสถานการณ์);
  • บรรลุการกระจายอำนาจได้ที่สุด

เมื่อโหนดนี้สอดคล้องกับแต่ละคนและควบคุมโดยแต่ละจัดเก็บข้อมูลส่วนบุคคลและโหลดโมเดลขนาดใหญ่ตัวแทนอัจฉริยะส่วนบุคคล (ตัวแทน) ส่วนบุคคลที่ได้รับการคุ้มครองความเป็นส่วนตัว 100% สามารถฝึกอบรมได้ Dr. Gong Ting หุ้นส่วนผู้ก่อตั้งชาวจีนของ SIG เปรียบเทียบโหนดส่วนตัวในอนาคตกับเมฆส่วนตัวเหนือศีรษะของ Olaf ใน "Frozen" ที่ติดตามเขาเสมอ

ในทางนี้ อวาตาร์ใน Metaverse จะไม่เป็นรูปภาพที่ควบคุมโดยแป้นพิมพ์อีกต่อไป แต่เป็นตัวแทนที่มีวิญญาณ เขาสามารถศึกษาข่าวออนไลน์ ประมวลผลอีเมล และแม้กระทั้งตอบกลับข้อความแชทสังคมของคุณโดยอัตโนมัติ 24 ชั่วโมงต่อวัน (สำหรับแฟนสาวที่ดื้อ คุณอาจต้องมีวิธีตรวจสอบว่าแฟนหนุ่มของคุณกำลังใช้ตัวแทนในการจัดการกับคุณในอนาคต) เมื่อตัวแทนของคุณต้องการทักษะใหม่ เหมือนกับการติดตั้งแอปบนโทรศัพท์มือถือ คุณสามารถติดตั้งแอปใหม่ในโหนดของคุณ

สรุป

ในประวัติศาสตร์ ด้วยการแพลตฟอร์มาไลเซชันของการพัฒนาของอินเทอร์เน็ต แม้ว่าเวลาสำหรับการเกิดของบริษัทยูนิคอร์นจะกลายเป็นเวลาสั้นลงทุกครั้ง แต่มันกลับกลายเป็นที่เสียหายต่อการพัฒนาของสตาร์ตอัพ

ด้วยแพลตฟอร์มการกระจายเนื้อหาที่มีประสิทธิภาพที่ Google และ Facebook ให้บริการ โดยที่ YouTube ซึ่งเกิดขึ้นในปี 2005 ถูกซื้อโดย Google ในราคา 1.6 พันล้านเหรียญสหรัฐเพียงหนึ่งปีต่อมา

พร้อมกับแพลตฟอร์มการกระจายแอปพลิเคชันที่มีประสิทธิภาพของ Apple App Store Instagram ได้ถูกก่อตั้งขึ้นในปี 2012 โดยมีคนทั้งหมดเพียง 10 คนเท่านั้น และได้ถูก Facebook เข้าซื้อในปี 2012 ด้วยมูลค่า 1 พันล้านดอลลาร์สหรัฐ

ด้วยความสนับสนุนจากโมเดลขนาดใหญ่ ChatGPT บริษัท Midjourney ที่มีเพียง 11 คน ได้รายได้ประมาณ 100 ล้าน​​ ดอลลาร์สหรัฐต่อปี และ OpenAI ซึ่งมีไม่เกิน 100 คน มีมูลค่าเกิน 20 พันล้าน​ ดอลลาร์สหรัฐ

บริษัท แพลตฟอร์มอินเทอร์เน็ตกําลังมีประสิทธิภาพมากขึ้นเรื่อย ๆ และการเกิดขึ้นของโมเดลขนาดใหญ่ไม่ได้เปลี่ยนรูปแบบที่มีอยู่ของอินเทอร์เน็ตที่ถูกผูกขาดโดยองค์กรขนาดใหญ่ องค์ประกอบทั้งสามของโมเดลขนาดใหญ่อัลกอริทึมข้อมูลและพลังการประมวลผลยังคงผูกขาดโดยองค์กรขนาดใหญ่ บริษัท สตาร์ทอัพไม่มีความสามารถในการคิดค้นโมเดลขนาดใหญ่และไม่มีความแข็งแกร่งทางการเงินในการฝึกอบรมโมเดลขนาดใหญ่ พวกเขาสามารถมุ่งเน้นไปที่การประยุกต์ใช้โมเดลขนาดใหญ่ในแนวตั้งเท่านั้น แม้ว่าโมเดลขนาดใหญ่ดูเหมือนจะส่งเสริมความนิยมของความรู้ แต่พลังที่แท้จริงถูกควบคุมโดยคนไม่เกิน 100 คนในโลกที่มีความสามารถในการผลิตแบบจําลอง

หากโมเดลขนาดใหญ่แทรกซึมเข้าไปในทุกแง่มุมของชีวิตของผู้คนในอนาคตและคุณถาม ChatGPT เกี่ยวกับอาหารประจําวันสุขภาพอีเมลงานของคุณและจดหมายทนายความของคุณในทางทฤษฎีผู้ที่เชี่ยวชาญโมเดลขนาดใหญ่จะต้องแอบเปลี่ยนพารามิเตอร์บางอย่างเท่านั้น มันสามารถส่งผลกระทบอย่างมากต่อชีวิตของผู้คนนับไม่ถ้วน การว่างงานบางอย่างที่เกิดจากโมเดลขนาดใหญ่อาจได้รับการแก้ไขผ่าน UBI หรือ Worldcoin แต่ผลที่ตามมาของความเป็นไปได้ของความชั่วร้ายที่เกิดจากโมเดลขนาดใหญ่ที่ถูกควบคุมโดยคนไม่กี่คนนั้นร้ายแรงกว่า นี่คือความตั้งใจเดิมของ OpenAI แม้ว่า OpenAI จะแก้ปัญหาที่ขับเคลื่อนด้วยผลกําไรด้วยวิธีการที่ไม่แสวงหาผลกําไร แต่จะแก้ปัญหาที่ขับเคลื่อนด้วยพลังงานได้อย่างไร? เห็นได้ชัดว่าโมเดลขนาดใหญ่ฝึกโมเดลความรู้อย่างรวดเร็วโดยใช้ความรู้ที่มนุษย์สะสมมานานหลายทศวรรษและแบ่งปันได้อย่างอิสระบนอินเทอร์เน็ต แต่โมเดลนี้ถูกควบคุมโดยคนจํานวนน้อยมาก

  1. ดังนั้น มีการขัดแย้งขนาดใหญ่ในค่ามูลค่าระหว่างโมเดลขนาดใหญ่และบล็อกเชน นักปฏิบัติบล็อกเชนจำเป็นต้องมีส่วนร่วมในการทำธุรกิจโมเดลขนาดใหญ่และใช้เทคโนโลยีบล็อกเชนเพื่อแก้ไขปัญหาโมเดลขนาดใหญ่ หากข้อมูลปริมาณมากที่มีอยู่บนอินเทอร์เน็ตได้รับการยกเว้นเสรีเป็นความรู้ทั่วไปของมนุษย์ แล้วโมเดลขนาดใหญ่ที่สร้างขึ้นจากข้อมูลเหล่านี้ควรเป็นของมนุษย์ทั้งหมดเช่นเดียวกับ OpenAI ที่เริ่มจ่ายเงินสำหรับฐานข้อมูลวรรณกรรมเร็ว ๆ นี้ OpenAI จำเป็นต้องจ่ายเงินสำหรับบล็อกส่วนตัวที่คุณและฉันทุ่มเทใจให้

ข้อความปฏิเสธความรับผิดชอบ:

  1. บทความนี้ถูกพิมพ์ใหม่จาก [ ThreeDAO, เกาะของสิ่งทั้งหมด]. ลิขสิทธิ์ทั้งหมดเป็นของผู้เขียนต้นฉบับ [36C]. หากมีข้อขัดแย้งใด ๆ เกี่ยวกับการพิมพ์ฉีดนี้ โปรดติดต่อ Gate Learnทีม และพวกเขาจะจัดการกับมันโดยรวดเร็ว
  2. ข้อความปฏิเสธความรับผิด: มุมมองและความคิดเห็นที่แสดงในบทความนี้เป็นเพียงของผู้เขียนเท่านั้น และไม่ใช่คำแนะนำในการลงทุนใด ๆ
  3. การแปลบทความเป็นภาษาอื่น ๆ ทำโดยทีม Gate Learn หากไม่ได้กล่าวถึง การคัดลอก การกระจาย หรือการลอกเลียนบทความที่ถูกแปล นั้นถือเป็นการละเมิดกฎ

AI โมเดลขนาดใหญ่และ Web3 สามารถสังคมอยู่ร่วมกันได้อย่างไร? |All Creation Camp AI+คริปโต สตูดิโอ

กลาง1/31/2024, 3:56:39 PM
บทความนี้อธิบายถึงวิธีที่เทคโนโลยีบล็อคเชนสามารถแก้ปัญหาข้อจำกัดในการฝึกโมเดล AI ขนาดใหญ่ในปัจจุบัน เช่น: ปริมาณข้อมูลและการสมดุลในเรื่องความเป็นส่วนตัว ต้นทุนและพลังการคำนวณ เป็นต้น และสำรวจความสัมพันธ์ระหว่าง AI และสังคมอย่างประทับใจ

เป็นเทคโนโลยีไฮเทคที่เติบโตที่สุดในประวัติศาสตร์มนุษย์ โมเดลขนาดใหญ่ได้ดึงดูดความสนใจของทุกคน เว็บ 3 ซึ่งเป็นสิ่งที่เพิ่งเกิดขึ้นเมื่อวานนี้ก็ถูกท้าทานทางกฎหมายมากขึ้น แต่เมื่อพูดถึงเทคโนโลยีที่แตกต่างอย่างสิ้นเชิง ไม่มีการแทนที่กันระหว่างทั้งสอง ผู้ที่รับผิดชอบทีม “AI+Crypto Studio” บนเกาะ All Things - นายเทียน ฮ่องเฟย จะพูดคุยกับคุณเกี่ยวกับปัญหาที่พบในการพัฒนาโมเดลขนาดใหญ่และว่า บริษัทในด้านเว็บ 3 มุ่งมั่นที่จะแก้ปัญหาเหล่านี้

ปัญหาใหญ่ของอุตสาหกรรมโมเดลและวิธีการรวม Web3 เพื่อแก้ไข

ตามทุกคนทราบกันดีว่าวงการอินเทอร์เน็ตได้เข้าสู่ระยะของออลิโกโปลีหลังจากปี 2015 และประเทศต่าง ๆ ทั่วโลกได้ดำเนินการตรวจสอบการกดขายของบริษัทพลัตฟอร์ม การเกิดขึ้นของโมเดลขนาดใหญ่ยิ่งทำให้ตำแหน่งของออลิโกโปลีมีความเป็นอโลโกโปรลีมากขึ้น โมเดลขนาดใหญ่รวมไปถึงอัลกอริทึม พลังคำนวณ และข้อมูล:

  • ในด้านของอัลกอริทึม ในขณะที่มีการครอบครองอย่างมาก อัลกอริทึมสามารถยังคงเปิดเผยอย่างมากเนื่องจากแรงจูงใจจากแหล่งออเพน การแข่งขันของมหาวิทยาลัยในการวิจัย รวมถึงความไม่ไว้วางใจในโอลิการ์ค;
  • จากมุมมองด้านพลังคำนวณ ด้วยค่าใช้จ่ายสูงมากในการฝึกโมเดลขนาดใหญ่ พลังคำนวณสามารถรับได้เฉพาะโดยองค์กรขนาดใหญ่เท่านั้น ดังนั้นสิ่งสำคัญคือการผลิตอัลกอริทึมถูกควบคุมโดยองค์กรขนาดใหญ่โดยสิ้นเชิง
  • ในเชิงข้อมูล ในขณะที่การฝึกโมเดลขนาดใหญ่พึงอ้างอิงถึงข้อมูลสาธารณะ ข้อมูลสาธารณะจะหมดเร็วตามการเติบโตของพารามิเตอร์ของโมเดลขนาดใหญ่ และดังนั้น การเติบโตต่อไปของโมเดลขนาดใหญ่พึงอ้างอิงถึงข้อมูลส่วนบุคคล ในขณะที่ปริมาณของข้อมูลอย่างแน่นอนที่เป็นเจ้าของโดยจำนวนมากของธุรกิจขนาดเล็กใหญ่มาก มันยากที่จะใช้ในการเลิกจำหน่าย ดังนั้น ธุรกิจขนาดใหญ่ยังคงมีการครองช่องสูงในข้อมูล

ด้วยผลลัพธ์ที่ได้ ยุค Big Model มีการควบคุมที่สำคัญมากกว่าที่เคยเป็นมาก่อน และโลกในอนาคตจะมีแนวโน้มที่จะถูกควบคุมโดยกลุ่มเล็กหรือแม้กระทั่งคอมพิวเตอร์เพียงเครื่องเดียว ( แม้ในโลก Web3 ที่ไม่มีการควบคุมจากศูนย์ End Game ที่พลวัตของ Vitalik สำหรับ Ethereum ก็จะถูกดำเนินการโดยเครื่องจักรขนาดใหญ่นอกเหนือจากบล็อก )

นอกจากนี้ บริษัท OpenAI ที่พัฒนา ChatGPT มีเพียงไม่กี่คนในทีมหลัก ๆ เนื่องจากเหตุผลต่าง ๆ อัลกอริทึมของ ChatGPT ยังไม่ได้เปิดเผยแบบโอเพน จนถึงตอนนี้ ธรรมชาติขององค์กรไม่แสวงหากำไรการประยุกต์ใช้ที่หลากหลายของ ChatGPT ได้เปลี่ยนแปลงชีวิตของมนุษย์ การปรับเปลี่ยนบางอย่างของโมเดล ChatGPT จะมีผลกระทบอย่างมากต่อมนุษย์ ในทางตรงกันข้ามกับหลักการของ Google ที่ไม่ทำความชั่วร้าย ChatGPT มีผลกระทบลึก ๆ ต่อคน

ดังนั้นความน่าเชื่อถือในการคำนวณของโมเดลจะกลายเป็นประเด็นสำคัญ แม้ว่า OpenAI สามารถดำเนินการเป็นองค์กรไม่แสวงหาผลกำไร การควบคุมพลังโดยบุคคลบางรายก็ยังมีผลกระทบที่เลวร้ายมากมาย (ในทวีความต่างกัน Ethereum End Game ที่เสนอโดย Vitalik ถูกสร้างขึ้นโดยเครื่องจะรักษาความโปร่งใสผ่านการตรวจสอบได้อย่างง่ายดายโดยสาธารณชน)

ในขณะเดียวกัน ยังมีปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่: ขาดกำลังคำนวณ ข้อมูลการฝึกที่มีพร้อมก็กำลังจะหมด และการแบ่งปันโมเดล ตามสถิติ ก่อนปี 2021 ปัญหาในอุตสาหกรรมปัญญาประดิษฐ์คือขาดข้อมูล และบริษัทดีพลีนนิ่งทั้งหมดกำลังมองหาข้อมูลในอุตสาหกรรมแนวตั้ง และหลังจากโมเดลขนาดใหญ่ ขาดกำลังคำนวณกลายเป็นอุปสรรค

การพัฒนาโมเดลขนาดใหญ่ถูกแบ่งออกเป็นหลายขั้นตอน: การเก็บข้อมูล การประมวลผลข้อมูล การฝึกโมเดล การปรับปรุงโมเดล และการสืบค้นการคำนวณการใช้งาน จากขั้นตอนเหล่านี้เราจะอธิบายอย่างสั้นเรื่องการมีส่วนร่วมของบล็อกเชนในโมเดลขนาดใหญ่และวิธีการต่อต้านความเสียหายจากความ-concentration มากเกินไปของโมเดลขนาดใหญ่

  • ในเชิงข้อมูล โดยเนื่องจากข้อมูลสาธารณะจะถูกใช้บริโภคหลัง 2030 จำนวนข้อมูลส่วนบุคคลที่มีค่าและมากขึ้นจะต้องถูกใช้ให้เหมาะสม พร้อมกับการปกป้องความเป็นส่วนตัวผ่านเทคโนโลยีบล็อกเชน
  • ในเชิงข้อมูลป้ายกำกับ โทเค็นสามารถใช้เป็นสิ่งสร้างสรรค์ให้กับการป้ายกำกับข้อมูลในขอบเขตของข้อมูลและการตรวจสอบข้อมูลขนาดใหญ่
  • ในขณะที่อยู่ในขั้นตอนการฝึกโมเดล การแบ่งปันพลังการคำนวณถูกบรรลุผ่านการแบ่งปันโมเดลและการฝึกอบรมร่วมกัน;
  • ในช่วงขั้นตอนการปรับโมเดลให้ดีขึ้น, การมีส่วนร่วมของชุมชนสามารถถูกสร้างสรรค์ผ่านโทเค็น;
  • ในขั้นตอนการคิดค้นและการคำนวณเหตุผลของผู้ใช้ บล็อกเชนสามารถป้องกันความเป็นส่วนตัวของข้อมูลผู้ใช้

โดยเฉพาะ

1) พลังงานคอมพิวเตอร์ที่ขาดแคลน

พลังงานคำนวณเป็นปัจจัยการผลิตที่จำเป็นสำหรับโมเดลขนาดใหญ่ และเป็นปัจจัยการผลิตที่แพงที่สุดในปัจจุบัน ถึงขนาดที่ สตาร์ทอัพที่เพิ่งระดมทุนได้จะต้องโอน 80% ของทุนของพวกเขาไปยัง NVIDIA เพื่อซื้อ GPU บริษัทที่ผลิตโมเดลขนาดใหญ่ของตนเองต้องใช้เงินอย่างน้อย 50 ล้านเหรียญเพื่อสร้างศูนย์ข้อมูลของตนเอง ในขณะที่ สตาร์ทอัพขนาดเล็กต้องซื้อบริการคอมพิวเตอร์คลาวด์ที่แพง

อย่างไรก็ตาม ความนิยมในระยะสั้นของโมเดลขนาดใหญ่และการใช้ทรัพยากรคอมพิวเตอร์โดยโมเดลขนาดใหญ่เองได้เกินกว่าความสามารถในการจัดหาของ NVIDIA ตามสถิติ ความต้องการในด้านพลังการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้นสองเท่าทุกๆ หลายเดือน ระหว่างปี 2012 ถึง 2018 ความต้องการในด้านพลังการคำนวณเพิ่มขึ้นถึง 300,000 เท่า และค่าใช้จ่ายในการคำนวณของโมเดลขนาดใหญ่เพิ่มขึ้น 31 เท่าทุกปี

สำหรับบริษัทอินเทอร์เน็ตจีน พวกเขาต้องเผชิญกับการขัดข้องจากสหรัฐต่อ GPU ระดับสูง สามารถบอกได้ว่าค่าฝึกอบรมที่มากมายเป็นเหตุผลหลักที่เทคโนโลยีโมเดลใหญ่ถูกควบคุมโดยผู้เรียนเพียงเพียงไม่กี่คน

ดังนั้นวิธีการแก้ปัญหาพลังการคำนวณของโมเดลขนาดใหญ่ผ่านบล็อกเชนคืออะไรครับ?

การพิจารณาถึงการผลิตโมเดลขนาดใหญ่ มันสามารถแบ่งออกเป็นการฝึกโมเดลขนาดใหญ่ การปรับปรุงแก้ไขอย่างละเอียดและการคำนวณการสืบค้นของผู้ใช้ แม้ว่าการฝึกโมเดลขนาดใหญ่จะเป็นที่รู้จักว่าเป็นค่าใช้จ่ายที่สูง แต่เวอร์ชันของโมเดลขนาดใหญ่เพียงเพียงต้องสร้างขึ้นมาเพียงครั้งเดียว ในส่วนมากของเวลา สำหรับผู้ใช้บริการโมเดลขนาดใหญ่ การคำนวณการสืบค้นเท่านั้นที่จำเป็น ตามสถิติของ AWS ก็ยืนยันว่า 80% ของพลังการคำนวณจริงๆถูกใช้ไปในการคำนวณการสืบค้น

การฝึกอบรมของโมเดลขนาดใหญ่ต้องใช้ความสามารถในการสื่อสารที่เร็วระหว่าง GPU แต่ไม่สามารถทำเสร็จบนเครือข่ายได้ (นอกจากว่าคุณจะเลือกแลกเวลาให้ต่ออายุเพื่อลดต้นทุน). แต่การคำนวณการอ่านค่าทำได้บน GPU เดียว. การปรับแต่งละเอียดจะขึ้นอยู่กับโมเดลขนาดใหญ่ที่ได้รับและข้อมูลที่มีคุณภาพ เพราะฉะนั้นจึงต้องใช้ทรัพยากรคำนวณน้อยกว่าการฝึกอบรมโมเดลขนาดใหญ่มากๆ

เมื่อพูดถึงการเรนเดอร์กราฟิกเป็นที่ชัดเจนว่า GPU ของผู้บริโภคทํางานได้ดีกว่า GPU ขององค์กรและไม่ได้ใช้งานเกือบตลอดเวลา ตั้งแต่มหาวิทยาลัยแคลิฟอร์เนียเบิร์กลีย์เปิดตัว SETI เพื่อค้นหามนุษย์ต่างดาวในปี 1999 และ Grid Computing ได้รับความนิยมในปี 2000 มีสถาปัตยกรรมทางเทคนิคบางอย่างที่ใช้ทรัพยากรคอมพิวเตอร์ที่ไม่ได้ใช้งานเพื่อทํางานร่วมกันเพื่อทํางานคอมพิวเตอร์ขนาดใหญ่ให้เสร็จ ก่อนการเกิดขึ้นของบล็อกเชนความร่วมมือเหล่านี้มักจะมุ่งเน้นไปที่งานทางวิทยาศาสตร์และอาศัยความกระตือรือร้นและการมีส่วนร่วมด้านสวัสดิการสาธารณะของผู้เข้าร่วม ตอนนี้ใช้เทคโนโลยีบล็อกเชนแอปพลิเคชันที่หลากหลายสามารถจูงใจผ่านโทเค็น

เช่นเดียวกับโครงการคลาวด์คอมพิวติ้งแบบกระจายอํานาจ Akash เครือข่ายคอมพิวเตอร์ทั่วไปได้รับการจัดตั้งขึ้นและผู้ใช้สามารถปรับใช้โมเดลแมชชีนเลิร์นนิงสําหรับการคํานวณเหตุผลและการแสดงภาพ นอกจากนี้ยังมีโครงการ AI ที่ใช้บล็อกเชนเช่น Bittensor, Modulus Lab, Giza และ ChainML ซึ่งทั้งหมดนี้มุ่งเป้าไปที่การคํานวณการอนุมานแบบสอบถาม

โปรโตคอลการคำนวณ AI บล็อกเชน Gensyn และแพลตฟอร์ม AI แบบสร้างสรรค์โอเพนซอร์ส Together มุ่งมั่นที่จะสร้างเครือข่ายการคำนวณที่จำกัดที่บริการการฝึกโมเดลขนาดใหญ่

ความท้าทาย: สำหรับเครือข่ายการคำนวณแบบกระจาย ความยากลำบากไม่ได้อยู่เฉพาะ อย่างเครื่องคอมพิวเตอร์ที่มีความเร็วต่ำและเครือข่ายการสื่อสารที่ไม่เชื่อถือได้ ความไม่สามารถในการซิงโครไนซ์สถานะการคำนวณ การจัดการกับสภาพแวดล้อมการคำนวณประเภท GPU หลายแบบ แต่ยังต้องจัดการกับกระตุ้นเศรษฐกิจ การโกงของผู้เข้าร่วม การพิสูจน์ภาระงาน ความปลอดภัย การป้องกันความเป็นส่วนตัว และการโจมตีแอนติสแปม

2) ข้อมูลที่ขาดแคลนและการแก้ไขข้อมูล

อัลกอริทึมหลักของโมเดลขนาดใหญ่ การเรียนรู้แบบเสริม (RLHF) ต้องการความมีส่วนร่วมของมนุษย์ในการปรับปรุงการฝึกอบรมเพื่อแก้ไขข้อผิดพลาดและกำจัดความลำเอียงและข้อมูลที่เป็นอันตราย OpenAI ใช้ RLHF ในการปรับปรุง GPT3 เพื่อสร้าง ChatGPT ในขั้นตอนนี้ OpenAI พบว่ามีผู้เชี่ยวชาญจากกลุ่ม Facebook และจ่ายค่าแรงแก่คนงานเคนย่า 2 ดอลลาร์ต่อชั่วโมง การฝึกอบรมเพื่อปรับปรุงในบางครั้งต้องการความมีส่วนร่วมของผู้เชี่ยวชาญด้านข้อมูลจากสาขาที่เฉพาะเจาะจง และการนำไปใช้งานสามารถรวมกับวิธีการสร้างสติ๊กเกอร์เพื่อส่งเสริมการมีส่วนร่วมของชุมชนได้อย่างเต็มที่

อุตสาหกรรมระบบพื้นฐานทางกายภาพที่ไม่มีการกำหนด (DePINs) ใช้โทเค็นเพื่อกระตุ้นผู้คนให้แบ่งปันข้อมูลจริง ๆ แบบ real-time จากโลกทางกายตามเซ็นเซอร์สำหรับการฝึกโมเดลต่าง ๆ รวมถึง: React รวบรวมข้อมูลการใช้พลังงาน, DIMO รวบรวมข้อมูลการขับขี่รถ, WeatherXM รวบรวมข้อมูลอากาศ, และ Hivemapper รวบรวมข้อมูลแผนที่ผ่านการกระตุ้นโทเค็นเพื่อกระตุ้นผู้คนให้ทำเครื่องหมายป้ายจราจรและช่วยให้อัลกอริทึมการเรียนรู้ของ RLHF ของตนปรับปรุงความแม่นยำ

ในขณะเดียวกันเมื่อพารามิเตอร์ของโมเดลขนาดใหญ่เพิ่มขึ้นข้อมูลสาธารณะที่มีอยู่จะหมดลงภายในปี 2030 และความคืบหน้าอย่างต่อเนื่องของโมเดลขนาดใหญ่จะต้องพึ่งพาข้อมูลส่วนตัว จํานวนข้อมูลส่วนตัวเป็น 10 เท่าของข้อมูลสาธารณะ แต่กระจัดกระจายอยู่ในมือขององค์กรและบุคคลและเป็นส่วนตัวและเป็นความลับในธรรมชาติทําให้ยากต่อการแสวงหาประโยชน์ ภาวะที่กลืนไม่เข้าคายไม่ออกสองครั้งเกิดขึ้น ในอีกด้านหนึ่งโมเดลขนาดใหญ่ต้องการข้อมูล แต่แม้ว่าฝ่ายที่มีข้อมูลต้องการโมเดลขนาดใหญ่ แต่ก็ไม่ต้องการส่งมอบข้อมูลให้กับโมเดลขนาดใหญ่ ปัญหาคู่นี้สามารถแก้ไขได้ด้วยเทคโนโลยีในสาขาบล็อกเชน

สำหรับโมเดลการอ่านแบบโอเพนซอร์ส โดยเนื่องจากว่าต้องใช้ทรัพยากรคำนวณน้อยกว่า จึงสามารถดาวน์โหลดโมเดลไปยังส่วนข้อมูลเพื่อดำเนินการ สำหรับโมเดลที่ไม่สาธารณะหรือโมเดลขนาดใหญ่ ต้องทำการตกความไว้ก่อนและอัปโหลดไปยังส่วนจบของโมเดล วิธีการตกความไว้รวมถึงข้อมูลสังเคราะห์และพิสูจน์ความรู้ศูนย์

ไม้มีส่วนไหนว่าโมเดลถูกดาวน์โหลดไปที่ด้านข้อมูลหรือว่าข้อมูลถูกอัปโหลดไปที่ด้านโมเดล ปัญหาเกี่ยวกับอำนาจจำเป็นต้องแก้ไขเพื่อป้องกันการโกงโมเดลหรือข้อมูล

ท้าทาย: หรือ ถึงแม้ว่าการกระตุ้นโทเค็นของ Web3 สามารถช่วยในการแก้ไขปัญหานี้ ปัญหาการโกงกลับต้องถูกแก้ไข

3) ความร่วมมือในการสร้างแบบจำลอง

ในชุมชน Civitai แห่งนี้ โลกของแพลตฟอร์มการแบ่งปันโมเดลการวาด AI ที่ใหญ่ที่สุดในโลก ผู้คนแบ่งปันโมเดลและสามารถคัดลอกโมเดลได้ง่าย และปรับเปลี่ยนโมเดลเพื่อสร้างโมเดลที่ตอบสนองตามความต้องการของตนเองได้อย่างง่ายดาย

Bittensor, โครงการบล็อกเชน AI แห่งรุ่นใหม่ที่เปิดเป็นโอเพนซอร์สและมีความเห็นร่วม ได้ออกแบบรูปแบบของโมเดลที่กระตุ้นโทเคน โดยอ้างอิงจากกลไกความร่วมมือของผู้เชี่ยวชาญหลายคน โดยร่วมกันสร้างโมเดลในการแก้ปัญหาและสนับสนุนการจำแนกองค์ความรู้ ซึ่งสามารถแบ่งปันระหว่างโมเดล ข้อมูล การฝึกอบรมที่เร่งด่วน ซึ่งมุ่งเน้นการให้โอกาสแก่ธุรกิจรุ่นใหม่มากมายในการเข้าร่วมโมเดลขนาดใหญ่

เป็นเครือข่ายรวมสำหรับบริการออฟเชน เช่น การอัตโนมัติ ออรัคเทล และ AI ร่วม ออโตโนลัส ออกแบบกรอบความร่วมมือสำหรับตัวแทนเพื่อเดินทางสู่การตกลงผ่าน Tendermint

ท้าทาย: การฝึกอบรมของโมเดลมากมายยังต้องการการสื่อสารมากมาย และความเชื่อถือได้และประสิทธิภาพทางเวลาของการฝึกอบรมแบบกระจายยังเป็นอุปสรรคที่ใหญ่

โมเดลขนาดใหญ่และนวัตกรรมใน Web3

ในการร่วมมือกับที่กล่าวถึงข้างต้นว่า Web3 สามารถใช้เพื่อแก้ไขบางปัญหาในอุตสาหกรรมโมเดลขนาดใหญ่ การผสมผสานของแรงกระทบสองสิ่งสำคัญจะส่งผลให้เกิดประยุกต์ใช้ที่น่าสนใจบ้าง

1) ใช้ ChatGPT เขียนสัญญาอัจฉริยะ

เร็ว ๆ นี้ศิลปิน NFT ใช้ทักษะเพื่อดำเนินการ ChatGPT โดยไม่มีความรู้ในการเขียนโปรแกรมเพื่อเปิดตัวสัญญาอัจฉริยะของตัวเองและออกโทเค็น Turboner ศิลปินใช้ YouTube เพื่อบันทึกรายการสร้างของเขาเป็นเวลา 1 สัปดาห์ และทำให้ทุกคนได้รับแรงบันดาลใจที่จะใช้ ChatGPT มาร่วมสร้างสัญญาอัจฉริยะ

2) การชำระเงินด้วยคริปโตเสริมพลังการบริหารอย่างฉลาด

การพัฒนาโมเดลขนาดใหญ่ได้ปรับปรุงความฉลาดของผู้ช่วยอัจฉริยะอย่างมากและเมื่อรวมกับการชําระเงินที่เข้ารหัสผู้ช่วยอัจฉริยะจะสามารถประสานงานทรัพยากรได้มากขึ้นและทํางานร่วมกันมากขึ้นในตลาดผู้ช่วยอัจฉริยะ AutoGPT แสดงให้เห็นถึงการพึ่งพาบัตรเครดิตที่ผู้ใช้จัดหาให้และเขาสามารถช่วยให้ผู้ใช้ซื้อทรัพยากรการประมวลผลแบบคลาวด์และการจองเที่ยวบินโดยอัตโนมัติ แต่ถูก จํากัด ด้วยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ และความสามารถของ AutoGPT ถูก จํากัด อย่างรุนแรงโดยการเข้าสู่ระบบอัตโนมัติหรือการตรวจสอบความปลอดภัยอื่น ๆ การออกแบบ Multi Agent System (MAS) รวมถึง Contract Net Protocol รวมถึงการทํางานร่วมกันของผู้ช่วยอัจฉริยะหลายคนในตลาดเปิดและหากได้รับการสนับสนุนจากโทเค็นการทํางานร่วมกันดังกล่าวจะทําลายการทํางานร่วมกันที่ จํากัด บนพื้นฐานของความไว้วางใจและกลายเป็นความร่วมมือขนาดใหญ่ตามเศรษฐกิจตลาดเช่นเดียวกับที่สังคมมนุษย์ย้ายจากสังคมดั้งเดิมไปสู่สังคมการเงิน

3) zkML(Zero Knowledge Machine Learning)

การประยุกต์ใช้เทคโนโลยี zkp (Zero Knowledge Proof) ในบล็อกเชนแบ่งออกเป็นสองประเภท หนึ่งคือการแก้ปัญหาประสิทธิภาพของบล็อกเชนโดยการถ่ายโอนข้อกําหนดการประมวลผลไปยัง off-chain จากนั้นไปยังการรับรองแบบ on-chain ผ่าน zkp ประเภทที่สองใช้เพื่อปกป้องความเป็นส่วนตัวของธุรกรรม การประยุกต์ใช้ zkp ในรุ่นขนาดใหญ่รวมถึงการคํานวณแบบจําลองที่เชื่อถือได้ (เพื่อพิสูจน์ความสอดคล้องและความถูกต้องของการคํานวณแบบจําลอง) และการคํานวณความเป็นส่วนตัวของข้อมูลการฝึกอบรม ในสภาพแวดล้อมแบบกระจายอํานาจผู้ให้บริการของโมเดลจําเป็นต้องพิสูจน์ให้ลูกค้าเห็นว่าโมเดลที่ขายเป็นโมเดลที่สัญญาไว้กับลูกค้าโดยไม่ต้องตัดมุม สําหรับคู่ค้าข้อมูลการฝึกอบรมพวกเขาจําเป็นต้องมีส่วนร่วมในการฝึกอบรมหรือใช้แบบจําลองบนสมมติฐานของการปกป้องความเป็นส่วนตัวของตนเอง . แม้ว่า zkp จะมีความเป็นไปได้อยู่บ้าง แต่ก็ยังมีความท้าทายมากมาย และโซลูชันต่างๆ เช่น การประมวลผลแบบโฮโมมอร์ฟิกและการประมวลผลความเป็นส่วนตัวแบบรวมศูนย์ยังไม่บรรลุนิติภาวะ

โซลูชันที่ใช้โครงสร้าง BEC (Blockchain Edge Client) เป็นพื้นฐาน

นอกจากมีโรงเรียนที่กล่าวถึงข้างต้น ยังมีโรงเรียนอีกหนึ่งโรงเรียนที่ไม่ได้รับความสนใจอย่างแพร่หลายเนื่องจากขาดของสิทธิแรงจูงใช้โทเเคนและการใช้งานแอปพลิเคชันบล็อกเชนแบบมินิมอลิสต์

สถาปัตยกรรมที่ใช้ BEC มีความคล้ายคลึงกับแนวคิดของ Web5 ที่ Jack Dorsey กล่าวถึงและ Solid โดย Tim Berners-Lee ในหลายด้าน

พวกเขาคิดว่าทั้งหมด

  • แต่ละคนมีจุดปล่อยสัญญาณควบคุมที่สอดคล้องกัน;
  • การคำนวณและการจัดเก็บในสถานการณ์ในข้อประยุกต์ส่วนใหญ่ควรจะถูกจัดการที่ตรงขอบ;
  • ความร่วมมือระหว่างโหนดบุคคลเสร็จสิ้นผ่านบล็อกเชน;
  • การสื่อสารระหว่างโหนดเสร็จสิ้นผ่าน P2P;
  • บุคคลสามารถควบคุมโหนดของตนเองได้เองหรือให้ความไว้วางใจกับบุคคลที่น่าเชื่อถือเพื่อให้บริหารโหนด (เรียกว่าเซิร์ฟเวอร์เชื่อมต่อในบางสถานการณ์);
  • บรรลุการกระจายอำนาจได้ที่สุด

เมื่อโหนดนี้สอดคล้องกับแต่ละคนและควบคุมโดยแต่ละจัดเก็บข้อมูลส่วนบุคคลและโหลดโมเดลขนาดใหญ่ตัวแทนอัจฉริยะส่วนบุคคล (ตัวแทน) ส่วนบุคคลที่ได้รับการคุ้มครองความเป็นส่วนตัว 100% สามารถฝึกอบรมได้ Dr. Gong Ting หุ้นส่วนผู้ก่อตั้งชาวจีนของ SIG เปรียบเทียบโหนดส่วนตัวในอนาคตกับเมฆส่วนตัวเหนือศีรษะของ Olaf ใน "Frozen" ที่ติดตามเขาเสมอ

ในทางนี้ อวาตาร์ใน Metaverse จะไม่เป็นรูปภาพที่ควบคุมโดยแป้นพิมพ์อีกต่อไป แต่เป็นตัวแทนที่มีวิญญาณ เขาสามารถศึกษาข่าวออนไลน์ ประมวลผลอีเมล และแม้กระทั้งตอบกลับข้อความแชทสังคมของคุณโดยอัตโนมัติ 24 ชั่วโมงต่อวัน (สำหรับแฟนสาวที่ดื้อ คุณอาจต้องมีวิธีตรวจสอบว่าแฟนหนุ่มของคุณกำลังใช้ตัวแทนในการจัดการกับคุณในอนาคต) เมื่อตัวแทนของคุณต้องการทักษะใหม่ เหมือนกับการติดตั้งแอปบนโทรศัพท์มือถือ คุณสามารถติดตั้งแอปใหม่ในโหนดของคุณ

สรุป

ในประวัติศาสตร์ ด้วยการแพลตฟอร์มาไลเซชันของการพัฒนาของอินเทอร์เน็ต แม้ว่าเวลาสำหรับการเกิดของบริษัทยูนิคอร์นจะกลายเป็นเวลาสั้นลงทุกครั้ง แต่มันกลับกลายเป็นที่เสียหายต่อการพัฒนาของสตาร์ตอัพ

ด้วยแพลตฟอร์มการกระจายเนื้อหาที่มีประสิทธิภาพที่ Google และ Facebook ให้บริการ โดยที่ YouTube ซึ่งเกิดขึ้นในปี 2005 ถูกซื้อโดย Google ในราคา 1.6 พันล้านเหรียญสหรัฐเพียงหนึ่งปีต่อมา

พร้อมกับแพลตฟอร์มการกระจายแอปพลิเคชันที่มีประสิทธิภาพของ Apple App Store Instagram ได้ถูกก่อตั้งขึ้นในปี 2012 โดยมีคนทั้งหมดเพียง 10 คนเท่านั้น และได้ถูก Facebook เข้าซื้อในปี 2012 ด้วยมูลค่า 1 พันล้านดอลลาร์สหรัฐ

ด้วยความสนับสนุนจากโมเดลขนาดใหญ่ ChatGPT บริษัท Midjourney ที่มีเพียง 11 คน ได้รายได้ประมาณ 100 ล้าน​​ ดอลลาร์สหรัฐต่อปี และ OpenAI ซึ่งมีไม่เกิน 100 คน มีมูลค่าเกิน 20 พันล้าน​ ดอลลาร์สหรัฐ

บริษัท แพลตฟอร์มอินเทอร์เน็ตกําลังมีประสิทธิภาพมากขึ้นเรื่อย ๆ และการเกิดขึ้นของโมเดลขนาดใหญ่ไม่ได้เปลี่ยนรูปแบบที่มีอยู่ของอินเทอร์เน็ตที่ถูกผูกขาดโดยองค์กรขนาดใหญ่ องค์ประกอบทั้งสามของโมเดลขนาดใหญ่อัลกอริทึมข้อมูลและพลังการประมวลผลยังคงผูกขาดโดยองค์กรขนาดใหญ่ บริษัท สตาร์ทอัพไม่มีความสามารถในการคิดค้นโมเดลขนาดใหญ่และไม่มีความแข็งแกร่งทางการเงินในการฝึกอบรมโมเดลขนาดใหญ่ พวกเขาสามารถมุ่งเน้นไปที่การประยุกต์ใช้โมเดลขนาดใหญ่ในแนวตั้งเท่านั้น แม้ว่าโมเดลขนาดใหญ่ดูเหมือนจะส่งเสริมความนิยมของความรู้ แต่พลังที่แท้จริงถูกควบคุมโดยคนไม่เกิน 100 คนในโลกที่มีความสามารถในการผลิตแบบจําลอง

หากโมเดลขนาดใหญ่แทรกซึมเข้าไปในทุกแง่มุมของชีวิตของผู้คนในอนาคตและคุณถาม ChatGPT เกี่ยวกับอาหารประจําวันสุขภาพอีเมลงานของคุณและจดหมายทนายความของคุณในทางทฤษฎีผู้ที่เชี่ยวชาญโมเดลขนาดใหญ่จะต้องแอบเปลี่ยนพารามิเตอร์บางอย่างเท่านั้น มันสามารถส่งผลกระทบอย่างมากต่อชีวิตของผู้คนนับไม่ถ้วน การว่างงานบางอย่างที่เกิดจากโมเดลขนาดใหญ่อาจได้รับการแก้ไขผ่าน UBI หรือ Worldcoin แต่ผลที่ตามมาของความเป็นไปได้ของความชั่วร้ายที่เกิดจากโมเดลขนาดใหญ่ที่ถูกควบคุมโดยคนไม่กี่คนนั้นร้ายแรงกว่า นี่คือความตั้งใจเดิมของ OpenAI แม้ว่า OpenAI จะแก้ปัญหาที่ขับเคลื่อนด้วยผลกําไรด้วยวิธีการที่ไม่แสวงหาผลกําไร แต่จะแก้ปัญหาที่ขับเคลื่อนด้วยพลังงานได้อย่างไร? เห็นได้ชัดว่าโมเดลขนาดใหญ่ฝึกโมเดลความรู้อย่างรวดเร็วโดยใช้ความรู้ที่มนุษย์สะสมมานานหลายทศวรรษและแบ่งปันได้อย่างอิสระบนอินเทอร์เน็ต แต่โมเดลนี้ถูกควบคุมโดยคนจํานวนน้อยมาก

  1. ดังนั้น มีการขัดแย้งขนาดใหญ่ในค่ามูลค่าระหว่างโมเดลขนาดใหญ่และบล็อกเชน นักปฏิบัติบล็อกเชนจำเป็นต้องมีส่วนร่วมในการทำธุรกิจโมเดลขนาดใหญ่และใช้เทคโนโลยีบล็อกเชนเพื่อแก้ไขปัญหาโมเดลขนาดใหญ่ หากข้อมูลปริมาณมากที่มีอยู่บนอินเทอร์เน็ตได้รับการยกเว้นเสรีเป็นความรู้ทั่วไปของมนุษย์ แล้วโมเดลขนาดใหญ่ที่สร้างขึ้นจากข้อมูลเหล่านี้ควรเป็นของมนุษย์ทั้งหมดเช่นเดียวกับ OpenAI ที่เริ่มจ่ายเงินสำหรับฐานข้อมูลวรรณกรรมเร็ว ๆ นี้ OpenAI จำเป็นต้องจ่ายเงินสำหรับบล็อกส่วนตัวที่คุณและฉันทุ่มเทใจให้

ข้อความปฏิเสธความรับผิดชอบ:

  1. บทความนี้ถูกพิมพ์ใหม่จาก [ ThreeDAO, เกาะของสิ่งทั้งหมด]. ลิขสิทธิ์ทั้งหมดเป็นของผู้เขียนต้นฉบับ [36C]. หากมีข้อขัดแย้งใด ๆ เกี่ยวกับการพิมพ์ฉีดนี้ โปรดติดต่อ Gate Learnทีม และพวกเขาจะจัดการกับมันโดยรวดเร็ว
  2. ข้อความปฏิเสธความรับผิด: มุมมองและความคิดเห็นที่แสดงในบทความนี้เป็นเพียงของผู้เขียนเท่านั้น และไม่ใช่คำแนะนำในการลงทุนใด ๆ
  3. การแปลบทความเป็นภาษาอื่น ๆ ทำโดยทีม Gate Learn หากไม่ได้กล่าวถึง การคัดลอก การกระจาย หรือการลอกเลียนบทความที่ถูกแปล นั้นถือเป็นการละเมิดกฎ
Comece agora
Inscreva-se e ganhe um cupom de
$100
!