ซื้อกลับบ้านที่สำคัญ
- กลุ่มนักพัฒนาใหม่กำลังสร้างโมเดล AI แบบโอเพ่นซอร์ส
- กลุ่มใช้โมเดลการฝึกภาษาขนาดใหญ่ที่จะเผยแพร่ภายใต้ใบอนุญาตแบบเปิด
- โอเพ่นซอร์ส AI สามารถช่วยทำให้พลังที่อาจพลิกเกมของเทคโนโลยีใหม่มีแนวโน้มที่จะอคติและข้อผิดพลาดน้อยลง
มีงานวิจัยเกี่ยวกับปัญญาประดิษฐ์จำนวนมากโดยบริษัทขนาดใหญ่ (AI) แต่กลุ่มออนไลน์กลุ่มหนึ่งต้องการทำให้กระบวนการนี้เป็นประชาธิปไตย
EleutherAI เป็นกลุ่มนักวิจัย วิศวกร และนักพัฒนาอาสาสมัครที่เพิ่งจัดตั้งขึ้นเมื่อเร็วๆ นี้ โดยมุ่งเน้นที่การวิจัย AI แบบโอเพนซอร์ส องค์กรใช้ฐานรหัส GPT-Neo และ GPT-NeoX เพื่อฝึกโมเดลภาษาขนาดใหญ่ที่วางแผนจะเผยแพร่ภายใต้ใบอนุญาตแบบเปิด
"ข้อมูลโอเพนซอร์สเป็นประโยชน์ต่อนักวิจัยเพราะนักวิทยาศาสตร์มีทรัพยากรฟรีมากขึ้นเพื่อใช้ในการฝึกแบบจำลองและการวิจัยที่สมบูรณ์" Edward Cui ซีอีโอของบริษัท AI Graviti กล่าวกับ Lifewire ในการสัมภาษณ์ทางอีเมล บริษัทของเขาไม่มีส่วนเกี่ยวข้องกับ EueutherAI "เราทราบดีว่าโครงการ AI จำนวนมากถูกยึดครองโดยการขาดข้อมูลคุณภาพสูงจากกรณีการใช้งานจริง ดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องกำหนดแนวทางเพื่อรับรองคุณภาพของข้อมูล ด้วยความช่วยเหลือจากชุมชนที่เข้าร่วม"
ทางนี้
จุดเริ่มต้นของ EleutherAI นั้นอ่อนน้อมถ่อมตน ปีที่แล้ว นักวิจัย AI อิสระชื่อ Connor Leahy โพสต์ข้อความต่อไปนี้บนเซิร์ฟเวอร์ Discord: "เฮ้พวกให้ [SIC] ให้ OpenAI ใช้เงินเหมือนวันดีๆ"
ก็เลยก่อตั้งกลุ่ม ขณะนี้มีผู้มีส่วนร่วมหลายร้อยคนที่โพสต์โค้ดของตนบนที่เก็บซอฟต์แวร์ออนไลน์ GitHub
โอเพ่นซอร์ส AI ไม่ใช่เรื่องใหม่อันที่จริง แพลตฟอร์มการจัดการเวิร์กโฟลว์ Airflow ของ Airbnb และกลไกค้นหาข้อมูลของ Lyft เป็นผลจากการใช้เครื่องมือโอเพนซอร์ซเพื่อช่วยให้ทีมข้อมูลสามารถทำงานกับข้อมูลได้ดีขึ้น กล่าวโดย Ali Rehman ผู้จัดการโครงการของบริษัทซอฟต์แวร์ CloudiTwins ในการสัมภาษณ์ทางอีเมลกับ Lifewire.
"เช่นเดียวกับการปฏิวัติโอเพ่นซอร์สที่นำไปสู่การเปลี่ยนแปลงของการพัฒนาซอฟต์แวร์ การพัฒนาและการทำให้เป็นประชาธิปไตยของวิทยาศาสตร์ข้อมูลและปัญญาประดิษฐ์ก็เช่นกัน" Rehman กล่าว "โอเพ่นซอร์สได้กลายเป็นตัวเปิดใช้งานที่สำคัญของโซลูชันวิทยาศาสตร์ข้อมูลระดับองค์กร โดยนักวิทยาศาสตร์ข้อมูลส่วนใหญ่ใช้เครื่องมือโอเพนซอร์ส"
เปิดประตู
การพัฒนา AI แบบโอเพ่นซอร์สสามารถช่วยทำให้พลังที่เปลี่ยนแปลงเกมของเทคโนโลยีใหม่มีแนวโน้มที่จะเกิดอคติและข้อผิดพลาดน้อยลง ผู้สังเกตการณ์บางคนโต้แย้ง
การวิจัย AI ส่วนใหญ่เกิดขึ้นในแบบเปิด โดยเกือบทุกบริษัท ห้องปฏิบัติการวิจัย และมหาวิทยาลัยต่างๆ นำเสนอผลงานของพวกเขาทันทีในสิ่งพิมพ์ทางวิชาการ Kush Varshney นักวิจัย AI ของ IBM กล่าวกับ Lifewire ในการสัมภาษณ์ทางอีเมล
"ชุมชนแบบเปิดนี้มีความจำเป็น เนื่องจากมีระดับการตรวจสอบและความสมดุลที่ดียิ่งขึ้นเพื่อให้แน่ใจว่ามีการค้นคว้า สร้าง ปรับใช้ และใช้งาน AI อย่างมีความรับผิดชอบ" Varshney กล่าวเสริม "นี่เป็นสิ่งสำคัญอย่างยิ่งในสถานการณ์ที่ระบบเหล่านี้สามารถมีอิทธิพลต่อชีวิตของสมาชิกในสังคมที่เปราะบางที่สุดของเรา การเปิดกว้างนี้ไม่เพียงใช้กับการเรียนรู้ของเครื่องทั่วไปและอัลกอริธึมการเรียนรู้เชิงลึกเท่านั้น แต่ยังรวมถึงองค์ประกอบของ AI ที่น่าเชื่อถือด้วย"
Rehman กล่าวว่าหนึ่งในความแตกต่างที่สำคัญระหว่างซอฟต์แวร์ที่เป็นกรรมสิทธิ์และโอเพ่นซอร์สคือความยืดหยุ่นและการปรับแต่ง การวิจัย AI ที่เป็นกรรมสิทธิ์จะมีปัญหาด้านความปลอดภัย การอัปเดต และการเพิ่มประสิทธิภาพ
"นี่เป็นเพราะแนวทางที่อิงตามชุมชนโอเพนซอร์สได้รับข้อมูลที่มีค่าจากผู้เชี่ยวชาญในอุตสาหกรรมหลายพันคนที่ระบุช่องโหว่ด้านความปลอดภัยที่อาจเกิดขึ้น จากนั้นจะแก้ไขได้รวดเร็วยิ่งขึ้น" Rehman กล่าวเสริม"ฉันทามติของชุมชนหมายความว่ารับประกันคุณภาพและระบุโอกาสใหม่ ๆ ได้ง่ายขึ้น"
อีกปัญหาหนึ่งคือการวิจัย AI ที่เป็นกรรมสิทธิ์จะไม่สามารถทำงานร่วมกันได้ หมายความว่ามันไม่สามารถทำงานได้กับรูปแบบข้อมูลต่างๆ และมีแนวโน้มที่จะมีการล็อคอินของผู้ขาย ซึ่งทำให้บริษัทไม่สามารถทำการทดสอบและทดลองใช้ซอฟต์แวร์ก่อนที่จะดำเนินการแก้ไข เรห์มานกล่าว
แต่ไม่ใช่ทุกแง่มุมของการวิจัย AI ที่จำเป็นต้องเป็นโอเพ่นซอร์ส Chris Kent ซีอีโอของบริษัท AI ด้านการแพทย์ Reveal Surgical กล่าวกับ Lifewire ในการสัมภาษณ์ทางอีเมล "สิ่งสำคัญคือต้องปกป้องแรงจูงใจทางเศรษฐกิจที่ขับเคลื่อนการพัฒนาเชิงพาณิชย์ของแอพพลิเคชันหลักของ AI" เขากล่าว
อย่างไรก็ตาม การวิจัยเกี่ยวกับ AI จำเป็นต้องมีองค์ประกอบโอเพ่นซอร์สที่แข็งแกร่ง Kent กล่าว เขาเสริมว่าโอเพ่นซอร์สทำงานเพื่อสร้างความไว้วางใจและใช้ชุดข้อมูลที่ไม่ใช่หรือไม่ควรถูกควบคุมโดยสถาบันหรือบริษัทเดียว
"แนวทางโอเพนซอร์ซเป็นวิธีที่ดีที่สุดในการระบุและชดเชยอคติที่อาจมีอยู่ในชุดการฝึก และจะนำไปสู่การใช้งาน AI แบบองค์รวม สร้างสรรค์ และเชื่อถือได้มากขึ้น" Kent กล่าว