ซื้อกลับบ้านที่สำคัญ
- Nvidia เพิ่งเปิดตัวเทคนิคที่เปลี่ยนภาพถ่าย 2D เป็นฉาก 3D ในไม่กี่วินาที
- วิธีนี้ใช้พลังคอมพิวเตอร์เพื่อประมาณว่าแสงมีพฤติกรรมอย่างไรในโลกแห่งความเป็นจริง
- metaverse เป็นพื้นที่หนึ่งที่ฉาก 3 มิติมีประโยชน์เพราะสามารถดูได้จากทุกมุมมองของกล้อง
เทคโนโลยีปัญญาประดิษฐ์ (AI) ใหม่จาก Nvidia ในไม่ช้าจะเปลี่ยนภาพถ่าย 2 มิติเป็นฉาก 3 มิติในเวลาเพียงไม่กี่วินาที ทำให้การสร้างพื้นที่เสมือนจริงที่สมจริง เช่น metaverse เป็นเรื่องเล็กน้อยเหมือนการประมวลผลคำ
Nvidia ได้สาธิตวิธีการถ่ายภาพที่เรียกว่า Instant NeRF ซึ่งใช้พลังประมวลผลเพื่อประมาณว่าแสงมีพฤติกรรมอย่างไรในโลกแห่งความเป็นจริง มันสามารถแปลงภาพถ่ายเก่าของคุณให้เป็นฉากวิดีโอเกมหรือสามารถใช้เพื่อฝึกหุ่นยนต์และรถยนต์ที่ขับด้วยตนเองเพื่อทำความเข้าใจขนาดและรูปร่างของวัตถุในโลกแห่งความเป็นจริง
"ภาพ 3 มิตินำมาซึ่งโลกใหม่ของการเปลี่ยนแปลง" Oren Debbi ซีอีโอของ Visionary.ai บริษัทวิชันซิสเต็มคอมพิวเตอร์ที่ใช้อัลกอริธึม 3 มิติบนแพลตฟอร์ม Nvidia กล่าวกับ Lifewire ในการสัมภาษณ์ทางอีเมล "เมื่อใช้ 3D คุณจะเลียนแบบความลึกในโลกแห่งความเป็นจริงในฉาก และทำให้ภาพดูมีชีวิตชีวาและสมจริงยิ่งขึ้น นอกจาก AR/VR และกล้องอุตสาหกรรม ซึ่ง 3D เป็นเรื่องธรรมดามาก ตอนนี้เราพบว่ามีการใช้งานบนสมาร์ทโฟนเกือบทุกเครื่องโดยไม่ต้องใช้ ผู้ใช้ถึงกับรู้เลย"
กำลังเพิ่มขนาด
ภาพแรกที่ถ่ายเมื่อ 75 ปีที่แล้วด้วยกล้องโพลารอยด์ มุ่งที่จะจับภาพโลก 3 มิติเป็นภาพ 2 มิติอย่างรวดเร็ว ตอนนี้นักวิจัย AI กำลังทำงานในทางตรงกันข้าม: เปลี่ยนคอลเลกชันของภาพนิ่งให้เป็นฉาก 3 มิติดิจิทัลในไม่กี่วินาที
เรียกว่าการเรนเดอร์แบบผกผัน กระบวนการนี้ใช้ AI ในการประมาณพฤติกรรมของแสงในโลกแห่งความเป็นจริง ทำให้นักวิจัยสามารถสร้างฉาก 3 มิติขึ้นมาใหม่จากภาพ 2 มิติจำนวนหนึ่งซึ่งถ่ายในมุมต่างๆ ได้ Nvidia อ้างว่าได้พัฒนาวิธีการที่บรรลุภารกิจนี้เกือบจะในทันที
Nvidia ใช้วิธีนี้กับเทคโนโลยีใหม่ที่เรียกว่า neural radiance field หรือ NeRF บริษัทกล่าวว่าผลลัพธ์ที่เรียกว่า Instant NeRF เป็นเทคนิค NeRF ที่เร็วที่สุดในปัจจุบัน โมเดลต้องใช้เวลาเพียงไม่กี่วินาทีในการฝึกกับภาพนิ่งไม่กี่โหล และจากนั้นสามารถเรนเดอร์ฉาก 3 มิติที่ได้ภายในสิบมิลลิวินาที
หากการแสดงภาพ 3 มิติแบบดั้งเดิม เช่น โพลิกอนเมช (Polygonal Mesh) คล้ายกับภาพเวกเตอร์ NeRFs ก็เหมือนภาพบิตแมป: พวกมันจับภาพวิธีที่แสงส่องจากวัตถุหรือภายในฉากอย่างหนาแน่น” David Luebke รองประธานฝ่ายวิจัยกราฟิกของ Nvidia กล่าวในการแถลงข่าว “ในแง่นั้น Instant NeRF อาจมีความสำคัญต่อ 3D เช่นเดียวกับกล้องดิจิตอลและการบีบอัด JPEG เป็นการถ่ายภาพ 2D ซึ่งเพิ่มความเร็ว ความง่าย และการเข้าถึงของการจับภาพและการแชร์ 3D อย่างมาก”
การรวบรวมข้อมูลเพื่อป้อน NeRF ต้องใช้โครงข่ายประสาทเทียมในการจับภาพสองสามโหลที่ถ่ายจากหลายตำแหน่งรอบๆ ฉาก รวมถึงตำแหน่งกล้องของแต่ละช็อต
NeRF ฝึกโครงข่ายประสาทเทียมขนาดเล็กเพื่อสร้างฉากขึ้นใหม่โดยทำนายสีของแสงที่เปล่งออกมาในทุกทิศทาง จากจุดใดก็ได้ในพื้นที่ 3 มิติ
ความดึงดูดของ 3D
metaverse เป็นพื้นที่หนึ่งที่ฉาก 3 มิติมีประโยชน์เพราะสามารถดูได้จากทุกมุมกล้อง Brad Quinton ผู้ก่อตั้ง Perceptus Platform for Augmented Reality (AR) บอกกับ Lifewire ในการสัมภาษณ์ทางอีเมล เช่นเดียวกับที่เราสามารถเดินผ่านห้องในชีวิตจริงและเห็นเนื้อหาจากมุมต่างๆ มากมาย ด้วยฉาก 3 มิติที่สร้างขึ้นใหม่ เราแทบจะเคลื่อนผ่านช่องว่างและดูได้จากทุกมุมมอง
"สิ่งนี้มีประโยชน์อย่างยิ่งในการสร้างสภาพแวดล้อมสำหรับใช้งานในโลกเสมือนจริง" Quinton กล่าว
โปรแกรมอย่าง Object Capture ของ Apple ใช้เทคนิคที่เรียกว่า photogrammetry เพื่อสร้างวัตถุ 3 มิติเสมือนจริงจากชุดภาพ 2 มิติ Quinton คาดการณ์ว่าโมเดล 3 มิติจะถูกนำมาใช้อย่างกว้างขวางในความจริงเสมือนและแอปพลิเคชัน AR ตัวอย่างเช่น AI บางตัว เช่นเดียวกับใน Perceptus AR Platform ใช้โมเดล 3 มิติเพื่อสร้างความเข้าใจในโลกแห่งความเป็นจริง ซึ่งช่วยให้สามารถใช้งานแอปพลิเคชัน AR แบบเรียลไทม์ได้
การใช้ภาพ 3 มิติยังเลียนแบบความลึกของโลกแห่งความเป็นจริงในฉากหนึ่ง และทำให้ภาพดูมีชีวิตชีวาและสมจริงยิ่งขึ้น Debbi กล่าว ในการสร้างเอฟเฟ็กต์โบเก้ (หรือโหมดแนวตั้งหรือโหมดภาพยนตร์) จำเป็นต้องมีการทำแผนที่ความลึก 3 มิติ เทคนิคนี้ใช้กับสมาร์ทโฟนเกือบทุกเครื่อง
"นี่เป็นมาตรฐานสำหรับช่างวิดีโอมืออาชีพที่ถ่ายทำภาพยนตร์อยู่แล้ว และนี่กำลังกลายเป็นมาตรฐานสำหรับผู้บริโภคทุกคน" Debbi กล่าวเสริม