ทีมวิจัย Microsoft เผยโฉม “VASA-1” โมเดล AI สร้างวิดีโอเหมือนจริงได้ ใช้แค่ภาพถ่ายและคลิปเสียง
Microsoft ได้ระบุว่าโมเดล VASA-1 ไม่เพียงแค่สร้างวิดีโอที่มีเสียงและปากซิงก์ที่เป็นธรรมชาติ แต่ยังสามารถเก็บรวบรวมรายละเอียดใบหน้าและการเคลื่อนไหวอย่างเป็นธรรมชาติอีกด้วย ซึ่งทำให้ผู้ใช้รู้สึกเหมือนกับเกิดขึ้นจริงและมีชีวิตชีวา
พร้อมรองรับการสร้างวิดีโอออนไลน์ที่มีคุณภาพสูง ที่มีความละเอียด 512×512 และ Frame Rate สูงถึง 40 FPS นอกจากนี้ยังสามารถสร้างวิดีโอจากภาพคนได้ และยังสามารถสร้างวิดีโอจากภาพวาด การร้องเพลง หรือเสียงจากภาษาอื่นที่ไม่ใช่ภาษาอังกฤษได้อีกด้วย นอกจากนี้ยังสามารถปรับแต่งท่าทางและการแสดงสีหน้าอารมณ์ได้อีกด้วย
ทางทีมวิจัยของ Microsoft ได้ระบุว่าภาพตัวอย่างในคลิปวิดีโอนั้นถูกสร้างขึ้นโดย AI (DALL·E-3) และไม่ใช่ภาพบุคคลที่มีอยู่จริง ภาพเหล่านี้เป็นเพียงการแสดงงานวิจัยเท่านั้น นอกจากนี้ยังไม่มีแผนที่จะเปิดให้ใช้โปรดักต์หรือ API หรือเปิดเผยรายละเอียดเพิ่มเติมใดๆ จนกว่าจะมั่นใจได้ว่าเทคโนโลยีนี้จะถูกนำไปใช้อย่างมีความรับผิดชอบและสอดคล้องกับกฎเกณฑ์
ในการวิจัยนี้ จุดประสงค์หลักคือการพัฒนาอวตาร AI ที่ใช้ในเชิงบวกเท่านั้น และไม่มีเจตนาให้ใช้สร้างคอนเทนต์หลอกลวงหรือก่อให้เกิดความเข้าใจผิด โดย Microsoft เห็นถึงประโยชน์ที่จะได้รับจากการใช้โมเดล VASA-1 ในด้านการศึกษาและการช่วยเหลือผู้ที่มีปัญหาด้านการสื่อสารและอื่น ๆ ด้วยเป้าหมายที่จะพัฒนา AI เพื่อเพิ่มคุณภาพชีวิตของมนุษย์
cr.https://www.thairath.co.th/money/tech_innovation/tech_companies/2779425