Gemini คืออะไร
Gemini เป็น “โมเดล AI ขนาดใหญ่” หรือ AI LLM ที่ทาง Google จะปล่อยให้ใช้งานใน Bard (แชตบอตที่พัฒนาโดย Google ลักษณะการใช้งานคล้าย Chat GPT ของ OpenAI) ไปก่อน เป็นที่รู้จักครั้งแรกในงาน Google I/O 2023 ที่แคลิฟอร์เนีย เมื่อเดือนพฤษภาคมที่ผ่านมา ก่อนจะเปิดให้ใช้งานอย่างเป็นทางการเมื่อวันพุธที่ผ่านมา (6 ธ.ค. 66)
คุณสมบัติคร่าว ๆ ของ Gemini คือ เป็นโมเดลปัญญาประดิษฐ์แบบมัลติโมเดล ที่รองรับข้อมูลทั้งข้อความปกติ โค้ด เสียง ภาพ และวิดีโอ Google ระบุว่า Gemini เวอร์ชัน 1.0 มี 3 รุ่น ได้แก่ Gemini Ultra ซึ่งเป็นรุ่นที่มีขนาดใหญ่สุด ประสิทธิภาพดีสุด รองรับงานที่มีความซับซ้อนสูง Gemini Pro เป็นรุ่นขนาดรองลงมา โดยยังสามารถทำงานได้หลากหลาย และ Gemini Nano โมเดลประสิทธิภาพสูงที่ใช้งานบนสมาร์ตโฟน
นอกจากนี้ Google ยังเผยความเจ๋งของ Gemini ด้วยการนำมาทดสอบเปรียบเทียบกับ GPT-4 โมเดล AI ที่ใช้บนแชตบอตอัจฉริยะอย่าง Chat-GPT จาก OpenAI ให้เห็นประสิทธิภาพการทำงานกันจะ ๆ พร้อมให้คะแนนการทดสอบโดยทีมวิจัยของ Google โดยจะทดสอบในหลากหลายด้าน เช่น MMLU ชุดคำถามวิชา STEM มนุษยวิทยา และคำถามวิชาต่าง ๆ ได้คะแนนถึง 90% เมื่อเทียบกับ GPT-4 ที่ได้คะแนนไป 86.4% GSM8K ที่เป็นชุดคำถามวิชาคณิตศาสตร์เบื้องต้นที่ใช้กันในโรงเรียน Gemini ได้คะแนนถึง 94.4% เมื่อเทียบกับ GPT-4 ที่ได้ 92% หรือ Infographic VQA ที่เป็นการทดสอบความเข้าใจและการสรุปความจากอินโฟกราฟิก Gemini ได้คะแนนถึง 80.3% ในขณะที่ GPT-4 ได้คะแนน 75.1%
อย่างไรก็ตาม มีเพียงการทดสอบเดียวเท่านั้น ที่ GPT-4 เหนือกว่า Gemini นั่นคือการทดสอบ HellaSwag ที่เป็นการทดสอบเกี่ยวกับการให้เหตุผล หรือ common sense ในชีวิตประจำวัน ที่ GPT-4 ได้คะแนนในส่วนนี้ไป 95.3% ในขณะที่ Gemini ได้คะแนนไป 87.8% โดย Google จะปล่อยโมเดล Gemini Pro ให้ผู้ใช้ Bard ก่อน และยังจำกัดการใช้งานเฉพาะภาษาอังกฤษ พร้อมมีแผนขยายการรองรับภาษาหรืออินพุตแบบอื่น ๆ ในอนาคต ส่วนผู้ใช้สมาร์ตโฟน Pixel 8 Pro จะได้ใช้โมเดล Gemini Nano ที่รองรับการสรุปจากการอัดเสียง หรือใช้ช่วยตอบข้อความต่าง ๆ ส่วนบริการอื่น ๆ จะตามมาภายหลัง
Cr: www.pptvhd36.com/news/ไอที/212084
ทีมงานพร้อมให้คำปรึกษาและพัฒนาซอฟต์แวร์