Gemini เป็นโมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM)ล่าสุดของกูเกิล และเป็น AI แบบ multimodal ที่สามารถทำความเข้าใจกับอินพุตหลายอย่างพร้อมกันแบบเป็นเหตุเป็นผลอย่างลึกซึ้ง (ข้อความ โค้ด เสียง รูปภาพ วิดีโอ หรืออื่น ๆ) ทำให้มันสามารถอธิบายและตอบคำถามในหัวข้อที่มีความซับซ้อนได้อย่างราบรื่น
ตัว Gemini ยังแบ่งย่อยเป็น 3 โมเดล เรียงตามขนาดเล็กไปใหญ่ คือ
- Gemini Nano — รุ่นที่มีประสิทธิภาพสูงสุดสำหรับงานบนอุปกรณ์โทรศัพท์มือถือ ออกแบบมาให้ใช้งานทั่วไป และใช้งานบนสมาร์ตโฟน
- Gemini Pro — โมเดลที่ดีที่สุดสำหรับการปรับขนาดในงานที่หลากหลาย ถูกนำมาใช้ขับเคลื่อนบริการ AI ต่าง ๆ ของกูเกิล และตอนนี้เข้าไปทำงานอยู่เบื้องหลังแชทบอตอย่างบาร์ด (Bard) ของกูเกิล
- Gemini Ultra — โมเดลที่ใหญ่ที่สุดและมีความสามารถมากที่สุดสำหรับงานที่มีความซับซ้อนสูง เป็น LLM ที่ทรงพลังที่สุดที่กูเกิลเคยสร้างมา มันถูกออกแบบมาให้ใช้งานในศูนย์ข้อมูลขนาดใหญ่ในระดับองค์กรที่มีการทำงานซับซ้อน เพื่อการศึกษาและพัฒนาในระดับที่ใหญ่ขึ้น
Gemini Ultra เป็นโมเดลที่ใหญ่ที่สุดและมีความสามารถมากที่สุด ออกแบบมาเพื่องานที่ซับซ้อนสูงและสร้างขึ้นเพื่อให้เข้าใจและดำเนินการกับข้อมูลประเภทต่างๆ ได้อย่างรวดเร็ว รวมถึงข้อความ รูปภาพ เสียง วิดีโอ และโค้ด