DALL·E (ออกเสียงว่า “ดอลลี่”) คือโมเดลปัญญาประดิษฐ์ที่พัฒนาโดย OpenAI ซึ่งสามารถสร้างภาพจากข้อความที่ผู้ใช้พิมพ์เข้าไปได้ (text-to-image generation) โดยใช้เทคนิคของ deep learning
🖼️ สร้างภาพจากข้อความ: เช่น หากคุณพิมพ์ว่า "แมวใส่หมวกคาวบอยเดินอยู่ในทะเลทราย" DALL·E สามารถสร้างภาพที่ตรงตามคำบรรยายนั้นได้
🎨 มีจินตนาการสูง: สามารถรวมสิ่งของที่ไม่มีอยู่ในโลกจริง เช่น "ช้างบินสีชมพูในอวกาศ"
🛠️ แก้ไขภาพ (Inpainting / Editing): สามารถลบ เปลี่ยนแปลง หรือเติมองค์ประกอบในภาพได้ (เช่น เพิ่มหมวกให้คนในภาพ)
🔄 เปลี่ยนสไตล์: สามารถเปลี่ยนภาพให้มีสไตล์ต่าง ๆ เช่น ภาพวาดสีน้ำมัน, การ์ตูน, หรือภาพถ่ายจริง
DALL·E 1 (2021): เวอร์ชันแรกที่แสดงศักยภาพของการแปลงข้อความเป็นภาพ
DALL·E 2 (2022): ภาพคมชัดขึ้น สมจริงมากขึ้น
DALL·E 3 (2023): เข้าใจข้อความได้ดียิ่งขึ้น ให้รายละเอียดตรงตามคำอธิบายมากกว่าเดิม และรวมอยู่ใน ChatGPT
ข้อดี - ข้อจำกัด
เข้าใจคำอธิบายทั้งแบบเรียบง่ายและซับซ้อน เช่น “หมานั่งอ่านหนังสือใต้ต้นไม้ในฤดูใบไม้ร่วง”
รองรับทั้งภาษาอังกฤษและหลายภาษาทั่วโลก (รวมถึงภาษาไทยในระดับหนึ่ง)
สร้างสิ่งที่ไม่มีอยู่จริง เช่น “หุ่นยนต์เล่นไวโอลินในโลกอนาคต” หรือ “พิซซ่าหน้าดาวเสาร์”
สามารถลบ เปลี่ยน หรือเติมองค์ประกอบบางส่วนของภาพได้ เช่น เพิ่มวัตถุ หรือเปลี่ยนสีเสื้อผ้า
โดยเฉพาะในเวอร์ชัน DALL·E 3 ที่ให้รายละเอียดและองค์ประกอบที่เหมือนภาพถ่ายจริง
เพียงพิมพ์ข้อความ ไม่ต้องใช้โค้ดหรือโปรแกรมพิเศษ
บางครั้งภาพที่สร้างอาจไม่ตรงกับทุกคำในคำสั่ง (โดยเฉพาะถ้ามีหลายเงื่อนไขซ้อนกัน เช่น สี, อารมณ์, ท่าทาง)
เช่น หากพิมพ์ “ผู้หญิงนั่งอยู่ข้างซ้ายของชายคนหนึ่ง” DALL·E อาจสลับด้านได้ เพราะ "ซ้าย" ขึ้นกับมุมมอง
เพื่อป้องกันการละเมิดสิทธิ์ส่วนบุคคล DALL·E ไม่สามารถใช้สร้างภาพของบุคคลที่มีชื่อเสียงหรือหน้าตาชัดเจนได้โดยตรง
เช่น โลโก้หรือป้ายชื่อในภาพมักจะผิดเพี้ยน เพราะโมเดลไม่ได้เน้นที่ความถูกต้องของตัวอักษร
เช่น ห้ามใช้สร้างภาพโป๊เปลือย ความรุนแรง หรือข่าวปลอม
วิดิโอ