OpenAI ได้เปิดตัวฟีเจอร์การสร้างและแก้ไขภาพใน GPT-4o ซึ่งเป็นความสามารถใหม่ที่เพิ่มเข้ามาในโมเดล AI ชั้นนำของบริษัท โดยสามารถสร้างภาพเหมือนจริงและมีความละเอียดสูง อีกทั้งยังสามารถแก้ไขภาพที่อัปโหลดได้ ผู้ใช้งาน ChatGPT จะได้สัมผัสกับฟีเจอร์นี้เป็นครั้งแรกหลังจากที่เป็นหนึ่งในฟีเจอร์ที่ได้รับการร้องขอมานาน

การพัฒนารูปแบบการสร้างภาพ

OpenAI อธิบายว่า GPT-4o ถูกฝึกด้วยข้อมูลร่วมของภาพและข้อความออนไลน์ ทำให้สามารถเข้าใจความสัมพันธ์ระหว่างภาพและข้อความได้อย่างลึกซึ้ง พร้อมทั้งการปรับปรุงขั้นสูงหลังการฝึกอบรม ทำให้โมเดลนี้มีความสามารถในการสร้างภาพที่สอดคล้องและมีประโยชน์อย่างไม่คาดคิด

การใช้งานง่ายและประสิทธิภาพที่เพิ่มขึ้น

การสร้างและแก้ไขภาพใน GPT-4o นั้นใช้งานไม่ต่างจากการสนทนาใน ChatGPT เพียงแค่ผู้ใช้ระบุลักษณะของภาพที่ต้องการ เช่น อัตราส่วนภาพ หรือรหัสสี สำหรับภาพที่มีความละเอียดสูง อาจใช้เวลาถึงหนึ่งนาทีในการประมวลผล ฟีเจอร์ที่โดดเด่นที่สุดคือความสามารถในการแสดงข้อความภาษาอังกฤษในภาพอย่างถูกต้องและสมบูรณ์ ซึ่งแก้ไขปัญหาข้อความผิดเพี้ยนในภาพที่ AI สร้างในอดีตได้เป็นอย่างดี

GPT-4o ยังสามารถเพิ่มความสามารถจากภาพและข้อความในแชตได้อย่างแม่นยำ รวมถึงการวิเคราะห์ภาพที่ผู้ใช้ส่งเข้ามาและเชื่อมโยงข้อมูลความรู้จากโลกผ่านภาพและข้อความ

ข้อจำกัดและการเผยแพร่

แม้ว่าฟีเจอร์นี้จะมีประสิทธิภาพสูง แต่ยังมีปัญหาเช่น การครอปภาพยาวเกินไป การสร้างข้อมูลที่ผิดพลาด และความยากลำบากในการแสดงผลภาษาที่ไม่ใช่ภาษาละติน

GPT-4o กำลังทยอยเปิดให้ใช้งานเป็นตัวสร้างภาพเริ่มต้นสำหรับผู้ใช้ ChatGPT รุ่น Plus, Pro, Team และ Free ส่วนองค์กรและการศึกษาจะได้ใช้งานเร็วๆ นี้ และนักพัฒนาจะสามารถสร้างภาพผ่าน API ในอีกไม่กี่สัปดาห์ข้างหน้า โดยยังมีให้ใช้งานใน Sora และ DALL·E GPT

ที่มา: Source