GPT-4o mini คืออะไร ความก้าวหน้าโมเดล AI ขนาดเล็กตอบโจทย์ความคุ้มค่า !

เมื่อไม่นานมานี้ OpenAI ได้เปิดตัวโมเดล GPT-4o mini คือโมเดลขนาดเล็ก ที่การันตีเรื่องความคุ้มค่าในการใช้งาน ทำให้ปัญญาประดิษฐ์มีราคาย่อมเยา และเข้าถึงได้ง่ายขึ้น เพื่อให้เกิดการเข้าถึงได้อย่างกว้างขวาง โดยผู้พัฒนาได้ทดสอบประสิทธิภาพตามมาตรฐานด้านความเข้าใจในหลายภาษาพร้อมกัน หรือ MMLU (Massive Multitask Language Understanding) ซึ่งทำคะแนนได้ถึง 82% พบว่ามีประสิทธิภาพเหนือกว่า GPT-41 ในการทดสอบบน LMSYS leaderboard และมีราคาต่อ Input Tokens , Output Tokens ที่ถูกกว่าโมเดลก่อนหน้า ทำให้ใช้ทรัพยากรได้คุ้มค่าและประหยัดกว่าเดิม

GPT-4o mini คืออะไร ?

GPT-4o mini ล่าสุด คือโมเดล AI ขนาดเล็กที่สามารถรองรับทั้งข้อความ และ API หลายรายการ ซึ่งรองรับการป้อนข้อมูล และแสดงผลลัพธ์เป็นข้อความรูปภาพ วิดีโอ และเสียงซึ่งจะมาในอนาคต – โมเดล 4o mini มีหน้าต่างรองรับบริบทการสนทนาขนาด 128K Tokens และรองรับ Tokens ผลลัพธ์สูงสุดถึง 16K ได้รับการอัปเดตชุดข้อมูลจนถึงเดือนตุลาคม 2023 โดยผู้พัฒนากล่าวว่าโมเดลได้รับการปรับปรุงในส่วนการประมวลผล Tokens ทำให้การใช้งานภาษาอื่นๆ ที่ไม่ใช่ภาษาอังกฤษทำได้ดีขึ้น

GPT-4o mini vs GPT-3.5 Turbo และโมเดลขนาดเล็กรุ่นอื่น

โมเดลรุ่น 4o mini มีความสามารถที่เหนือกว่ารุ่น 3.5 Turbo และโมเดลขนาดเล็กอื่นๆ ในด้านการให้เหตุผล และมัลติโหมด รวมถึงมีประสิทธิภาพในการจัดการบริบทระยะยาวได้ดีกว่า อีกทั้งยังสามารถรองรับภาษาต่างๆ ได้เทียบเท่ารุ่น 4o แบบปกติ

4o mini ได้รับการประเมินประสิทธิภาพตามมาตรฐานหลายด้าน ดังต่อไปนี้

ด้านการใช้เหตุผล : โมเดลสามารถทำงานได้ดีกว่าโมเดลขนาดเล็กอื่นๆ ในแง่ของการให้เหตุผลที่เกี่ยวข้องกับข้อความ และวิสัยทัศน์ อยู่ที่คะแนน 82% (MMLU) เมื่อเทียบกับ Gemini Flash อยู่ที่ 77.9% และ Claude Haiku อยู่ที่ 73.8%
ด้านการคำนวณทางคณิตฯ และเขียนโปรแกรม : โมเดลเหนือกว่าโมเดลขนาดเล็กอื่นๆ ในด้านคณิตศาสตร์ โดยทำคะแนนอยู่ที่ 87.0% (MGSM) เมื่อเทียบกับ Gemini Flash อยู่ที่ 75.5% และได้คะแนน 71.7% สำหรับ Claude Haiku นอกจากนี้การทดสอบการเขียนโปรแกรม (HumanEval) ซึ่งได้คะแนน ดังนี้ 87.2%, 71.5% และ 75.9% ตามลำดับ
ด้านการใช้เหตุผล (มัลติโหมด) : ได้ทำการทดสอบ MMMU โดยทำคะแนนได้ 59.4%, 56.1% และ 50.2% ตามลำดับ

มาตรฐานด้านความปลอดภัยของโมเดล

ผู้พัฒนากล่าวว่าในด้านความปลอดภัยนั้น ได้ถูกปลูกฝังบทเรียนเหล่านี้ตั้งแต่เริ่มต้นการฝึกโมเดล โดยทำการกรองข้อมูลที่ไม่พึงประสงค์ให้โมเดล เช่น การแสดงออกทางคำพูดที่ไม่เหมาะสม, ความเกลียดชัง, เนื้อหาสำหรับผู้ใหญ่ และอื่นๆ นอกจากนี้ยังควบคุมพฤติกรรมของโมเดลตามนโยบายการเรียนรู้ด้วยข้อเสนอของมนุษย์ RLHF (Reinforcement Learning with Human Feedback) อีกด้วย – OpenAI ได้อธิบายว่า 4o mini มีการใช้มาตรฐานความปลอดภัยแบบเดียวกับ GPT-4o รุ่นปกติ และยังได้รับคำแนะนำจากผู้เชี่ยวชาญภายนอกมากกว่า 70 คน ในสาขาด้านจิตวิทยา ภายในโมเดลยังสามารถต้านการโจมตีจากคำสั่งที่แอบแฝงไปในทางไม่ดี เพื่อทำให้การตอบสนองของโมเดลน่าเชื่อถือมากขึ้น และเต็มไปด้วยความปลอดภัย

อะไรจะเกิดขึ้นต่อไปในอนาคตกล่าวโดย OpenAI

ทางทีมผู้พัฒนากล่าวว่า. ในช่วงไม่กี่ปีที่ผ่านมาเราจะได้เห็นความก้าวหน้าที่น่าทึ่งด้านความฉลาดของ AI พร้อมกับความพยายามในการลดต้นทุนในการใช้งานด้านงบประมาณ และทรัพยากรประมวลผลลง เห็นได้จากตัวอย่างของโมเดล text-davinci-003 ตั้งแต่ได้รับการเปิดตัวจนถึง GPT ในปัจจุบัน ในขณะเดียวกันประสิทธิภาพที่เพิ่มสูงขึ้นเรื่อยๆ ทุกปีแต่แฝงมาด้วยการลดต้นทุน และความคุ้มค่า

ในอนาคตโมเดลต่างๆ จะถูกผสานเข้ากับเว็บไซต์ และแอปพลิเคชัน AI ได้อย่างมีประสิทธิภาพ และคุ้มค่ามากขึ้น OpenAI ยังได้ทิ้งท้ายว่า “เราตื่นเต้นที่จะเป็นผู้นำในเส้นทางนี้ต่อไป ~” หากชื่นชอบการรีวิว หรือบทสรุปของเราเกี่ยวกับ ChatGPT ยังสามารถย้อนไปอ่านโมเดลรุ่นใหญ่อย่าง 4o (Omni) ได้เลย

ที่มา : OpenAI