รู้จัก Llama 3.1 เจาะลึกโมเดล AI จาก Meta ในรูปแบบ Open Source เพื่อการต่อยอด

รู้จัก Llama 3.1 โมเดลแบบจำลองภาษาขนาดใหญ่ (LLMs) ที่ทาง Meta พัฒนาขึ้น ซึ่งเป็นโมเดลทางภาษาขนาดใหญ่ที่ถูก Pretrained เพื่อการฝึกอบรมล่วงหน้า โดยมีการแบ่งขนาดของโมเดลออกเป็น 3 ขนาด ดังนี้ 8B, 70B และ 405B โดยแบ่งตามขนาดของข้อมูลที่ใช้ในการฝึกอบรม โมเดลถูกปรับให้เหมาะสมสำหรับการใช้งานในรูปแบบการสนทนาหลายภาษา และมีประสิทธิภาพดีกว่าโมเดลแชทแบบ Open Source ที่มีอยู่ในปัจจุบันตามเกณฑ์มาตรฐานในการตรวจสอบประสิทธิภาพปัญญาประดิษฐ์ “ในรุ่น 405B ประสิทธิภาพใกล้เคียง GPT-4o เชียวหล่ะ !”

สถาปัตยกรรมของโมเดล Llama

Llama เป็นโมเดลทางภาษาที่ทำงานแบบอัตโนมัติด้วยสถาปัตยกรรม Transformer ที่ได้รับการปรับจูนให้เหมาะสม โดยได้มีการปรับแต่งด้วยวิธีการใช้ข้อมูลที่มีการดูแล (SFT) และการเรียนรู้แบบเสริมด้วยข้อเสนอแนะของมนุษย์ (RLHF) เพื่อให้โมเดลตอบสนองได้ตรงตามความต้องการ และมีความปลอดภัยกับผู้ใช้ 

รู้จัก Llama 3.1 - แต่ละรุ่น 8B, 70B, 405B
รู้จัก Llama 3.1 - แต่ละรุ่น 8B, 70B, 405B

การรองรับภาษาของโมเดล Llama 3.1 สำหรับ 8 ภาษา

English, German, French, Italian, Portuguese, Hindi, Spanish, Thai

ข้อควรรู้เกี่ยวกับ Llama 3.1

วัตถุประสงค์ของโมเดลนี้ถูกออกแบบมาสำหรับการใช้งานเชิงพาณิชย์ และการวิจัย โดยโมเดลสามารถใช้สำหรับสร้างการสนทนารูปแบบเสมือน Chatbot ได้ และโมเดลสามารถใช้ได้ดีสำหรับงานสร้างภาษาธรรมชาติอื่นๆ ซึ่งมีการฝึกฝนด้วยชุดข้อมูลในแต่ละภาษามากกว่า 8 ภาษา ดังที่ได้กล่าวไปข้างต้น

ใบอนุญาต : ผู้พัฒนาได้เน้นย้ำถึงข้อห้ามดังต่อไปนี้ ห้ามใช้ในลักษณะที่ก่อให้เกิดการละเมิดกฎหมายหรือข้อบังคับ หรือละเมิดนโยบายการใช้งานที่ยอมรับได้ และใบอนุญาตชุมชน Llama 3.1 รวมถึงการใช้ในภาษาที่ไม่รองรับ ซึ่งสามารถศึกษาต่อได้ที่ LLAMA 3.1 COMMUNITY LICENSE AGREEMENT 

Datasets ที่ถูกนำมาฝึกฝนโมเดล

ทีมพัฒนาได้มีการใช้งานชุดข้อมูลสาธารณะประมาณ 15 ล้านล้านโทเค็น และตัวอย่างที่สร้างขึ้นเองมากกว่า 25 ล้านตัวอย่าง ในการฝึกฝนโมเดลเพื่อทำการ Pretrained ก่อนที่จะปล่อยตัวโมเดลต้นแบบเพื่อให้ผู้พัฒนา หรือนักวิจัยสามารถนำไปปรับแต่ง Fine-Tune ตามความเหมาะสมในการใช้งานได้ต่อไป โดยสามารถเข้าไปศึกษาต่อได้ที่ Llama 3.1 Documentation

บทสรุป

Llama 3.1 เป็นโมเดล AI รุ่นใหม่ที่น่าจับตามอง ด้วยความสามารถที่หลากหลาย ประสิทธิภาพสูง และการเปิดให้ใช้งานในรูปแบบ Open Source โมเดลรุ่นนี้มีศักยภาพมากมายที่จะนำไปประยุกต์ใช้ในงานต่างๆ ได้อย่างกว้างขวาง

ที่มา : Meta

LazAffTravel
ช่วยเผยแพร่โหน่ย:
Verified by MonsterInsights