Meta ปล่อยโมเดล Code Llama ขนาด 70B คะแนนทดสอบ HumanEval แซง GPT-4, Gemini Pro

By: lew

on 30 January 2024 - 00:55 Tags:

Topics:

Meta ปล่อยโมเดล Code Llama ขนาด 70B หลังจากปีที่แล้วปล่อยรุ่นใหญ่สุดอยู่ที่ 34B เท่านั้น โดยตอนนี้ยังไม่บอกรายละเอียดนัก นอกจากระบุว่าคะแนนทดสอบ HumanEval อยู่ที่ 67.8 แซงหน้า GPT-4 (67.0) และ Gemini Pro (67.7) โดยระบบอื่นๆ ที่ได้คะแนนสูงกว่านี้มักใช้ GPT-4/GPT-3.5 ร่วมกับเทคนิคอื่นๆ เพื่อให้ทำคะแนนได้สูงขึ้น

โมเดลที่ปล่อยออกมามี 3 รุ่นย่อย ได้แก่ รุ่นพื้นฐานสำหรับใช้งานทั่วไป, รุ่นภาษาไพธอนโดยเฉพาะ, และรุ่น Instruct สำหรับรับคำสั่งเพื่อเขียนโปรแกรมตาม รุ่นที่รายงานคะแนน HumanEval นั้นคือรุ่น Instruct

โมเดลเหล่านี้ใช้งานได้ฟรีแบบมีข้อจำกัด โดยห้ามใช้งานกับองค์กรที่มีผู้ใช้เกิน 700 ล้านคนต่อเดือน

ที่มา - AI at Meta, Hugging Face

No Description

Hiring! บริษัทที่น่าสนใจ

Data Wow Co.,Ltd

We enable our clients to realize increased productivity by solving their most complex issues by Data

Thoughtworks Thailand

Thoughtworks เป็นบริษัทที่ปรึกษาด้านเทคโนโยลีระดับโลกที่คว้า Great Place to Work 3 ปีซ้อน

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Comments

By: shub on 30 January 2024 - 08:47 #1304688

องค์กรที่มีผู้ใช้เกิน 700 ล้านคนต่อเดือนนี่ต้องเป็นองค์กรระดับไหนนะ

By: Godhand

on 30 January 2024 - 08:51 #1304690

ตอนแรกก็อ่านแล้วสงสัยว่าทำไมต้องไม่เกิน 700 ล้านคนต่อเดือน

จงใจ Block Apple / Google / Microsoft นี่เอง

By: btoy

on 30 January 2024 - 10:08 #1304702

def check_term_condition():

    if active_users_per_month > 700 or org_name.lower() in ['apple', 'google', 'microsoft', 'amazon']:
        return False
    return True

..: เรื่อยไป

By: tontan

on 30 January 2024 - 10:35 #1304704

Microsoft คงไม่มีปัญหานะครับ https://www.blognone.com/node/134904 ได้ยินว่าเริ่มเอา LLaMa ไปใช้คู่กับ openai แล้วด้วย ที่มีปัญหาน่าจะอเมซอนมากกว่า รายนี้เงียบกว่า apple อีก ส่วน apple คงไม่สนใจอยู่แล้ว ทำเอง

บล็อก: wannaphong.com และ Python 3

By: Iamz

on 30 January 2024 - 11:14 #1304707 Reply to:1304704

AWS มีโมเดลธุรกิจต่างกับเจ้าอื่นนิดหน่อยครับ มี Titan ของตัวเองแต่ก็ไม่ได้เน้นว่าเก่งกว่าของคนอื่น ลูกค้าอยากใช้ model ไหนก็ได้ตราบใดที่ใช้ infrastructure ของ AWS ในการ run

By: lew

on 30 January 2024 - 13:33 #1304713 Reply to:1304704

เอาเข้าจริงอะไรก็ไม่มีปัญหาครับ แค่ไปคุยก่อน แบ่งผลประโยชน์กันสักหน่อย

ส่วนรายเล็กๆ ต่อให้จ่ายก็ไม่กี่ตังค์ Meta ก็ปล่อยเลย

lewcpe.com, @wasonliw

By: mr_tawan

on 30 January 2024 - 21:46 #1304726

ตอนแรกอ่านเป็น 70 Bytes

เล็กจัง

9tawan.net บล็อกส่วนตัวฮับ

Main menu