ทีมวิจัยจาก UC San Diego อัพเดตรายงานทดสอบ Turing Test แบบจำกัดเวลา เพื่อทดสอบว่าปัญญาประดิษฐ์จะสามารถหลอกว่าเป็นมนุษย์ได้หรือไม่ จากเดิมที่เคยทดสอบตั้งแต่ปี 2023 และรอบนี้พบว่า GPT-4.5 เอาชนะมนุษย์ได้อย่างชัดเจน
กระบวนการทดสอบใช้จะให้ผู้ทดสอบคุยแชตกับ AI และมนุษย์ไปพร้อมกัน โดยสามารถคุยได้เพียง 8 ข้อความและจำกัดเวลา และเมื่อจบเวลา 5 นาทีก็ต้องเลือกว่าหน้าจอไหนเป็นมนุษย์หรือ AI โดยเมื่อปี 2023 นั้น GPT-4 ทำคะแนนได้สูงสุด 41% รอบนี้พบว่า GPT-4.5 สามารถทำคะแนนได้ถึง 73% สูงกว่ามนุษย์จริงๆ อย่างมีนัยสำคัญ
กลุ่มผู้ทดสอบที่ร่วมการทดสอบมีสองกลุ่ม คือ กลุ่มนักศึกษาปริญญาตรีของ UC San Diego เอง 126 คน และกลุ่มรับทดสอบ AI จากแพลตฟอร์ม Prolific อีก 158 คน GPT-4.5 ทำคะแนนได้ดีมากทั้งสองกลุ่ม ตามมาด้วย Llama 3.1 405B ที่ทำได้ดีกับกลุ่ม Prolific อย่างเดียว
ผลทดสอบพบว่าพรอมพ์เริ่มต้นมีความสำคัญมากต่อคะแนน และแม้ว่าการทดสอบ Turing Test เดิมนั้นจะพยายามทดสอบ "ปัญญา" แต่การทดสอบแบบจำกัดนี้ก็บีบให้ผู้เข้าทดสอบต้องพยายามทดสอบว่าใครเป็น AI ด้วยกลยุทธ์ต่างๆ บางด้านเท่านั้น แต่การที่ GPT-4.5 ทำคะแนนได้ดีมาก แสดงให้เห็นว่า AI สามารถหลอกมนุษย์ได้เนียนขึ้นเรื่อยๆ
ที่มา - arxiv
Comments
สามารถหลอกมนุษย์ได้เนียนขึ้นเรื่อยๆ
กลายเป็นคน คิดว่า
AI เป็นคน มากกว่าคนจริงๆ ไปแล้วสินะ 😅