ผลทดสอบ Turing Test กับ LLM ล่าสุด GPT-4 ได้ผลดีสุด ELIZA จากปี 1966 ยังได้ผลดีกว่า GPT-3.5

By: lew

on 4 December 2023 - 21:50 Tags:

Topics:

Artificial Intelligence

LLM

Alan Turing

ทีมวิจัยจาก UC San Diego รายงานผลการทดสอบประสิทธิภาพของปัญญาประดิษฐ์ในการหลอกมนุษย์ว่าเป็นมนุษย์ หรือที่รู้จักกันในชื่อ Turing Test โดยผลเบื้องต้นพบว่า GPT-4 มีคะแนนใกล้คนที่สุด

การทดลองครั้งนี้อาศัยบริการออนไลน์ โดยผู้เล่นจะเข้าไปรอคิวในระบบที่มี AI ที่ทีมงานเตรียม prompt ของ AI ทั้ง GPT-3.5 และ GPT-4 เอาไว้รวม 25 ตัว โดยยังมี ELIZA โปรแกรมแชตที่พยายามคุยเหมือนมนุษย์ที่ออกมาตั้งแต่ปี 1966 มาเป็นตัวเทียบด้วย ผู้เล่นที่ทำหน้าที่ผู้ตัดสินจะต้องตัดสินว่ากำลังคุยกับปัญญาประดิษฐ์ภายใน 5 นาที โดยคุยแต่ละข้อความไม่เกิน 300 ตัวอักษร ระบบจะสุ่มว่าผู้เล่นแต่ละคนนั้นจะได้คุยกับปัญญาประดิษฐ์หรือมนุษย์

ผู้ร่วมทดสอบทั้งหมด 652 คน เล่นเกมทั้งหมด 1,810 ครั้ง แต่ทีมงานตัดเกมบางส่วนออก เนื่องจากผู้เล่นบางคนถูกสุ่มเจอแต่ AI โดยไม่เจอมนุษย์เลย หรือบางคนก็รู้จักกับผู้เล่นที่เป็นมนุษย์ฝั่งตรงข้าม เหลือเกมที่นับผล 1,405 เกม แล้ววัดว่า AI หรือมนุษย์สามารถโน้มน้าวให้มนุษย์อีกฝั่งเชื่อว่าเป็นมนุษย์ได้ดีเพียงใด

ผลพบว่ามนุษย์ที่อยู่ฝั่งถูกตัดสินนั้นโน้มน้าวผู้ตัดสินว่าเป็นมนุษย์จริงๆ ได้ 63% สูงกว่า AI ทุกตัว แต่ GPT-4 สองตัวที่ทีมงานกำหนด prompt ไว้ก็ทำคะแนนได้สูงระดับ 41% ที่น่าสนใจคือ ELIZA ซึ่งเป็นโค้ดง่ายๆ เขียนมาหลายสิบปีนั้นสามารถทำคะแนนได้ 27% สูงกว่า GPT-3.5 สองตัวในการทดลองเสียอีก

ทีมวิจัยระบุว่า ELIZA ทำคะแนนได้ดีแม้จะเก่ามากแล้วเพราะมันถูกเขียนโปรแกรมให้คุยตามน้ำไปเรื่อยๆ ไม่พยายามแสดงความรู้อะไรออกมา, ไม่พยายามช่วยเหลือหรือพูดคุยเป็นมิตรเกินคนปกติ, และสุดท้ายคือ ELIZA แย่มากจนไม่เหมือนปัญญาประดิษฐ์สมัยใหม่ แต่ไปเหมือนกับคนที่ตอบกวนไปมามากกว่า

ที่มา - ArXiv

No Description

Hiring! บริษัทที่น่าสนใจ

H LAB

Re-engineering healthcare systems through intelligent platforms and system design.

LTMH TECH

LTMH TECH มุ่งเน้นการพัฒนาผลิตภัณฑ์ที่สามารถช่วยพันธมิตรของเราให้บรรลุเป้าหมาย

KBTG - KASIKORN Business-Technology Group

KBTG - "The Technology Company for Digital Business Innovation"

Comments

By: zyzzyva

on 4 December 2023 - 22:15 #1300567

ลองดูในภาคผนวก มีคนนึงคิดว่า ELIZA เป็นมนุษย์ โดยให้เหตุผลว่าตอบได้โง่เกินกว่าที่จะเป็น AI 55555

By: KuLiKo

on 4 December 2023 - 22:48 #1300569 Reply to:1300567

ชมและด่าไปในตัว 555

By: Fzo

on 5 December 2023 - 00:10 #1300573 Reply to:1300567

ขำมากกก 555

WE ARE THE 99%

By: big50000

on 5 December 2023 - 01:41 #1300574 Reply to:1300567

55555

By: Tasksenger on 5 December 2023 - 07:32 #1300579 Reply to:1300567

ผมว่าเราพัฒนา AI จนมันฉลาดเกินไป ห่างจากความเป็นมนุษย์ไปเรื่อยๆ ทั้งที่จุดประสงค์ที่ต้องการคือ AI ที่มีความเป็นมนุษย์ ซึ่งมันมีผิดบ้าง ถูกบ้าง หลงๆ ลืมๆ และโง่ รวมถึงแกล้งโง่ในบางกรณีได้ ซึ่งมีความหลากหลายของบุคลิกมากกว่า แต่ก็เข้าใจแหล่ะว่ากำลังพัฒนา Knowledge อยู่ แต่ถ้าไม่จัดการเรื่องธรรมชาติของคน หรือสร้างบุคลิกขึ้นมามันจะทำให้เราใช้ทรัพยากรในการเทรนสูญเปล่าเป็นจำนวนมากเนื่องจากข้อมูลที่เราใช้ถามตอบในชีวิตประจำวันมันไม่ได้เยอะมหาศาลเหมือนที่ผู้พัฒนาพยายามสอน AI ในตอนนี้

By: Holy

on 5 December 2023 - 09:16 #1300583 Reply to:1300579

ผมว่าแล้วแต่จุดประสงค์แต่ละคนครับ เวลาผมถาม AI คือไม่ได้ต้องการเพื่อนแก้เหงาคุยเหมือนคน แต่ต้องการข้อมูลละเอียดเชิงลึก แบบถูกต้อง 100% หรือมากที่สุดเท่าที่จะได้

ถ้าอยากคุยกับคน ผมคุยกับคนจริงๆ ก็ได้ครับ

By: Tasksenger on 5 December 2023 - 10:26 #1300590 Reply to:1300583

ผมว่าสิ่งที่คุณต้องการไม่ใช่ AI นะ คุณต้องการ Search Engine ที่สามารถสรุปข้อมูลดีๆ ให้คุณได้

By: specimen

on 5 December 2023 - 11:07 #1300592 Reply to:1300579

ลักษณะงานของผมไม่ได้ต้องการ AI ที่เหมือนคนนะครับ

ผมต้องการ AI ที่สามารถทำงานได้ฉลาดละเอียดและแม่นยำกว่ามนุษย์ครับ ถ้าต้องการ AI ที่เหมือนคนเราใช้คนทำต่อดีกว่าครับถูกกว่าด้วย การทำงานผิดๆถูกๆถือว่ายอมรับไม่ได้ในสายงานของผมครับอันตราย

อีกอย่าง AI ที่ผมใช้เป็น AI เฉพาะทางครับไม่ได้เหมือน AI สาธารณะที่เล่นกันอยู่ตอนนี้ ดังนั้นมันถูกเทรนมาเฉพาะเจาะจงเป็นผู้ชำนาญเฉพาะด้าน

By: Tasksenger on 5 December 2023 - 12:20 #1300599 Reply to:1300592

งั้นผมถามกลับง่ายๆ แล้วกันว่าถ้าเราจะสร้าง AI แบบที่คุณบอก ทำไมต้องมี Turing Test ด้วยล่ะครับ ทำไมไม่ทดสอบเฉพาะความถูกต้อง วัตถุประสงค์สุดท้ายที่ทุกคนอยากทำก็คือการสร้างมนุษย์ดิจิทัลนั่นแหล่ะ เพียงแค่เรากลัวที่จะยอมรับ และกลัวการต่อต้านจากคนทั่วไป

ส่วนความแม่นยำ ไม่แม่นยำมันก็เป็นเรื่องของ Knowledge ที่เรา Train ให้มัน คนเรามันก็มีทั้งรู้อยู่ แต่ก็ไม่พูดก็มี ซึ่ง AI มันก็สามารถพัฒนาพฤติกรรมตามบุคคลที่มันสนทนาด้วยได้ว่ามันอยากจะให้ข้อมูลแบบไหน ผมถึงบอกไงว่าสิ่งที่คุณต้องการไม่ใช่ AI แต่เป็น Search Engine ที่สรุปข้อมูลได้

By: aeksael

on 5 December 2023 - 11:37 #1300593 Reply to:1300579

เอ่อ... ทีคุณกล่าวมาผมลองจินตนาการดู โคตรน่ากลัวเลยจ้า

The Last Wizard Of Century.

By: GodPapa

on 5 December 2023 - 12:18 #1300596 Reply to:1300579

เอไอคือต้องการให้เรียนรู้ได้เองครับ
ไม่ใช่ให้คิดเหมือนคน

By: Tasksenger on 5 December 2023 - 12:24 #1300600 Reply to:1300596

ไม่ต้องห่วงหรอกครับ พอมันพัฒนาถึงจุดหนึ่งมันก็จะคิดได้เหมือนคน และมีพฤติกรรมเลียนแบบมนุษย์ได้ มันเหมือนปลายภูเขาน้ำแข็งนั่นแหล่ะครับ ทุกคนกำลังคลำยอดของมันอยู่ แต่ด้านล่างมันยังมีพัฒนาการอีกเยอะที่ทำต่อยอดได้ และอาจมีบางคนทำมันขึ้นมาแล้วก็ได้แต่ไม่ได้เผยแพร่ เพราะมันเป็นความฝันของนักพัฒนา AI ทุกคนอยู่แล้ว

Main menu