กูเกิลลดราคา Gemini 1.5 Flash ลง 80% เหลือประมาณครึ่งหนึ่งของ GPT-4o mini

By: lew

on 3 August 2024 - 21:46 Tags:

Topics:

Gemini

LLM

กูเกิลประกาศลดราคา Gemini 1.5 Flash ที่เพิ่งเปิดตัวมาเพียงสามเดือนลง 80% (อินพุต) ด้วยราคาระดับนี้ทำให้สามารถใช้งานได้หลากหลายขึ้น เช่น การใช้ถอดข้อความจากเสียงนั้นหลายครั้ง Gemini ทำได้ดีกว่าโมเดลแแปลงเสียงเป็นข้อความแล้ว

Gemini 1.5 Flash รองรับทั้งข้อความ, วิดีโอ, เสียง, และภาพ ราคาใหม่ อยู่ที่ 0.01875 ดอลลาร์ต่อ 1 ล้านตัวอักษร หากนับเป็นโทเค็นจะอยู่ที่ประมาณ 0.075 ดอลลาร์ต่อ 1 ล้านโทเค็น ประมาณครึ่งหนึ่งของ GPT-4o mini ที่ราคาถูกที่สุดตอนนี้ ราคาฝั่งเอาท์พุตของ Gemini 1.5 Flash อยู่ที่ 0.15 ดอลลาร์ต่อ 1 ล้านโทเค็น เทียบกับ GPT-4o mini อยู่ที่ 0.60 ดอลลาร์ต่อ 1 ล้านโทเค็น

นอกจากการลดราคา API ตรงๆ แล้ว Vertex AI ยังเปิด Batch API สำหรับงานที่รอได้ ทำให้ราคาลดลงไปอีก 50% ทำให้ค่าใช้งานถูกลงมาก หรือหากต้องการใช้งานปริมาณมากๆ สามารถเลือกใช้ Provisioned Throughput เพื่อจองโควต้าการใช้งานล่วงหน้าได้

ราคาใหม่ของ Gemini 1.5 Flash จะมีผลวันที่ 12 สิงหาคมนี้

ที่มา - Google Cloud Blog

Hiring! บริษัทที่น่าสนใจ

Icon Framework co.,Ltd.

Global Standard Platform for Real Estate แพลตฟอร์มสำหรับธุรกิจอสังหาริมทรัพย์ครบวงจร มาตรฐานระดับโลก

CLEVERSE

Cleverse is a Venture Builder. Our team builds several tech companies.

CP Axtra Public Company Limited

Makro PRO is an exciting new digital venture by the iconic Makro.

Comments

By: Tasksenger on 3 August 2024 - 22:46 #1318620

เอาเป็นว่าราคาต่อโทเคนไม่ค่อยเป็นประเด็นเท่าไหร่หรอกครับ แต่ที่โดนหนักๆ น่าจะเป็น rpm มากกว่า ผมเคยเผลอ run โปรแกรมเป็น background แล้วมัน overflow ไป ผม kill หน้าจอ แต่ลืมไปว่ามันมี background ตื่นเช้ามา โอ้ว พระถังซัมจั๋งช่วย กราฟพุ่งขึ้นอย่างชัน โดนไปหลายร้อยเหมือนกัน 555 กับคำสั่งสั้นๆ ที่โทเคนหลักร้อย ยังดีที่ตั้ง thread ไม่ถี่มาก

By: lew

on 4 August 2024 - 14:13 #1318652 Reply to:1318620

งงครับ เขาลดราคาลง ต่อให้เขียนโปรแกรมมี bug ค่าใช้จ่ายที่เกิดก็ลดลงอยู่ดี แล้วมันไม่เป็นประเด็นอย่างไรนะครับ

req-per-min นี่ปกติมีปัญหาตอนต้องการใช้เยอะจริงๆ ต้องขอโควต้ากันเพิ่ม ไม่ใช่เรื่องค่าใช้จ่ายด้วย (อยากจ่ายเยอะแต่ระบบไม่อนุญาต)

lewcpe.com, @wasonliw

By: Tasksenger on 4 August 2024 - 18:19 #1318668 Reply to:1318652

สงสัยผมเข้าใจผิดเอง มันผูก package ไว้กับ google cloud แบบ Pay-as-you-go ซึ่งตอนแรกผมเข้าใจว่ามันคิดแยกออกจาก package หลักหากใช้จาก AI Studio ไม่ใช่ Vertex โดยดูจากการใช้งานว่าเกิน Limit หรือยัง ถ้าเกินแล้วถึงจะเริ่มคิดเงิน เพราะเท่าที่ผมดูถึงจะ overflow ไป token ก็ไม่น่าจะถึงที่มันจะคิดเงิน แต่ค่า rpm น่าจะเกิน limit แน่ๆ เพราะมีบิลเรียกเก็บเงินผมมาในส่วนของ Non-Firebase services ซึ่งมันก็ไม่ได้แจงรายละเอียดอะไรด้วยใน report ขอบคุณมากครับ ผมเองก็กำลังประเมินค่าใช้จ่ายเพื่อคิดต้นทุนอยู่ ก็เลยไปคิดว่ามันคิดจาก rpm ด้วย ถึงมีค่าใช้จ่ายมา เนื่องจากทุกวันที่ผม run โปรแกรม มันจะมีค่าใช้จ่ายมาประมาณวันละ 1 บาท น่าจะเป็นมันคำนวณต่อ token แล้วคิดเงินเลยจาก package ที่ผมใช้ ไม่ใช่จาก rpm

By: lew

on 5 August 2024 - 00:11 #1318686 Reply to:1318668

ปกติแล้ว rate limit ผมเคยเห็นแต่ request ไปแล้วได้ error response กลับมาบอกว่า rate limit reached ไม่เคยเห็นใครใช้ท่าเกิน rate limit แล้วคิดเงิน (พวก provisioned นี่อีกแบบ ต้องจองล่วงหน้า จ่ายเงินเสมอไม่ว่าใช้ไม่ใช้)

ถ้าเชื่อว่า token ไม่เกินจริงๆ ลองเปิด ticket ไปไหมครับว่ามันค่าอะไรกันแน่

lewcpe.com, @wasonliw

By: lew

on 5 August 2024 - 00:17 #1318688 Reply to:1318668

ถ้าเป็น Plan ฟรี ต้องแสดงว่าฟรีในหน้า API เลยครับ

ถ้า Pay-as-You-Go นี่เสียเงินตั้งแต่ req แรก (เงื่อนไขการใช้งานต่างกัน, นำข้อมูลไปฝึกหรือไม่นำไปฝึก + rate limit ต่างกัน) ไม่ได้ใช้ฟรีจนหมดก่อยแล้วค่อยเริ่มคิดเงิน

No Description

lewcpe.com, @wasonliw

By: Fzo

on 4 August 2024 - 03:23 #1318632

โอ้ยย ดี เวรี่กู๊ดดด

WE ARE THE 99%

By: hidap on 4 August 2024 - 09:29 #1318639

😂😂มันจะช้าไปหรือเปล่า

By: lew

on 4 August 2024 - 14:14 #1318653 Reply to:1318639

ถ้าฝั่งเสียง Gemini เปิดก่อนมานานแล้วแล้วนะครับ GPT-4o นี่จนทุกวันนี้ยังใส่เสียงผ่าน API ไม่ได้เลย

lewcpe.com, @wasonliw

By: pd2002 on 4 August 2024 - 14:43 #1318660 Reply to:1318653

API ChatGPT ง่อยมาก ทำอะไรก็ไม่ได้ โดนตัดฟีเจอร์เพียบ

Main menu