Tags:
Topics: 
Node Thumbnail

กูเกิลประกาศลดราคา Gemini 1.5 Flash ที่เพิ่งเปิดตัวมาเพียงสามเดือนลง 80% (อินพุต) ด้วยราคาระดับนี้ทำให้สามารถใช้งานได้หลากหลายขึ้น เช่น การใช้ถอดข้อความจากเสียงนั้นหลายครั้ง Gemini ทำได้ดีกว่าโมเดลแแปลงเสียงเป็นข้อความแล้ว

Gemini 1.5 Flash รองรับทั้งข้อความ, วิดีโอ, เสียง, และภาพ ราคาใหม่ อยู่ที่ 0.01875 ดอลลาร์ต่อ 1 ล้านตัวอักษร หากนับเป็นโทเค็นจะอยู่ที่ประมาณ 0.075 ดอลลาร์ต่อ 1 ล้านโทเค็น ประมาณครึ่งหนึ่งของ GPT-4o mini ที่ราคาถูกที่สุดตอนนี้ ราคาฝั่งเอาท์พุตของ Gemini 1.5 Flash อยู่ที่ 0.15 ดอลลาร์ต่อ 1 ล้านโทเค็น เทียบกับ GPT-4o mini อยู่ที่ 0.60 ดอลลาร์ต่อ 1 ล้านโทเค็น

นอกจากการลดราคา API ตรงๆ แล้ว Vertex AI ยังเปิด Batch API สำหรับงานที่รอได้ ทำให้ราคาลดลงไปอีก 50% ทำให้ค่าใช้งานถูกลงมาก หรือหากต้องการใช้งานปริมาณมากๆ สามารถเลือกใช้ Provisioned Throughput เพื่อจองโควต้าการใช้งานล่วงหน้าได้

ราคาใหม่ของ Gemini 1.5 Flash จะมีผลวันที่ 12 สิงหาคมนี้

ที่มา - Google Cloud Blog

Get latest news from Blognone

Comments

By: Tasksenger on 3 August 2024 - 22:46 #1318620

เอาเป็นว่าราคาต่อโทเคนไม่ค่อยเป็นประเด็นเท่าไหร่หรอกครับ แต่ที่โดนหนักๆ น่าจะเป็น rpm มากกว่า ผมเคยเผลอ run โปรแกรมเป็น background แล้วมัน overflow ไป ผม kill หน้าจอ แต่ลืมไปว่ามันมี background ตื่นเช้ามา โอ้ว พระถังซัมจั๋งช่วย กราฟพุ่งขึ้นอย่างชัน โดนไปหลายร้อยเหมือนกัน 555 กับคำสั่งสั้นๆ ที่โทเคนหลักร้อย ยังดีที่ตั้ง thread ไม่ถี่มาก

By: lew
FounderJusci's WriterMEconomicsAndroid
on 4 August 2024 - 14:13 #1318652 Reply to:1318620
lew's picture

งงครับ เขาลดราคาลง ต่อให้เขียนโปรแกรมมี bug ค่าใช้จ่ายที่เกิดก็ลดลงอยู่ดี แล้วมันไม่เป็นประเด็นอย่างไรนะครับ

req-per-min นี่ปกติมีปัญหาตอนต้องการใช้เยอะจริงๆ ต้องขอโควต้ากันเพิ่ม ไม่ใช่เรื่องค่าใช้จ่ายด้วย (อยากจ่ายเยอะแต่ระบบไม่อนุญาต)


lewcpe.com, @wasonliw

By: Tasksenger on 4 August 2024 - 18:19 #1318668 Reply to:1318652

สงสัยผมเข้าใจผิดเอง มันผูก package ไว้กับ google cloud แบบ Pay-as-you-go ซึ่งตอนแรกผมเข้าใจว่ามันคิดแยกออกจาก package หลักหากใช้จาก AI Studio ไม่ใช่ Vertex โดยดูจากการใช้งานว่าเกิน Limit หรือยัง ถ้าเกินแล้วถึงจะเริ่มคิดเงิน เพราะเท่าที่ผมดูถึงจะ overflow ไป token ก็ไม่น่าจะถึงที่มันจะคิดเงิน แต่ค่า rpm น่าจะเกิน limit แน่ๆ เพราะมีบิลเรียกเก็บเงินผมมาในส่วนของ Non-Firebase services ซึ่งมันก็ไม่ได้แจงรายละเอียดอะไรด้วยใน report ขอบคุณมากครับ ผมเองก็กำลังประเมินค่าใช้จ่ายเพื่อคิดต้นทุนอยู่ ก็เลยไปคิดว่ามันคิดจาก rpm ด้วย ถึงมีค่าใช้จ่ายมา เนื่องจากทุกวันที่ผม run โปรแกรม มันจะมีค่าใช้จ่ายมาประมาณวันละ 1 บาท น่าจะเป็นมันคำนวณต่อ token แล้วคิดเงินเลยจาก package ที่ผมใช้ ไม่ใช่จาก rpm

By: lew
FounderJusci's WriterMEconomicsAndroid
on 5 August 2024 - 00:11 #1318686 Reply to:1318668
lew's picture

ปกติแล้ว rate limit ผมเคยเห็นแต่ request ไปแล้วได้ error response กลับมาบอกว่า rate limit reached ไม่เคยเห็นใครใช้ท่าเกิน rate limit แล้วคิดเงิน (พวก provisioned นี่อีกแบบ ต้องจองล่วงหน้า จ่ายเงินเสมอไม่ว่าใช้ไม่ใช้)

ถ้าเชื่อว่า token ไม่เกินจริงๆ ลองเปิด ticket ไปไหมครับว่ามันค่าอะไรกันแน่


lewcpe.com, @wasonliw

By: lew
FounderJusci's WriterMEconomicsAndroid
on 5 August 2024 - 00:17 #1318688 Reply to:1318668
lew's picture

ถ้าเป็น Plan ฟรี ต้องแสดงว่าฟรีในหน้า API เลยครับ

ถ้า Pay-as-You-Go นี่เสียเงินตั้งแต่ req แรก (เงื่อนไขการใช้งานต่างกัน, นำข้อมูลไปฝึกหรือไม่นำไปฝึก + rate limit ต่างกัน) ไม่ได้ใช้ฟรีจนหมดก่อยแล้วค่อยเริ่มคิดเงิน

No Description


lewcpe.com, @wasonliw

By: Fzo
ContributorAndroid
on 4 August 2024 - 03:23 #1318632
Fzo's picture

โอ้ยย ดี เวรี่กู๊ดดด


WE ARE THE 99%

By: hidap on 4 August 2024 - 09:29 #1318639

😂😂มันจะช้าไปหรือเปล่า

By: lew
FounderJusci's WriterMEconomicsAndroid
on 4 August 2024 - 14:14 #1318653 Reply to:1318639
lew's picture

ถ้าฝั่งเสียง Gemini เปิดก่อนมานานแล้วแล้วนะครับ GPT-4o นี่จนทุกวันนี้ยังใส่เสียงผ่าน API ไม่ได้เลย


lewcpe.com, @wasonliw

By: pd2002 on 4 August 2024 - 14:43 #1318660 Reply to:1318653

API ChatGPT ง่อยมาก ทำอะไรก็ไม่ได้ โดนตัดฟีเจอร์เพียบ