ข่าว กูเกิลเปิดให้ใช้ Gemini 2.5 Flash บอกเป็นโมเดลแบบมี Thinking ที่ราคาถูกที่สุด

News · 2025-04-18T08:56:45+0700

หลังจากกูเกิลเปิดตัว Gemini 2.5 Flash โมเดลรุ่นเล็กของซีรีส์ 2.5 ในงาน Google Cloud Next '25 ได้ประมาณหนึ่งสัปดาห์กว่าๆ ก็เริ่มให้บริการผ่าน Google AI Studio และ Vertex AI พร้อมเปิดเผยราคาและความสามารถแล้ว

กูเกิลตั้งราคาของ Gemini 2.5 Flash แพงกว่าโมเดลรุ่นก่อนหน้า Gemini 2.0 Flash เล็กน้อย (แต่ 2.5 มี Thinking ในขณะที่ 2.0 ไม่มี) โดยค่าอินพุตอยู่ที่ 0.15 ดอลลาร์ต่อ 1M token, ค่าเอาท์พุตอยู่ที่ 0.30 ดอลลาร์ต่อ 1M token และ 0.60 ดอลลาร์หากใช้ฟีเจอร์ reasoning ด้วย เทียบกับราคาของ 2.0 Flash ที่คิดอินพุต 0.10 ดอลลาร์และเอาท์พุต 0.40 ดอลลาร์ตามลำดับ

ส่วนผลคะแนนเบนช์มาร์คของ 2.5 Flash เพิ่มขึ้นจาก 2.0 Flash เยอะพอสมควร และค่อนข้างใกล้เคียงกับโมเดลคู่แข่งระดับเดียวกันคือ DeepSeek R1 แต่ค่ารันของ 2.5 Flash ถูกกว่ากันมาก (DeepSeek R1 คิดอินพุต 0.55 ดอลลาร์ เอาท์พุต 2.19 ดอลลาร์)

กูเกิลนิยาม Gemini 2.5 Flash ว่าเป็น "Our most cost-efficient thinking model" ชูจุดเด่นเรื่องราคาต่อประสิทธิภาพที่คุ้มกว่าใครในตลาด (ดูกราฟประกอบ) แนวทางของกูเกิลตอนนี้คือมีโมเดลให้เลือก 4 ตัวตามความเก่ง (2.5 Pro เก่งสุด, 2.0 Flash Lite ถูกที่สุด) แต่ถ้าเทียบประสิทธิภาพต่อราคาแล้ว โมเดลตระกูล Gemini คุ้มค่าที่สุดเมื่อเทียบกับคู่แข่ง

จุดเด่นอีกอย่างของการรัน 2.5 Flash คือระบบ thinking budget กำหนดเพดานจำนวน token ที่ใช้ในโหมด thinking ไว้ได้ล่วงหน้า (ยิ่งใช้ token เยอะยิ่งได้คำตอบคุณภาพสูงขึ้น แต่ก็แพงขึ้น) เพื่อควบคุมต้นทุนในการรันตั้งแต่แรก

ที่มา - Google

กูเกิลเปิดให้ใช้ Gemini 25 Flash บอกเป็นโมเดลแบบมี Thinking ที่ราคาถูกที่สุด-1.jpg

กูเกิลเปิดให้ใช้ Gemini 25 Flash บอกเป็นโมเดลแบบมี Thinking ที่ราคาถูกที่สุด-2.jpg

Topics:
Gemini
LLM
Google

Continue reading...