• แนะนำการใช้งานเบื่องต้น การใช้งาน-community
    ประกาศ :
    • ทำการแก้ไขระบบนับถอยหลังเพื่อดาวน์โหลดไฟล์แล้ว
กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


OpenAI ปล่อยโมเดลแปลงเสียงเป็นข้อความใหม่ เล็กลงครึ่งหนึ่งแต่คุณภาพใกล้เคียงของเดิม ยกเว้นภาษาไทยแย่ลงมาก

ข่าว OpenAI ปล่อยโมเดลแปลงเสียงเป็นข้อความใหม่ เล็กลงครึ่งหนึ่งแต่คุณภาพใกล้เคียงของเดิม ยกเว้นภาษาไทยแย่ลงมาก

News 

Moderator
สมาชิกทีมงาน
Moderator
Verify member
OpenAI ปล่อยโมเดลแปลงเสียงเป็นข้อความ whisper-large-v3-turbo ปรับย่อโมเดลโดยลดชั้น decoder ลงจาก 32 ชั้นเหลือ 8 ชั้น ทำให้พารามิเตอร์เดิม 1,550 ล้านพารามิเตอร์เหลือเพียง 809 ล้านพารามิเตอร์เท่านั้น

หลังจากปรับย่อลงแล้ว ทีมงานนำข้อมูลฝึกของโมเดล large-v3 เดิมมาฝึกซ้ำอีกสองรอบแล้ววัดประสิทธิภาพรวม พบว่าโมเดลกลับไปมีคุณภาพค่อนข้างดีใกล้เคียงกับโมเดลต้นทาง ยกเว้นภาษาไทยและกวางตุ้งเท่านั้นที่ประสิทธิภาพลดลงชัดเจน ในกรณีชุดข้อมูล Common Voice นั้นอัตราคำผิดภาษาไทยสูงขึ้นเกือบ 4 เท่าตัว

แนวทางการพัฒนา whisper-large-v3-turbo ปรับมาจากงานวิจัย Distil-Whisper ที่นำเอาท์พุตจากโมเดลขนาดใหญ่มาฝึกโมเดลขนาดเล็กกว่า แต่ทาง OpenAI อาศัยการฝึกด้วยข้อมูลเต็มแทน

ตอนนี้ whisper-large-v3-turbo เป็นโมเดลเริ่มต้นในแพ็กเกจ openai-whisper เวอร์ชั่นล่าสุด หากใครใช้งานภาษาไทยอาจจะต้องระวังปรับไปใช้โมเดลอื่น

ที่มา - OpenAI/Whisper

No Description


Topics:
OpenAI
Artificial Intelligence

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม ด้านล่าง