انویدیا با معرفی یک دیتاست عظیم و متنباز، قدم بزرگی برای بهبود ترجمه و شناسایی گفتار در زبانهای اروپایی برداشت.
به گزارش تکراتو و به نقل از slashdot، انویدیا اعلام کرده است که تنها بخش کوچکی از بیش از ۷ هزار زبان موجود در دنیا توسط مدلهای هوش مصنوعی پشتیبانی میشوند.
به همین دلیل این شرکت از یک دیتاست جدید به نام Granary رونمایی کرده که هدف آن پشتیبانی از توسعه ابزارهای هوش مصنوعی باکیفیت برای زبانهای اروپایی است.
این دیتاست شامل بیش از یک میلیون ساعت داده صوتی چندزبانه است که ۶۵۰ هزار ساعت آن مربوط به شناسایی گفتار و ۳۵۰ هزار ساعت به ترجمه گفتار اختصاص دارد.
تیم هوش مصنوعی گفتاری انویدیا با همکاری پژوهشگران دانشگاه کارنگی ملون و بنیاد برونو کسله دادههای صوتی بدون برچسب و سخنرانیهای عمومی را پردازش کرده و به شکل مناسب برای آموزش مدلهای هوش مصنوعی درآورده است.
Granary از ۲۵ زبان اروپایی پشتیبانی میکند که تقریبا تمام زبانهای رسمی اتحادیه اروپا به همراه روسی و اوکراینی را شامل میشود. همچنین زبانهایی با دادههای محدود مانند کرواتی، استونیایی و مالتی هم در این مجموعه حضور دارند.
این موضوع اهمیت زیادی دارد زیرا فراهم کردن دیتاستهای کمیاب و حاشیهای باعث میشود توسعهدهندگان بتوانند فناوریهای گفتاری فراگیرتری تولید کنند و در عین حال به دادههای آموزشی کمتری برای آموزش مدلهای خود نیاز داشته باشند.
نتایج تحقیقات نشان میدهد که با استفاده از Granary تنها نصف دادههای آموزشی نسبت به دیتاستهای معروف دیگر برای دستیابی به دقت بالا در شناسایی و ترجمه خودکار گفتار کافی است.
در کنار این دیتاست، انویدیا از مدلهای جدید Canary و Parakeet نیز رونمایی کرد تا نشان دهد با Granary چه دستاوردهایی ممکن است. نسخه جدید Canary تحت مجوزی نسبتا آزاد برای استفاده تجاری و پژوهشی منتشر شده و زبانهای پشتیبانیشده آن از ۴ زبان به ۲۵ زبان افزایش یافته است.
این مدل کیفیتی مشابه مدلهایی سه برابر بزرگتر ارائه میدهد اما تا ۱۰ برابر سریعتر عمل میکند. مدل Canary با داشتن یک میلیارد پارامتر حتی میتواند به طور کامل روی بیشتر گوشیهای پرچمدار نسل جدید اجرا شود و ترجمه گفتاری را به صورت لحظهای انجام دهد.
طراحی و اجرا :
وین تم
هر گونه کپی برداری از طرح قالب یا مطالب پیگرد قانونی خواهد داشت ، کلیه حقوق این وب سایت متعلق به وب سایت تک فان است
دیدگاهتان را بنویسید