دستیار هوش مصنوعی Gemini اکنون قابلیت جدیدی را اضافه کرده که از فایلهای صوتی پشتیبانی میکند. این ویژگی موجب میشود صداها به متن تبدیل و اطلاعات کلیدی استخراج شوند، موضوعی که کاربران زیادی انتظار آن را داشتند.

دستیار هوش مصنوعی Gemini از کمپانی گوگل به تازگی قابلیت جدیدی دریافت کرده است که از فایلهای صوتی حمایت میکند. کاربران میتوانند با آپلود فایلهای صوتی در این دستیار، به سرعت تبدیل صدا به متن، خلاصهسازی و استخراج امور کلیدی را انجام دهند. این ویژگی مخصوصاً برای کسانی که از یادداشتبرداری دستی یا تکرار جلسات طولانی خسته شدهاند، ارزشمندی زیادی دارد.
قابلیت تبدیل فایلهای صوتی به متن امکان جستجوی سریع و آسان فایلهای صوتی را فراهم کرده است. دستیار هوش مصنوعی Gemini توانایی دارد تا 10 دقیقه از صدا را پردازش کند و اطلاعات مفید را به مستندات قابل جستجو تبدیل کند. این ویژگی، فرایندهایی که قبلاً نیاز به نرمافزارهای جداگانه داشت، به یک گام ساده تبدیل کرده است.
ارتقای جدید Gemini در کنار دیگر ویژگیهای بهینهسازی شده این دستیار هوش مصنوعی، مانند ادغام در برنامهها و گزینههای شخصیسازی متنوع، نشاندهنده پیشرفتهای مستمر گوگل در این زمینه است. از طرفی دیگر، پشتیبانی از فایلهای صوتی با هدف کاربردهای روزمره، تفاوت مهمی نسبت به ویژگیهای مشابهی که در دیگر دستیاران وجود دارد، ایجاد کرده است.
گوگل اعلام کرده است که ویژگی آپلود فایلهای صوتی یکی از بیشترین درخواستها از سمت کاربران بوده و نائب رییس Gemini، آقای جاش وودوارد، نیز این خبر را تایید کرد.

در آزمایشهای من، Gemini توانست تمامی کلمات موجود در فایلهای صوتی بارگذاری شده را به دقت تبدیل کند و حتی نکات کلیدی و موضوعات مهم را استخراج نماید. این قابلیت محدود به 10 دقیقه است، و کاربران در پلنهای رایگان محدودیتهایی برای استفاده روزانه دارند.
در مقایسه با دستیاران دیگر مثل ChatGPT و ابزارهای مشابه، پیشنهاد گوگل نظیر Whisper از نظر دقت و کارایی بهتر عمل میکند. همچنین، استفادههای متنوع مثل سادهسازی زبان، استخراج نظرات خاص سخنرانان و تولید سوالات بر اساس محتوای صدا، این ویژگی را به یک ابزار تبدیل کامل تبدیل کرده است.
نتیجهگیری
دستیار هوش مصنوعی Gemini با اضافه کردن قابلیت پشتیبانی از فایلهای صوتی، گامی بزرگ در جهت استفاده روزمره و کاربردهای متعدد برداشته است. این ویژگی جدید به کاربران امکان میدهد تا به راحتی فایلهای صوتی خود را به متن قابل جستجو تبدیل کرده و از اطلاعات کلیدی بهرهبرداری کنند.


