صفحه نخست

سیاست

اقتصاد

جامعه

فرهنگ‌وهنر

ورزش

علم و فناوری

دین و فرهنگ رضوی

مشهد

چندرسانه‌ای

شهربانو

افغانستان

عکس

کودک

پخش زنده

جام جهانی 2026

صفحات داخلی

ترجمه زنده با صدای واقعی در جمینای۳.۵ | گوگل مرز‌های ترجمه را جابه‌جا کرد

  • کد خبر: ۴۲۱۱۸۷
  • ۲۰ خرداد ۱۴۰۵ - ۱۴:۳۲
گوگل از قابلیت ترجمه زنده در جمینای ۳.۵ رونمایی کرده که می‌تواند به صورت همزمان زبان را تشخیص دهد و ترجمه‌ای با لحن، سرعت و زیروبمی صدای گوینده تولید کند.

به گزارش شهرآرانیوز؛ این سامانه به طور خودکار زبان‌ها را تشخیص می‌دهد و گفتاری تولید می‌کند که لحن، سرعت و زیر و بمی صدای گوینده واقعی را بازتاب می‌دهد. برخلاف ترجمه‌های سنتی که به صورت نوبتی انجام می‌شوند، ترجمه زنده جمینای ۳.۵ یا (Gemini ۳.۵ Live Translate) به طور پیوسته صوت تولید می‌کند و تنها چند ثانیه تأخیر دارد تا دقت معنایی و حفظ بافت گفتار تضمین شود، در حالی که همچنان با سخنان گوینده هماهنگ باقی می‌ماند.

به نقل از گجت، این فناوری در محصولات مختلف گوگل در حال عرضه است. کاربران سازمانی نیز از همین ماه به نسخه پیش‌نمایش خصوصی این قابلیت در گوگل‌میت دسترسی خواهند داشت.

برای کاربران عادی این قابلیت در سیستم‌عامل‌های اندروید و iOS در دسترس خواهد بود. این یکپارچه‌سازی از بیش از ۷۰ زبان پشتیبانی می‌کند که نسبت به محدودیت‌های پیشین، گسترش قابل توجهی محسوب می‌شود.

تجربه کاربری بهبودیافته

کاربران اندروید از یک قابلیت جدید به نام «حالت شنیدن» (Listening Mode) در اپلیکیشن گوگل ترنسلیت بهره‌مند خواهند شد.

این ویژگی به کاربران امکان می‌دهد ترجمه‌ها را مستقیما از طریق بلندگوی مکالمه تلفن خود بشنوند؛ قابلیتی که برای شنیدن خصوصی بدون نیاز به هدفون مفید است. گوگل میت نیز ارتقاء خواهد یافت و از بیش از ۲۰۰۰ ترکیب زبانی در یک جلسه واحد پشتیبانی خواهد کرد؛ جهشی عظیم نسبت به قابلیت‌های قبلی این سرویس که عمدتا بر زبان انگلیسی متمرکز بودند. هدف از این تغییرات، فراهم کردن ارتباطی روان و بی‌وقفه در سطح جهانی است.

مقاومت این مدل در برابر نویز محیطی و توانایی آن در مدیریت ورودی‌های چندزبانه بدون نیاز به تنظیمات دستی، از ویژگی‌های کلیدی آن برای استفاده در شرایط واقعی به شمار می‌رود. این قابلیت‌ها آن را برای ترجمه همزمان در جلسات، کلاس‌های آموزشی و پخش‌های زنده مناسب می‌کند.

بازخورد‌های اولیه شرکای تجاری نشان می‌دهد کیفیت ترجمه، دقت و تأخیر پایین این فناوری بسیار چشمگیر بوده است.

تمام صدا‌های تولیدشده توسط هوش مصنوعی با فناوری SynthID نشانه‌گذاری دیجیتال خواهند شد تا قابل شناسایی باشند و از انتشار اطلاعات نادرست جلوگیری شود.

منبع: ایسنا

ارسال نظرات
دیدگاه های ارسال شده توسط شما، پس از تائید توسط شهرآرانیوز در سایت منتشر خواهد شد.
نظراتی که حاوی توهین و افترا باشد منتشر نخواهد شد.