ارائه شکایت جدید ایران از استارلینک به اتحادیه بین‌المللی مخابرات همه چیز درباره نسخه جدید بازی جنگ‌های صلیبی (۲۰۲۵) + سیستم مورد نیاز و گیم پلی واکنش ستار هاشمی به بحث‌های اخیر درباره اینترنت طبقاتی (۲۶ تیر ۱۴۰۴) چرا بحث «اینترنت طبقاتی» در ایران دوباره جنجالی شد؟ + واکنش‌ها و حواشی ۴ مهارتی که کودکان را برای دنیای آینده آماده می‌‌کند بعد از جنجال‌های اخیر xAI دستورالعمل‌های این هوش مصنوعی اصلاح شد در ماه اخیر از حدود ۱۷۰ کشور به زیرساخت‌های کشور حملات سایبری شده است مدیرعامل انویدیا: هوش مصنوعی نحوه انجام ۱۰۰ درصد کار‌ها را تغییر می‌دهد «همراهان» (Companions): قابلیت جدید Super Grok برای مشترکین صحبت‌های جدید سخنگوی دولت درباره ارائه اینترنت آزادتر به خبرنگاران و احتمال رفع فیلتر تلگرام (۲۴ تیر ۱۴۰۴) Sun Day: اپ جدید جک دورسی برای ثبت ویتامین D دریافتی فرد اضافه‌شدن ویژگی‌های جدید به برنامه‌های آفیس ویندوز ۱۰ از سال ۲۰۲۶ متوقف می‌شود ویدئو | وزارت ارتباطات درباره اختلال مسیریاب‌ها: متوجه سختی وارد شده به مردم هستیم! چرا باید برای رسیدن به بهترین پاسخ از چندین هوش مصنوعی استفاده کرد؟ گوگل می‌خواهد ChromeOS و اندروید را با هم ادغام کند ویوو ایکس فولد ۵، سبک‌ترین گوشی تاشدنی کتابی دنیا، معرفی شد + مشخصات اپل آیفون ۱۷ را چه زمانی معرفی می‌کند؟ ماجرای اختلال در دامنه‌های ir چه بود؟ (۲۳ تیر ۱۴۰۴) غم و اندوه فصل تابستان یک حقیقت واقعی است! محققان ایمپلنت هوشمندی ساخته‌اند که به‌طور خودکار در بدن بیماران دیابتی دارو آزاد می‌کند چگونه هوش مصنوعی ورزش تنیس را متحول می‌کند؟
سرخط خبرها

ChatGPT علاوه‌بر مکالمه متنی به مکالمه صوتی هم مجهز می‌شود

  • کد خبر: ۱۸۵۸۱۲
  • ۰۳ مهر ۱۴۰۲ - ۲۰:۰۰
ChatGPT علاوه‌بر مکالمه متنی به مکالمه صوتی هم مجهز می‌شود
ChatGPT در حال تبدیل‌شدن به چیزی فراتر از یک موتور جستجوی مبتنی بر متن است. OpenAI امروز اعلام کرد که هوشمند‌سازی‌های جدیدی مبتنی بر صدا و تصویر به این مدل اضافه می‌کند.

به گزارش شهرآرانیوز - دستیار هوش مصنوعی مولد یکی از بزرگترین دستاوردهای فناوری در چند وقت اخیر بوده است. این دستیار به هر کسی اجازه می‌دهد تا مقاله و شعر و هر متنی را با اعلان‌های ساده مبتنی بر متن تولید کند. اما اکنون، ChatGPT در شرف تعامل بسیار بیشتر است و کاربران می‌توانند با چت‌بات مکالمه صوتی داشته باشند.

این خبر همان روزی منتشر شد که آمازون متعهد شد ۴ میلیارد دلار در رقیب OpenAI Anthropic سرمایه‌گذاری کند؛ اقدامی که بخشی از نبرد بزرگ‌تر هوش مصنوعی بین غول‌های فناوری جهان را تشکیل می‌دهد.

با ترکیب دنیای آشنای دستیار‌های مبتنی بر صدا و مدل‌های قدرتمند زبان بزرگ (LLM)، امروز یک تحول قابل‌توجه در جنبش هوش مصنوعی اتفاق افتاده است.

برای مثال، یک کاربر می‌تواند به‌صورت شفاهی و با دادن چند دستور از ChatGPT بخواهد تا یک داستان را برای قبل از خواب بسازد و روایت کند. یا کاربر می‌تواند به سادگی از این دستیار سوال بپرسد و ChatGPT پاسخ خود را به صورت کلامی بیان کند.

در جا‌های دیگر، کاربران ChatGPT می‌توانند با استفاده از تصاویر، پاسخ‌ها را جستجو کنند. برای مثال، عکسی از چیزی را آپلود کنند و از ChatGPT بخواهند توضیح دهد که این تصویر چیست، یا دستورالعمل‌هایی برای تکمیل یک هدف ارائه دهد.

ویژگی صوتی را یک مدل جدید تبدیل متن به گفتار ارائه می‌کند که می‌تواند صدا‌هایی شبیه انسان را از متن و چند ثانیه نمونه گفتار تولید کند. OpenAI گفته است که با صداپیشگان معتبر برای ایجاد پنج صدای مختلف، با سیستم تشخیص گفتار منبع‌باز Whisper که برای تبدیل جملات شفاهی به متن استفاده می‌شود، همکاری کرده است.

اسپاتیفای هم به‌عنوان شریک این ویژگی معرفی شده است. غول پخش موسیقی یک ویژگی جدید و به شدت کاربردی را برای پادکست‌ها معرفی کرده که با آن می‌توان صدای خودمان را نمونه‌برداری کنیم و پادکست‌هایمان را از انگلیسی به صوت اسپانیایی، فرانسوی یا آلمانی ترجمه کنیم. به نظر می‌رسد که OpenAI مراقب است که در این زمینه هدف انتقادات قرار نگیرد، زیرا این فناوری را در دسترس کسی قرار نمی‌دهد. الان به‌طور خاص فقط چند پادکست از این ویژگی استفاده می‌کنند.

OpenAI در پستی نوشته است: «فناوری صوتی جدید - که قادر به ساخت صدا‌ از تنها چندثانیه گفتار واقعی است - در‌ها را به روی بسیاری از برنامه‌های کاربردی و خلاقانه باز می‌کند.» با این حال، این قابلیت‌ها خطرات جدیدی را نیز به همراه دارند، مثل جعل هویت افراد یا کلاهبرداری.

گزارش خطا
ارسال نظرات
دیدگاه های ارسال شده توسط شما، پس از تائید توسط شهرآرانیوز در سایت منتشر خواهد شد.
نظراتی که حاوی توهین و افترا باشد منتشر نخواهد شد.
پربازدید
{*Start Google Analytics Code*} <-- End Google Analytics Code -->