مدل جدید هوش مصنوعی گوگل می‌تواند ۱۰۰۰ زبان مختلف را درک کند

به گزارش شهرآرانیوز - گوگل اطلاعاتی را درباره یک مدل هوش مصنوعی به اشتراک گذاشته که اولین گام مهم برای حرکت در مسیر دستیابی به این هدف بزرگ است.

گوگل در پست جدیدی در وبلاگ خود اطلاعاتی را درباره مدل گفتار جهانی (USM) به اشتراک گذاشته که در‌واقع خانواده‌ای از پیشرفته‌ترین مدل‌های گفتاری با بیش از ۲ میلیارد پارامتر است. این مدل با ۱۲ میلیون ساعت داده گفتاری و ۲۸ میلیارد جمله از ۳۰۰ زبان آموزش داده شده و فعلاً می‌تواند ۱۰۰ زبان را متوجه شود.

مدل گفتار جهانی که یوتوب هم برای تولید زیرنویس از آن استفاده می‌کند، از فناوری تشخیص گفتار خودکار (ASR) بهره می‌برد. این فناوری قادر است زبان‌هایی مثل انگلیسی، ماندارین، امهری، سبوانو، آسامی و ... را شناسایی و ترجمه کند.

مدل USM به‌عنوان زیربنایی برای ساخت یک سیستم گسترده‌تر استفاده خواهد شد که هدف نهایی گوگل است. در گزارش‌ها پیش‌بینی شده که این شرکت در کنفرانس توسعه‌دهندگان آتی خود از ۲۰ محصول با هوش مصنوعی پرده بردارد و این مدل هم می‌تواند بخشی از این محصولات جدید باشد.

بااین‌حال، یکی از مقاصد احتمالی برای استفاده از مدل‌های زبانی به حوزه عینک‌های واقعیت افزوده مربوط می‌شود. این شرکت در رویداد I/O قبلی خود دمویی از یک عینک هوشمند را به نمایش گذاشت که قادر بود به‌صورت آنی حرف‌های طرف مقابل را به زبان قابل‌فهم برای کاربر ترجمه کند.

البته از آن زمان تاکنون خبر دیگری در این رابطه منتشر نشده است و به‌نظر می‌رسد که هنوز فاصله زیادی تا عرضه این ویژگی در دنیای واقعی داشته باشیم. گفتنی است که متا هم روی ابزار‌های مشابهی برای ترجمه با هوش مصنوعی کار می‌کند که هنوز در مراحل اولیه توسعه قرار دارند.

منبع: دیجیاتو