به گزارش شهرآرانیوز، گروه MCINext همراه اول در نخستین روز برگزاری نمایشگاه بینالمللی الکامپ، تعدادی از مدلهای زبانی توسعهیافته خود شامل «سیلک» (با ۱.۳ میلیارد پارامتر)، «آهوران» (با ۸ میلیارد پارامتر) و «آوا» (با ۱۳ میلیارد پارامتر) را با حضور عیسی زارع پور، وزیر ارتباطات و فناوری اطلاعات در سالن اختصاصی همراه اول (سالن ۳۵)، رونمایی کرد.
مدل زبانی بزرگ (LLM)، به سیستمهای هوش مصنوعی گفته میشود که با تحلیل و یادگیری از حجم زیادی از دادههای متنی، قادر به تولید متن، ترجمه، پاسخ به سؤالات و انجام وظایف مختلف زبانی هستند.
مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده، با وجود تعداد پارامتر نسبتاً کم، قابلیت زبانی خوبی را به نمایش میگذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.
مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و بهصورت آموزش ادامهدار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیتهای زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده درحالیکه قابلیتهای دیگر مدل تا حد زیادی حفظ شده است.
کاربردهای تجاری این مدلها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چتباتها، تحلیل احساسات و نظرات کاربران در شبکههای اجتماعی و ایجاد ابزارهای کمکی برای نویسندگان و مترجمان است. این مدلها میتوانند به شرکتها در افزایش بهرهوری، کاهش هزینهها و بهبود تجربه مشتری کمک کنند.
مدل آوا نیز به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت Cohere توسعه داده شده است.
بنا به اعلام همراه اول، تلاش شده است علاوهبر آموزش این مدلها، به کمک روشهای همترازسازی RLHF و DPO از تولید محتوای آسیبزا نیز جلوگیری شود.
گروه MCINext همراه اول قصد دارد در آینده نزدیک امکان استفاده عمومی از این مدلها را فراهم کند.
منبع: دیجیاتو