به گزارش شهرآرانیوز، شرکت اپل، امروز (۲۵ آوریل) چند مدل زبانی بزرگ (LLM) متنباز منتشر کرد که برای اجرا بهصورت محلی روی دستگاه طراحی شدهاند و به سرورهای ابری وابسته نیستند. این چند LLM که OpenELM (مدلهای زبانی کارآمد متنباز) نامیده میشوند، در Hugging Face Hub، انجمنی برای اشتراکگذاری کدهای هوش مصنوعی، دردسترس هستند.
طبق گفتهٔ اپل، در مجموع هشت OpenELM وجود دارد که چهار مدل از آنها با استفاده از کتابخانهٔ CoreNet از قبل آموزش داده شدهاند و چهار مدل دیگر با دستورالعملها آموزش دیدهاند. اپل از یک استراتژی مقیاسبندی لایهای استفاده کرده که هدف آن بهبود دقت و کارایی است.
اپل، بهجای مدلهای آموزشدیدهٔ نهایی، کدها، گزارشهای آموزشی و نسخههای متعدد را ارائه کرده است. محققان امیدوارند که این پروژه منجر به پیشرفت سریعتر و «نتایج قابلاعتمادتر» در زمینهٔ هوش مصنوعی شود.
این شرکت اعلام کرده است هوش مصنوعی جدیدش شامل چارچوب کاملی برای آموزش و ارزیابی مدلهای زبانی بزرگ در دیتاسِتهای دردسترس عموم است، از جمله گزارشهای آموزشی و مواردی از این دست.
اپل، همچنین، میگوید که OpenELM را برای «توانمندسازی و غنیسازی جامعهٔ تحقیقاتی متنباز» با مدلهای زبانی پیشرفته منتشر میکند. بهاشتراکگذاری مدلهای متنباز به محققان راهی برای بررسی خطرات و دادهها و سوگیریهای مدل میدهد. توسعهدهندگان و شرکتها میتوانند از مدلهای پیشفرض به همان شکل استفاده کنند یا در آنها تغییراتی بدهند.
اشتراکگذاری آزاد اطلاعات به ابزار مهمی برای جذب مهندسان، دانشمندان و کارشناسان برتر تبدیل شده است، چراکه فرصتهایی برای مقالات تحقیقاتی فراهم میکند که بهطور معمول تحت سیاستهای محرمانهٔ اپل نمیتوانستند منتشر شوند.
اپل هنوز OpenELM را به دستگاههای خود نیاورده است، اما انتظار میرود iOS 18 تعدادی ویژگی جدید مبتنیبر هوش مصنوعی داشته باشد.
منبع: زومیت