قطع دسترسی به اینستاگرام، فیس‌بوک و تیک‌تاک در افغانستان | فیلترینگ گسترده اینترنت توسط طالبان سقف قانونی سود موبایل‌فروشان از فروش گوشی چقدر است؟ برندگان نوبل شیمی ۲۰۲۵ اعلام شدند: مبدعان روش‌های نوآورانه‌ در طراحی و سنتز کاتالیزورهای فعال و پایدار ارزان‌ترین نسخه تسلا مدل Y رونمایی شد | تغییرات جدید برای جذب مشتریان اقتصادی دلایل اصلی خرابی زودهنگام مودم چیست؟ دومین درخشش پیاپی گوگل در نوبل فیزیک | تقدیر از پیشگامان محاسبات کوانتومی سامانه اعتراض آنلاین به جریمه‌های رانندگی راه‌اندازی شد احتمال بروز اختلال موقت در بخشی از شبکه ارتباطی خراسان رضوی در بامداد پنجشنبه (۱۷ مهر ۱۴۰۴) تقدیر اینستاگرام از برترین و نوآورترین محتواسازان با Rings Award ایلان ماسک: سال آینده یک بازی تولیدشده با هوش مصنوعی منتشر خواهیم کرد گوگل برای هک هوش مصنوعی جمینی جایزه ۲۰ هزار دلاری تعیین کرد آیا کابل شارژ هم از جعبه گوشی‌ها حذف خواهد شد؟ برندگان نوبل فیزیک ۲۰۲۵ اعلام شدند: کاشفان تونل‌زنی کوانتومی ماکروسکوپی و کوانتیزاسیون انرژی ChatGPT به ۸۰۰ میلیون کاربر هفتگی رسید | رشد بی‌سابقه در کمتر از دو سال گوگل: با محدودکردن نصب برنامه‌های اندروید از منابع غیررسمی به امنیت کاربران کمک می‌کنیم آیا قطع ارتباط با ماهواره‌های هدهد و کوثر به دلیل خرابکاری بوده است؟ برندگان جایزه نوبل پزشکی ۲۰۲۵ معرفی شدند: کاشفان سلول‌های تنظیم‌کننده سیستم ایمنی بدن تیزر جدید کمپانی تسلا: رونمایی احتمالی رودستر نسل جدید یا مدل اقتصادی ارزان‌قیمت؟ دموکرات‌های سنا: هوش مصنوعی باعث حذف میلیون‌ها شغل در آمریکا می‌شود بازی Ghost of Yotei، به صدر جدول فروش بریتانیا رسید پایان دوران صدای رباتیک | هوش مصنوعی صدای انسان را به‌طور واقعی تقلید می‌کند
سرخط خبرها

توانایی مدل هوش مصنوعی Llama ۲ Long متا در پاسخ به سؤالات طولانی

  • کد خبر: ۱۸۶۷۲۴
  • ۰۹ مهر ۱۴۰۲ - ۲۰:۱۲
توانایی مدل هوش مصنوعی Llama ۲ Long متا در پاسخ به سؤالات طولانی
مدل هوش مصنوعی Llama ۲ Long در زمینه پاسخگویی به سؤالات طولانی مهارت دارد و بهتر از بسیاری از رقبای خود عمل می‌کند.

به گزارش شهرآرانیوز - متا چند روز پیش از یک ابزار هوش مصنوعی برای ویرایش تصویر در اینستاگرام و نسل جدید عینک هوشمند خود پرده برداشت. اما محققان این شرکت همچنین بی‌سروصدا مقاله‌ای منتشر کردند که به معرفی مدل هوش مصنوعی Llama ۲ Long می‌پردازد. این مدل ظاهراً در زمینه پاسخگویی به سؤالات طولانی مهارت دارد و بهتر از بسیاری از رقبای خود عمل می‌کند.

مدل هوش مصنوعی Llama ۲ Long نسخه دیگری از مدل Llama ۲ است که در فصل تابستان معرفی شده بود. این مدل می‌تواند از منابع مختلف داده دریافت و کار‌های مختلفی نظیر کدنویسی، ریاضیات، فهم زبان، استدلال و محاوره را انجام دهد.

بااین‌حال، این مدل بیش از همه روی متون طولانی آموزش یافته و به‌گونه‌ای پیکربندی شده است که بتواند دنباله‌های طولانی‌تری از اطلاعات را مدیریت کند. Llama ۲ Long با این قابلیت می‌تواند بهتر از مدل‌هایی مثل GPT-۳.۵ Turbo و Claude ۲ که محدودیت‌هایی در زمینه دریافت ورودی دارند، عمل کند.

متا چگونه مدل هوش مصنوعی Llama ۲ Long را ساخته است؟

پژوهشگران متا برای ساخت این مدل هوش مصنوعی از دو نسخه از Llama ۲ با ۷ تا ۷۰ میلیارد پارامتر استفاده کرده‌اند. سپس ۴۰۰ میلیارد توکن داده دیگر که شامل متونی طولانی‌تر از مجموعه داده‌های نسخه اصلی Llama ۲ بود، به این ترکیب اضافه شد.

محققان همچنین اندکی معماری Llama ۲ را دستکاری کردند و شیوه کدگذاری موقعیت هر توکن در دنباله را تغییر دادند. آن‌ها از تکنیکی موسوم به RoPE بهره گرفتند که هر توکن را به نقطه‌ای در یک گراف سه‌بعدی که وضعیتش را نسبت به بقیه توکن‌ها نشان می‌دهد، وصل می‌کند. با این کار، مدل هوش مصنوعی می‌تواند پاسخ‌های دقیق‌تر و مفیدتری ارائه کند و در عین حال حافظه کمتری مصرف کند.

متا مدعی است که مدل Llama ۲ Long می‌تواند به سؤالاتی با حداکثر ۲۰۰ هزار نویسه که معادل یک کتاب ۴۰ صفحه‌ای است، پاسخ‌های باکیفیت بدهد. در این مقاله که از این لینک قابل دسترس است، نمونه‌هایی از پاسخ‌های این مدل در زمینه موضوعاتی مثل تاریخ، علم، ادبیات و ورزش دیده می‌شود.

دانشمندان می‌گویند Llama ۲ Long گامی به سمت ساخت مدل‌های هوش مصنوعی جامع و همه‌منظوره است که می‌توانند به نیاز‌های مختلف کاربر پاسخ بدهند.

منبع: دیجیاتو

گزارش خطا
ارسال نظرات
دیدگاه های ارسال شده توسط شما، پس از تائید توسط شهرآرانیوز در سایت منتشر خواهد شد.
نظراتی که حاوی توهین و افترا باشد منتشر نخواهد شد.
پربازدید
آخرین اخبار پربازدیدها چند رسانه ای عکس
{*Start Google Analytics Code*} <-- End Google Analytics Code -->