بسته اینترنت ۱۴۰۴ خبرنگاران چه زمانی فعال می‌شود؟ + فیلم ریتم مخفی مغز در کنترل استرس کشف شد استودیو تیم‌ نینجا: نسخه اصلی بازی Nioh ۳ بهبودها و تغییرات زیادی خواهد داشت گلکسی S25 FE چه زمانی رونمایی می‌شود؟ طرح «نظام‌بخشی فضای مجازی» در مجلس اعلام وصول شد | صیانت ۳ در راه است؟ ضعف آنتن‌دهی و دسترسی دشوار به اینترنت در مشهد در زمان قطعی برق | چرا با قطع شدن برق آنتن موبایل هم می‌رود؟ گوگل در تبلیغ جدید پیکسل ۱۰، هوش مصنوعی اپل را به مسخره کرده است چرا مردم از اینترنت فیبر نوری استقبال نمی‌کنند؟ ویوو X۳۰۰ به دوربین جدید و قدرتمند ساخت سامسونگ مجهز خواهد بود ۸ ترفند جدید و غیرمعمول و کاربردی برای سؤال‌پرسیدن از چت‌جی‌پی‌تی آیا بازی‌های ویدیویی باعث افزایش ضریب هوشی کودکان می‌شود؟ اطلاعیه گروه انتخاب: اختلال ۹۰ درصد تلویزیون‌های اسنوا و دوو حل شده است بعد از نابودی بشریت، احتمالاً اختاپوس‌ها وارث تمدن انسان‌ها خواهند بود! برای اجرای بازی Battlefield ۶ چه مشخصات سیستمی نیاز است؟ چطور بفهمیم چت‌هایمان با ChatGPT در گوگل منتشر شده است یا نه؟ + راهنمای حذف ماجرای عجیب انتشار چت‌های کاربران ChatGPT در گوگل جزئیاتی جدید از زمان و شیوه رفع مشکل تلویزیون‌های هوشمند اسنووا و دوو (۱۱ مرداد ۱۴۰۴) حمله سایبری هکرها به بیش از ۹۰ نهاد آمریکا گوشی گلکسی S۲۵ FE سامسونگ به زودی عرضه می‌شود حساب گوگل کاربران زیر ۱۸ سال با هوش مصنوعی محدود می‌شود نوزادی که رویانش ۳۰ سال پیش فریز شده بود، سالم متولد شد
سرخط خبرها

آپدیت جدید هوش مصنوعی دیپ‌سیک منتشر شد (۸ خرداد ۱۴۰۴)

  • کد خبر: ۳۳۵۵۵۲
  • ۰۸ خرداد ۱۴۰۴ - ۱۳:۱۵
آپدیت جدید هوش مصنوعی دیپ‌سیک منتشر شد (۸ خرداد ۱۴۰۴)
استارتاپ چینی DeepSeek، رقیب جدی شرکت‌های هوش مصنوعی آمریکایی، به‌روزرسانی جدید مدل استدلالی R1 خود را معرفی و منتشر کرده است.

به گزارش شهرآرانیوز؛ DeepSeek که امسال با مدل R1 توجه زیادی را به خود جلب کرد، حالا نسخه جدیدی از این مدل را با مجوز باز MIT روی پلتفرم Hugging Face منتشر کرده است. این مجوز به کاربران اجازه می‌دهد تا از این مدل به‌صورت تجاری استفاده کنند.

به گفته DeepSeek، این به‌روزرسانی جزئی است و نسبت به نسخه قبلی شامل چندین بهبود می‌شود. با این حال، مخزن مربوط به این مدل در Hugging Face فاقد توضیحات دقیق بوده و فقط شامل فایل‌های پیکربندی و وزن‌های مدل است؛ یعنی همان پارامترهایی که رفتار مدل را تعیین می‌کنند.

مدل جدید R1 دارای 685 میلیارد پارامتر است که نشان‌دهنده اندازه عظیم آن است. این حجم بالا باعث می‌شود اجرای مدل بدون تغییرات خاص روی سخت‌افزارهای خانگی ممکن نباشد.

طبق داده‌های منتشرشده توسط برخی کاربران فعال در حوزه مدل‌های هوش مصنوعی، نسخه جدید DeepSeek R1 عملکرد بهتری نسبت به نسخه قبلی خود در بنچمارک Thematic Generation ثبت کرده است. امتیاز این مدل در این آزمون از 1.80 به 1.74 کاهش یافته که نشان‌دهنده بهبود در توانایی مدل برای تولید محتوای موضوع‌محور است؛ چرا که در این معیار، امتیاز پایین‌تر نشان‌دهنده کیفیت بالاتر است.

همچنین کاربر دیگری با انتشار ویدیوی زیر که عملکرد DeepSeek-R1-0528 (نسخه جدید) را در برابر Claude-4-Sonnet نشان می‌دهد، ادعا کرده که این نسخه در حوزه استدلال منطقی با بهبود قابل‌توجهی همراه بوده است. طبق گفته این کاربر، مدل جدید در زمینه توسعه فرانت‌اند و استفاده هوشمندانه‌تر از ابزارها نیز پیشرفت کرده است.

این ارتقاها می‌تواند R1 را به گزینه‌ای قوی‌تر برای توسعه‌دهندگان و کاربران حرفه‌ای تبدیل کند.

DeepSeek در اوایل سال جاری با معرفی نسخه اولیه مدل R1 سر و صدای زیادی به‌پا کرد و حتی با رقبای بزرگی مانند OpenAI مقایسه شد. با‌این‌حال، فناوری این استارتاپ چینی توجه برخی نهادهای نظارتی آمریکایی را نیز به خود جلب کرده و برخی آن را تهدیدی برای امنیت ملی ایالات متحده دانسته‌اند.

این حرکت همچنین موج جدیدی از انتشار مدل‌ها توسط شرکت‌های چینی نظیر علی‌بابا و Zhipu AI را به دنبال داشت.

منبع: دیجیاتو

گزارش خطا
ارسال نظرات
دیدگاه های ارسال شده توسط شما، پس از تائید توسط شهرآرانیوز در سایت منتشر خواهد شد.
نظراتی که حاوی توهین و افترا باشد منتشر نخواهد شد.
پربازدید
آخرین اخبار پربازدیدها چند رسانه ای عکس
{*Start Google Analytics Code*} <-- End Google Analytics Code -->