به گزارش شهرآرانیوز، همزمان با داغشدن رقابت جهانی بر سر رهبری در فناوری هوش مصنوعی، علیبابا، روز جمعه (۲۵ اوت/ ۳ شهریور)، مدلی جدید از این فناوری را راه انداخت که بهگفتهٔ این شرکت میتواند تصاویر را درک کند و، در مقایسه با محصولات پیشین ایشان، مکالمات پیچیدهتری انجام دهد.
این غول چینی فناوری گفت که دو مدل جدیدش، یعنی Qwen-VL و Qwen-VL-Chat، متنباز خواهند بود، به این معنی که پژوهشگران، دانشگاهیان و شرکتها ــ در سراسر جهان ــ میتوانند، بی آنکه لازم باشد سیستمهایشان را آمادهسازی کنند، از آنها برای ساخت برنامههای هوش مصنوعی ویژهٔ خود بهره بگیرند؛ بدین ترتیب، در زمان و هزینه صرفهجویی میشود.
علیبابا گفت که Qwen-VL میتواند به بینهایت پرسش در باب تصاویر مختلف پاسخ دهد و از آنها شرحی بهدست دهد. Qwen-VL-Chat «تعامل پیچیدهتری» دارد و ــ مثلاً ــ میتواند تصاویر ورودی متعدد را با یکدیگر مقایسه کند و به چند دور سؤال پاسخ گوید. برخی از کارهای دیگر عبارتاند نوشتن داستان و تصویرسازی بر اساس عکسهایی که کاربر وارد میکند و همچنین حل معادلات ریاضی مندرج در تصویر.
یکی از مثالهای علیبابا در این زمینه تابلوی چینی درْ ورودی بیمارستان است: هوش مصنوعی میتواند، با تفسیر تصویر علامتها، به سؤالات مربوط به جانمایی بخشهای خاص بیمارستانی پاسخ دهد.
تاکنون، اغلب نمونههای هوش مصنوعی مولد (گونهای از این فناوری که بر اساس ورودیهای انسانی پاسخهایی عرضه میدارد) متمرکز بر پاسخ به متن بودهاند. گفتنی است که آخرین نسخهٔ ChatGPT شرکت OpenAI نیز مانند Qwen-VL-Chat توانایی درک تصاویر و پاسخگویی در قالب متن را دارد.
منبع: سیانبیسی