وبلاگ
رونمایی از پلتفرم سنجش مدلهای زبانی فارسی
ما در آزمایشگاه نرم افزار هوشمند، پلتفرمی ایجاد کردهایم که ارزیابی جامعی از مدلهای زبانی بزرگ (LLM) در زبان فارسی را ارائه میدهد. تا امروز، معیار دقیق و شفافی برای عملکرد این مدلها در فارسی وجود نداشت و این پلتفرم به پر کردن این خلأ کمک خواهد کرد.
ویژگیهای کلیدی:
مقایسه ناشناس و تصادفی: ارزیابی عادلانه و بدون سوگیری مدلها.
جمعسپاری ارزیابیها: بهرهگیری از نظرات متنوع کاربران.
سیستم امتیازدهی: رتبهبندی مدلها بر اساس عملکرد و بازخورد کاربران.
کافی است یک پیام را وارد کنید تا پاسخ دو مدل مختلف را دریافت کرده و ارزیابی کنید کدام یک بهتر است. این نتایج میتواند به جامعه محققین هوش مصنوعی کمک بسیاری کند.
هدف ما ارائه معیاری قابل اعتماد برای سنجش توانایی مدلهای زبانی در زبان فارسی است. به زودی میتوانید نتایج این ارزیابیها را در وبسایت مشاهده کنید.
همین حالا به وبسایت ما سر بزنید و در این ارزیابی شرکت کنید⇙
https://arena.ssl.qom.ac.ir