رونمایی از پلتفرم سنجش مدل‌های زبانی فارسی

ما در آزمایشگاه نرم افزار هوشمند، پلتفرمی ایجاد کرده‌ایم که ارزیابی جامعی از مدل‌های زبانی بزرگ (LLM) در زبان فارسی را ارائه می‌دهد. تا امروز، معیار دقیق و شفافی برای عملکرد این مدل‌ها در فارسی وجود نداشت و این پلتفرم به پر کردن این خلأ کمک خواهد کرد.

ویژگی‌های کلیدی:
مقایسه ناشناس و تصادفی: ارزیابی عادلانه و بدون سوگیری مدل‌ها.
جمع‌سپاری ارزیابی‌ها: بهره‌گیری از نظرات متنوع کاربران.
سیستم امتیازدهی: رتبه‌بندی مدل‌ها بر اساس عملکرد و بازخورد کاربران.

کافی است یک پیام را وارد کنید تا پاسخ دو مدل مختلف را دریافت کرده و ارزیابی کنید کدام یک بهتر است. این نتایج می‌تواند به جامعه محققین هوش مصنوعی کمک بسیاری کند.

هدف ما ارائه معیاری قابل اعتماد برای سنجش توانایی مدل‌های زبانی در زبان فارسی است. به زودی می‌توانید نتایج این ارزیابی‌ها را در وب‌سایت مشاهده کنید.

همین حالا به وب‌سایت ما سر بزنید و در این ارزیابی شرکت کنید⇙
https://arena.ssl.qom.ac.ir

Post Views: ۶۴