مایکروسافت از انتشار کردن مدل زبانی کوچک Phi-2 خود با ۲.۷ میلیارد پارامتر خبر داد. Phi-2 یک مدل متنبهمتن هوش مصنوعی است که میتوان آن را روی یک لپتاپ یا گوشی موبایل اجرا کرد. پیشازاین، مایکروسافت مدلهای Phi-1 و Ph-1.5 را نیز با ۱.۳ میلیارد پارامتر انتشار کرده می بود. مدل هوش مصنوعی تازه مایکروسافت از Gemini Nano-2 گوگل و Llama-2 متا کارکرد بهتری دارد.
در چند ماه قبل، مایکروسافت مجموعهای از مدلهای زبانی کوچک (SLM) به نام Phi را انتشار کرده است. Phi-1 ابتدا با ۱.۳ میلیارد پارامتر یا اتصال بین نورونهای مصنوعی انتشار شد و مخصوص کدنویسی پایتون می بود. در شهریورماه نیز مایکروسافت ریسرچ مدل Phi-1.5 را با ۱.۳ میلیارد پارامتر انتشار کرد که با یک منبع داده تازه آموزش دیده می بود. با وجود اندازه کوچک، Phi-1.5 عملکردی تقریباً پیشرفته را در قیاس با دیگر مدلهای با اندازه شبیه اراعه میکرد.
بر پایه بلاگ رسمی مایکروسافت ریسرچ، کارکرد مدل Phi-2 با ۲.۷ میلیارد پارامتر را میتوان با دیگر مدلهای زیاد بزرگتر ازجمله مدل Llama 2-7B متا و حتی مدل Mistral-7B با ۷ میلیارد پارامتر قیاس کرد.
قیاس مدل زبانی کوچک Phi-2 با دیگر مدلهای شبیه
چند روز پیش، گوگل مجموعه مدلهای زبان Gemini را معارفه کرد. Gemini Nano کارآمدترین مدل گوگل است که میتواند مستقیماً روی تراشه موبایل اجرا بشود. مدل زبانی کوچک Gemini Nano ویژگیهایی همانند خلاصهسازی متن، جوابهای هوشمند متنی و تصحیح دستور زبان پیشرفته را مقدور میکند. مدل نانو دو نسخه دارد که نسخه نانو دارای پارامترهای زیاد تر است.
به حرف های مایکروسافت، مدل تازه Phi-2 بهرغم اندازه کوچکتر، مطابق یا حتی بهتر از Gemini Nano-2 گوگل است. علاوه بر کارکرد بهتر Phi-2 نسبت به Gemini Nano-2، این مدل از مدلهای Mistral و Llama-2 نیز در اکثر معیارها پیشی میگیرد.
بااینحال، بهرغم کارکرد قوی مدل تازه مایکروسافت، Phi-2 محدودیت بزرگی دارد؛ اکنون این مدل فقط برای اهداف تحقیقاتی مجوز فعالیت دارد و نمیتوان برای منفعت گیری تجاری از آن منفعتمند شد.
منبع