در هفتههای اخیر، هوش مصنوعی چینی DeepSeek که با هزینهای بهمراتب کمتر از مدلهای آمریکایی توسعه یافته، باعث نوسانات شدیدی در بازارهای مالی و سهام شرکتهای فناوری شده است. حالا محققان دانشگاههای استنفورد و واشنگتن با انتشار مقالهای جدید، از ساخت مدلی مشابه O1 شرکت OpenAI خبر دادهاند که با هزینهای کمتر از 50 دلار توسعه یافته است.
مدل S1؛ یک رقیب کمهزینه اما قدرتمند
بر اساس گزارشهای منتشرشده، این مدل که S1 نام دارد، در آزمونهای مرتبط با ریاضی و برنامهنویسی عملکردی در سطح مدلهای پیشرفتهای مانند O1 و DeepSeek R1 از خود نشان داده است. نکته جالب اینجاست که هماکنون کدهای آموزشی و دادههای مورد استفاده برای توسعه S1 بهطور رایگان در GitHub منتشر شده است.
روش توسعه S1؛ انقلابی در آموزش مدلهای هوش مصنوعی
محققان توضیح دادهاند که ابتدا یک مدل پایه را توسعه داده و سپس از فرایند «تقطیر» برای استخراج قابلیتهای استدلال از یک مدل دیگر استفاده کردهاند. در این فرایند، از مدل Gemini 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.
یکی از نقاط قوت این مدل، سرعت آموزش بسیار بالای آن است. به گفته محققان، مدل S1 تنها در ۳۰ دقیقه و با استفاده از ۱۶ پردازنده گرافیکی انویدیا H100 آموزش داده شده و توانسته در بنچمارکهای معتبر هوش مصنوعی عملکرد چشمگیری داشته باشد.
مقیاسپذیری و برتری نسبت به روشهای سنتی
هدف اصلی تیم تحقیقاتی توسعهدهنده S1، ارائه مدلی با رویکردی ساده اما قدرتمند برای استدلال و مقیاسبندی زمان آزمون بوده است. این قابلیت به مدل اجازه میدهد که قبل از ارائه پاسخ، زمان بیشتری را صرف پردازش و تحلیل کند. پیشتر، OpenAI در مدل O1 و DeepSeek در مدل R1 نیز از این تکنیک بهره برده بودند.
از دیگر نکات مهم این مقاله، اشاره به فرایند «تنظیم دقیق نظارتشده» (SFT) است. در این روش، یک مدل هوش مصنوعی با استفاده از یک مجموعه داده کوچک، آموزش داده میشود تا رفتارهای خاصی را تقلید کند. این تکنیک هزینه کمتری نسبت به یادگیری تقویتی (RLHF) دارد که DeepSeek برای آموزش مدل R1 بر اساس O1 استفاده کرده بود.
آیا S1 بازی هوش مصنوعی را تغییر میدهد؟
انتشار مدل S1 بهصورت رایگان و متنباز میتواند تحولی در توسعه مدلهای استدلالگر ارزانقیمت ایجاد کند. این مسئله نهتنها چالش جدیدی برای شرکتهای بزرگ مانند OpenAI و DeepSeek است، بلکه میتواند مسیر جدیدی برای استفاده عمومی از هوش مصنوعی پیشرفته هموار کند.
Powered by Froala Editor