در هفته‌های اخیر، هوش مصنوعی چینی DeepSeek که با هزینه‌ای به‌مراتب کمتر از مدل‌های آمریکایی توسعه یافته، باعث نوسانات شدیدی در بازارهای مالی و سهام شرکت‌های فناوری شده است. حالا محققان دانشگاه‌های استنفورد و واشنگتن با انتشار مقاله‌ای جدید، از ساخت مدلی مشابه O1 شرکت OpenAI خبر داده‌اند که با هزینه‌ای کمتر از 50 دلار توسعه یافته است.

مدل S1؛ یک رقیب کم‌هزینه اما قدرتمند

بر اساس گزارش‌های منتشرشده، این مدل که S1 نام دارد، در آزمون‌های مرتبط با ریاضی و برنامه‌نویسی عملکردی در سطح مدل‌های پیشرفته‌ای مانند O1 و DeepSeek R1 از خود نشان داده است. نکته جالب اینجاست که هم‌اکنون کدهای آموزشی و داده‌های مورد استفاده برای توسعه S1 به‌طور رایگان در GitHub منتشر شده است.

روش توسعه S1؛ انقلابی در آموزش مدل‌های هوش مصنوعی

محققان توضیح داده‌اند که ابتدا یک مدل پایه را توسعه داده و سپس از فرایند «تقطیر» برای استخراج قابلیت‌های استدلال از یک مدل دیگر استفاده کرده‌اند. در این فرایند، از مدل Gemini 2.0 Flash Thinking Experimental گوگل کمک گرفته شده است.

یکی از نقاط قوت این مدل، سرعت آموزش بسیار بالای آن است. به گفته محققان، مدل S1 تنها در ۳۰ دقیقه و با استفاده از ۱۶ پردازنده گرافیکی انویدیا H100 آموزش داده شده و توانسته در بنچمارک‌های معتبر هوش مصنوعی عملکرد چشمگیری داشته باشد.

مقیاس‌پذیری و برتری نسبت به روش‌های سنتی

هدف اصلی تیم تحقیقاتی توسعه‌دهنده S1، ارائه مدلی با رویکردی ساده اما قدرتمند برای استدلال و مقیاس‌بندی زمان آزمون بوده است. این قابلیت به مدل اجازه می‌دهد که قبل از ارائه پاسخ، زمان بیشتری را صرف پردازش و تحلیل کند. پیش‌تر، OpenAI در مدل O1 و DeepSeek در مدل R1 نیز از این تکنیک بهره برده بودند.

از دیگر نکات مهم این مقاله، اشاره به فرایند «تنظیم دقیق نظارت‌شده» (SFT) است. در این روش، یک مدل هوش مصنوعی با استفاده از یک مجموعه داده کوچک، آموزش داده می‌شود تا رفتارهای خاصی را تقلید کند. این تکنیک هزینه کمتری نسبت به یادگیری تقویتی (RLHF) دارد که DeepSeek برای آموزش مدل R1 بر اساس O1 استفاده کرده بود.

آیا S1 بازی هوش مصنوعی را تغییر می‌دهد؟

انتشار مدل S1 به‌صورت رایگان و متن‌باز می‌تواند تحولی در توسعه مدل‌های استدلال‌گر ارزان‌قیمت ایجاد کند. این مسئله نه‌تنها چالش جدیدی برای شرکت‌های بزرگ مانند OpenAI و DeepSeek است، بلکه می‌تواند مسیر جدیدی برای استفاده عمومی از هوش مصنوعی پیشرفته هموار کند.

Powered by Froala Editor