Stable Diffusion مهم‌ترین مدل هوش مصنوعی در هنر است

به تازگی شرکت هوش مصنوعی stability.ai اعلام کرد مدل هوش مصنوعی خود موسوم به Stable Diffusion در دسترس عموم قرار گرفت .این مدل این امکان را به شما می دهد که متنی را برای توصیف صحنه ای که مد نظر دارید وارد کنید سپس هوش مصنوعی تصویری شگف انگیز برایتان ایجاد خواهد کرد

به دو دلیل این خبر بسیار حائز اهمیت می باشد

اولا بر خلاف DALL-E 2 و Midjourney هوش مصنوعی Stable Diffusion به صورت اپن سورس می باشد این بدان معناست که هر کسی میتواند زیر ساخت آن را برای توسعه برنامه های تبدیل متن به تصویر سفارشی خود استفاده کند.

توسعه دهنده های Midjourney قابلیتی را فراهم آوردند تا با استفاده از آن افراد توانایی ترکیب آن با Stable Diffusion را داشته باشند که منجر به نتایج شگف انگیزی شد (گرچه این امکان در حال حاضر از دسترس خارج است اما به محض اینکه آنها راهی برای جلوگیری از تولید نتایج مضر پیدا کنند در دسترس عموم قرار خواهد گرفت )

تصویر ساخته شده توسط هوش مصنوعی

نمونه تصویر با ترکیب Stable Diffusion و Midjourney

زمانی که این مقاله نوشته شده می شود تنها 72 ساعت از انتشار Stable Diffusion گذشته است، تصور کنید قابلیت های آن در هفته ها و ماه های آینده چگون خواهد بود

دوما بر خلاف DALL-E 2 و Disco Diffusion ، Stable Diffusion تصاویر شگفت انگیز و واقع گرایانه ای تولید می کند که اصلا با مدل های OpenAI و Google قابل رقابت نیستند

برای اینکه با قدرت هوش مصنوعی Stable Diffusion آشنا شوید چند نمومه از تصاویر ساخته شده توسط هوش مصنوعی را در ادامه مقاله آورده ایم

ai generated art

خودرو طراحی شده با هوش مصنوعی

تصویر دشت به وسیله هوش مصنوعی

هوش مصنوعی Stable Diffusion در برگیرنده بهترین خصوصیت های هوش مصنوعی در زمینه هنر می باشد. شاید بهترین مدل هوش مصنوعی اوپن سورس باشد که تا کنون عرضه شده است

شاید تصور کنید که مدل های هوش مصنوعی سال ها تا تجاری شدن فاصله داشته باشند، اما هوش مصنوعی Stable Diffusion بر خلاف مدل های دیگر روی لبه مرز فاز تحقیقاتی و کاربرد در زندگی واقعی است (هم جالب هم بدر بخور) . همین حالا هم توسعه دهندگان برنامه های ساخته اند که بزودی کاربرد آنها را خواهید دید

شگفت انگیز خواد بود که ممکن است در باره این نرم افزار ها از کسانی که اصلا انتظار ندارید مطلع شوید افرادی که خارج از دنیای هوش مصنوعی هستند مانند والدین، فرزندان، دوستان و همکاران

هنر ممکن است راهی باشد که از طریق آن فناوری هوش مصنوعی سرانجام درب کسانی را می زند که در غیر این صورت از آینده ای که در انتظارشان است غافل هستند. شاعرانه نیست

چیزی فراتر از DALL-E اوپن سورس

Stability.ai به وجود آمده تا ابزار های هوش مصنوعی رایگانی ارائه دهد که ما را تا سر حد توانایی هایمان پیش ببرد. نه فقط مدل‌ های تحقیقاتی که هرگز به دست عموم مردم نخواهند رسید ، بلکه ابزارهایی یا برنامه ‌های کاربردی در دنیای واقعی برای من و شما، برای استفاده و کاوش.

این یک تفاوت بزرگ با کمپانیهای مطرح هوش مصنوعی نظیر OpenAi است که از اسرار بهترین سیستم های خود مانند GPT-3, DALL-E 2 به شدت محافظت می کند یا حتی گوگل که اجازه استفاده از PaLM, LaMDA, Imagen, or Parti خود را هم نمی دهد. چندین ماه قبل شایعاتی در مورد اینکه Stability.ai تصمیم به ساخت هوش مصنوعی برای رقابت با DALL-E 2 دارد شنیده می شد اما چیزی که اتفاق افتاد فرا تر چیزی بود که آنها انتظارش را داشتند.

مردم علاقه ای به دیدن کارهای که دیگران با هوش مصنوعی انجام می دهند نداند، آنها می خواهند خودشان این تجربه را کسب کنند. این شرکت پا را فراتر گذاشته و نه تنها کد و وزن های شبکه عصبی را منتشر کرده بلکه در وب سایتی این امکان را به عموم مردم داده تا بدون درگیری با کدها و الگوریتم ها، خودشان درون وب سایتی به راحتی و بدون استفاده از کدهای کامپیوتری این هوش مصنوعی را درک کنند

نام وب سایت آنها DreamStudio است. استفاده از قابلیت های آن تا 200 تصویر رایگان است. مشابه با DALL-E 2 امکان خرید اشتراک برای 1000 تصویر به قیمت 10 دلار وجود دارد (در OpenAI شما اجازه استفاده 15 بار در ماه به صورت رایگان را دارید و برای بیشتر از آن باید اشتراک تهیه کنید) اشتراک DALL-E2 به ازای هر تصویر 0.03 دلار است اما DreamStudio به ازای هر تصویر 0.01 دلار هزینه دارد

علاوه بر اینها امکان استفاده از api آنها در پروژه های دیگر وجود دارد و طبق اعلام این شرکت هوش مصنوعی به زودی پروژه DreamStuio Pro که شامل صدا و تصویر است را معرفی خواهند کرد

امکان دیگری که به احتمال زیاد در آینده نزدیک توسط آنها معرفی خواهد شد تولید تصاویر با استفاده از تصاویر دیگر می باشد بر خلاف حالت تبدیل نوشته به عکس توسط هوش مصنوعی که در حال حاضر امکان استفاده از آن وجود دارد

اگر با مفهوم ساخت تصویر به وسیله هوش مصنوعی آشنا نیستید، در وب سایت آنها جایی وجود دارد که می توانید در آن عبارت مورد نظر خود را بنویسید (توجه کنید در حال حاضر ارتباط مطلوب با هوش مصنوعی به وسیله نوشته ممکن است مقداری دشوار باشد) همچنین بر خلاف DALL-E 2 و Craiyon امکان تنظیم برخی از پارامتر ها فراهم آمده است تا بتوانید کنترل بهتری روی نتایج خروجی داشته باشید.

آنها هر کاری که می توانستند انجام داده اند تا دسترسی کاربران به هوش مصنوعی راحت تر شود OpenAI در ابتدا برای اینکه بتواند ارزیابی نسبت به ریسک ها و سوگیری های مدل داشته باشد عرضه آن را آهسته و به صورت نسخه آزمایشی خصوصی آغاز کرد اما بر خلاف آنها Stable Diffusion امکان استفاده توسط عموم را فرآهم آوردند

امنیت، حریم شخصی و باز بودن

تکنولوژی های اوپن سورس محدودیت های خاص خود را دارند و به طور کلی اولویت متن باز بودن باید بالاتر از حفظ حریم شخصی باشد اما نباید بالاتر از ایمنی قرار بگیرد

Stability.ai به خوبی به این نکته توجه کرده است آنها مدل خود را تحت Creative ML openRAIL-M license عرضه کرده اند که اجازه استفاده به طور تجاری و غیر تجاری از هوش مصنوعی به شرط باز و شفاف و مسئولیت پذیر بودن است را می دهد

باز بودن این مدل به خودی خود گامی عالی است، اما اگر بخواهیم این فناوری در نهایت به مردم آسیب نرساند یا در قالب اطلاعات نادرست، آسیب بیشتری به اینترنت اضافه کند، ایجاد محافظ های معقول به همان اندازه مهم است. اما باز هم ممکن است این اتفاق بیافتد این هوش مصنوعی ممکن است محتوی توهین آمیز یا خطرناک تولید کند بنابراین سیاست های کاهش باز بودن مدل همچنین بحث آزاد در مورد آن سوگیری ها می تواند همه را به این بحث بکشاند که باز بودن به علاوه ایمنی از حفظ حریم شخصی مهم تر است

هنر هوش مصنوعی

Stable Diffusion با بنیادی قوی از ارزش‌های اخلاقی و باز بودن، قول می‌دهد از رقبای خود از نظر تأثیرگذاری در دنیای واقعی فراتر رود. برای کسانی که می خواهند آن را دانلود کرده و روی رایانه شخصی خود اجرا کنند، باید بدانید که به 6.9 گیگابایت VRAM نیاز دارد که در ردیف یک پردازنده گرافیکی خانگی رده بالا قرار می گیرد که میتواند برای اکثر کاربران دور از دسترس باشد.

Stable Diffusion به عنوان بهترین مدل هوش مصنوعی مولد هنر در نظر گرفته می‌شود، زیرساختی برای برنامه‌ها، وب‌ سایت ها و سرویس‌های بی‌شماری خواهد بود که نحوه ایجاد و تعامل ما با هنر را بازتعریف می‌کنند. تا قبل از معرفی stable diffusion اگر انتظار نتایج مطلوبی داشتید باید از DALL-E 2 یا Midjourney استفاده میکردید که محدودیت هایی در زمینه شفاف بودن نوع مدل مورد استفاده آنها وجود داشت

نگرانی هنرمندان

تغییرات پارادایم در سطح جهانی برای همه خوشایند نیست. ما اکنون در حال وارد شدن به وضعیتی بسیار پیچیده هستیم ( که در حال حاضر با ماهیت اوپن سورس بودن مدلهای هوش مصنوعی شتاب گرفته است )

هنرمندان و کسانی که کارهای خلاقانه انجام می دهند بسیار ابراز نگرانی می کنند که به جا هم هست. خیلی ها شغلشان را از دست خواهند داد و نمی توانند با هوش مصنوعی رقابت کنند. اما این را هم باید مد نظر قرار داد که شاید هنر تولید شده توسط هوش مصنوعی هیچ وقت جایگزین هنر انسان نشود و ممکن است نوع جدیدی هنر در زمینه ای که در حال حاضر وجود ندارد ایجاد کند.

هوش مصنوعی تولید کننده تصویر

کلام آخر

بدون شک انتشار نسخه عمومی و اوپن سورت هوش مصنوعی Stable Diffusion مهمترین اتفاقی است که تا کنون برای مدل های هوش مصنوعی در رشته های هنر افتاده است و این تازه آغاز ماجراست همانطور که از موسس آن در توییتر نوشت آنها قصد دارند در آینده این تکنیک هوش مصنوعی را برای صدا، ویدئو، مدل های سه بعدی و زبان های برنامه نویسی توسعه دهند

ما در آستانه یک انقلاب چند ساله در نحوه تعامل، ارتباط و درک هنر به طور خاص و خلاقیت به طور کلی هستیم. دنیای خلاقیت برای همیشه تغییر خواهد کرد و ما باید گفتگوهای باز و محترمانه داشته باشیم تا آینده بهتری برای همه ایجاد کنیم.