با گوگل، دیگر برای ویرایش تصاویر به فتوشاپ نیازی ندارید!

هوش مصنوعی در حال متحول کردن شیوه ویرایش تصاویر است و دیگر نیازی به صرف ساعتها کار با ابزارهای پیچیده فتوشاپ نیست.
گوگل با معرفی مدل جمینای ۲.۰ فلش، قابلیت جدیدی ارائه کرده که امکان ویرایش تصاویر تنها با یک درخواست متنی را فراهم میکند.
این مدل نهتنها از قابلیتهای متنی فراتر رفته، بلکه خروجی چندرسانهای تولید میکند، به این معنا که میتواند همزمان متن، تصویر و محتوای تعاملی ایجاد کند. به عنوان مثال، کاربران میتوانند با این فناوری، بازیهای گرافیکی یا داستانهایی با تصاویری ثابت اما هماهنگ تولید کنند.
یکی از قابلیتهای مهم این مدل، امکان بازسازی تصاویر از زوایای دیگر است. در یک آزمایش، تصویری که به مدل داده شده بود، از زاویهای متفاوت بازآفرینی شد. این ویژگی نهتنها در ویرایش تصویر، بلکه در طراحی سهبعدی، فیلمسازی و حتی فناوریهای واقعیت مجازی کاربرد دارد.
یکی از چالشهای همیشگی مدلهای هوش مصنوعی، درج متن درون تصاویر بوده است. گوگل ادعا میکند که مدل جدیدش در این زمینه عملکرد بهتری نسبت به رقبا دارد، اما بررسیهای اولیه نشان میدهند که هنوز به سطح ایدهآل نرسیده است.
این پیشرفتها چشماندازی از آیندهای را نشان میدهند که در آن، هوش مصنوعی قادر خواهد بود انواع مختلفی از محتوا را در لحظه تولید کند؛ از متن و تصویر گرفته تا صدا، ویدیو، مدلهای سهبعدی و حتی اشیای فیزیکی قابلچاپ با پرینترهای سهبعدی. این فناوری را میتوان مشابه «هولودک» در مجموعه علمیتخیلی پیشتازان فضا دانست، البته بدون قابلیت تکثیر ماده.
با این حال، این مدل همچنان در مراحل اولیه قرار دارد. گوگل تأکید کرده که نسخه کنونی جمینای ۲.۰ فلش در مقایسه با مدلهای بزرگتر، برای اجرای سریعتر و اقتصادیتر طراحی شده است. به همین دلیل، اطلاعات تصویری آن محدود بوده و تمام اینترنت را در خود جای نداده است. دادههای آموزشی این مدل ترکیبی از اطلاعات عمومی و دادههای مصنوعی هدفمند هستند که برای بهبود کیفیت خروجیهای آن به کار رفتهاند.
انتظار میرود که با پیشرفت فناوریهای هوش مصنوعی و کاهش هزینههای پردازشی، این مدلها بهسرعت توسعه پیدا کنند. همانطور که مدلهای تصویری مانند استیبل دیفیوژن و میدجرنی در مدت کوتاهی پیشرفت قابلتوجهی داشتند، مدلهای چندرسانهای نظیر جمینای ۲.۰ فلش نیز در آینده کیفیت بالاتری خواهند داشت.
پیشرفتهای اخیر نشان میدهند که رسانههای دیجیتال در آستانه تحولی بزرگ قرار دارند. در آیندهای نهچندان دور، افراد میتوانند تنها با چند کلمه، تصاویری جدید خلق کرده و دنیای دیجیتال را بهدلخواه خود شکل دهند. حال این پرسش مطرح میشود که آیا این فناوری جایگزین روشهای سنتی ویرایش تصویر خواهد شد؟ شاید هنوز نه، اما آینده گرافیک دیجیتال دیگر مانند گذشته نخواهد بود.