ابزار DragGAN رقیب جدی Warp فتوشاپ
تحقیقات جدید هوش مصنوعی با توسعه برنامه DragGAN به شما این امکان را میدهد روی عکسها کلیک کرده و بکشید تا بتوانید در چند ثانیه آنها را دستکاری کنید این ابزار DragGAN مانند ابزار Warp فتوشاپ عمل میکند اما بسیار قدرتمندتر. حتی میتوانید تصاویر را طوری بچرخانید که انگار سه بعدی هستند. کافی است خودتان ویدئوها را تماشا کنید تا به توانایی حیرت انگیز ابزار Drag GAN در خلق تصاویر واقع گرایانه با استفاده از هوش مصنوعی پی ببرید. دفعه بعد اگر تصویری کاملا طبیعی از یک شیر در آغوش یک کفتار را دیدید، دیگر نباید به چشمهایتان شک کنید!
ابزار DragGAN چیست؟
ایجاد محتوای بصری که متناسب با نیازهای کاربر باشد. اغلب مستلزم کنترل دقیق و منعطف بر ویژگیهایی مانند: حالت، شکل، بیان، و چیدمان اشیا تولید شده است. روشهای سنتی برای کنترل شبکههای متخاصم مولد (GAN)، به دادههای دستی یا مدلهای سه بعدی قبلی متکی هستند. با این حال، این رویکردها اغلب فاقد دقت، انعطاف پذیری و عمومیت هستند. در پاسخ به این کاستیها، موسسه Max Planck DragGAN ابزار DragGAN را معرفی میکند، رویکرد جدیدی که به کاربران اجازه میدهد تا به صورت تعاملی هر نقطه در یک تصویر را به مکانهای مورد نظر بکشند.
ابزار DraGAN شامل چند جز است؟
DragGAN شامل دو جز اصلی است: نظارت بر حرکت و رویکرد جدید ردیابی نقطهای. نظارت حرکت امکان حرکت توسط کاربر را در نقاط دسته در تصویر به سمت موقعیتهای هدف فراهم میکند. رویکرد ردیابی نقطهای از ویژگیهای متمایز ژنراتور استفاده میکند تا مکانها را در حین جابجایی ردیابی کند. در نتیجه، کاربران میتوانند تصاویر را با دقت تغییر شکل دهند و بر ویژگیهایی مانند: حالت، شکل، بیان و چیدمان در دستههای مختلف مانند: حیوانات، ماشینها، انسانها و مناظر تاثیر بگذارند.
نحوه کار با ابزار DragGAN
برای دستکاری تصاویر با استفاده از ابزار DragGAN کافیست بر روی نقاط دلخواه تصویر کلیک کرده و آن را بکشید تا تغییرات توسط مدل هوش مصنوعی اعمال شود. در واقع این مدل هوش مصنوعی، تغییرات کاملا مرتبطی بر روی تصاویر اعمال میکند تا یک تصویر جدید اما مرتبط با تصویر اصلی خلق شود. این ابزار جدید نه تنها میتواند اندازه یک خودرو را دستکاری کند یا لبخند را بر روی چهره موجود در عکسها بیاورد، بلکه حتی از عهده تغییر جهت و چرخش عناصر موجود در تصاویر هم بر میآید. البته برای این کار باید تصویر یک مدل سه بعدی باشد.
محققان این مدل که DragGAN نام دارد توضیح میدهند: «رویکرد ما میتواند محتواهای غیر قابل دسترس مانند دندانهای داخل دهان یک شیر را نیز متصور شود و میتواند اجسام را براساس سختی آنها تغییر شکل دهد، مانند خم کردن پاهای یک اسب.» البته این مدل در حال حاضر فقط یک نسخه آزمایشی است و باید ارزیابیهای کاملی روی آن انجام شود.
ابزار DragGAN شبیه Warp فتوشاپ
این ابزار که عملکردی شبیه ابزار Warp در فتوشاپ دارد، به شما این امکان را میدهد ابعاد یک خودرو یا حالت چهره را تغییر دهید و اگر مدلی سه بعدی در اختیار داشتید آن را به سادگی بچرخانید. شرکت Verge این ابزار را با ابزار Warp در فتوشاپ مقایسه کرد و گفت این ابزار بسیار قدرتمندتر است. زیرا پیکسلها را به هم نمیریزد، بلکه شی زیرین را دوباره تولید میکند و حتی میتواند تصاویر سه بعدی را بچرخاند. نکته قابل توجه دیگر که باعث میشود این مدل هوش مصنوعی که هنوز در مرحله مقاله تحقیقاتی قرار دارد جذابیت زیادی داشته باشد، رابط کاربری آن است که از طریق آن میتوانید تصویر خود را براساس پارامترهای مختلفی تغییر دهید و تنظیم کند. هر چند در حال حاضر نیز مدلهای زیادی وجود دارند که براساس توضیحات کاربران میتوانند تصاویر را ایجاد کنند، اما اکثر این روشها فاقد انعطاف پذیری و دقت هستند.
بر اساس گزارش ورج، این نخستین باری نیست که ابزارهای این چنینی را میبینیم اما هیچ یک از ابزارهای قبلی تا این حد عملکرد سادهای نداشتهاند. بسیاری از سرویسهای هوش مصنوعی نیاز به آموزش ویژه دارند، با این حال کاربران عادی نیز میتوانند با ابزار DragGAN کار کنند.
برنامههای مشابه به ابزار DragGAN
برندهای زیادی وجود دارند که سعی در ارائه گزینههای ویرایش برای محتوای تولیدی هوش مصنوعی دارند. با این حال، اکثر آنها تا آنجا که اجازه ویرایش واقعی تصاویر را میدهند پیش نمیروند، بلکه بیشتر به جنبههایی مانند: ویرایش پیرامون تصاویر میپردازند. به عنوان مثال: اپلیکیشن Designer مایکروسافت به شما امکان میدهد تصاویر هوش مصنوعی را از یک پیام متنی تولید کنید. و میتوانید عکس مورد علاقه خود را از بین سه نتیجه انتخاب کنید. سپس آن را به استودیوی طراحی ببرید. جایی که میتوانید مجموعهای از پروژههای مبتنی بر خلاقیت و بهره وری ایجاد کنید. مانند پستهای رسانههای اجتماعی، دعوت نامهها، کارت پستالهای دیجیتال یا تصاویر گرافیکی با تصویر به عنوان نقطه کانونی. با این حال، شما نمیتوانید تصویر ایجاد شده توسط هوش مصنوعی را ویرایش کنید. در صورتی که با ابزار Drag GAN میتوانید هر عکسی هر طوری که میخواهید ادیت کنید.
ابزار DragGAN نسخه دمو
با توجه به اینکه ابزار Drag GAN در حال حاضر هنوز یک نسخه نمایشی است. نمیتوان گفت که کیفیت یک فناوری چقدر خوب یا بد است. به خصوص که دموها بر اساس ویدیوهای با وضوح پایین هستند. با این حال، این یک مثال جالب از سرعت توسعه هوش مصنوعی است. برخی از دموهایی که بخشی از مقاله تحقیقاتی هستند عبارتند از: افزودن ارتفاع به کوه، تغییر موقعیت یک مدل و ویرایش طول و شکل لباس، باز یا بسته کردن دهان شیر، تغییر چهره یک فرد از ظاهر ساده به یک لبخند. با بسیاری از ابزارهای هوش مصنوعی که در حال حاضر در دسترس هستند، کاربران باید یک تصویر را با یک اعلان خاصتر بازسازی کنند تا نتیجه مطلوبتری به دست آورند.
نتیجه گیری
در نتیجه، ابزار DragGAN نشان دهنده یک پیشرفت قابل توجه در زمینه دستکاری تصویر مبتنی بر GAN است. این روش از یک GAN از پیش آموزش دیده برای تولید تصاویری استفاده میکند. که از نزدیک ورودی کاربر را دنبال میکنند و در عین حال واقع گرایانه هستند. DragGAN با استفاده از بهینه سازی کدهای پنهان و روش ردیابی نقطه، تغییر شکلهای تصویر دقیق پیکسلی و عملکرد تعاملی را ارائه میدهد. محققان هوش مصنوعی امیدوارند در آینده این ویرایش مبتنی بر نقطه را به مدلهای مولد سه بعدی گسترش دهند.