ابزار DragGAN رقیب جدی Warp فتوشاپ

ابزار DragGAN

تحقیقات جدید هوش مصنوعی با توسعه برنامه DragGAN به شما این امکان را می‌دهد روی عکس‌ها کلیک کرده و بکشید تا بتوانید در چند ثانیه آن‌ها را دستکاری کنید این ابزار DragGAN مانند ابزار Warp فتوشاپ عمل می‌کند اما بسیار قدرتمندتر. حتی می‌توانید تصاویر را طوری بچرخانید که انگار سه بعدی هستند. کافی است خودتان ویدئوها را تماشا کنید تا به توانایی حیرت انگیز ابزار Drag GAN در خلق تصاویر واقع ‌گرایانه با استفاده از هوش مصنوعی پی ببرید. دفعه بعد اگر تصویری کاملا طبیعی از یک شیر در آغوش یک کفتار را دیدید، دیگر نباید به چشم‌هایتان شک کنید!

ابزار DragGAN چیست؟

ایجاد محتوای بصری که متناسب با نیازهای کاربر باشد. اغلب مستلزم کنترل دقیق و منعطف بر ویژگی‌هایی مانند: حالت، شکل، بیان، و چیدمان اشیا تولید شده است. روش‌های سنتی برای کنترل شبکه‌های متخاصم مولد (GAN)، به داده‌های دستی یا مدل‌های سه بعدی قبلی متکی هستند. با این حال، این رویکردها اغلب فاقد دقت، انعطاف پذیری و عمومیت هستند. در پاسخ به این کاستی‌ها، موسسه Max Planck DragGAN ابزار DragGAN را معرفی می‌کند، رویکرد جدیدی که به کاربران اجازه می‌دهد تا به صورت تعاملی هر نقطه در یک تصویر را به مکان‌های مورد نظر بکشند.

DragGAN

ابزار DraGAN شامل چند جز است؟

DragGAN شامل دو جز اصلی است: نظارت بر حرکت و رویکرد جدید ردیابی نقطه‌ای. نظارت حرکت امکان حرکت توسط کاربر را در نقاط دسته در تصویر به سمت موقعیت‌های هدف فراهم می‌کند. رویکرد ردیابی نقطه‌ای از ویژگی‌های متمایز ژنراتور استفاده می‌کند تا مکان‌ها را در حین جابجایی ردیابی کند. در نتیجه، کاربران می‌توانند تصاویر را با دقت تغییر شکل دهند و بر ویژگی‌هایی مانند: حالت، شکل، بیان و چیدمان در دسته‌های مختلف مانند: حیوانات، ماشین‌ها، انسان‌ها و مناظر تاثیر بگذارند.

نحوه کار با ابزار DragGAN

برای دستکاری تصاویر با استفاده از ابزار DragGAN کافیست بر روی نقاط دلخواه تصویر کلیک کرده و آن را بکشید تا تغییرات توسط مدل هوش مصنوعی اعمال شود. در واقع این مدل هوش مصنوعی، تغییرات کاملا مرتبطی بر روی تصاویر اعمال می‌کند تا یک تصویر جدید اما مرتبط با تصویر اصلی خلق شود. این ابزار جدید نه تنها می‌تواند اندازه یک خودرو را دستکاری کند یا لبخند را بر روی چهره  موجود در عکس‌ها بیاورد، بلکه حتی از عهده تغییر جهت و چرخش عناصر موجود در تصاویر هم بر می‌آید. البته برای این کار باید تصویر یک مدل سه بعدی باشد.
محققان این مدل که DragGAN نام دارد توضیح می‌دهند: «رویکرد ما می‌تواند محتواهای غیر قابل دسترس مانند دندان‌های داخل دهان یک شیر را نیز متصور شود و می‌تواند اجسام را براساس سختی آن‌ها تغییر شکل دهد، مانند خم کردن پاهای یک اسب.» البته این مدل در حال حاضر فقط یک نسخه آزمایشی است و باید ارزیابی‌های کاملی روی آن انجام شود.

ابزار DragGAN شبیه Warp فتوشاپ

این ابزار که عملکردی شبیه ابزار Warp در فتوشاپ دارد، به شما این امکان را می‌دهد ابعاد یک خودرو یا حالت چهره را تغییر دهید و اگر مدلی سه‌ بعدی در اختیار داشتید آن را به‌ سادگی بچرخانید. شرکت Verge این ابزار را با ابزار Warp در فتوشاپ مقایسه کرد و گفت این ابزار بسیار قدرتمندتر است. زیرا پیکسل‌ها را به هم نمی‌ریزد، بلکه شی زیرین را دوباره تولید می‌کند و حتی می‌تواند تصاویر سه بعدی را بچرخاند. نکته قابل توجه دیگر که باعث می‌شود این مدل هوش مصنوعی که هنوز در مرحله مقاله تحقیقاتی قرار دارد جذابیت زیادی داشته باشد، رابط کاربری آن است که از طریق آن می‌توانید تصویر خود را براساس پارامترهای مختلفی تغییر دهید و تنظیم کند. هر چند در حال حاضر نیز مدل‌های زیادی وجود دارند که براساس توضیحات کاربران می‌توانند تصاویر را ایجاد کنند، اما اکثر این روش‌ها فاقد انعطاف‌ پذیری و دقت هستند.
بر اساس گزارش ورج، این نخستین باری نیست که ابزارهای این‌ چنینی را می‌بینیم اما هیچ ‌یک از ابزارهای قبلی تا این حد عملکرد ساده‌ای نداشته‌اند. بسیاری از سرویس‌های هوش مصنوعی نیاز به آموزش ویژه دارند، با این ‌حال کاربران عادی نیز می‌توانند با ابزار DragGAN کار کنند.

تفاوت ابزار DragGAN با Warp

برنامه‌های مشابه به ابزار DragGAN

برندهای زیادی وجود دارند که سعی در ارائه گزینه‌های ویرایش برای محتوای تولیدی هوش مصنوعی دارند. با این حال، اکثر آن‌ها تا آنجا که اجازه ویرایش واقعی تصاویر را می‌دهند پیش نمی‌روند، بلکه بیشتر به جنبه‌هایی مانند: ویرایش پیرامون تصاویر می‌پردازند. به عنوان مثال: اپلیکیشن Designer مایکروسافت به شما امکان می‌‎دهد تصاویر هوش مصنوعی را از یک پیام متنی تولید کنید. و می‌توانید عکس مورد علاقه خود را از بین سه نتیجه انتخاب کنید. سپس آن را به استودیوی طراحی ببرید. جایی که می‌توانید مجموعه‌ای از پروژه‌های مبتنی بر خلاقیت و بهره وری ایجاد کنید. مانند پست‌های رسانه‌های اجتماعی، دعوت نامه‌ها، کارت پستال‌های دیجیتال یا تصاویر گرافیکی با تصویر به عنوان نقطه کانونی. با این حال، شما نمی‌توانید تصویر ایجاد شده توسط هوش مصنوعی را ویرایش کنید. در صورتی که با ابزار Drag GAN می‌توانید هر عکسی هر طوری که می‌خواهید ادیت کنید.

ابزار DragGAN نسخه دمو

با توجه به اینکه ابزار Drag GAN در حال حاضر هنوز یک نسخه نمایشی است. نمی‌توان گفت که کیفیت یک فناوری چقدر خوب یا بد است. به خصوص که دموها بر اساس ویدیوهای با وضوح پایین هستند. با این حال، این یک مثال جالب از سرعت توسعه هوش مصنوعی است. برخی از دموهایی که بخشی از مقاله تحقیقاتی هستند عبارتند از: افزودن ارتفاع به کوه، تغییر موقعیت یک مدل و ویرایش طول و شکل لباس، باز یا بسته کردن دهان شیر، تغییر چهره یک فرد از ظاهر ساده به یک لبخند. با بسیاری از ابزارهای هوش مصنوعی که در حال حاضر در دسترس هستند، کاربران باید یک تصویر را با یک اعلان خاص‌تر بازسازی کنند تا نتیجه مطلوب‌تری به دست آورند.

نتیجه گیری

در نتیجه، ابزار DragGAN نشان دهنده یک پیشرفت قابل توجه در زمینه دستکاری تصویر مبتنی بر GAN است. این روش از یک GAN از پیش آموزش دیده برای تولید تصاویری استفاده می‌کند. که از نزدیک ورودی کاربر را دنبال می‌کنند و در عین حال واقع گرایانه هستند. DragGAN با استفاده از بهینه سازی کدهای پنهان و روش ردیابی نقطه، تغییر شکل‌های تصویر دقیق پیکسلی و عملکرد تعاملی را ارائه می‌دهد. محققان هوش مصنوعی امیدوارند در آینده این ویرایش مبتنی بر نقطه را به مدل‌های مولد سه بعدی گسترش دهند.

دانلود PDF مقاله ابزار DragGAN 

5/5 - (1 امتیاز)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *