تسلط هوش مصنوعی بر طراحی دست؛ تشخیص تصاویر جعل عمیق دشوارتر شد
تاریخ انتشار: ۱۲ فروردین ۱۴۰۲ | کد خبر: ۳۷۴۳۱۲۱۷
ایتنا - بسیاری از هنرمندان دست انسان را یکی از پیچیدهترین چیزها برای طراحی در نظر میگرفتند
باتوجه به اینکه یک تولیدکننده پیشگام تصویر هوش مصنوعی پیبرد که چگونه تصاویری واقعی از دست ایجاد کند، ممکن است یکی از بزرگترین نشانههای پنهان برای تشخیص یک تصویر جعل عمیق (دیپفیک)، رفع شده باشد.
به گزارش ایتنا و به نقل از ایندیپندنت، جدیدترین نسخه «میدجرنی»، که از متنهای مکتوب ساده تصویر تولید میکند، در مقایسه با نسخههای پیشین فناوری هوش مصنوعی مولد که معمولا دستهای انسان را به شکل عجیب و غریب یا با تعداد انگشتان اشتباه به تصویر میکشند، پیشرفت قابلتوجهی را نشان میدهد.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
به گفته سازندگان، میدجرنی وی۵ کیفیت تصویر بسیار بالاتر، خروجیهای متنوعتر، دامنه سبکشناختی گستردهتر، پشتیبانی از بافتهای یکپارچه، نسبتهای تصویری گستردهتر و تصویری بهتر و دامنه دینامیکی گستردهتر ارائه میکند.
پیشرفتها عبارتاند از بافتهای واقعیتر پوست، بازتابها و سایههای بهتر و حالت چهرهها با جزئیاتی بیشتر.
اما کاربران بهسرعت متوجه شدند که به نظر میرسد بزرگترین ارتقا و بهسازی به توانایی هوش مصنوعی در راستای تولید دستهایی شبیه به دست انسان مربوط میشود.
بسیاری از هنرمندان دست انسان را یکی از پیچیدهترین چیزها برای طراحی در نظر میگرفتند و نخستین تصویرسازهای هوش مصنوعی در میدجرنی، استیبل دیفیوژن و اوپنایآی دالئی، نشان دادند که هوش مصنوعی مولد نیز با مشکلاتی مواجه است.
این بدان معنا است که در غیر این صورت، جعلی بودن تصاویر قابل باور از شخصیتهای سیاسی مانند دونالد ترامپ و امانوئل مکرون را میتوان تنها با نگاه کردن به دستها تشخیص داد.
دل واکر، هنرمند بازیهای ویدیویی، گفت: «فقط یک هشدارــ هوش مصنوعی میدجرنی اینک میتواند طراحی دستها را بهدرستی انجام دهد.»
«به هر تصویر سیاسی بهویژه عکاسی، نگاهی نکتهسنجتر داشته باشید، به خصوص تصاویری که در فضای مجازی میبینید و سعی در برانگیختن واکنش دارند.»
محققان هوش مصنوعی پیشتر تلاش کردهاند توضیح دهند که چرا هوش مصنوعی مولد که با میلیاردها تصویر از اینترنت آموزش داده شده است، با جنبههای خاصی از فرم بدن انسان مشکل دارد.
سخنگوی استیبیلیتی ایآی اوایل سال جاری به بازفید نیوز گفت: «به طور کلی این موضوعی آشنا است که تصاویر انسان در مجموعه دادههای هوش مصنوعی دستها را مشخصا کمتر از صورتها نشان میدهند.»
«دستها معمولا در تصاویر منبع هم بسیار کوچکترند. چرا که در قالب بزرگ، نسبتا بهندرت قابل مشاهدهاند.»
منبع: ايتنا
کلیدواژه: هوش مصنوعی هوش مصنوعی دست ها
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.itna.ir دریافت کردهاست، لذا منبع این خبر، وبسایت «ايتنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۷۴۳۱۲۱۷ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
بگو سیب! رباتها لبخند میزنند
خبرگزاری علم و فناوری آنا؛ اگر با رُبات انساننمایی روبهرو شوید که اول او به شما لبخند بزند چه حسی دارید؟ بیشک حس تعامل جالبی خواهد بود، اما ربات چطور میتواند چنین کاری کند و یا اصلاً لبخند را چطور تشخیص میدهد؟ در گزارش حاضر که از پایگاه اینترنتی ساینس دیلی به فارسی برگردان شده است، با دستاورد تیم تحقیقاتی دانشگاه کلمبیا در طراحی چنین رباتی آشنا میشوید.
رباتها برای برقراری ارتباط کلامی طراحی شدهاند، اما ارتباطات غیرکلامی، بهویژه حالات چهره، حوزهای است که هنوز در آن مشکل دارند. آزمایشگاه دانشکده مهندسی و علوم کاربردی دانشگاه کلمبیا بیش از پنج سال است که روی این چالش کار میکند. آنها روباتی به نام ایمو (Emo) ساختهاند که یک سر انسانمانند دارد و صورتش مجهز به ۲۶ رانشگر است که طیف وسیعی از حالات چهره را ممکن میسازد. ایمو حتی یاد گرفته است که لبخند انسان را ۸۴۰ میلی ثانیه زودتر پیشبینی کند و همزمان با شخص لبخند بزند.
چالشهای طراحی ربات
یکی از چالشهای تیم دانشگاه کلمبیا، نحوه طراحیِ مکانیکی یک چهره رباتیک همهکاره بود که سختافزار پیچیده و مکانیزمهای فعالسازی داشت. این تیم تصمیم گرفت، به ربات آموزش دهد که حالتهای صورت انسان را پیشبینی کند و آنها را بهطور همزمان با یک انسان اجرا کند. زمان انجام این حرکات بسیار مهم بود و تأخیر در تقلید، باعث میشد آنها غیرواقعی به نظر برسند، اما بیان همزمان حالتهای چهره، آنها را طبیعیتر نشان میداد، زیرا بر اساس استنباط از وضعیت احساسی انسان بود.
روش آموزش
محققان برای آموزش حالتهای چهره، ایمو را جلوی دوربین قرار دادند و به آن اجازه دادند حرکات تصادفی انجام دهد. پس از چند ساعت، ربات رابطه بین حالات چهره و دستورات حرکتی خود را یاد گرفت. این تیم دو مدل هوش مصنوعی توسعه دادند: یکی که حالات چهره انسان را با تجزیهوتحلیل تغییرات ظریف در صورت هدف پیشبینی میکند و دیگری که با تشخیص حالات صورت، دستورات حرکتی را انجام میدهد. سپس این تیم تحقیقاتی، ویدیویی از حالات صورت انسان را برای ایمو اجرا کردند و پس از آموزش، ایمو توانست حالات چهره افراد را با مشاهده تغییرات کوچک در چهرهشان پیشبینی کند.
اجزاء سازنده
ایمو دارای دوربینهایی با وضوح بالا در مردمک هر چشم است که به آن امکان میدهد تماس چشمی برقرار کند و برای ارتباطات غیرکلامی بسیار مهم است. سر این ربات با یک پوست سیلیکونی نرم و مجهز به سیستم اتصال مغناطیسی پوشانده شده است که امکان سفارشیسازی آسان را فراهم میکند. محققان اکنون در تلاش هستند یک مدل بزرگ زبانی مانند چت جیپیتی را در ایمو ادغام کنند.
آینده تعامل انسان و ربات
به گفته نویسنده اصلی این مطالعه علمی، یوهانگ هو (Yuhang Hu)، پیشبینی دقیق حالات چهره انسان به کمک هوش مصنوعی یک انقلاب در تعاملات انسان و ربات است. به طور سنتی، رباتها برای تشخیص حالات چهره انسانها هنگام تعامل طراحی نشدهاند، اما اضافه شدن این توانایی نه تنها کیفیت تعامل را بهبود میبخشد، بلکه به اعتمادسازی بین انسان و رباتها نیز کمک میکند. در آینده، یک ربات حالتهای چهره شما را دقیقاً مانند یک شخص واقعی مشاهده و تفسیر خواهد کرد.
به آیندهای نزدیک میشویم که در آن رباتها میتوانند وارد زندگی روزمره ما شوند و همراهی، کمک و حتی همدلی کنند.
انتهای پیام/
نازنین احسانی طباطبایی