کد خبر: 216682                      تاريخ انتشار: 1404/02/14 - 10:43
هوش مصنوعی با شبیه‌سازی ضربان قلب ابزارهای تشخیص «جعل عمیق» را دور می‌زند!
 
محققانی که به دنبال کشف جعل عمیق یا دیپ‌فیک‌ها بودند، مدت‌ها به یک روش تشخیصی به ظاهر بی‌عیب و نقص متکی بودند و آن این بود که هوش مصنوعی نمی‌توانست تغییرات ظریف در رنگ پوست را که ناشی از نبض افراد است، جعل کند. این قطعیت اکنون از بین رفته است، زیرا دانشمندان کشف کرده‌اند که جعل‌های عمیق مدرن سهوا الگوهای ضربان قلب را از ویدئوهای منبع خود حفظ می‌کنند و باعث می‌شوند که معتبرترین ابزارهای تشخیص ما ناگهان به گزینه‌هایی غیرقابل اعتماد تبدیل شوند. به نظر می‌رسد این همزادهای دیجیتالی ما، به تازگی قادر به شبیه‌سازی نبض شده‌اند.
 
سال‌ها، کارشناسان امنیت سایبری بر این باور بودند که توانایی تشخیص جعل عمیق را دارند. از آنجایی که هوش مصنوعی برای شبیه‌سازی تغییرات ظریف در رنگ پوست انسان که ناشی از جریان خون است، برنامه‌ریزی نشده بود، محققان معتقد بودند که ویدئوهای جعلی فاقد این نشانه‌های فیزیولوژیکی هستند. اما طبق یک مطالعه بین‌المللی جدید، این راه گزینه از دست رفته است.
به نقل از اس‌اف، تحقیقات قبلی نشان داده است که فرآیندهای ایجاد جعل عمیق، سیگنال‌های ظریف مربوط به ضربان قلب را در ویدئوها پاک می‌کنند و آنها را به ابزاری قابل اعتماد برای تشخیص تبدیل می‌کنند. با این حال، این مطالعه این ایده را به چالش کشیده است و نشان می‌دهد که فرآیندهای جعل عمیق مدرن دیگر این نشانه‌ها را حذف نمی‌کنند.
این بدان معناست که بسیاری از ابزارهای تشخیص جعل عمیق موجود ممکن است کمتر از آنچه پیش از این تصور می‌شد، مؤثر عمل کنند. تکیه بر تشخیص نبض به عنوان سپری در برابر جعل عمیق ممکن است دیگر یک گزینه مناسب به شمار نرود.
چگونه می‌توان ضربان قلب را در یک ویدئو تشخیص داد؟
از آن جا که خون در رگ‌های نزدیک به سطح پوست جریان می‌یابد، ضربان قلب ما باعث ایجاد تغییرات رنگی ظریفی در پوست می‌شود. این پدیده که با چشم غیرمسلح قابل مشاهده نیست، می‌تواند با استفاده از روشی به نام تغییر حجم‌سنجی نوری یا فوتوپلتیسموگرام از راه دور (rPPG) تشخیص داده شود.
فوتوپلتیسموگرام از راه دور را به عنوان یک روش بدون تماس برای اندازه‌گیری نبض فرد از طریق ویدئو در نظر بگیرید. الگوریتم‌های ویژه، تغییرات رنگ تقریبا نامحسوس در پوست صورت را برای استخراج اطلاعات ضربان قلب تجزیه و تحلیل می‌کنند. تاکنون، این روش به عنوان یکی از امیدوارکننده‌ترین روش‌ها برای شناسایی جعل عمیق در نظر گرفته می‌شد.
محققان برای مطالعه خود، یک مسیر ایجاد کردند که به طور خاص برای استخراج این سیگنال‌های فیزیولوژیکی از ویدئوها طراحی شده است. آنها هم ویدئوهای واقعی و هم جعل عمیق را تجزیه و تحلیل کردند و بر سیگنال‌های مرتبط با ضربان قلب که معمولا بین ۰.۷ هرتز و سه هرتز (معادل ۴۲-۱۸۰ ضربان در دقیقه) رخ می‌دهند، تمرکز کردند.
این گروه ویدئوهایی از دوازده شرکت‌کننده متنوع را در شرایط کنترل‌شده با نور یکنواخت ضبط کردند. در طول هر جلسه، شرکت‌کنندگان فعالیت‌های مختلفی مانند صحبت کردن، خواندن و تعامل با سرپرست ضبط انجام دادند. نکته مهم این است که محققان همچنین ضربان قلب واقعی شرکت‌کنندگان انتخاب‌شده را با استفاده از حسگرهای الکتروکاردیوگرام (ECG) و فوتوپلتیسموگرام(PPG) اندازه‌گیری کردند تا داده‌های واقعی را ایجاد کنند.
تکامل جعل عمیق
محققان با استفاده از این موارد ضبط شده، جعل‌های عمیق خود را با استفاده از چندین روش تولید کردند. در یک روش از یک سیستم ویژه استفاده شد که دو سیستم رمزگشا را برای ایجاد ویدئوهای جعل عمیق واقع‌گرایانه با هم ترکیب می‌کند و در نتیجه ۸۵۸ ویدئو از افراد مختلف و ۱۵۶ ویدئوی اصلی و بدون ویرایش ایجاد شد. آنها همچنین با استفاده از یک ابزار منبع باز به نام DeepFaceLive که تعویض چهره را در لحظه انجام می‌دهد، جعل‌های عمیق بیشتری ایجاد کردند.
جعل‌های عمیق تولید شده به طرز چشمگیری با کیفیت بودند و از اشتباهات رایجی که نسل‌های قبلی ویدئوهای جعلی به آن‌ها دچار می‌شدند، اجتناب کردند.
وقتی محققان جعل‌های عمیق را تجزیه و تحلیل کردند، متوجه شدند که ویدئوهای جعلی حاوی سیگنال‌های ضربان قلب معتبری هستند که با ویدئوهای منبع اصلی مطابقت نزدیکی دارند. این همبستگی به‌ویژه در ویدئوهای جعلی تولیدشده توسط DeepFaceLive قوی بود.
این بدان معناست که فناوری جعل عمیق ناخواسته سیگنال‌های فیزیولوژیکی را از ویدئوهای منبع حفظ می‌کند و عملا «امضای ضربان قلب» را به ویدئوهای جعلی منتقل می‌کند.
بسیاری از محققان سیستم‌های تشخیصی را با این فرض ساخته بودند که جعل‌های عمیق نمی‌توانند این سیگنال‌های زیستی ظریف را شبیه‌سازی کنند. اکنون، این سیستم‌ها ممکن است نیاز به طراحی مجدد کامل داشته باشند.
یک نکته مثبت هم وجود دارد. در حالی که جعل‌های عمیق سیگنال‌های ضربان قلب را حفظ می‌کردند، این سیگنال‌ها عموما ضعیف‌تر از ویدئوهای اصلی بودند. میانگین نسبت سیگنال به نویز برای ویدئوهای اصلی -۱.۹۷ دسی‌بل در مقایسه با -۳.۳۵ دسی‌بل برای جعل‌های عمیق بود که نشان می‌دهد سیگنال ضربان در جعل‌های عمیق، اگرچه وجود دارند اما از کیفیت پایین‌تری برخوردارند.
این موضوع چه تاثیری بر توانایی ما در شناسایی ویدئوهای جعلی دارد؟ به گفته محققان، ما باید از جستجوی صرف وجود یا عدم وجود سیگنال‌های ضربان قلب فاصله بگیریم. در عوض، روش‌های تشخیص آینده باید نحوه توزیع این سیگنال‌ها در صورت را تجزیه و تحلیل کنند.
مسئله فقط وجود نبض در ویدئو نیست، بلکه این است که آیا آن نبض در نواحی مختلف صورت به طور طبیعی رفتار می‌کند یا خیر. ویدئوهای واقعی الگوهای خاصی از جریان خون را نشان می‌دهند که جعل‌های عمیق ممکن است با وجود ثبت ضربان کلی قلب، به طور کامل آن را شبیه‌سازی نکنند.
رقابت بین سازندگان و فناوری تشخیص آغاز شده است. جعل‌های عمیق از آنچه پیش‌بینی می‌کردیم، در حال پیچیده‌تر شدن هستند و روش‌های تشخیص ما باید به همان سرعت خود جعل‌های عمیق تکامل یابند.
ایسنا
انتهای پیام/ن