«حسگر نور محیط» ابزاری برای جاسوسی

18 بهمن 1402 «حسگر نور محیط» ابزاری برای جاسوسی

روابط عمومی شرکت ایدکو (توزیع‌کننده‌ی محصولات کسپرسکی در ایران)؛ مقاله‌ای در Science Magazine که اواسط ژانویه منتشر شد روش غیرمعمولِ جاسوسی کاربران اسمارت‌فونی را شرح می‌دهد که از طریق حسگر نورِ محیط[1] انجام می‌شود. در ادامه با ما همراه شوید تا از ساز و کار این جاسوسی سر دربیاوریم.

همه اسمارت‌فون‌ها و تبلت‌ها این اجزا را به طور درو‌ن‌سازه‌ای دارند (درست مانند بسیاری از لپ‌تاپ‌ها و تلویزیون‌ها). تسک اولیه‌ این اجزا این است که میزان نور محیط را در فضایی که دستگاه قرار دارد درک کند و روشنایی نمایشگر را بر اساس آن تنظیم کند. اما ابتدا باید توضیح دهیم چرا عامل تهدید باید به جای دوربین معمولی دستگاه هدف، از چنین روش عجیبی استفاده کند. دلیل این است که حسگرهایی که ما «نامناسب یا نامعمول» می‌خوانیم معمولاً تماماً محافظت‌نشده هستند. بیایید تصور کنیم مهاجمی کاربری را فریب داده که روی اسمارت‌فونش برنامه مخرب نصب کند. این بدافزار برای دسترسی پیدا کردن به اجزای مورد هدف مانند میکروفون یا دوربین دست و پا خواهد زد اما همین سناریو برای حسگر نور محیط مثل آب خوردن است. پس محققین ثابت کردند این حسگر نور محیط می‌تواند به جای دوربین استفاده شود (برای مثال برای گرفتن اسنپ‌شات دست کاربر که دارد پین را روی کیبورد مجازی وارد می‌کند). به لحاظ تئوری با تحلیل چنین داده‌هایی ممکن است بشود خود پسورد را نیز از نو ساخت.

حسگر نور یک فناوری نسبتاً بدوی است. یک فتوسل حساس به نور برای اندازه‌گیری میزان روشنایی نور محیط آن هم چندین بار در ثانیه. دوربین‌های دیجیتال از حسگرهای نور مشابهی (البته کوچکتر) استفاده می‌کنند اما میلیون‌ها نسخه از آن‌ها وجود دارد. لنز تصویری را روی این ماتریس فتوسل می‌اندازد، روشنایی هر المان اندازه‌گیری می‌شود و نتیجه می‌شود یک عکاسی دیجیتال. بنابراین می‌توانید حسگر نور را بدوی‌ترین دوربنی دیجیتالی بخوانید: رزولوشن آن دقیقاً یک پیکسل است. چطور چنین چیزی می‌تواند اتفاقات روی دستگاه را ثبت کند؟ محققین از اصل متقابل Helmholtz که اواسط قرن 19 مطرح شد استفاده کردند. این اصل به طور گسترده در گرافیک‌های کامپیوتر استفاده می‌شود؛ برای مثال جایی که محاسبات به طرز شگفت‌انگیزی ساده‌سازی می‌شود. در سال 2005 این اصل پایه‌ی متود پیشنهادیِ عکاسی دوگانه را شکل داد. بیایید برای فهم بیشتر به تصویری که در این مقاله منتشر شد نگاه کنیم:

تصور کنید دارید از اجسامی روی میز عکاسی می‌کنید. یک لامپ روی اجسام می‌تابد، نور منعکس‌شده به لنز دوربین برخورد می‌کند و نتیجه می‌شود عکاسی کاملاً معمولی. . در عکس بالا تصویر سمت چپ دقیقاً چنین عکسی است. سپس به معنای ساده‌اش، محققین شروع کردند تغییر نور لامپ و ضبط تغییرات در روشنایی. در نتیجه آن‌ها اطلاعات کافی برای بازسازی تصویر سمت راست را جمع کردن (طوری گرفته شده انگار از نقطه دید لامپ است). در این موقعیت دوربینی وجود ندارد و هرگز هم وجود نداشته اما بنا بر سنجش‌ها، صحنه به طور موفقیت‌آمیزی بازسازی شده بود. از همه جالب‌تر این است که این ترفند حتی به دوربین هم نیاز ندارد. یک عکاس ساده هم انجامش خواهد داد- درست مانند همانی که در حسگر نور محیط است. مقاومت نوری (یا «دوربین تک پیکسلی») تغییرات نور منعکس شده از اجسام را اندازه گیری کرده و از این داده‌ها برای ساختن عکسی از آنها استفاده می‌شود.

کیفیت تصویر پایین خواهد بود و اندازه گیری های زیادی باید انجام شود - تعداد آنها به صدها یا هزاران می‌رسد.

بیایید به مطالعه و حسگر نور برگردیم. نویسندگان مقاله از تبلت نسبتاً بزرگ Samsung Galaxy View با صفحه نمایش 17 اینچی استفاده کردند. الگوهای مختلفی از مستطیل های سیاه و سفید بر روی صفحه نمایش تبلت نمایش داده شد. یک مانکن رو به روی صفحه نمایش در نقش کاربری قرار داشت که چیزی را روی صفحه کلید روی صفحه وارد می‌کرد. سنسور نور تغییرات روشنایی را ثبت کرد. در چندین صد اندازه گیری مانند این، تصویری از دست مانکن تولید شد. یعنی نویسندگان از اصل متقابل هلمهولتز برای گرفتن عکسی از دست استفاده کردند که انگار از دید صفحه نمایش گرفته شده بود. محققین به طور موثر صفحه نمایش تبلت را به دوربینی بسیار کم کیفیت تبدیل کردند.

درست است، واضح ترین تصویر نیست. تصویر بالا سمت چپ نشان می‌دهد چه چیزی باید گرفته شود: در یک مورد، کف دست باز مانکن. در مورد دیگر، چگونه به نظر می‌رسد "کاربر" روی چیزی روی صفحه نمایش ضربه می‌زند. تصاویر در مرکز یک "عکس" بازسازی شده با وضوح 32×32 پیکسل هستند که تقریباً هیچ چیز در آن قابل مشاهده نیست - نویز بیش از حد در داده ها. اما با کمک الگوریتم‌های یادگیری ماشینی، نویز برای تولید تصاویر سمت راست فیلتر شد، جایی که می‌توانیم موقعیت یک دست را از دیگری تشخیص دهیم. نویسندگان مقاله نمونه‌های دیگری از ژست‌های معمولی را که افراد هنگام استفاده از صفحه نمایش لمسی تبلت انجام می‌دهند، ارائه می‌دهند. یا بهتر بگوییم، نمونه‌هایی از اینکه چگونه آنها موفق به "عکاسی" از آنها شدند:

پس می‌توانیم این متود را در عمل به کار گیریم؟ ممکن است بشود نظارت کرد کاربر چطور با تاچ اسکرین تبلت یا اسمارت‌فون تعامل می‌کند؟ چطور متنی را روی کیبورد آن‌اسکرین وارد می‌کند؟ می‌شود نظارت کرد چطور کاربر جزئیات بانکی‌اش را وارد می‌کند؟ چطور اپ‌ها را باز می‌کند؟ خوشبختانه هنوز این روش آنقدرها هم ساده نشده. به کپشن‌های بالای عکاسی‌ها در تصویر فوق دقت کنید. آن‌ها نشان می‌دهند ساز و کار این متود بسیار کند است. در بهترین حالت ممکن محققین توانستند عکس دست را در کمتر از سه دقیقه بازسازی کنند. تصویر عکس قبلی هم 17 دقیقه طول کشید تا گرفته شود. نظارت در لحظه با چنین سرعتی قابل بحث نیست.

همچنین اکنون واضح است که چرا در بیشتر آزمایش‌ها دست مانکن است: دست انسان نمی‌تواند برای مدت زیادی بی‌حرکت بماند. اما این امکان پیشرفت این متود را از بین می‌برد؟ باید بدترین سناریو را هم مرور کنیم: اگر هر تصویر دست را بشود نه در سه دقیقه که فرضاً در نیم ثانیه بدست آورد، اگر خروجی روی صفحه نه یک سری اشکال سیاه سفید عجیب و غریب که ویدیویی از مجموعه عکس‌ها یا انیمیشن مورد علاقه کاربر باشد و اگر کاربر کاری که ارزش جاسوسی را داشته باشد انجام دهد آنوقت حمله منطقی خواهد بود و با عقل جور درخواهد آمد. اما همان موقع هم شاید آنقدر منطقی نباشد: کل نیروی محققین با این حقیقت که «اگر مهاجم تصمیم بگیرد بدافزاری را روی دستگاه قربانی بگذارد کلی راه‌های ساده‌تر برای فریب کاربر جهت ورود پسورد یا جزئیات کارت اعتباری وجود دارد» تضعیف می‌شود. شاید ما برای اولین بار در بخش پوشش‌دهی چنین مقالاتی است که در تقلاییم حتی سناریویی در زندگی واقعی برای این حمله متصور شویم. تنها کاری که می‌توانیم بکنیم شگفت‌زده شدن از زیبایی این متود پیشنهادی است. این پژوهش حکم یادآور دارد: باید یادمان باشد حتی دستگاه‌های به ظاهر آشنا و معصوم که ما را از هر طرف محاصره کرده‌اند می‌توانند کارکردهای نامعمول و کمتر شناخته‌شده داشته باشند. با این حال برای کسانی که نگران نقض احتمالی حریم خصوصی‌اند، راهکار ساده است: چنین تصاویر کم کیفیتی نتیجه‌ی این حقیقت هستند که حسگر نور به ندرت اندازه‌گیری را انجام می‌دهد: هر ثانیه بین 10 تا 20 بار. داده‌های خروجی هم از دقت بالایی برخوردار نیستند. اما این فقط به تبدیل کردن حسگر به دوربین مرتبط است. برای تسک اصلی که همان اندازه‌گیری نور محیط باشد، این نرخ بسیار زیاد است. می‌توانیم داده‌ها را حتی بیشتر «درشت کنیم»؛ مثلاً انتقال آن‌ها 5 برابر بیشتر از 20 بار بر ثانیه. برای مطابقت روشنایی صفحه با نور حیط این حتی از کافی هم کافی‌تر است.  اما جاسوسی از طریق حسگر –که همین الانش غیرممکن است- اجرایی و انجام‌پذیر نخواهد بود.

 

[1] ambient light sensor

 

منبع: کسپرسکی آنلاین (ایدکو)

کسپرسکی اسم یکی از بزرگترین شرکتهای امنیتی و سازنده آنتی ویروس است که برخی از کاربران اشتباهاً این شرکت و محصولات آنتی ویروس آن را با عناوینی نظیر کسپرسکای،کاسپرسکی، کسپراسکای، کسپراسکای، و یا کاسپراسکای نیز می‌شناسد. همچنین لازم به ذکر است مدیرعامل این شرکت نیز یوجین کسپرسکی نام دارد.