به گزارش آتیه آنلاین و به نقل از ال پائیس؛ مکالماتی مانند «الکسا، زنگ ساعت را برای ساعت ۸ صبح تنظیم کن»، «الکسا، فیلم اوپنهایمر را پخش کن» یا «الکسا، به من بگو در عید پاک هوا چگونه خواهد بود» میتواند بخشی از یک مکالمه عادی با هوش مصنوعی خانگی باشد. تمام این مکالمات با اسپیکر هوشمند ضبط شده و برای هر کاربری که از آمازون درخواست کند در دسترس است، و این دقیقاً همان کاری است که «ماریا آپرادور» جرمشناس انجام داد. او با شگفتی متوجه شد که برخی از مکالمات ضبط شده توسط دستگاه با رمز فعالسازی «الکسا» از پیش فعال نشده بود. او یافتههای خود را در ویدئویی در TikTok و Instagram گزارش کرد که از آن زمان به بعد در فضای مجازی توجه زیادی را به خود جلب کرد. اما چه طور ممکن است؟
خط مشی آمازون واضح است: هیچ صوتی ذخیره یا به فضای ابری ارسال نمیشود مگر اینکه دستگاه کلمه فعالسازی را تشخیص دهد. این مورد حتی توسط شرکت تایید شده و آزمایش شده است. آمازون اضافه میکند که به دلیل نشانگر نور آبی یا صدای هشداری که از بلندگو ارسال میشود، کاربر میداند چه زمانی الکسا درخواست کاربران را به فضای ابری ارسال میکند.
با در نظر گرفتن این موضوع، «دیوید آرویو»، یک محقق اسپانیایی متخصص در امنیت سایبری و دادهها، توضیح میدهد که چه اتفاقی ممکن است افتاده باشد: «سیستم هوش مصنوعی فقط زمانی فعال میشود که کسی کلمه ماشه را بگوید. اما، به دلایل مختلف و دلایل کاذب دیگری نیز مکانیسم ماشه میتواند فعال شود. آنچه باید ببینیم این است که تا چه حد میتوان با عناصری که تفسیر کلمه بیداری را مختل میکنند مقابله کرد».
سیستمهای تشخیص صدا که از یادگیری ماشینی استفاده میکنند، مانند سیستمهایی که توسط بلندگوهای الکسا، گوگل و اپل استفاده میشوند، عناصر متفاوتی را برای بهبود عملکرد خود ترکیب میکنند. اما با این حال، ترکیبکردن این عناصر کار آسانی نیست. «ماریا آپرادور» جرم شناس درباره مکالمات ضبط شده خود میگوید: «آنها تکههایی از مکالمات معمولی هستند که در آن افراد خانه صحبت میکنند». این جرمشناس همه بیش از ۵۰۰ فایل صوتی را که آمازون برای او ارسال کرده بود بررسی نکرده است، اما در حدود ۵۰ موردی که به آنها گوش داده است، دو مورد پیدا شده که در آنها هیچ کلمه ماشهای وجود ندارد.
مطالعه محققان دانشگاه «روهر» بوخوم و «موسسه امنیت و حریم خصوصی ماکس پلانک» مشکل فعالسازی تصادفی در بلندگوهای هوشمند را بررسی کرده است. پس از تجزیه و تحلیل ۱۱ دستگاه از هشت سازنده مختلف، محققان بیش از ۱۰۰۰ فعال سازی غیر ارادی را یافتند. «جوزپ البرز»، مدیر تحقیقات و آگاهی در شرکت امنیت سایبری ESET اسپانیا، با اشاره به موارد مثبت کاذب، میگوید: «ما در مورد سیستمهای تشخیص صدا صحبت میکنیم که بسته به نحوه پیادهسازی آنها، میتوانند بهتر یا بدتر کار کنند».
چگونه بلندگوها کلمه فعالسازی را تشخیص میدهند
پس از شنیدن Alexa»، Ok, Google» یا «Hey, Siri»، بلندگوهای هوشمند، سیستمی دارند که دائماً آن عبارات را ردیابی میکند. در نهایت، آنها دستگاههایی هستند که دائماً گوش میدهند. اما گوشیهای هوشمند یا بسیاری از اینترکامها نیز این کار را انجام میدهند و چنین فعالیت شنیدنی صرفا محدود به الکسا نیست.
«آرویو» نیز ارزیابی خود را دارد. وقتی اسپیکر را در حالت آماده به کار فعال قرار میدهید، به این معنی است که دائماً چیزی را که در مورد آن صحبت میکنید جذب میکند. آن را ضبط نمیکند، اما الگوریتم در حال پردازش آن است، زیرا باید ببیند چه کلماتی گفته میشود.
این الگوریتمی است که به صورت محلی روی خود دستگاه کار میکند و الگوهای صوتی مربوط به کلمه ماشه را جستجو میکند. آمازون ادعا میکند که فناوری آن برای تشخیص کلمه ماشه فقط به اطلاعات امواج صوتی متکی است و اضافه میکند که بلندگو را میتوان با یک دکمه نیز فعال کرد که از نظارت صدا جلوگیری میکند. در مورد ضبطهایی که هنگام فعال شدن دستگاه اتفاق میافتد، کاربران میتوانند انتخاب کنند که در این ضبط صداها ذخیره نشوند.
مشکل دستگاهی که دائماً کلمه ماشه را ردیابی میکند چیست؟ این دو متخصص امنیت سایبری توافق دارند که اگر مکالمه یک فرد برای استخراج دادههای فراتر از جستجوی کلیدواژه پردازش شود، این یک مسئله حفظ حریم خصوصی بسیار جدی خواهد بود. اما آنها همچنین قبول دارند که هیچ مدرکی دال بر این موضوع وجود ندارد. «آلبرز» میگوید: «منافع زیادی وجود دارد که در این رابطه تاثیرگذار است، زیرا این به معنای از بین رفتن اعتماد به همه دستگاهها و آسیب اقتصادی بسیار قابل توجهی برای این شرکتها است».
نظر شما