هوش مصنوعی صداهای انسانی را جعل میکند؛ چگونه از خود محافظت کنیم؟
در گذشته شنیدن صدای یک دوست، مدیر یا عضو خانواده کافی بود تا به صحت یک تماس تلفنی اعتماد کنیم؛ اما حالا فناوریهای مبتنی بر هوش مصنوعی این معادله قدیمی را برهم زدهاند.
ابزارهای «جعل عمیق صوتی» یا Voice Deepfake اکنون قادرند تنها با چند ثانیه نمونه صوتی، صدایی کاملاً مشابه یک فرد واقعی تولید کنند؛ آنقدر طبیعی که تشخیص آن برای بسیاری از افراد تقریبا غیرممکن شده است.
کارشناسان امنیت سایبری هشدار میدهند که مجرمان دیجیتال دیگر فقط به سرقت رمز عبور یا هک حسابها متکی نیستند، بلکه با تقلید صدای انسانها تلاش میکنند قربانیان را به انتقال پول، افشای اطلاعات حساس یا اجرای دستورات جعلی وادار کنند.
این روش موج تازهای از کلاهبرداریهای سایبری را در جهان رقم زده است.
جعل عمیق صوتی چیست؟
جعل عمیق صوتی به فناوریای گفته میشود که با استفاده از الگوریتمهای هوش مصنوعی و یادگیری عمیق، صدای انسان را شبیهسازی یا بازتولید میکند. این سیستمها پس از تحلیل ویژگیهایی مانند لحن، سرعت صحبت، لهجه، نحوه بیان و حتی احساسات صوتی، قادرند هر متن نوشتهشدهای را با صدای فرد هدف بازخوانی کنند.
کمیسیون تجارت فدرال آمریکا (FTC) هشدار داده است که برخی سامانههای جدید استنساخ صدا میتوانند تنها با چند ثانیه فایل صوتی موجود در شبکههای اجتماعی یا ویدیوهای اینترنتی، نسخهای بسیار متقاعدکننده از صدای افراد تولید کنند.

فناوری جعل صدا چگونه کار میکند؟
۱. جمعآوری دادههای صوتی
مهاجم ابتدا تلاش میکند به نمونههای صوتی فرد هدف دسترسی پیدا کند.
این نمونهها میتوانند از ویدئوهای منتشرشده در شبکههای اجتماعی، مصاحبههای رسانهای، پیامهای صوتی یا جلسات مجازی ضبطشده به دست آیند.
۲. آموزش مدل
سپس نمونههای صوتی در اختیار یک مدل هوش مصنوعی تخصصی در زمینه شبیهسازی صدا قرار میگیرند.
این مدل ویژگیهای منحصربهفرد صدا، مانند زیر و بمی، سرعت گفتار، لهجه، شیوه تلفظ و الگوهای احساسی را تحلیل میکند.
۳. تولید صدای جعلی
پس از پایان مرحله آموزش، سامانه میتواند هر متن نوشتهشدهای را به گفتاری تبدیل کند که گویی توسط همان فرد هدف بیان شده است.
پژوهشهای منتشرشده نشان میدهد کیفیت صداهای مصنوعی طی سالهای اخیر بهطور چشمگیری افزایش یافته و برخی مدلها اکنون قادرند صداهایی تولید کنند که تشخیص آنها از صدای واقعی برای شنوندگان عادی بسیار دشوار است.
کلاهبرداریهایی که میلیاردها دلار خسارت بهجا گذاشت
گزارشهای منتشرشده از سوی بزرگترین نهادهای امنیتی و پژوهشی نشان میدهد که خطر جعل عمیق صوتی با سرعتی نگرانکننده در حال افزایش است.
کارشناسان امنیتی شرکت کاسپرسکی اعلام کردهاند که ابزارهای جعل صوتی مبتنی بر هوش مصنوعی اکنون در بازارهای دارکوب با قیمتهایی بسیار پایین، گاه تنها چند دلار، بهصورت خدماتی فروخته میشوند؛ موضوعی که این فناوری را نهتنها در دسترس گروههای حرفهای، بلکه برای کلاهبرداران آماتور نیز قرار داده است.
همچنین کمیسیون تجارت فدرال آمریکا (FTC) هشدار رسمی و شدیدی به مصرفکنندگان صادر کرده و اعلام کرده است که پروندههای کلاهبرداری مبتنی بر جعل هویت در صدر جرایم مالی قرار دارند و خسارتهای ناشی از آنها به میلیاردها دلار رسیده است. رئیس این کمیسیون، جعل صوتی با استفاده از هوش مصنوعی را «متقاعدکنندهترین سلاح در دست مجرمان امروز» توصیف کرده است.
آزمایشگاههای بینالمللی تحقیقات امنیتی نیز موارد متعددی از خسارتهای سنگین ناشی از این فناوری را ثبت کردهاند. از جمله مشهورترین آنها، ماجرای مدیر یک بانک در یکی از کشورهای عربی است که در سال ۲۰۲۰ پس از دریافت تماس تلفنی با صدایی که بهدقت از یکی از مدیران شرکتهای بزرگ طرف قرارداد بانک شبیهسازی شده بود، مبلغ ۳۵ میلیون دلار انتقال داد.
در پروندهای دیگر، یک شرکت انرژی بریتانیایی بهدلیل جعل صدای مدیرعامل شرکت مادر از طریق تماس تلفنی، ۲۴۳ هزار دلار زیان متحمل شد.
چرا تشخیص صدای جعلی دشوار است؟
پژوهشگران میگویند انسانها بهصورت طبیعی صدا را با هویت افراد گره میزنند و همین موضوع باعث میشود هنگام شنیدن صدای آشنا، سطح اعتماد به شکل خودکار افزایش یابد.

مطالعات تخصصی نشان دادهاند بسیاری از افراد در تشخیص تفاوت میان صدای واقعی و صدای تولیدشده با هوش مصنوعی ناکام میمانند؛ حتی زمانی که تصور میکنند توانایی بالایی در تشخیص دارند.
توانایی هوش مصنوعی در تقلید احساسات انسانی، پیشرفت سریع الگوریتمها و محدودیت شنوایی انسان در تشخیص تفاوتهای بسیار ریز صوتی، از مهمترین دلایل این مسئله به شمار میرود.
راهکارهای محافظت
برای مقابله با این تهدید روبهرشد، لازم است یک راهبرد امنیتی چندلایه شامل ابعاد انسانی، فنی و سازمانی اتخاذ شود.
۱. در سطح خانواده و افراد
پروتکل «رمز خانوادگی»: اعضای خانواده میتوانند یک عبارت یا رمز محرمانه و تصادفی مانند «سقف آبی» یا «گربه آفتابی» میان خود تعیین کنند. در صورت دریافت تماس اضطراری از فردی که درخواست پول یا کمک دارد، باید از او خواسته شود این رمز را بیان کند. اگر فرد نتواند پاسخ دهد یا دچار تردید شود، تماس باید فوراً قطع شود.
قانون «خودت تماس بگیر»: در صورت دریافت تماس مشکوک از یک دوست، خویشاوند یا حتی بانک، بهتر است تماس را قطع کرده، چند دقیقه صبر کنید و سپس از طریق شماره ذخیرهشده در فهرست مخاطبان خود با آن فرد تماس بگیرید. این روش خطر سوءاستفاده از فناوریهای جعل شماره تماس را کاهش میدهد.
محدود کردن انتشار نمونههای صوتی: از انتشار عمومی و بدون محدودیت ویدئوها یا فایلهای صوتی طولانی و واضح در شبکههای اجتماعی خودداری کنید، زیرا این محتواها مهمترین منبع جمعآوری نمونههای صوتی برای کلاهبرداران محسوب میشوند.
۲. در سطح شرکتها و سازمانها
بازنگری در اختیارات مالی: هیچ انتقال وجه یا تصمیم حساس نباید صرفاً بر اساس یک دستور صوتی، حتی اگر از سوی مدیرعامل یا رئیس هیئتمدیره باشد، انجام شود. استفاده از سازوکار «تأیید دوگانه در چند کانال» ضروری است؛ بهگونهای که دستور صوتی با تأیید از طریق ایمیل رمزگذاریشده یا امضای دیجیتال همراه باشد.
آموزش و شبیهسازی حملات صوتی: کارکنان، بهویژه در واحدهای مالی و منابع انسانی، باید بهصورت منظم در دورههای آموزشی و آزمونهای شبیهسازی کلاهبرداری صوتی (Vishing) شرکت کنند تا توانایی تشخیص و تردید منطقی در برابر تماسهای مشکوک افزایش یابد.
۳. راهکارهای فنی و نرمافزاری
سامانههای بیومتریک تشخیص جعل عمیق: امروزه بسیاری از شرکتهای بزرگ از نرمافزارهایی استفاده میکنند که در پسزمینه تماسهای صوتی، اصالت صدا را تحلیل میکنند. این سامانهها صرفاً به لحن و آهنگ صدا توجه نمیکنند، بلکه به دنبال «ردپاهای دیجیتالی» و فرکانسهای غیرطبیعی هستند که هنگام تولید صدا توسط الگوریتمهای هوش مصنوعی ایجاد میشوند. این نشانهها معمولاً توسط گوش انسان قابل تشخیص نیستند.
کارشناسان معتقدند هوش مصنوعی انقلابی بزرگ در تولید محتوای دیجیتال ایجاد کرده است، اما همزمان چالشهای امنیتی بیسابقهای نیز به وجود آورده است. صدایی که زمانی بهعنوان یک شناسه منحصربهفرد و قابل اعتماد شناخته میشد، اکنون میتواند تنها در چند دقیقه با استفاده از ابزارهای در دسترس عموم بازسازی شود.
با گسترش ارتباطات دیجیتال، دورکاری و خدمات آنلاین، توانایی احراز هویت دقیق و راستیآزمایی افراد بیش از هر زمان دیگری اهمیت یافته است و آگاهی عمومی مهمترین خط دفاعی در برابر این نوع کلاهبرداریهای نوظهور به شمار میرود.