رمزگشایی از دینامیک‌های تحریف‌شده سیگنال عصبی پس از کم‌شنوایی

الکتروفیزیولوژی در مقیاس بزرگ و یادگیری عمیق: رمزگشایی از دینامیک‌های تحریف‌شده سیگنال عصبی پس از کم‌شنوایی

شنوندگان مبتلا به کم‌شنوایی اغلب در درک گفتار در محیط‌های پر سر و صدا، حتی با استفاده از سمعک، دچار مشکل می‌شوند. برای درک بهتر نقص‌های پردازش شنوایی که زمینه‌ساز این مشکل هستند، ما ضبط‌های مغزی در مقیاس بزرگ از جربيل‌ها، که مدل حیوانی رایجی برای شنوایی انسان هستند، انجام دادیم و در حین آن، مجموعه بزرگی از صداهای گفتار و نویز را ارائه کردیم. ابتدا از یادگیری منیفولد (manifold learning) برای شناسایی زیرفضای عصبی که گفتار در آن کدگذاری می‌شود استفاده کردیم و دریافتیم که این زیرفضا کم‌بعد است و دینامیک‌های آن در اثر کم‌شنوایی به شدت تحریف می‌شوند. سپس یک شبکه عصبی عمیق (DNN) را آموزش دادیم تا کدگذاری عصبی گفتار را در حالت‌های با و بدون کم‌شنوایی بازتولید کند و دینامیک‌های شبکه زیرین را تحلیل کردیم. یافته‌ها نشان داد که کم‌شنوایی عمدتاً بر پردازش طیفی تأثیر می‌گذارد و باعث تحریف‌های غیرخطی در تعاملات بین‌فرکانسی می‌شود که منجر به حساسیت بیش از حد به نویز پس‌زمینه می‌شود، حتی پس از تقویت صدا با سمعک. نتایج ما نقطه تمرکز جدیدی برای طراحی سمعک‌های بهبودیافته ارائه می‌دهد و قدرت شبکه‌های عصبی عمیق را به‌عنوان ابزاری برای مطالعه ساختارهای مغزی مرکزی نشان می‌دهد.

مقدمه

کم‌شنوایی یکی از شایع‌ترین اختلالات حسی در جهان است که تأثیرات عمیقی بر زندگی افراد دارد. این مشکل نه‌تنها به کاهش توانایی درک گفتار، به‌ویژه در محیط‌های پر سر و صدا منجر می‌شود، بلکه پیامدهای اجتماعی و روانی گسترده‌ای مانند انزوای اجتماعی، کاهش بهره‌وری، و افت کیفیت زندگی به همراه دارد (Wilson et al., 2017). بر اساس گزارش سازمان جهانی بهداشت (WHO, 2021)، هزینه‌های مرتبط با کم‌شنوایی سالانه به حدود ۱ تریلیون دلار می‌رسد، که نشان‌دهنده بار اقتصادی قابل‌توجه این اختلال است.

سمعک‌ها به‌عنوان اصلی‌ترین راهکار درمانی برای کم‌شنوایی، تقویت صوتی را برای جبران کاهش حساسیت شنوایی فراهم می‌کنند. با این حال، حتی با استفاده از سمعک‌های پیشرفته، بسیاری از کاربران همچنان در درک گفتار در محیط‌های پر سر و صدا با مشکل مواجه هستند (Lesica, 2018). این محدودیت نشان می‌دهد که کم‌شنوایی فراتر از کاهش حساسیت، شامل نقص‌های پیچیده‌تری در پردازش شنیداری است که به‌خوبی درک نشده‌اند.

کم‌شنوایی ناشی از آسیب حلزون گوش، علاوه بر کاهش حساسیت، تغییراتی در ساختار فضایی-زمانی الگوهای فعالیت عصبی ایجاد می‌کند که اطلاعات صوتی را رمزگذاری می‌کنند (Henry et al., 2016). این تغییرات می‌توانند شامل از دست رفتن همزمانی عصبی یا اعوجاج در تونوتوپی (نقشه فرکانسی در مغز) باشند، که به مشکلات ادراکی مانند دشواری در درک گفتار در نویز منجر می‌شوند (Moore, 2007). با وجود نظریه‌های متعدد درباره این نقص‌ها (Humes and Dubno, 2010; Plomp, 1986)، فقدان مطالعات مقایسه‌ای مستقیم در نواحی مرکزی مغز، مانع از شناسایی دقیق مکانیزم‌های عصبی مسئول این مشکلات شده است.

در این مطالعه، ما از الکتروفیزیولوژی در مقیاس بزرگ و یادگیری عمیق برای بررسی تأثیر کم‌شنوایی بر رمزگذاری عصبی گفتار استفاده کردیم. با ضبط فعالیت عصبی از کولیکولوس تحتانی (IC) جربيل‌ها و تحلیل داده‌ها با روش‌های یادگیری منیفولد و شبکه‌های عصبی عمیق (DNN)، به دنبال شناسایی تغییرات کلیدی در پردازش شنیداری بودیم. نتایج ما نشان می‌دهد که کم‌شنوایی به‌طور خاص پردازش طیفی را مختل می‌کند و حساسیت بیش از حد به نویز پس‌زمینه ایجاد می‌کند، که حتی با تقویت سمعک قابل جبران نیست.

مقایسه مشکلات درک گفتار قبل و بعد از کم‌شنوایی (برگرفته از مطالعه ۲۰۲۵)

[table id=137 /]

روش‌ها

ضبط‌های عصبی

ما فعالیت عصبی را از کولیکولوس تحتانی (IC) جربيل‌های بیهوش‌شده با استفاده از آرایه‌های الکترودی ۵۱۲ کاناله ثبت کردیم (Armstrong et al., 2022). این آرایه‌ها امکان نمونه‌برداری گسترده از نورون‌های حساس به فرکانس‌های مختلف گفتار را فراهم کردند. بیش از ۱۰ ساعت گفتار از پایگاه داده TIMIT (Garofolo, 1993) ارائه شد، که شامل دو حالت بود: گفتار در سکوت و گفتار در حضور نویز پس‌زمینه. شدت صدا، نسبت سیگنال به نویز (SNR)، و نوع نویز به‌صورت تصادفی تغییر می‌کرد تا شرایط واقعی شبیه‌سازی شود.

داده‌های عصبی با بازه‌های زمانی ۱.۳ میلی‌ثانیه پردازش شدند تا شمارش اسپایک‌های فعالیت چندواحدی (MUA) استخراج شود، که با توانایی IC در رمزگذاری دقیق زمانی اطلاعات گفتار همخوانی دارد (Garcia-Lazaro et al., 2013).

تحلیل یادگیری منیفولد

برای شناسایی زیرفضای عصبی که اطلاعات گفتار را رمزگذاری می‌کند، از تحلیل مؤلفه‌های اصلی (PCA) استفاده کردیم. داده‌ها به دو مجموعه آموزشی و آزمایشی تقسیم شدند. مجموعه آموزشی برای شناسایی مؤلفه‌های اصلی (PCs) به کار رفت، در حالی که مجموعه آزمایشی برای ارزیابی واریانس توضیح‌پذیر توسط هر PC استفاده شد. فعالیت عصبی روی PCs فرافکنی شد و بازسازی فعالیت با داده‌های اصلی مقایسه شد تا دقت کاهش ابعاد سنجیده شود.

مدل‌سازی با شبکه عصبی عمیق

یک شبکه عصبی عمیق (DNN) طراحی شد تا رمزگذاری عصبی گفتار در IC را در حالت‌های با و بدون کم‌شنوایی شبیه‌سازی کند. DNN با داده‌های عصبی واقعی آموزش داده شد تا دینامیک‌های سیگنال عصبی را بازتولید کند. سپس، دینامیک‌های داخلی شبکه تحلیل شد تا تغییرات ناشی از کم‌شنوایی در پردازش طیفی و زمانی شناسایی شود.

نتایج

منیفولد سیگنال عصبی کم‌بعد است

تحلیل داده‌های عصبی از جربيل‌های با شنوایی طبیعی نشان داد که همبستگی‌های سیگنالی (مرتبط با اطلاعات صوتی) غالب هستند و ۹۵٪ از همبستگی کلی بین واحدهای عصبی را تشکیل می‌دهند (شکل ۱c). با وجود واریانس بالای فعالیت عصبی، زیرفضای کم‌بعدی که اطلاعات گفتار را رمزگذاری می‌کند، شناسایی شد. این زیرفضا با استفاده از PCA استخراج شد و نشان داد که تعداد محدودی از مؤلفه‌های اصلی می‌توانند بخش عمده‌ای از اطلاعات صوتی را توضیح دهند.

در جربيل‌های مبتلا به کم‌شنوایی، دینامیک‌های این زیرفضا به شدت تحریف شده بود. این تحریف‌ها به‌ویژه در پاسخ به گفتار در نویز مشهود بودند، که نشان‌دهنده اختلال در پردازش اطلاعات صوتی در حضور نویز پس‌زمینه بود.

تأثیر کم‌شنوایی بر پردازش طیفی

تحلیل DNN نشان داد که کم‌شنوایی عمدتاً بر پردازش طیفی تأثیر می‌گذارد، نه پردازش زمانی. تعاملات غیرخطی بین فرکانس‌های مختلف، به‌ویژه در حضور نویز، به‌طور قابل‌توجهی مختل شده بودند. این اختلال منجر به حساسیت بیش از حد به نویز پس‌زمینه شد، به‌طوری که حتی تقویت صوتی با سمعک نتوانست این مشکل را به‌طور کامل برطرف کند. به‌ویژه، فرکانس‌های بالا تحت تأثیر ماسکرهای فرکانسی پایین قرار گرفتند، که نشان‌دهنده اعوجاج در تعاملات بین‌فرکانسی بود.

پایداری و دقت مدل

نتایج DNN با داده‌های عصبی واقعی همخوانی بالایی داشت (ضریب ICC بین ۰.۸۵ تا ۰.۹۳). این مدل توانست تغییرات دینامیکی ناشی از کم‌شنوایی را با دقت بازتولید کند، که نشان‌دهنده پتانسیل DNN به‌عنوان ابزاری برای مطالعه پردازش عصبی است.

محدودیت‌های سمعک‌های فعلی و جهت‌گیری آینده (بر اساس یافته‌های الکتروفیزیولوژی ۲۰۲۵)

[table id=138 /]

بحث و بررسی

تأثیرات فراتر از کاهش حساسیت

کم‌شنوایی اغلب به‌عنوان کاهش حساسیت به صداهای کم‌شدت تعریف می‌شود، که با تقویت صوتی سمعک‌ها قابل جبران است. با این حال، یافته‌های ما نشان می‌دهد که مشکلات اصلی در کم‌شنوایی، به‌ویژه در درک گفتار در نویز، از تحریف‌های غیرخطی در پردازش طیفی ناشی می‌شوند. این تحریف‌ها حتی در شدت‌های بالا، جایی که سمعک‌ها تقویت کافی فراهم می‌کنند، باقی می‌مانند.

این مشکل به دلیل تغییرات در تعاملات بین‌فرکانسی است که در زیرفضای عصبی مشاهده شد. در افراد با شنوایی طبیعی، این تعاملات به‌طور دقیق اطلاعات گفتاری را رمزگذاری می‌کنند، اما در کم‌شنوایی، اعوجاج‌های غیرخطی باعث می‌شوند که نویز پس‌زمینه تأثیر نامتناسبی بر رمزگذاری گفتار داشته باشد.

پیامدها برای طراحی سمعک

سمعک‌های کنونی عمدتاً بر تقویت فرکانس‌های خاص تمرکز دارند، اما نتایج ما نشان می‌دهد که این رویکرد برای رفع مشکلات پردازش طیفی کافی نیست. برای بهبود عملکرد سمعک‌ها، باید الگوریتم‌های پیشرفته‌تری طراحی شوند که:

تعاملات بین‌فرکانسی را اصلاح کنند.

نویز پس‌زمینه را به‌صورت پویا فیلتر کنند.

از فناوری‌های هوش مصنوعی برای شبیه‌سازی پردازش عصبی طبیعی استفاده کنند.

قدرت یادگیری عمیق

استفاده از DNN در این مطالعه، امکان تحلیل دقیق دینامیک‌های عصبی را فراهم کرد. این ابزار نه‌تنها به شناسایی مکانیزم‌های اختلال در کم‌شنوایی کمک کرد، بلکه نشان داد که می‌تواند به‌عنوان یک مدل محاسباتی برای شبیه‌سازی و پیش‌بینی پاسخ‌های عصبی در شرایط مختلف استفاده شود.

محدودیت‌ها و جهت‌گیری‌های آینده

با وجود نتایج امیدوارکننده، این مطالعه محدودیت‌هایی دارد:

استفاده از جربيل‌ها ممکن است تمام جنبه‌های کم‌شنوایی انسانی را پوشش ندهد.

تمرکز بر IC به‌عنوان یک ناحیه مغزی، اطلاعات محدودی درباره پردازش در نواحی بالاتر (مانند قشر شنوایی) ارائه می‌دهد.

نیاز به آزمایش در شرایط واقعی‌تر، مانند محیط‌های اجتماعی پیچیده.

مطالعات آینده می‌توانند از DNN برای مدل‌سازی نواحی بالاتر مغز استفاده کنند و الگوریتم‌های سمعک را با داده‌های عصبی واقعی بهبود دهند.

نتیجه‌گیری

این مطالعه با استفاده از الکتروفیزیولوژی در مقیاس بزرگ و یادگیری عمیق، بینش‌های جدیدی درباره تأثیر کم‌شنوایی بر پردازش عصبی گفتار ارائه داد. ما دریافتیم که کم‌شنوایی به‌طور خاص پردازش طیفی را مختل می‌کند و باعث حساسیت بیش از حد به نویز پس‌زمینه می‌شود، که حتی با سمعک‌های کنونی قابل جبران نیست. این یافته‌ها نقطه تمرکز جدیدی برای طراحی سمعک‌های پیشرفته ارائه می‌دهند و قدرت DNN را به‌عنوان ابزاری برای مطالعه سیستم‌های عصبی نشان می‌دهند.

با ادامه پیشرفت در فناوری‌های شنوایی و هوش مصنوعی، می‌توان انتظار داشت که سمعک‌های آینده نه‌تنها تقویت صوتی، بلکه اصلاح دینامیک‌های عصبی را نیز هدف قرار دهند. این رویکرد می‌تواند کیفیت زندگی میلیون‌ها فرد کم‌شنوا را بهبود بخشد و بار اجتماعی و اقتصادی کم‌شنوایی را کاهش دهد.

منابع:

Armstrong et al., 2022

Garcia-Lazaro et al., 2013

Garofolo, 1993

Henry et al., 2016

Humes and Dubno, 2010

Lesica, 2018

Moore, 2007

Plomp, 1986

Wilson et al., 2017

World Health Organization, 2021

مونا دراقی

مطالب مرتبط

وقتی سمعک خیس می‌شود چه کنیم؟

مزایای سمعک ساخت ایران در مقایسه با برندهای خارجی

مراحل تجویز و فیتینگ سمعک