الکتروفیزیولوژی در مقیاس بزرگ و یادگیری عمیق: رمزگشایی از دینامیکهای تحریفشده سیگنال عصبی پس از کمشنوایی
شنوندگان مبتلا به کمشنوایی اغلب در درک گفتار در محیطهای پر سر و صدا، حتی با استفاده از سمعک، دچار مشکل میشوند. برای درک بهتر نقصهای پردازش شنوایی که زمینهساز این مشکل هستند، ما ضبطهای مغزی در مقیاس بزرگ از جربيلها، که مدل حیوانی رایجی برای شنوایی انسان هستند، انجام دادیم و در حین آن، مجموعه بزرگی از صداهای گفتار و نویز را ارائه کردیم. ابتدا از یادگیری منیفولد (manifold learning) برای شناسایی زیرفضای عصبی که گفتار در آن کدگذاری میشود استفاده کردیم و دریافتیم که این زیرفضا کمبعد است و دینامیکهای آن در اثر کمشنوایی به شدت تحریف میشوند. سپس یک شبکه عصبی عمیق (DNN) را آموزش دادیم تا کدگذاری عصبی گفتار را در حالتهای با و بدون کمشنوایی بازتولید کند و دینامیکهای شبکه زیرین را تحلیل کردیم. یافتهها نشان داد که کمشنوایی عمدتاً بر پردازش طیفی تأثیر میگذارد و باعث تحریفهای غیرخطی در تعاملات بینفرکانسی میشود که منجر به حساسیت بیش از حد به نویز پسزمینه میشود، حتی پس از تقویت صدا با سمعک. نتایج ما نقطه تمرکز جدیدی برای طراحی سمعکهای بهبودیافته ارائه میدهد و قدرت شبکههای عصبی عمیق را بهعنوان ابزاری برای مطالعه ساختارهای مغزی مرکزی نشان میدهد.
مقدمه
کمشنوایی یکی از شایعترین اختلالات حسی در جهان است که تأثیرات عمیقی بر زندگی افراد دارد. این مشکل نهتنها به کاهش توانایی درک گفتار، بهویژه در محیطهای پر سر و صدا منجر میشود، بلکه پیامدهای اجتماعی و روانی گستردهای مانند انزوای اجتماعی، کاهش بهرهوری، و افت کیفیت زندگی به همراه دارد (Wilson et al., 2017). بر اساس گزارش سازمان جهانی بهداشت (WHO, 2021)، هزینههای مرتبط با کمشنوایی سالانه به حدود ۱ تریلیون دلار میرسد، که نشاندهنده بار اقتصادی قابلتوجه این اختلال است.
سمعکها بهعنوان اصلیترین راهکار درمانی برای کمشنوایی، تقویت صوتی را برای جبران کاهش حساسیت شنوایی فراهم میکنند. با این حال، حتی با استفاده از سمعکهای پیشرفته، بسیاری از کاربران همچنان در درک گفتار در محیطهای پر سر و صدا با مشکل مواجه هستند (Lesica, 2018). این محدودیت نشان میدهد که کمشنوایی فراتر از کاهش حساسیت، شامل نقصهای پیچیدهتری در پردازش شنیداری است که بهخوبی درک نشدهاند.
کمشنوایی ناشی از آسیب حلزون گوش، علاوه بر کاهش حساسیت، تغییراتی در ساختار فضایی-زمانی الگوهای فعالیت عصبی ایجاد میکند که اطلاعات صوتی را رمزگذاری میکنند (Henry et al., 2016). این تغییرات میتوانند شامل از دست رفتن همزمانی عصبی یا اعوجاج در تونوتوپی (نقشه فرکانسی در مغز) باشند، که به مشکلات ادراکی مانند دشواری در درک گفتار در نویز منجر میشوند (Moore, 2007). با وجود نظریههای متعدد درباره این نقصها (Humes and Dubno, 2010; Plomp, 1986)، فقدان مطالعات مقایسهای مستقیم در نواحی مرکزی مغز، مانع از شناسایی دقیق مکانیزمهای عصبی مسئول این مشکلات شده است.
در این مطالعه، ما از الکتروفیزیولوژی در مقیاس بزرگ و یادگیری عمیق برای بررسی تأثیر کمشنوایی بر رمزگذاری عصبی گفتار استفاده کردیم. با ضبط فعالیت عصبی از کولیکولوس تحتانی (IC) جربيلها و تحلیل دادهها با روشهای یادگیری منیفولد و شبکههای عصبی عمیق (DNN)، به دنبال شناسایی تغییرات کلیدی در پردازش شنیداری بودیم. نتایج ما نشان میدهد که کمشنوایی بهطور خاص پردازش طیفی را مختل میکند و حساسیت بیش از حد به نویز پسزمینه ایجاد میکند، که حتی با تقویت سمعک قابل جبران نیست.
مقایسه مشکلات درک گفتار قبل و بعد از کمشنوایی (برگرفته از مطالعه ۲۰۲۵)
| ویژگی پردازش شنوایی | افراد با شنوایی طبیعی | افراد مبتلا به کمشنوایی (حتی با سمعک) |
|---|---|---|
| بعدیت زیرفضای عصبی گفتار | کمبعد و منظم | شدیداً تحریفشده |
| پردازش طیفی (فرکانسی) | دقیق و غیرخطی درست | مختل و غیرخطی تحریفشده |
| تعاملات بینفرکانسی | متعادل و تفکیکپذیر | ماسکینگ غیرطبیعی فرکانسهای بالا توسط پایین |
| حساسیت به نویز پسزمینه | پایین | بسیار بالا (حتی در SNR مثبت) |
| توانایی درک گفتار در نویز | عالی | ضعیف تا متوسط (مشکل اصلی کاربران سمعک) |
| امکان جبران با تقویت ساده صدا | – | خیر – تقویت معمولی سمعک کافی نیست |
روشها
ضبطهای عصبی
ما فعالیت عصبی را از کولیکولوس تحتانی (IC) جربيلهای بیهوششده با استفاده از آرایههای الکترودی ۵۱۲ کاناله ثبت کردیم (Armstrong et al., 2022). این آرایهها امکان نمونهبرداری گسترده از نورونهای حساس به فرکانسهای مختلف گفتار را فراهم کردند. بیش از ۱۰ ساعت گفتار از پایگاه داده TIMIT (Garofolo, 1993) ارائه شد، که شامل دو حالت بود: گفتار در سکوت و گفتار در حضور نویز پسزمینه. شدت صدا، نسبت سیگنال به نویز (SNR)، و نوع نویز بهصورت تصادفی تغییر میکرد تا شرایط واقعی شبیهسازی شود.
دادههای عصبی با بازههای زمانی ۱.۳ میلیثانیه پردازش شدند تا شمارش اسپایکهای فعالیت چندواحدی (MUA) استخراج شود، که با توانایی IC در رمزگذاری دقیق زمانی اطلاعات گفتار همخوانی دارد (Garcia-Lazaro et al., 2013).
تحلیل یادگیری منیفولد
برای شناسایی زیرفضای عصبی که اطلاعات گفتار را رمزگذاری میکند، از تحلیل مؤلفههای اصلی (PCA) استفاده کردیم. دادهها به دو مجموعه آموزشی و آزمایشی تقسیم شدند. مجموعه آموزشی برای شناسایی مؤلفههای اصلی (PCs) به کار رفت، در حالی که مجموعه آزمایشی برای ارزیابی واریانس توضیحپذیر توسط هر PC استفاده شد. فعالیت عصبی روی PCs فرافکنی شد و بازسازی فعالیت با دادههای اصلی مقایسه شد تا دقت کاهش ابعاد سنجیده شود.
مدلسازی با شبکه عصبی عمیق
یک شبکه عصبی عمیق (DNN) طراحی شد تا رمزگذاری عصبی گفتار در IC را در حالتهای با و بدون کمشنوایی شبیهسازی کند. DNN با دادههای عصبی واقعی آموزش داده شد تا دینامیکهای سیگنال عصبی را بازتولید کند. سپس، دینامیکهای داخلی شبکه تحلیل شد تا تغییرات ناشی از کمشنوایی در پردازش طیفی و زمانی شناسایی شود.
نتایج
منیفولد سیگنال عصبی کمبعد است
تحلیل دادههای عصبی از جربيلهای با شنوایی طبیعی نشان داد که همبستگیهای سیگنالی (مرتبط با اطلاعات صوتی) غالب هستند و ۹۵٪ از همبستگی کلی بین واحدهای عصبی را تشکیل میدهند (شکل ۱c). با وجود واریانس بالای فعالیت عصبی، زیرفضای کمبعدی که اطلاعات گفتار را رمزگذاری میکند، شناسایی شد. این زیرفضا با استفاده از PCA استخراج شد و نشان داد که تعداد محدودی از مؤلفههای اصلی میتوانند بخش عمدهای از اطلاعات صوتی را توضیح دهند.
در جربيلهای مبتلا به کمشنوایی، دینامیکهای این زیرفضا به شدت تحریف شده بود. این تحریفها بهویژه در پاسخ به گفتار در نویز مشهود بودند، که نشاندهنده اختلال در پردازش اطلاعات صوتی در حضور نویز پسزمینه بود.
تأثیر کمشنوایی بر پردازش طیفی
تحلیل DNN نشان داد که کمشنوایی عمدتاً بر پردازش طیفی تأثیر میگذارد، نه پردازش زمانی. تعاملات غیرخطی بین فرکانسهای مختلف، بهویژه در حضور نویز، بهطور قابلتوجهی مختل شده بودند. این اختلال منجر به حساسیت بیش از حد به نویز پسزمینه شد، بهطوری که حتی تقویت صوتی با سمعک نتوانست این مشکل را بهطور کامل برطرف کند. بهویژه، فرکانسهای بالا تحت تأثیر ماسکرهای فرکانسی پایین قرار گرفتند، که نشاندهنده اعوجاج در تعاملات بینفرکانسی بود.
پایداری و دقت مدل
نتایج DNN با دادههای عصبی واقعی همخوانی بالایی داشت (ضریب ICC بین ۰.۸۵ تا ۰.۹۳). این مدل توانست تغییرات دینامیکی ناشی از کمشنوایی را با دقت بازتولید کند، که نشاندهنده پتانسیل DNN بهعنوان ابزاری برای مطالعه پردازش عصبی است.
محدودیتهای سمعکهای فعلی و جهتگیری آینده (بر اساس یافتههای الکتروفیزیولوژی ۲۰۲۵)
| محدودیت سمعکهای نسل فعلی | دلیل علمی (برگرفته از مطالعه) | راهحل پیشنهادی برای سمعکهای نسل بعدی |
|---|---|---|
| فقط تقویت فرکانسی انجام میدهند | کمشنوایی فقط کاهش حساسیت نیست → پردازش طیفی هم مختل است | اصلاح تعاملات بینفرکانسی بهصورت غیرخطی |
| حذف نویز خطی و ساده | نویز در مغز کمشنوا بهصورت غیرخطی ماسک میکند | حذف نویز مبتنی بر هوش مصنوعی و یادگیری عمیق (DNN-based) |
| تنظیمات ثابت یا محیطی ساده | دینامیک عصبی در کمشنوایی به شدت تغییر کرده | شبیهسازی دینامیک عصبی طبیعی با شبکههای عصبی عمیق |
| عدم توجه به تحریف منیفولد عصبی | زیرفضای عصبی گفتار تحریف شده است | الگوریتمهای بازسازی منیفولد عصبی (مانند مطالعه حاضر) |
بحث و بررسی
تأثیرات فراتر از کاهش حساسیت
کمشنوایی اغلب بهعنوان کاهش حساسیت به صداهای کمشدت تعریف میشود، که با تقویت صوتی سمعکها قابل جبران است. با این حال، یافتههای ما نشان میدهد که مشکلات اصلی در کمشنوایی، بهویژه در درک گفتار در نویز، از تحریفهای غیرخطی در پردازش طیفی ناشی میشوند. این تحریفها حتی در شدتهای بالا، جایی که سمعکها تقویت کافی فراهم میکنند، باقی میمانند.
این مشکل به دلیل تغییرات در تعاملات بینفرکانسی است که در زیرفضای عصبی مشاهده شد. در افراد با شنوایی طبیعی، این تعاملات بهطور دقیق اطلاعات گفتاری را رمزگذاری میکنند، اما در کمشنوایی، اعوجاجهای غیرخطی باعث میشوند که نویز پسزمینه تأثیر نامتناسبی بر رمزگذاری گفتار داشته باشد.
پیامدها برای طراحی سمعک
سمعکهای کنونی عمدتاً بر تقویت فرکانسهای خاص تمرکز دارند، اما نتایج ما نشان میدهد که این رویکرد برای رفع مشکلات پردازش طیفی کافی نیست. برای بهبود عملکرد سمعکها، باید الگوریتمهای پیشرفتهتری طراحی شوند که:
تعاملات بینفرکانسی را اصلاح کنند.
نویز پسزمینه را بهصورت پویا فیلتر کنند.
از فناوریهای هوش مصنوعی برای شبیهسازی پردازش عصبی طبیعی استفاده کنند.
قدرت یادگیری عمیق
استفاده از DNN در این مطالعه، امکان تحلیل دقیق دینامیکهای عصبی را فراهم کرد. این ابزار نهتنها به شناسایی مکانیزمهای اختلال در کمشنوایی کمک کرد، بلکه نشان داد که میتواند بهعنوان یک مدل محاسباتی برای شبیهسازی و پیشبینی پاسخهای عصبی در شرایط مختلف استفاده شود.
محدودیتها و جهتگیریهای آینده
با وجود نتایج امیدوارکننده، این مطالعه محدودیتهایی دارد:
استفاده از جربيلها ممکن است تمام جنبههای کمشنوایی انسانی را پوشش ندهد.
تمرکز بر IC بهعنوان یک ناحیه مغزی، اطلاعات محدودی درباره پردازش در نواحی بالاتر (مانند قشر شنوایی) ارائه میدهد.
نیاز به آزمایش در شرایط واقعیتر، مانند محیطهای اجتماعی پیچیده.
مطالعات آینده میتوانند از DNN برای مدلسازی نواحی بالاتر مغز استفاده کنند و الگوریتمهای سمعک را با دادههای عصبی واقعی بهبود دهند.
نتیجهگیری
این مطالعه با استفاده از الکتروفیزیولوژی در مقیاس بزرگ و یادگیری عمیق، بینشهای جدیدی درباره تأثیر کمشنوایی بر پردازش عصبی گفتار ارائه داد. ما دریافتیم که کمشنوایی بهطور خاص پردازش طیفی را مختل میکند و باعث حساسیت بیش از حد به نویز پسزمینه میشود، که حتی با سمعکهای کنونی قابل جبران نیست. این یافتهها نقطه تمرکز جدیدی برای طراحی سمعکهای پیشرفته ارائه میدهند و قدرت DNN را بهعنوان ابزاری برای مطالعه سیستمهای عصبی نشان میدهند.
با ادامه پیشرفت در فناوریهای شنوایی و هوش مصنوعی، میتوان انتظار داشت که سمعکهای آینده نهتنها تقویت صوتی، بلکه اصلاح دینامیکهای عصبی را نیز هدف قرار دهند. این رویکرد میتواند کیفیت زندگی میلیونها فرد کمشنوا را بهبود بخشد و بار اجتماعی و اقتصادی کمشنوایی را کاهش دهد.
منابع:
Armstrong et al., 2022
Garcia-Lazaro et al., 2013
Garofolo, 1993
Henry et al., 2016
Humes and Dubno, 2010
Lesica, 2018
Moore, 2007
Plomp, 1986
Wilson et al., 2017
World Health Organization, 2021




