ابداع عینکی برای مکالمه بدون صدا!
به گزارش راوه بلاگ، این عینک موسوم به EchoSpeech از میکروفون ها و بلندگو های کوچکی برای خواندن کلماتی استفاده می کند که به شکل بی صدا از گلوی کاربر بیرون می آید و به کاربر اجازه می دهد تا کار های مختلف را بدون نیاز به هرگونه ورودی فیزیکی انجام دهد.
پژوهشگران دانشگاه کرنل پیروز به ساخت عینک هایی شده اند که ارتباط صوتی بدون کلام را ممکن می سازد.
به نقل از نیواطلس، پژوهشگران دانشگاه کرنل فناوری نوی را توسعه داده اند که امکان برقراری ارتباط بی صدا را به وسیله عینک های سونار فراهم می کند.
این عینک موسوم به EchoSpeech از میکروفون ها و بلندگو های کوچکی برای خواندن کلماتی استفاده می کند که به شکل بی صدا از گلوی کاربر بیرون می آید و به کاربر اجازه می دهد تا کار های مختلف را بدون نیاز به هرگونه ورودی فیزیکی انجام دهد.
اکنون یکی از هیجان انگیزترین چشم انداز های این فناوری نو این است که افراد مبتلا به ناتوانی گفتاری از آن برای گفتگوی بی صدا استفاده کنند که سپس این سیستم کلمات را با صدای بلند بیان می کند.
این عینک همچنین می تواند برای کنترل پخش موسیقی در یک کتابخانه یا برای تبدیل گفتار به نوشتار در یک کنسرت پر سر و صدا که صدا به صدا نمی رسد، استفاده گردد.
این فناوری به وسیله یک دانشجوی دکترا در دانشگاه کرنل به نام رویدونگ ژانگ (Ruidong Zhang) و از پروژه مشابهی که از هدفون بی سیم و مدل های قبلی متکی به دوربین استفاده می کرد، توسعه داده شده است.
این عینک به گونه ای طراحی شده است که ساده باشد و کاربر را با یک دوربین بزرگ یا استفاده از هدفون روبرو نکند.
در عوض، این عینک از سونار (Sonar) به معنی ناوبری و فاصله یابی صوتی برای حس کردن حرکات گلو استفاده می کند و در عین حال از الگوریتم یادگیری عمیق برای تجزیه و تحلیل پژواک ها در لحظه استفاده می کند. این کار به سیستم اجازه می دهد تا به دقت 95 درصدی در تشخیص کلماتی که بی صدا به وسیله کاربر تلفظ می شوند، دست یابد.
سونار یا ناوبری و فاصله یابی صوتی در اصل به یک دستگاه ردیاب زیردریایی گفته می گردد که طرز کار آن استفاده از انتشار امواج صوتی است و علاوه بر ردیابی، معمولاً به منظور ناوبری و ارتباط با دیگر یگان های شناور و زیرآبی نیز استفاده می گردد.
خفاش ها به منظور حرکت کردن و معین مسیر و شکار حشرات در تاریکی مطلق، یک سامانه با قدمت بیش از 60 میلیون ساله دارند که بر هر سامانه ناوبری که تا به امروز به وسیله فناوری تولید شده رجحان دارد.
آن ها با فریاد زدن در فرکانس های فراصوت (معمولاً بالای 20 کیلوهرتز) می توانند صدا های منعکس شده از اشیاء اطرافشان را تشخیص دهند و آن ها را به صورت یک تصویر صوتی تفسیر کنند. این بسیار موضوع پیچیده ای است که آن ها می توانند در سرعت های بالا پرواز کنند و در مسیرشان از همه موانع اجتناب کنند و حتی حشرات کوچک را از فاصله چند متری تشخیص دهند.
بانگ ها و صدا های مافوق صوتی که در حنجره خفاش ها تولید می گردد، برای شناسایی محیط اطرافشان و همچنین برای پیدا کردن غذا کارآمد و دقیق است.
دو بلندگوی مینیاتوری در قسمت زیرین قاب عینک و زیر یک لنز نصب شده اند، در حالی که دو میکروفون کوچک در زیر لنز دیگر قرار گرفته اند. این بلندگو ها امواج صوتی غیر قابل شنیدن را منتشر می کنند که از دهان کاربر منعکس می گردد و به سمت میکروفون برمی گردد.
این پژواک ها در لحظه به وسیله یک الگوریتم یادگیری عمیق در تلفن هوشمند متصل به صورت بی سیم تجزیه و تحلیل می شوند. این الگوریتم برای مرتبط ساختن پژواک های خاص با حرکات خاص دهان آموزش داده می گردد.
این فناوری به گونه ای طراحی شده است که نُقلی، کم مصرف و حساس به حریم خصوصی باشد و هیچ داده ای از تلفن کاربر خارج نگردد. به این ترتیب، هیچ نگرانی در مورد حریم خصوصی وجود نخواهد داشت.
این عینک همچنین دارای حالتی است که نیاز به رو به رو شدن با دوربین یا قرار دادن چیزی در گوش کاربر را برطرف می کند؛ بنابراین نسبت به سایر فناوری های تشخیص گفتار بی صدا عملی تر و دردسترس تر است.
به گفته چنگ ژانگ استادیار علوم اطلاعات درد انشگاه کرنل، بیشتر فناوری ها در تشخیص بی صدای گفتار به مجموعه ای از دستورات از پیش معین شده محدود می گردد و کاربر را ملزم می کند با دوربین روبرو گردد یا آن را بپوشد که نه عملی است و نه امکانپذیر. ما در حال تحقق سونار روی بدن هستیم.
پژوهشگران می گویند، این سیستم تنها به چند دقیقه داده آموزشی برای یادگیری الگو های گفتار کاربر نیاز دارد و پس از آماده شدن برای کار، امواج صوتی را در سراسر صورت کاربر ارسال و دریافت می کند و حرکات دهان را حس می کند و در عین حال از الگوریتم یادگیری عمیق برای تجزیه و تحلیل پژواک ها استفاده می کند.
عینک EchoSpeech در حال حاضر قادر است 31 دستور را با دقت 95 درصدی تشخیص دهد.
نسخه فعلی این عینک از آنجایی که از یک دوربین پرقدرت استفاده نمی کند، حدود 10 ساعت عمر باتری ارائه می دهد و پردازش داده ها را به صورت بی سیم در تلفن هوشمند کاربر انجام می دهد تا همین طور کوچک و بدون مزاحمت باقی بماند. این در حالی است که سازندگان آن ادعا می کنند که سیستم های مبتنی بر دوربین با هر بار شارژ تنها برای حدود 30 دقیقه کار می کنند.
تیم آزمایشگاه رابط های رایانه ای هوشمند برای تعاملات آینده (SciFi) در دانشگاه کرنل در حال بررسی تجاری سازی این فناوری با استفاده از برنامه تأمین مالی این دانشگاه است. آن ها همچنین در پی کاربرد های این عینک هوشمند برای ردیابی حرکات صورت، چشم و بالاتنه هستند.
چنگ ژانگ می گوید: ما فکر می کنیم عینک یک سکوی محاسبات شخصی مهم برای درک فعالیت های انسان در تنظیمات روزمره خواهد بود.
همانطور که اشاره شد، این سیستم برای افرادی که نگرانی های مربوط به حفظ حریم خصوصی دارند، هیچ دوربینی را در خود جای نداده است و هیچ اطلاعاتی را به اینترنت ارسال نمی کند.
به طور کلی، عینک های سوناری که پژوهشگران دانشگاه کرنل ساخته اند، یک پیشرفت مهم در فناوری تشخیص گفتار بی صدا است. این عینک با توانایی تشخیص طیف گسترده ای از کلمات و عبارات می تواند نحوه تعامل ما با تکنولوژی و یکدیگر را متحول کند.
پژوهشگران این دانشگاه در حال حاضر روی تجاری سازی این فناوری کار می کنند.
رویدونگ ژانگ می گوید: این فناوری برای افرادی که نمی توانند صحبت کنند، گفتار بی صدا را فراهم می کند. در واقع می تواند صدای بیماران را بازگرداند.
گفتنی است که آزمایشگاه SciFi در دانشگاه کرنل قبلاً یک سیستم مشابه به نام EarIO را توسعه داده بود که از یک دستگاه مجهز به سونار برای ثبت حالات چهره کاربر استفاده می کرد.
منبع: ایسنا
منبع: فرادید