ابداع عینکی برای مکالمه بدون صدا!

ابداع عینکی برای مکالمه بدون صدا!

گروه هوش مصنوعی: پژوهشگران دانشگاه «کرنل» موفق به ساخت عینک هایی شده اند که ارتباط صوتی بدون کلام را ممکن می سازد.


به گزارش گروه هوش مصنوعی به نقل از ایسنا و به نقل از نیواطلس، پژوهشگران دانشگاه «کرنل» فناوری جدیدی را توسعه داده اند که امکان برقراری ارتباط بی صدا را بوسیله عینک های سونار فراهم می آورد.
این عینک موسوم به EchoSpeech از میکروفون ها و بلندگوهای کوچکی برای خواندن کلماتی استفاده می نماید که به شکل بی صدا از گلوی کاربر بیرون می آید و به کاربر اجازه می دهد تا کارهای مختلف را بدون نیاز به هرگونه ورودی فیزیکی انجام دهد.
حالا یکی از هیجان انگیزترین چشم اندازهای این تکنولوژی جدید این است که افراد مبتلا به ناتوانی گفتاری از آن برای گفتگوی بی صدا بهره گیرند که سپس این سیستم کلمات را با صدای بلند بیان می کند. این عینک همین طور می تواند برای کنترل پخش موسیقی در یک کتابخانه یا برای تبدیل گفتار به نوشتار در یک کنسرت پر سر و صدا که صدا به صدا نمی رسد، استفاده گردد.
این فناوری ازطریق یک دانشجوی دکترا در دانشگاه کرنل به نام رویدونگ ژانگ(Ruidong Zhang) و از پروژه مشابهی که از هدفون بی سیم و مدلهای قبلی متکی به دوربین استفاده می کرد، توسعه داده شده است.
این عینک به شکلی طراحی شده است که ساده باشد و کاربر را با یک دوربین بزرگ یا استفاده از هدفون مواجه نکند.
در عوض، این عینک از سونار(Sonar) به مدلول ناوبری و فاصله یابی صوتی برای حس کردن حرکات گلو استفاده می نماید و در عین حال از الگوریتم یادگیری عمیق برای تحلیل و بررسی پژواک ها در لحظه استفاده می نماید. این کار به سیستم اجازه می دهد تا به دقت ۹۵ درصدی در تشخیص کلماتی که بی صدا توسط کاربر تلفظ می شوند، برسد.
سونار یا ناوبری و فاصله یابی صوتی در اصل به یک دستگاه ردیاب زیردریایی گفته می شود که طرز کار آن استفاده از انتشار امواج صوتی است و علاوه بر ردیابی، به طور معمول بمنظور ناوبری و ارتباط با دیگر یگان های شناور و زیرآبی نیز استفاده می شود.
خفاش ها بمنظور حرکت کردن و تعیین مسیر و شکار حشرات در تاریکی مطلق، یک سامانه با قدمت بیش از ۶۰ میلیون ساله دارند که بر هر سامانه ناوبری که تا حالا به وسیله فناوری تولید شده برتری دارد. آنها با فریاد زدن در فرکانس های فراصوت(معمولاً بالای ۲۰ کیلوهرتز) می توانند صداهای منعکس شده از اشیاء اطرافشان را تشخیص دهند و آنها را بصورت یک «تصویر صوتی» تفسیر کنند. این بسیار موضوع پیچیده ای است که آنها می توانند در سرعت های بالا پرواز کنند و در مسیرشان از همه موانع اجتناب کنند و حتی حشرات کوچک را از فاصله چند متری تشخیص دهند.
بانگ ها و صداهای مافوق صوتی که در حنجره خفاش ها تولید می شود، برای شناسایی محیط اطرافشان و همین طور برای پیدا کردن غذا کارآمد و دقیق است.
دو بلندگوی مینیاتوری در قسمت زیرین قاب عینک و زیر یک لنز نصب شده اند، در صورتیکه دو میکروفون کوچک در زیر لنز دیگر قرار گرفته اند. این بلندگوها امواج صوتی غیر قابل شنیدن را منتشر می کنند که از دهان کاربر منعکس می شود و به سمت میکروفون برمی گردد.
این پژواک ها در لحظه ازطریق یک الگوریتم یادگیری عمیق در تلفن هوشمند متصل بصورت بی سیم تحلیل و بررسی می شوند. این الگوریتم برای مرتبط ساختن پژواک های خاص با حرکات خاص دهان آموزش داده می شود.


این فناوری به شکلی طراحی شده است که نُقلی، کم مصرف و حساس به حریم خصوصی باشد و هیچ داده ای از تلفن کاربر خارج نشود. به این ترتیب، هیچ نگرانی در مورد حریم خصوصی وجود نخواهد داشت.
این عینک همین طور دارای حالتی است که نیاز به رو به رو شدن با دوربین یا قرار دادن چیزی در گوش کاربر را برطرف می کند. بدین سبب نسبت به سایر فناوری های تشخیص گفتار بی صدا عملی تر و دردسترس تر است.
بگفته چنگ ژانگ استادیار علوم اطلاعات درد انشگاه کرنل، بیشتر فناوری ها در تشخیص بی صدای گفتار به مجموعه ای از دستورات از پیش تعیین شده محدود می شود و کاربر را ملزم می کند با دوربین روبرو شود یا آنرا بپوشد که نه عملی است و نه امکانپذیر. ما درحال تحقق سونار روی بدن هستیم.
پژوهشگران می گویند، این سیستم تنها به چند دقیقه داده آموزشی برای یادگیری الگوهای گفتار کاربر نیاز دارد و بعد از آماده شدن برای کار، امواج صوتی را در سراسر صورت کاربر ارسال و دریافت می کند و حرکات دهان را حس می کند و در عین حال از الگوریتم یادگیری عمیق برای تحلیل و بررسی پژواک ها استفاده می نماید.
عینک EchoSpeech هم اکنون قادر می باشد ۳۱ دستور را با دقت ۹۵ درصدی تشخیص دهد.
نسخه فعلی این عینک از آنجا که از یک دوربین پرقدرت استفاده نمی کند، حدود ۱۰ ساعت عمر باتری ارائه می دهد و پردازش داده ها را بصورت بی سیم در تلفن هوشمند کاربر انجام می دهد تا همچنین کوچک و بدون مزاحمت باقی بماند. این در حالیست که سازندگان آن ادعا می کنند که سیستم های مبتنی بر دوربین با هر بار شارژ تنها برای حدود ۳۰ دقیقه کار می کنند.
تیم لابراتوار رابط های کامپیوتری هوشمند برای تعاملات آینده(SciFi) در دانشگاه کرنل درحال بررسی تجاری سازی این فناوری با بهره گیری از برنامه تامین مالی این دانشگاه است. آنها همین طور بدنبال کاربردهای این عینک هوشمند برای ردیابی حرکات صورت، چشم و بالاتنه هستند.
چنگ ژانگ می گوید: ما فکر می نماییم عینک یک سکوی محاسبات شخصی مهم برای درک کارهای انسان در تنظیمات روزمره خواهد بود.
همانطور که اشاره شد، این سیستم برای افرادی که نگرانی های مربوط به حفظ حریم خصوصی دارند، هیچ دوربینی را در خود جای نداده است و هیچ اطلاعاتی را به اینترنت ارسال نمی کند.
بطور کلی، عینک های سوناری که پژوهشگران دانشگاه کرنل ساخته اند، یک پیشرفت مهم در فناوری تشخیص گفتار بی صدا است. این عینک با توانایی تشخیص طیف گسترده ای از کلمات و عبارات می تواند نحوه تعامل ما با تکنولوژی و یکدیگر را متحول کند.
پژوهشگران این دانشگاه هم اکنون روی تجاری سازی این فناوری کار می کنند.
رویدونگ ژانگ می گوید: این فناوری برای افرادی که نمی توانند صحبت کنند، گفتار بی صدا را فراهم می آورد. در حقیقت می تواند صدای بیماران را بازگرداند.
گفتنی ست که لابراتوار SciFi در دانشگاه کرنل قبلاً یک سیستم مشابه به نام EarIO را توسعه داده بود که از یک دستگاه مجهز به سونار برای ثبت حالات چهره کاربر استفاده می کرد.




منبع:

1402/01/20
10:55:59
5.0 / 5
536
مطلب را می پسندید؟
(1)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۸ بعلاوه ۴
گروه هوش مصنوعی
iagrp.ir - مالکیت معنوی سایت گروه هوش مصنوعی متعلق به مالکین آن می باشد