,

سرویس تشخیص صوت مایکروسافت به کم ترین نرخ خطا دست پیدا کرده است

تشخیص صدا مایکروسافت می

 

آنگونه که از سخنرانی های ارائه شده در کنفرانس های توسعه دهندگان در طول سال گذشته به نظر میرسد ، شرکت ها تمایل دارند در آینده ی نزدیک برای پیشبرد فناوری در سه حوزه ی ، یادگیری ماشینی ، هوش مصنوعی و تشخیص صوت گام بر دارند.

به صورت ایده آل ؛ برای کاربرانی که روز به روز از دستیار های دیجیتال و اپلیکیشنن های موبایل متکی بر اتصال به فضای ابری  استفاده ی بیشتری می کنند، یادگیری ماشینی، تشخیص صوت و هوش مصنوعی در همراهی با یکدیگر، تجربه ای خارق العاده خلق خواهند کرد.

خوشبختانه برای مایکروسافت، ریسک این شرکت در سرمایه گذاری بر روی دستیار دیجیتالی که از تشخیص صوت استفاده می کند در حال جواب دادن است و گام مهمی در زمینه ی ارتباط انسان – ماشین برداشته شده است.

طبق گزارش جدید ترین ارزیابی های مایکروسافت که توسط  مدیر بخش “صدا” مایکروسافت منتشر شد، این شرکت به پایین ترین میزان خطا تا کنون دست یافته است. محققین مایکروسافت با پشت سر گذاشتن استاندارد های صنعتی در این حوزه، خطای تشخیص صوت سرویس خود را تا ۶٫۳ درصد کاهش داده اند. این رکورد جدید ۶٫۳ درصدی پایین ترین میزان خطا در این حوزه تا به امروز است.

محققین مایکروسافت که در پشت صحنه ی این موفقیت بزرگ قرار دارند، موفقیت خود را مرهون بنیان های توسعه داده شده بر پایه ی شبکه های عصبی می دانند. محققین مایکروسافت در رقابت های تشخیص تصویر که بر پایه ی شبکه های عصبی است نیز به برتری درست پیدا کرده اند. با استفاده از اتصالات شبکه ی چند لایه، محققین قادر بودند تا از هر لایه برای بهبود تشخیص صدا و الگو های موجود در آن استفاده کنند.

تشخیص صدا مایکروسافت می

تشخیص صدا
مایکروسافت می

یکی دیگر از عناصر کلیدی که به ثبت این رکورد کمک کرده است، پروژه ی موفق دیگر مایکروسافت با نام  ” Computational Network Toolkit ” است که به محققین اجازه می دهد تا با استفاده از الگوریتم های یادگیری، بهینه سازی های پیچیده ای را روی سرویس تشخیص صوت اعمال کنند.

هرچند این موضوع هفت ماه قبل گفته شده و نهایتا توسط بسیاری فراموش شد، مایکروسافت ریسک جدیدی را به جان خریده و در حال سرمایه گذاری بر روی قابلیتی است که در آن صوت به نوع جدیدی از لمس بدل خواهد شد و کنترل اپ ها از طریق صدا به میزان استفاده از صفحات لمسی ممکن و کاربردی خواهد بود.

به نظر میرسد محققین مایکروسافت در راه تحقق بخشیدن به چنین رویایی کاملا مصمم هستند و این قابلیت تنها در حد یک اسلاید  پاورپوینت در یک کنفرانس  محدود نخواهد ماند.

برای کسب اطلاعات بیشتر در مورد محققینی که در اجرای این پروژه نقش داشتند یا کسب اطلاع از جزئیات این رکورد جدید به وبلاگ رسمی مایکروسافت مراجعه کنید.

 

منبع :

 

http://www.winbeta.org/news/microsoft-speech-recognition-achieves-the-lowest-ever-error-rate-in-recent-study

 

0 پاسخ

دیدگاه خود را ثبت کنید

میخواهید در گفت و گو ها شرکت کتید؟
مشتاقیم نظر شما را بدانیم!

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *