گوشی های هوشمند و فناوری تشخیص صدا

گوشی های هوشمند و فناوری تشخیص صدا
  • 1391/6/2
  • آزاد
  • 0

Apple Siri

بدون ترید شرکت اپل و فناوری سیری، اولین شرکتی بود که بار دیگر توجه همه  را به فناوری تشخیص صدا و اهمیت آن در گوشی های هوشمند معطوف کرد.

apple-siri

فناوری تشخیص صدای اپل« سیری» برای نخستین بار در سال گذشته همزمان با معرفی گوشی آیفون4اس ( iPhone 4s)  به همگان معرفی شد. آنچه را که باعث محبوبیت سیری در میان تمام پلتفرم های تشخیص صدا شده است می توان در موارد زیر دسته بندی کرد :

 کیفیت اجرای سیری

1- عدم محدودیت آن به موارد ساده‌‌‌‌‌‌‌‌‌ای همچون تنظیم قرار ملاقات

2- پخش موسیقی و ویدئو

3- و همه مهم‌تر محبوبیت بالای گوشی آی فون.

با فشار دادن کلید Home  که در زیر صفحه نمایش آی فون قرار دارد می توان سیری را فعال کرد و آماده دریافت دستورات صوتی کاربر می‌‌‌‌‌‌‌‌‌شود.

 در این مرحله سیری ضمن تشخیص نوع دستورات وارد شده از سوی کاربر در مورد اجرای محلی (Local) دستورات یا ارسال آنها از طریق شبکه به سرورهای ابری  (Cloud) تصمیم‌گیری می‌کند. دستورات داخلی با توجه به الگوی در اختیار نرم‌‌‌‌‌‌‌‌‌افزار به سرعت از طریق خود گوشی اجرا شده و دستورات ارسال‌شده برای سرور نیز توسط نرم‌‌‌‌‌‌‌‌‌افزارهای تحلیل داده برای تشخیص کلمات، نوع چینش آنها و در نهایت جمله تشکیل‌شده توسط این کلمات مورد تحلیل و بررسی قرار می‌‌‌‌‌‌‌‌‌گیرد.

iPhone-4S-Siri

 در این هنگام با توجه به درک سیری و اطمینان آن از تشخیص صدای ضبط‌شده و جملات گفته ‌شده پاسخ مناسب از سوی سرورها برای کاربر ارسال شده و نمایش داده می‌‌‌‌‌‌‌‌‌شود.

تغییرات جدیدی بر روی سیری در نسخه تازه سیستم‌‌‌‌‌‌‌‌‌عامل اپل موسوم به   iOS 6.0 به ثبت رسیده است که از آن جمله می‌توان به امکان استفاده از آن در اپلیکیشن‌‌‌‌‌‌‌‌های جانبی و افزوده شدن زبان‌های جدید به لیست زبان‌‌‌های مورد پشتیبانی این برنامه اشاره کرد.

از جمله تغییرات کوچک و بزرگ دیگر در نسخه جدید سیری روی   iOS 6، آپدیت شدن اطلاعات داخلی برنامه، همکاری اپل با شرکت‌‌‌‌‌‌‌‌‌های بزرگ خودروسازی در ایجاد دکمه مخصوص سیری و امکان پرسش از برنامه در رابطه با وقایع ورزشی به شمار می‌رود.

Samsung S-Voice

یکی از سرویس جدیدی که همزمان با معرفی گوشی هوشمند و چهار هسته ای سامسونگ موسوم به گلکسی اس 3 معرفی شد، قابلیت تشخیص صدای  S-Voice است که امکان تشخیص صدا و مدیریت محتوا را در گلکسی فراهم می‌کند.

S-Voice-apk

زبان‌‌‌‌‌‌‌‌‌هایی که توسط  S Voice پشتیبانی می شوند شامل: انگلیسی، فرانسه، اسپانیایی، ایتالیایی، آلمانی و کره‌‌‌‌‌‌‌‌‌ای می‌شود که در مقایسه با سیری لیست کامل‌‌‌‌‌‌‌‌‌تری از زبان ها را تشکیل می‌دهد.

علاوه بر امکاناتی که همراه با سیستم عامل اندروید بر روی گلکسی اس 3 وجود دارد وتوسط رابط صوتی اندروید نیز پشتیبانی می‌‌‌‌‌‌‌‌‌شود ( همانند برقراری تماس، ارسال پیام و جست‌وجوی وب )، فناوری تشخیص صدای S Voice  قابلیت انجام موارد زیر را نیز دارد:

  • Notification Area
  • کنترل پخش ‌‌‌‌‌‌‌‌کننده موسیقی
  • جست‌وجوی وضعیت هوا و ترافیک
  • تنظیم زمان و آلارم
  • اجرای برنامه

Samsung-S-Voice

بعضی از نرم افزارها و اپلیکیشن‌‌‌‌‌‌‌‌‌هایی که توسط  S Voice پشتیبانی می شوند برای اجراشدن به دستورات صوتی به خصوصی احتیاج دارند. برای مثال، جهت فعال کردن دوربین می ‌‌‌‌‌‌‌‌توان از «I want to take a picture» و برای گرفتن عکس از عبارت «!Cheese» استفاده کرد.

نکته مثبت و برتری دیگری که   S Voice نسبت به سیری دارد، امکان آپدیت مستقیم وضعیت در شبکه‌های اجتماعی فیس‌بوک و توییتر است که یکی از برتری‌های این سرویس بر سیری محسوب می‌شود.

 S Voice از پایگاه داده Wolfram Alpha برای جست‌وجوی سوالات علمی و پایه‌‌‌‌‌‌‌‌‌ای کاربران استفاده می‌کند که دقیقا همان منبع مورد استفاده سیری است و از این لحاظ نمی‌توان تفاوتی میان این دو قائل شد.

wolfram

از جمله نکات منفی که S Voice  در مقایسه با سیری می توان به این موارد اشاره کرد :

دقت پایین‌تر این برنامه در تشخیص صحیح صدا، سرعت عملکرد پایین‌تر و برنامه‌‌‌‌‌‌‌‌‌ریزی ضعیف‌تر آن برای موقعیت‌‌‌‌‌‌‌‌های تعریف‌نشده‌

Google Voice

نسخه جدید Google Voice در ورژن 4.1 اندروید، تغییرات بی‌‌‌‌‌‌‌‌شماری را نسبت به گذشته تجربه کرده و این ‌‌‌‌‌‌‌‌ بار تقریبا می‌‌‌‌‌‌‌‌‌توان در رابطه با هر چیزی از گوگل سوال پرسید. در تست‌‌‌‌‌‌‌‌های صورت‌پذیرفته روی Google Voice سرعت و دقت بسیار بالایی به چشم می‌‌‌‌‌‌‌‌‌خورد که در مقایسه با سیری نیز نتایج بسیار مطلوب‌تری را نشان می ‌‌‌‌‌‌‌‌دهد.

google-voice-logo

نکته جذاب دیگر در این رابطه حضور رابط صوتی برای این فناوری است که عليرغم تشابه با سیری، صدای انتخاب شده برای آن تا حدودی انسانی‌‌‌‌‌‌‌‌‌تر بوده و از فرم روباتیک سیری فاصله گرفته است. البته خروجي Google Voice از لحاظ ظاهری در بسیاری از موارد با جذابیت کمتری نسبت به سیری همراه است اما سرعت و دقت آنها شرایط سختی را برای اپل در جهت رقابت ایجاد کرده است.

یکی دیگر از برتری‌های سرویس Google Voice اتکای آن به موتور جست‌وجوی قدرتمند گوگل است که در حین جست‌وجوهای موضوعی برتری خود را کاملا نشان می‌دهد، به عنوان مثال پس از درخواست از سیری برای نمایش یک عکس خاص رابط صوتی برای جست‌وجوی وب به دنبال آن تصویر از کاربر کسب اجازه می‌کند اما Google Voice بلافاصله نتایج جست‌وجوی تصویر مورد نظر از گوگل را نمايش مي‌دهد.

_google-voice-features

البته توجه به این نکته نیز ضروری ا‌‌‌‌‌‌‌‌ست که نسخه جدید سیری روی iOS 6.0 هنوز مراحل بتای خود را پشت سر می‌گذارد و با آمدن نسخه نهایی این سیستم‌‌‌‌‌‌‌‌‌عامل ممکن است بسیاری از موارد گفته‌شده اصلاح شود. یکی از قابلیت‌‌‌‌‌‌‌‌‌های جدید Google Voice امکان تبدیل صدا به متن به صورت آفلاین است، به طوری که سرعت بالاتری در حین نوشتن متن بدون نیاز به اینترنت فراهم می‌شود. این اینترفیس با آموختن نوع الگوریتم مورد استفاده کاربر به مرور زمان کیفیت بالاتری از اجرا را ارائه می‌دهد.

Windows Phone Speech

سرویس Voice اختصاصی شرکت مایکروسافت موسوم به Speech که از نسخه 7.5 سیستم‌عامل Windows Phone پا به عرصه وجود گذاشت در ورژن هشتم این سیستم به نام Apollo به گونه‌‌‌‌‌‌‌‌‌ای تغییر یافته که می‌‌‌‌‌‌‌‌‌توان از آن به عنوان یکی از بزرگان این رده و از جمله رقبای قابل اعتنای سیری و Google Voice در پلتفرمی دیگر و از جمله دلایل جدید جذابیت سیستم‌عامل ویندوزفون یاد کرد.

Windows-Phone-8-Features

بزرگ‌ترین نکته قابل اشاره در مورد Speech و کلیدی‌ترین قابلیت این برنامه امکان استفاده از آن در دیگر برنامه‌‌‌‌‌‌‌‌‌ها و عدم محدودیت آن به برنامه‌های اصلی و پیش‌فرض سیستم‌‌‌‌‌‌‌‌‌عامل است که مایکروسافت از آن با عنوان امکان گفت‌وگوی مستقیم با اپلیکیشن‌ها یاد می‌کند؛ از این طریق برنامه‌‌‌‌‌‌‌‌‌نویسان و توسعه‌دهندگان سیستم ‌‌‌‌‌‌‌‌عامل ویندوزفون امکان تعریف کنترلرهای صوتی مختلف برای برنامه خود را پیدا می‌کنند و از این طریق امکان در اختیار داشتن برنامه از طریق دستورهای صوتی را برای کاربران فراهم می‌آورند.

از جمله مثال‌‌‌‌‌‌‌‌‌های عملی در این رابطه می‌توان به اجرای یک کتاب صوتی از صفحه اصلی، Pause کردن خوانش، پرش به فصل ویژه‌‌‌‌‌‌‌‌‌ای از کتاب یا بستن اپلیکیشن اشاره کرد. مایکروسافت رابط صوتی خود را در همکاری با شرکت Audible گسترش داده است که تجربه فراوانی در این زمینه دارد. سرویس Voice مایکروسافت علاوه بر این طبیعتا امکان انجام موارد استانداردی از قبیل جست‌وجوی وب، فرستادن پیام و ایمیل و تنظیم آلارم و قرار ملاقات‌ها را نیز داراست و در این زمینه دقت مناسبی از خود نشان می‌دهد.

10-Speech-Platform

امکان مسیریابی با پشتیبانی صوتی و تشخیص هوشمندانه موارد خاص با پیشنهادهای ویژه برای کاربران از دیگر امکانات سرویس Speech ویندوزفون به شمار می‌رود. در رابطه با ویندوزفون8 نیز شرایط نسبتا مشابهی با سیری برقرار است چرا که این نسخه جدید هنوز در مرحله بتا قرار دارد و تا قرارگیری نهایی آن در ویندوزفون8 هنوز چند ماه دیگر باقی است.

 منبع : http://www.gomonews.com/

http://community.giffgaff.com        

دیدگاه خود را وارد کنید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *