گوشی های هوشمند و فناوری تشخیص صدا
Apple Siri
بدون ترید شرکت اپل و فناوری سیری، اولین شرکتی بود که بار دیگر توجه همه را به فناوری تشخیص صدا و اهمیت آن در گوشی های هوشمند معطوف کرد.
فناوری تشخیص صدای اپل« سیری» برای نخستین بار در سال گذشته همزمان با معرفی گوشی آیفون4اس ( iPhone 4s) به همگان معرفی شد. آنچه را که باعث محبوبیت سیری در میان تمام پلتفرم های تشخیص صدا شده است می توان در موارد زیر دسته بندی کرد :
کیفیت اجرای سیری
1- عدم محدودیت آن به موارد سادهای همچون تنظیم قرار ملاقات
2- پخش موسیقی و ویدئو
3- و همه مهمتر محبوبیت بالای گوشی آی فون.
با فشار دادن کلید Home که در زیر صفحه نمایش آی فون قرار دارد می توان سیری را فعال کرد و آماده دریافت دستورات صوتی کاربر میشود.
در این مرحله سیری ضمن تشخیص نوع دستورات وارد شده از سوی کاربر در مورد اجرای محلی (Local) دستورات یا ارسال آنها از طریق شبکه به سرورهای ابری (Cloud) تصمیمگیری میکند. دستورات داخلی با توجه به الگوی در اختیار نرمافزار به سرعت از طریق خود گوشی اجرا شده و دستورات ارسالشده برای سرور نیز توسط نرمافزارهای تحلیل داده برای تشخیص کلمات، نوع چینش آنها و در نهایت جمله تشکیلشده توسط این کلمات مورد تحلیل و بررسی قرار میگیرد.
در این هنگام با توجه به درک سیری و اطمینان آن از تشخیص صدای ضبطشده و جملات گفته شده پاسخ مناسب از سوی سرورها برای کاربر ارسال شده و نمایش داده میشود.
تغییرات جدیدی بر روی سیری در نسخه تازه سیستمعامل اپل موسوم به iOS 6.0 به ثبت رسیده است که از آن جمله میتوان به امکان استفاده از آن در اپلیکیشنهای جانبی و افزوده شدن زبانهای جدید به لیست زبانهای مورد پشتیبانی این برنامه اشاره کرد.
از جمله تغییرات کوچک و بزرگ دیگر در نسخه جدید سیری روی iOS 6، آپدیت شدن اطلاعات داخلی برنامه، همکاری اپل با شرکتهای بزرگ خودروسازی در ایجاد دکمه مخصوص سیری و امکان پرسش از برنامه در رابطه با وقایع ورزشی به شمار میرود.
Samsung S-Voice
یکی از سرویس جدیدی که همزمان با معرفی گوشی هوشمند و چهار هسته ای سامسونگ موسوم به گلکسی اس 3 معرفی شد، قابلیت تشخیص صدای S-Voice است که امکان تشخیص صدا و مدیریت محتوا را در گلکسی فراهم میکند.
زبانهایی که توسط S Voice پشتیبانی می شوند شامل: انگلیسی، فرانسه، اسپانیایی، ایتالیایی، آلمانی و کرهای میشود که در مقایسه با سیری لیست کاملتری از زبان ها را تشکیل میدهد.
علاوه بر امکاناتی که همراه با سیستم عامل اندروید بر روی گلکسی اس 3 وجود دارد وتوسط رابط صوتی اندروید نیز پشتیبانی میشود ( همانند برقراری تماس، ارسال پیام و جستوجوی وب )، فناوری تشخیص صدای S Voice قابلیت انجام موارد زیر را نیز دارد:
- Notification Area
- کنترل پخش کننده موسیقی
- جستوجوی وضعیت هوا و ترافیک
- تنظیم زمان و آلارم
- اجرای برنامه
بعضی از نرم افزارها و اپلیکیشنهایی که توسط S Voice پشتیبانی می شوند برای اجراشدن به دستورات صوتی به خصوصی احتیاج دارند. برای مثال، جهت فعال کردن دوربین می توان از «I want to take a picture» و برای گرفتن عکس از عبارت «!Cheese» استفاده کرد.
نکته مثبت و برتری دیگری که S Voice نسبت به سیری دارد، امکان آپدیت مستقیم وضعیت در شبکههای اجتماعی فیسبوک و توییتر است که یکی از برتریهای این سرویس بر سیری محسوب میشود.
S Voice از پایگاه داده Wolfram Alpha برای جستوجوی سوالات علمی و پایهای کاربران استفاده میکند که دقیقا همان منبع مورد استفاده سیری است و از این لحاظ نمیتوان تفاوتی میان این دو قائل شد.
از جمله نکات منفی که S Voice در مقایسه با سیری می توان به این موارد اشاره کرد :
دقت پایینتر این برنامه در تشخیص صحیح صدا، سرعت عملکرد پایینتر و برنامهریزی ضعیفتر آن برای موقعیتهای تعریفنشده
Google Voice
نسخه جدید Google Voice در ورژن 4.1 اندروید، تغییرات بیشماری را نسبت به گذشته تجربه کرده و این بار تقریبا میتوان در رابطه با هر چیزی از گوگل سوال پرسید. در تستهای صورتپذیرفته روی Google Voice سرعت و دقت بسیار بالایی به چشم میخورد که در مقایسه با سیری نیز نتایج بسیار مطلوبتری را نشان می دهد.
نکته جذاب دیگر در این رابطه حضور رابط صوتی برای این فناوری است که عليرغم تشابه با سیری، صدای انتخاب شده برای آن تا حدودی انسانیتر بوده و از فرم روباتیک سیری فاصله گرفته است. البته خروجي Google Voice از لحاظ ظاهری در بسیاری از موارد با جذابیت کمتری نسبت به سیری همراه است اما سرعت و دقت آنها شرایط سختی را برای اپل در جهت رقابت ایجاد کرده است.
یکی دیگر از برتریهای سرویس Google Voice اتکای آن به موتور جستوجوی قدرتمند گوگل است که در حین جستوجوهای موضوعی برتری خود را کاملا نشان میدهد، به عنوان مثال پس از درخواست از سیری برای نمایش یک عکس خاص رابط صوتی برای جستوجوی وب به دنبال آن تصویر از کاربر کسب اجازه میکند اما Google Voice بلافاصله نتایج جستوجوی تصویر مورد نظر از گوگل را نمايش ميدهد.
البته توجه به این نکته نیز ضروری است که نسخه جدید سیری روی iOS 6.0 هنوز مراحل بتای خود را پشت سر میگذارد و با آمدن نسخه نهایی این سیستمعامل ممکن است بسیاری از موارد گفتهشده اصلاح شود. یکی از قابلیتهای جدید Google Voice امکان تبدیل صدا به متن به صورت آفلاین است، به طوری که سرعت بالاتری در حین نوشتن متن بدون نیاز به اینترنت فراهم میشود. این اینترفیس با آموختن نوع الگوریتم مورد استفاده کاربر به مرور زمان کیفیت بالاتری از اجرا را ارائه میدهد.
Windows Phone Speech
سرویس Voice اختصاصی شرکت مایکروسافت موسوم به Speech که از نسخه 7.5 سیستمعامل Windows Phone پا به عرصه وجود گذاشت در ورژن هشتم این سیستم به نام Apollo به گونهای تغییر یافته که میتوان از آن به عنوان یکی از بزرگان این رده و از جمله رقبای قابل اعتنای سیری و Google Voice در پلتفرمی دیگر و از جمله دلایل جدید جذابیت سیستمعامل ویندوزفون یاد کرد.
بزرگترین نکته قابل اشاره در مورد Speech و کلیدیترین قابلیت این برنامه امکان استفاده از آن در دیگر برنامهها و عدم محدودیت آن به برنامههای اصلی و پیشفرض سیستمعامل است که مایکروسافت از آن با عنوان امکان گفتوگوی مستقیم با اپلیکیشنها یاد میکند؛ از این طریق برنامهنویسان و توسعهدهندگان سیستم عامل ویندوزفون امکان تعریف کنترلرهای صوتی مختلف برای برنامه خود را پیدا میکنند و از این طریق امکان در اختیار داشتن برنامه از طریق دستورهای صوتی را برای کاربران فراهم میآورند.
از جمله مثالهای عملی در این رابطه میتوان به اجرای یک کتاب صوتی از صفحه اصلی، Pause کردن خوانش، پرش به فصل ویژهای از کتاب یا بستن اپلیکیشن اشاره کرد. مایکروسافت رابط صوتی خود را در همکاری با شرکت Audible گسترش داده است که تجربه فراوانی در این زمینه دارد. سرویس Voice مایکروسافت علاوه بر این طبیعتا امکان انجام موارد استانداردی از قبیل جستوجوی وب، فرستادن پیام و ایمیل و تنظیم آلارم و قرار ملاقاتها را نیز داراست و در این زمینه دقت مناسبی از خود نشان میدهد.
امکان مسیریابی با پشتیبانی صوتی و تشخیص هوشمندانه موارد خاص با پیشنهادهای ویژه برای کاربران از دیگر امکانات سرویس Speech ویندوزفون به شمار میرود. در رابطه با ویندوزفون8 نیز شرایط نسبتا مشابهی با سیری برقرار است چرا که این نسخه جدید هنوز در مرحله بتا قرار دارد و تا قرارگیری نهایی آن در ویندوزفون8 هنوز چند ماه دیگر باقی است.
منبع : http://www.gomonews.com/
http://community.giffgaff.com