برقراري ارتباط صوتي كاربران با سيستم‌عامل رايانه‌هاي شخصي، تلفن‌هاي همراه و … که از طریق آن، اجراي فرمان‌هاي صوتي ارسالي از سمت كاربر توسط اين وسائل امکان‌پذیر می‌شود، اتفاق تازه‌ای نیست و مدت‌هاست که با این تکنولوژی در حوزه‌ تعامل بین انسان و رایانه آشنا هستیم.

سيستم شماره‌گير صوتي تلفن‌های همراه، سيستم تشخيص صدا براي ورود و خروج از درب‌های امنیتی ساختمان‌ها، فناوری تبدیل صوت به متن در نرم‌افزارهای رایانه‌ای، کدهای امنیتی صوتی سرویس‌های اینترنتی (Voice Captcha) و … برخی از کاربردهای این API‌ نرم‌افزاری هستند.

با ظهور نسخه پنجم زبان HTML و معرفی API صوتی موجود در این زبان، برقراری ارتباط صوتی بین کاربر و وب‌سایت‌های اینترنتی بسیار ساده‌تر شد و تنها با به ‌کارگیری تگ‌های مربوط به این API، می‌توان ارتباط بین ورودی صوت رایانه‌ی کاربر (میکروفون) و سرویس تشخیص صدای موجود در وب‌سایت‌های اینترنتی را برقرار نمود.

نسخه 11 مرورگر گوگل کروم

نسخه 11 مرورگر گوگل کروم

و اینبار هم گوگل یکی از اولین شرکتهایی است که چنین فناوری‌های جدیدی را در سرویس‌های خود به کاربرانش معرفی می‌کند. به تازگی (در تاریخ 27 آوریل 2011) که نسخه 11 مرورگر کروم شرکت گوگل از حالت بتا (Beta Version) خارج شد و به صورت پایدار (Stable) برای دانلود در اختیار کاربران این مرورگر اینترنتی قرار گرفت، گوگل از اضافه‌شدن امکان پشتیبانی از Voice Input (که یکی از ویژگی‌های جدید اضافه شده به زبان HTML5 است) در این مرورگر خبر داد. (منبع)

براي پي بردن به اينكه آيا مرورگر شما از قابليت API صوتي در HTML5 پشتيباني مي‌كند يا نه و امتحان كردن عملي كاربرد فرمان‌‌هاي صوتي مي‌توانيد به اين‌ صفحه مراجعه نماييد.

در نسخه 11 مرورگر گوگل کروم که برای سیستم‌عامل ویندوز، لینوکس، مکینتاش و کرومیوم به صورت پایدار عرضه شده‌است، کاربران می‌توانند با استفاده از میکروفون و پس اتصال به اینترنت از سرویس‌های صوتی ارائه شده در اینترنت به راحتی و بدون نصب هیچ‌نرم‌افزار اضافه‌ای استفاده کنند.

اولین سرویس اینترنتی که از این قابلیت پشتیبانی می‌کند، سرویس مترجم گوگل (Google Translate) است. اگر مرورگر شما از قابلیت HTML5 Voice Input API پشتیبانی نماید، پس از ورود به صفحه سرویس مترجم گوگل، آیکون کوچکی را در باکس ورود متن خواهید دید که با کلیک بر روی آن، سرویس مترجم دریافت صدای شما را آغاز کرده و پس از ایستادن صدای گوینده و قطع صحبت، پردازش صدا و تبدیل آن به متن را در عرض چند ثانیه انجام می‌دهد.

دکمه‌ای که قبل از صحبت باید بر روی آن کلیک کنید

دکمه‌ای که قبل از صحبت باید بر روی آن کلیک کنید

البته گوگل اعلام کرده است که این، تنها سرویس مبتنی بر API صوتی زبان HTML5‌ در مرورگر Google Chrome نیست و به زودی سرویس‌های جدیدی نیز به کاربران معرفی خواهد شد. علاوه‌ بر اين، در حال حاضر اين فناوري فقط براي زبان انگليسي فعال شده و گوگل قول داده است كه به زودي پشتيباني از باقي زبان‌هاي مهم دنيا را نيز در اين سرويس ارائه نمايد.

ما هم برای اینکه دوست‌داران دنیای ارتباطات و فناوری اطلاعات و مخاطبين عزيز مجله اينترنتي گويا آي‌تي با این فناوري جذاب گوگل بيشتر آشنا شوند، ویدئویی را به زبان فارسی ضبط کرده‌ایم که چگونگی عملکرد اين سرويس را به نمايش مي‌گذارد. برای دریافت این ویدئو با کیفیت عالی يا متوسط از لینک مستقیم سرور گویا آپ،بر روی يكي از تصاویر زیر کلیک نمایید.

6.64 مگابایت

6.64 مگابایت

2.5 مگابایت

2.5 مگابایت

لطفا نظرات و تجربیات خود در مورد سرویس‌های صوتی در وب را با ما در میان بگذارید.

محسن پاك نيت