همکاری آنلاین در مقیاس بسیار وسیعچند نفر از شما تاکنون فرمهای اینترنتی رو پر کردید وقتی که از شما خواسته میشه کاراکترهای بهم ریخته ای را بخوانید؟  چه تعداد از شما ان را ناراحت کننده می دانید؟

این کاراکترهای به هم ریخته که با نام فایل کپچا (CAPTCHA)  می شناسیم برای آن است که سایت ها  مطمئن شوند کسی که فرم رو پر می کند واقعا یک انسان است نه یک نوع برنامه کامپیوتری.

پروژه کپچا چیری است که ما در دانشگاه کارنگی ملون  شروع کردیم و اکنون چندین سال است که در همه جا استفاده می شود.

حالا اجازه بدهید در مورد پروژه ای توضیح دهم  که در چند سال گذشته شروع کردیم که نوعی انقلاب در کپچا به حساب می اید.  این پروژه ری کپچا   ( ReCAPTCHA) نام دارد که ما در کارنگی ملون شروع کردیم و چند سال بعد  شرکت گوگل مالک آن شد

همکاری آنلاین در مقیاس بسیار وسیع

این پروژه چگونه شروع شد ؟

به نظر می رسد که روزانه حدود 200 میلیون کپچا توسط مردم نوشته می شوند.

هر زمان که شما یک کپچا رو می نویسید حداقل 10 ثانیه زمان صرف می کنید و اگه شما ان را ضرب در 200 میلیون کنید 500000 ساعت نفر در روز زمان از دست رفته داریم تایپ این کپچای آزار دهنده است بنابر این من حس خوبی نداشتم. و شروع به فکر کردن کردم .

خوب ، البته ، ما نمی توانیم از شر کپچا خلاص شویم برای اینکه امنیت بخشی از وب سایت به ان بستگی دارد. پس با این وجود آیا راهی وجود دارد که بتوانیم از این حرکت استفاده کنیم چیری که برای بشریت مفید باشد ؟

زمانی که شما یک فایل کپچا را می نویسید در زمان 10 ثانیه مغز شما کار جالبی انجام می دهد که هنوز هیچ رایانه ای قادر به انجام ان نیست پس ما کاری میکنیم که درون این 10 ثانیه کار مفیدی انجام بشود.

همکاری آنلاین در مقیاس بسیار وسیع

بنابر این ان چیزی که ممکن است شما تا حالا ندانید این است که زمانی شما کپچا رو می نویسید فقط خودتان را به عنوان یک انسان معرفی نمی کنید بلکه شما کمک می کنید تا ما کتابها را الکترونیکی کنیم .

تا حالا پروژه های زیادی جهت الکترونیکی کردن کتابها وجود داشته ( از جمله آمازو ن با کیندل  ) . روش کار به این صورت است که شما با یک کتاب قدیمی شروع می کنید ،و شما ان را اسکن می کنید که شبیه یک عکس دیجیتالی از هر صفحه از کتاب است .

مرحله بعد پردازش داده ها است که به یک کامپیوتر جهت تشخیص کلمه ها از میان صفحات اسکن شده کتاب  نیاز دارد، که به این تکنولوژی ocr  می گویند . حالا مشکل این است  که ocr ها عالی عمل نمی کنند خصوصا برای کتابهای قدیمی.

جایی که جوهر کمرنگ شده و صفحات زرد است ocr نمی تواند خیلی از این کلمات را تشخیص بدهد پس ما باید چکار کنیم ؟ آیا غیر از این است که ما می توانیم کلماتی را تشخیص بدهیم که کامپیوتر نمی تواند.  بنابراین  ما از انسانها استفاده می کنیم تا انها را برای ما بخوانند، زمانی که انها یک فایل کپچا را در اینترنت می نویسند.

پس زمانی که شما یک فایل کپچا را می نویسید، این کلمه که شما می نویسید واقعا بخشی از یک کتاب هستند که در حال الکترونیکی شدن است و کامپیوترها هم قادر به تشخیص ان نیستند.

همکاری آنلاین در مقیاس بسیار وسیع

دلیل اینکه ما دو کلمه را کنار هم به جای یک کلمه قرار می دهیم این است که، همانطور که می دانید، یک کلمه کلمه ای است که کامپیوتر از کتاب بدست آورده و  نمی داند که آن کلمه چیست (کلمه کلیدی) و به شما ارائه کرده است و  کلمه دیگر که ما در اختیار شما قرار می دهیم کلمه ای که سیستم جواب ان را می داند (کلمه مبهم مورد نظر).  ما از شما می خواهیم  هر دو کلمه را بنویسید.
اگر کاربر کلمه کلیدی را درست وارد کند ، به احتمال فراوان کلمه نامعلوم دیگری را نیز درست وارد کرده است. و اگر ما این را برای 10 شخص دیگر بفرستیم و تمامی انها توافق داشته باشند بر روی اینکه ان کلمه چیست پس ما توانستیم به طور صحیحی یک کتاب رو دیجیتالی کنیم .

همکاری آنلاین در مقیاس بسیار وسیع

این روشی است که سیستم کار می کند و زمانی که ما ان را از سه یا چهار سال پیش عرضه کردیم خیلی از وبسایتها کپچای خود را به این سیستم تغییر دادند.

از کپچایی قدیمی که مردم وقت خود را بیهوده صرف می کردند به کپچای جدیدی که مردم به الکترونیکی کردن کتابها کمک می کنند.

اکنون حدود 350000 از سایتهای دیگر در حال استفاده از ری کپچا هستند در واقع تعداد سایتهای که از ری کپچا استفاده میکنند بسیار بالاست و تعداد کلماتی که ما در حال دیجیتالی کردن هستیم هر روز بیشتر می شود، چیزی در حدود 100 میلیون کلمه در روز یا دو ونیم میلیون کتاب در سال .  و تمامی این موارد زمانی انجام می شود که شما  یک کپچا را در اینترنت تایپ می کنید .