گاهی اوقات پیش میآید که نمیتوان متن داخل فایل های PDF را خواند ، حتی اگر برای خواندن این فایل ها از برنامه های Adobe Reader یا Foxit Reader استفاده کنیم. و شاید ما به متن داخل فایل های PDF احتیاج دارم. برای بدست آوردن متن های داخل فایل های PDF باید از تکنولوژی OCR استفاده کنیم.

OCR تکنولوژی هست که میتوان با آن فایل های تصویری را اسکن کرد و بعد با هماهنگ کردن فونت ها اطلاعات به متن تبدیل میشود. به طور کلی OCR یعنی خواندن متن از عکس.

PDF OCR یک نرم افزار رایگان ویندوز هست که به وسیله تکنولوژی OCR فایل های PDF شما را به فایل های متنی Text تبدیل میکند.

این نرم افزار از دو قسمت جداگانه تشکیل شده هست و هنگام اجرای آن ، دو پنجره باز میشود. پنجره سمت چپی برای اجرا و خواندن فایل های PDF هست و در کنار این پنجره میتوانید صفحات فایل PDF را مدیریت کرد.

حال بعد از اجرا فایل PDF روی دکمه Start OCR کلیک کنید و بعد یک پنجره کوچک باز میشود که میتوانید تعداد صفحات را مشخص کنید ، بعد از تایید صفحات روی دکمه OCR کلیک کنید تا فایل اسکن شود.

سپس بعد از اسکن ، نتایج در پنجره سمت راستی نمایش داده میشود که میتوانید در آن پنجره ، متن های تولید شده را مدیریت و ویرایش کنید.

اسم پنجره سمت راستی PDF OCR Editor نام دارد که در واقع یک ویرایش گر ساده متون هست. شما در این پنجره میتوانید مانند ورد تغییرات کوچکی مثله اندازه فونت ، رنگ نوشته ها و غیره را اعمال کنید.

بعد از تغییراتی که در پنجره PDF OCR Editor اعمال کردید ، میتوانید آن را در چند ثانیه به فرمت های Text و Doc تبدیل و استخراج کنید.

این نرم افزار معمولا برای به دست آوردن متن و نجات فایل های PDF هست که بعد از استخراج متن ، میتوانید آنها را در برنامه های ویرایش گر حرفه ای مانند Microsoft Word باز کنید و گرامر یا هر چیزی از آن را چک و تنظیم کنید.

نرم افزار PDF OCR میتواند برای هر کاربری مناسب باشد چون کار کردن با آن بسیار ساده هست. این برنامه از اکثر زبان ها پشتیبانی میکند و با تمام ویندوز های مایکروسافت سازگار هست ، همچنین ورژن های 32 و 64 بیتی این برنامه هم موجود هست. این نرم افزار را میتوان از اینجا به رایگان دانلود کنید :

با این سایت هم میتوانید فایل های PDF را به صورت آنلاین اسکن کنید و آن ها را به متن Text تبدیل کنید.

منبع: ghacks