সহায়:অ'চিআৰ

ৱিকিউৎসৰ পৰা
Jump to navigation Jump to search

Optical Character Recognition (OCR) প্ৰক্ৰিয়াই pdf/djvu/jpg ফাইলৰ স্কেন ছবি এখনৰ পৰা আখৰৰ চিহ্নক ইউনিক'ড চিহ্নলৈ পৰিৱৰ্তিত কৰিব পাৰে। গতিকে ছবি এখনত থকা অসমীয়া আখৰবোৰ মেনুৱেলী টাইপ কৰি থকাৰ সলনি এই প্ৰক্ৰিয়ালৈ কামটো উজু আৰু খৰতকীয়া কৰি তোলে। ভাৰতীয় ভাষাবোৰৰ বাবে ২০১৫ চনৰ মাজভাগলৈকে কোনো সন্তোষজনক OCR উপলব্ধ নাছিল। তাৰ পাছত গুগলে ভাৰতীয় ভাষাবোৰৰ বাবেও OCR সেৱা মুকলি কৰে আৰু এতিয়া ভাৰতীয় ৱিকিউৎসমূহে সেই সুবিধাকে ব্যৱহাৰ কৰি আছে।

OCRৰ সহায়ত পাঠ্য সংযোগ[সম্পাদনা কৰক]

অ'চিআৰ সঁজুলিটো অসমীয়া ৱিকিউৎসৰ সকলো ব্যৱহাৰকাৰীৰ বাবে পৃষ্ঠা নামস্থানত উপলব্ধ। উদাহৰণস্বৰূপে পাঠ্য সংযোগৰ আগতে সূচী:লাহৰী.pdfৰ ১১ নং পৃষ্ঠা খুলিলে (পৃষ্ঠা:লাহৰী.pdf/১১) তলৰ দিয়াৰ দৰে দেখা পাব।

Aswikisource OCR tool.JPG

OCR বুটামটো হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱা হৈছে। এই বুটামটো ক্লিক কৰিলে "গুগল অ'চিআৰৰ পৰা পাঠ আহৰণ কৰি থকা হৈছে" বুলি বাৰ্তা দেখা পাব আৰু দুই ছেকেণ্ডমানৰ পাছতে তলত দিয়াৰ দৰে পাঠ্য দৃশ্যমান হ'ব।

Aswikisource OCR tool 2.JPG

ইউনিক'ড সংশোধন[সম্পাদনা কৰক]

অ'চিআৰৰ সহায়ত পাঠ্য আহৰণ কৰাৰ পাছত রকে ধৰি কিছুমান ত্ৰুটি থাকি যায় (সহায়:মুদ্ৰণ সংশোধন# সাধাৰণ OCR ত্ৰুটিসমূহ দ্ৰষ্টব্য)। গতিকে পৃষ্ঠাটো সাঁচি থোৱাৰ আগতে ইয়াৰ সংশোধনৰ প্ৰয়োজন। এনে কৰিবলৈ OCR বুটামৰ কাষতে থকা উজ্জ্বল ৰঙা ৰঙৰ "ৰ" বুটামটো এবাৰ ক্লিক কৰিব আৰু তাৰ পাছত পৃষ্ঠাটো সাঁচি থ'ব।

As wikisource Unicode correction tool.jpg

Indic OCR সঁজুলি[সম্পাদনা কৰক]

কেতিয়াবা কিবা কাৰণত কোনো ব্যৱহাৰকাৰীয়ে সাধাৰণ অ'চিআৰ সঁজুলিটো দেখা নাপাব পাৰে বা সঁজুলিটোৱে ভালকৈ কাম নকৰিব পাৰে। তেনে ক্ষেত্ৰত গুগল ড্ৰাইভ APIৰ সহায়ত সজা ইণ্ডিক অ'চিআৰ সঁজুলিটো ব্যৱহাৰ কৰিব পাৰি। ইয়াৰ বাবে ব্যৱহাৰকাৰীজনে নিজৰ সদস্য পৃষ্ঠাত common.js পৃষ্ঠা এটা সৃষ্টি কৰিব লাগিব। অৰ্থাৎ ব্যৱহাৰকাৰীগৰাকীৰ সদস্যনাম "অমুক" হ'লে "সদস্য:অমুক/common.js" (উৰ্ধকমা অবিহনে) নামৰ পৃষ্ঠা এটা সৃষ্টি কৰি এই সংকেতখিনি তালৈ প্ৰতিলিপি কৰিব: mw.loader.load('//meta.wikimedia.org/w/index.php?title=User:Indic-TechCom/Script/IndicOCR.js&action=raw&ctype=text/javascript');

এতিয়া পৃষ্ঠাটো সাঁচি থ'ব। ব্ৰাউজাৰ কেশ্ব খালি কৰি সম্পাদনা পৃষ্ঠা এটালৈ গ'লে (যেনে- পৃষ্ঠা:লাহৰী.pdf/১১) তলৰ হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱাৰ দৰে এটা বুটাম দেখা পাব।

Indic OCR tool.JPG

এই বুটামটো ক্লিক কৰিলেও সাধাৰণ OCR বুটামৰ দৰে কাম কৰিব আৰু কেইছকেণ্ডমানৰ পাছত পাঠ্য দৃশ্যমান হ'ব।

টোকা[সম্পাদনা কৰক]

অ'চিআৰৰ সহায়ত লাভ কৰা পাঠ্য ১০০% শুদ্ধ নহয়। পাঠ্য শুধৰাবৰ বাবে মেনুৱেল মুদ্ৰণ সংশোধন কৰিবই লাগিব। পাঠ্যৰ শুদ্ধতা মূল গ্ৰন্থৰ পৃষ্ঠাৰ অৱস্থা আৰু স্কেন ফাইলৰ প্ৰাঞ্জলতাৰ ওপৰত নিৰ্ভৰ কৰিব।