সহায়:অ'চিআৰ

ৱিকিউৎসৰ পৰা
Jump to navigation Jump to search
'সহায় আৰু নিৰ্দেশাৱলী': অ'চিআৰ
ৱিকিউৎসত কিতাপ এখনৰ স্কেন প্ৰতিলিপিক ইউনিক'ড আখৰলৈ কেনেকৈ সলাব পাৰি।

Optical Character Recognition (OCR) প্ৰক্ৰিয়াই pdf/djvu/jpg ফাইলৰ স্কেন ছবি এখনৰ পৰা আখৰৰ চিহ্নক ইউনিক'ড চিহ্নলৈ পৰিৱৰ্তিত কৰিব পাৰে। গতিকে ছবি এখনত থকা অসমীয়া আখৰবোৰ মেনুৱেলী টাইপ কৰি থকাৰ সলনি এই প্ৰক্ৰিয়ালৈ কামটো উজু আৰু খৰতকীয়া কৰি তোলে। ভাৰতীয় ভাষাবোৰৰ বাবে ২০১৫ চনৰ মাজভাগলৈকে কোনো সন্তোষজনক OCR উপলব্ধ নাছিল। তাৰ পাছত গুগলে ভাৰতীয় ভাষাবোৰৰ বাবেও OCR সেৱা মুকলি কৰে আৰু এতিয়া ভাৰতীয় ৱিকিউৎসমূহে সেই সুবিধাকে ব্যৱহাৰ কৰি আছে।

OCRৰ সহায়ত পাঠ্য সংযোগ[সম্পাদনা কৰক]

অ'চিআৰ সঁজুলিটো অসমীয়া ৱিকিউৎসৰ সকলো ব্যৱহাৰকাৰীৰ বাবে পৃষ্ঠা নামস্থানত উপলব্ধ। উদাহৰণস্বৰূপে পাঠ্য সংযোগৰ আগতে সূচী:অসমীয়া সাহিত্যৰ চানেকি (দ্বিতীয় খণ্ড, দ্বিতীয় ভাগ)ৰ ২৫১ নং পৃষ্ঠা খুলিলে (পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫১) তলৰ দিয়াৰ দৰে দেখা পাব।

Aswikisource OCR tool.PNG

OCR বুটামটো হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱা হৈছে। এই বুটামটো ক্লিক কৰিলে "গুগল অ'চিআৰৰ পৰা পাঠ আহৰণ কৰি থকা হৈছে" বুলি বাৰ্তা দেখা পাব আৰু দুই ছেকেণ্ডমানৰ পাছতে তলত দিয়াৰ দৰে পাঠ্য দৃশ্যমান হ'ব।

Aswikisource OCR tool 2.PNG

ইউনিক'ড সংশোধন[সম্পাদনা কৰক]

অ'চিআৰৰ সহায়ত পাঠ্য আহৰণ কৰাৰ পাছত রকে ধৰি কিছুমান ত্ৰুটি থাকি যায় (সহায়:মুদ্ৰণ সংশোধন# সাধাৰণ OCR ত্ৰুটিসমূহ দ্ৰষ্টব্য)। গতিকে পৃষ্ঠাটো সাঁচি থোৱাৰ আগতে ইয়াৰ সংশোধনৰ প্ৰয়োজন। এনে কৰিবলৈ OCR বুটামৰ কাষতে থকা উজ্জ্বল ৰঙা ৰঙৰ "ৰ" বুটামটো এবাৰ ক্লিক কৰিব আৰু তাৰ পাছত পৃষ্ঠাটো সাঁচি থ'ব।

As wikisource Unicode correction tool.jpg

Indic OCR সঁজুলি[সম্পাদনা কৰক]

কেতিয়াবা কিবা কাৰণত কোনো ব্যৱহাৰকাৰীয়ে সাধাৰণ অ'চিআৰ সঁজুলিটো দেখা নাপাব পাৰে বা সঁজুলিটোৱে ভালকৈ কাম নকৰিব পাৰে। তেনে ক্ষেত্ৰত গুগল ড্ৰাইভ APIৰ সহায়ত সজা ইণ্ডিক অ'চিআৰ সঁজুলিটো ব্যৱহাৰ কৰিব পাৰি। ইয়াৰ বাবে ব্যৱহাৰকাৰীজনে নিজৰ সদস্য পৃষ্ঠাত common.js পৃষ্ঠা এটা সৃষ্টি কৰিব লাগিব। অৰ্থাৎ ব্যৱহাৰকাৰীগৰাকীৰ সদস্যনাম "অমুক" হ'লে "সদস্য:অমুক/common.js" (উৰ্ধকমা অবিহনে) নামৰ পৃষ্ঠা এটা সৃষ্টি কৰি এই সংকেতখিনি তালৈ প্ৰতিলিপি কৰিব: mw.loader.load('//meta.wikimedia.org/w/index.php?title=User:Indic-TechCom/Script/IndicOCR.js&action=raw&ctype=text/javascript');

এতিয়া পৃষ্ঠাটো সাঁচি থ'ব। ব্ৰাউজাৰ কেশ্ব খালি কৰি সম্পাদনা পৃষ্ঠা এটালৈ গ'লে (যেনে- পৃষ্ঠা:অসমীয়া সাহিত্যৰ চানেকি v2p2.djvu/২৫২) তলৰ হালধীয়া বৃত্তৰে ঘেৰি দেখুওৱাৰ দৰে এটা বুটাম দেখা পাব।

Indic OCR tool.JPG

এই বুটামটো ক্লিক কৰিলেও সাধাৰণ OCR বুটামৰ দৰে কাম কৰিব আৰু কেইছকেণ্ডমানৰ পাছত পাঠ্য দৃশ্যমান হ'ব।

টোকা[সম্পাদনা কৰক]

অ'চিআৰৰ সহায়ত লাভ কৰা পাঠ্য ১০০% শুদ্ধ নহয়। পাঠ্য শুধৰাবৰ বাবে মেনুৱেল মুদ্ৰণ সংশোধন কৰিবই লাগিব। পাঠ্যৰ শুদ্ধতা মূল গ্ৰন্থৰ পৃষ্ঠাৰ অৱস্থা আৰু স্কেন ফাইলৰ প্ৰাঞ্জলতাৰ ওপৰত নিৰ্ভৰ কৰিব।