সদস্য:Gitartha.bordoloi/অসমীয়া গ্ৰন্থৰ ডিজিটেলকৰণ
অসমীয়া ৱিকিউৎসত কপিৰাইট-মুক্ত গ্ৰন্থৰ স্কেনৰ পৰা ইউনিক'ড ৰূপলৈ নিয়াৰ কাম কৰি থকা হৈছে। স্কেন প্ৰতিলিপি আপল'ড কৰাৰ মূল সুবিধাসমূহ হৈছে-
> সকলোৱে সমিলমিলে কাম কৰিব পাৰে।
> প্ৰুফ চাওঁতাই মূল কিতাপৰ লগত ভুল-শুদ্ধ সকলো মিলাই চাব পাৰে।
> পঢ়ুৱৈয়ে ইউনিক'ড ৰূপৰ লগতে মূল কিতাপতো চকু ফুৰাব পাৰে, আদি।
এই লেখাটোত স্কেনিং, আপল'ড আৰু ইউনিক'ডকৰণৰ প্ৰণালী আৰু আমি সুবিধাৰ বাবে মানি চলিবলগীয়া নিয়ম কেইটামান উল্লেখ কৰিম।
১) প্ৰথমেই আমাক লাগিব কপিৰাইট-মুক্ত কিতাপ। ভাৰতীয় কপিৰাইট আইনমতে লেখকৰ মৃত্যুৰ পাছৰ বছৰৰ পৰা ৬০ বছৰ পাৰ হ'লে তেওঁৰ সৃষ্টিসমূহ কপিৰাইট মুক্ত হয়। লেখক অজ্ঞাত হ'লে প্ৰকাশৰ পাছৰ বছৰৰ পৰা ৬০ বছৰ পাৰ হ'ব লাগে। কিন্তু পৰৱৰ্তী সংস্কৰণবোৰত কোনো সম্পাদক, প্ৰকাশকে সালসলনি কৰিলে তেনে কিতাপৰ কপিৰাইট লোপ নাপায় (যেনে- 'হেমকোষ'ৰ নতুন সংস্কৰণ)। অসমীয়া ৱিকিপিডিয়াৰ এই পৃষ্ঠাটোত কপিৰাইট লোপ পোৱা কেইজনমান অসমীয়া লেখকৰ নাম আছে (কিতাপখন বাছনি কৰোঁতে তুলনামূলকভাৱে সৰু আকাৰৰ হ'লে কামখিনিত সুবিধা হয়। ইয়াৰ লগতে কিতাপখন অসমীয়া সাহিত্যৰ জগতত কিমান গুৰুত্বপূৰ্ণ সেয়াও বিচাৰ কৰা ভাল।)
ভাৰত চৰকাৰৰ উদ্যোগত আৰম্ভ হোৱা Digital Library of India(http://www.dli.ernet.in/handle/2015/315561)ত বহু পুৰণি অসমীয়া কিতাপৰ স্কেন পাব। উৎসৰ উল্লেখ কৰি সেয়া ৱিকিকমন্সত আপল'ড কৰিব পাৰি। https://archive.org/ ৱেবছাইটতো পুৰণি অসমীয়া কিতাপ পাব।
২) ডাউনল'ড কৰিব পৰা ফাইল নাপালে আমি নিজে কিতাপখন বেটুপাত, আগকথা আদিৰে সৈতে স্কেন কৰাৰ কাম আৰম্ভ কৰিব পাৰোঁ (ক'লা-বগা কৰিলে সোনকালে হয়)। স্কেন কৰাৰ আগতে ছেটিঙত 300 dpi মিলাই ল'লে ভাল (আটাইতকৈ ভাল কোৱালিটিৰ স্কেন প্ৰতিলিপিটো সদ্যহতে ব্যৱহাৰ নহ'লেও সাঁচি থ'ব পাৰে)। পৃষ্ঠা আকাৰ বেছি সৰু কৰিবলৈ গ'লে আখৰবোৰ অস্পষ্ট হৈ পৰিব। স্কেন কৰাৰ সলনি ডিজিটেল কেমেৰাৰেও কাম চলাব পাৰি। কেৱল গোটেই পৃষ্ঠাতে ভালকৈ পোহৰ পৰাতো নিশ্চিত কৰি ল'ব (ফ্লাচ্ ব্যৱহাৰ কৰিলে কেতিয়াবা পৃষ্ঠাটো সমানে উজ্জ্বল নহয়)। এবাৰতে কিতাপখনৰ দুটা পৃষ্ঠা বা এটাকৈ ফটো তুলি যাব পাৰে।
৩) স্কেন কৰা/ফটো তোলা শেষ হ'লে গোটেইবোৰ ফাইল ফ'ল্ডাৰ এটাত গোটাই লওক। ক্ৰম মিলি আছেনে নাই পৰীক্ষা কৰক। এতিয়া ছফ্টৱেৰ ব্যৱহাৰ কৰি দুটা দুটা পৃষ্ঠা হৈ থকা ছবিবোৰ কাটি এটা এটা পৃষ্ঠা কৰক। অদৰকাৰী অংশ বাদ দি, চুক-কোণবোৰ মিলাওক। এই কামৰ বাবে Scan tailor বা তেনেকুৱা আন ছফ্টৱেৰ পোৱা যায়। নহ'লে Crop, Rotate আদি কামৰ বাবে Windows picture manager ব্যৱহাৰ কৰিলেও হয়। সালসলনিৰ পাছত গোটেই ফাইলবোৰ ছে'ভ কৰক।
৪) এতিয়া ছবিবোৰৰ পৰা pdf বা djvu ফাইল তৈয়াৰ কৰিব পাৰে। djvu ফাইলবোৰ আকাৰত অলপ সৰু হয়, কিন্তু ৰাইজে চিনাকি ফৰ্মেট পিডিএফ ব্যৱহাৰ কৰিলেই হ'ল। 'Weeny free image to pdf converter' বা তেনেকুৱা আন ছফ্টৱেৰৰ জৰিয়তে গোটেই ছবিখিনি একেলগে এখন পিডিএফ কৰিব পাৰি। কন্ভাৰ্ট কৰাৰ আগতে ছেটিঙত dpi মিলাই লওক। এই ছফ্টৱেৰটোৰে কন্ভাৰ্ট কৰিলে নিজে নিজে অলপ compress হয়। ফাইলটোৰ নামটো কিতাপখনৰ নামেৰে দিয়ক।
৫) এতিয়া ৱিকিমিডিয়া কমন্সলৈ (https://commons.wikimedia.org/) যাওক। ছবি আপল'ড কৰাৰ নিচিনাকৈ ফাইলটো আপল'ড কৰক। নে'ট সংযোগ লেহেমীয়া হ'লে নোৱাৰিব। কিতাপখনৰ চমু পৰিচয়, প্ৰতিলিপিটোৰ উৎস আদি উল্লেখ কৰিব লাগিব। অনুজ্ঞাপত্ৰ শিতানত {{PD-India}} লিখি দিলে ভাৰতত কপিৰাইট মুক্ত হোৱাটো বুজাব। শ্ৰেণী 'Books in Assamese' বুলি লিখিব। (উদাহৰণ: https://commons.wikimedia.org/wiki/File:%E0%A6%B8%E0%A6%BE%E0%A7%B0%E0%A6%A5%E0%A6%BF_%28Sarothi%29.pdf)
৬) এতিয়া অসমীয়া ৱিকিউত্সত (https://as.wikisource.org/) লগ্ ইন কৰক। 'সূচী:ফাইলটোৰ নাম' এনেকৈ পৃষ্ঠা এটা সৃষ্টি কৰক, যেনে- সূচী:সাৰথি (Sarothi).pdf। তেতিয়া Type, Title, Author আদি উল্লেখ কৰিবলগীয়া সম্পাদনা ক্ষেত্ৰ এখন ওলাব। যাৱতীয় তথ্যবোৰ দি Pages শিতানত সদ্যহতে Reflist সংকেতৰ দৰে Pagelist বুলি লিখক। Progress শিতানত default বাছনি কৰক। পৃষ্ঠাটো সাঁচক। এতিয়া পৃষ্ঠাটো ইয়াৰ দৰে দেখা পাব: সূচী:সাৰথি (Sarothi).pdf (উৎসাহীসকলে সূচীখনৰ সম্পাদনালৈ গৈ pagelist কিদৰে মিলোৱা হৈছে চাব পাৰে।)
নীলা ৰঙৰ পৃষ্ঠাবোৰত পাঠ্য আছে, ৰঙা ৰঙৰবিলাকত নাই।
৭) এতিয়া ইউনিক'ডকৰণৰ কাম আৰম্ভ কৰিব পাৰে। অসমীয়া ৱিকিউৎসৰ গুগলৰ OCR সুবিধা সংযোগ কৰা হৈছে বাবে এতিয়া এই কাম যথেষ্ট সহজ। সূচীৰ তলত গোটেই পৃষ্ঠা সংখ্যাবোৰ ৰঙা লিংক হিচাপে দেখা পাব (ৰঙা লিংক=পৃষ্ঠা নাই)। তাৰে এটাত ক্লিক কৰক। সোঁফালে কিতাপখনৰ পৃষ্ঠাটোৰ ছবি আৰু বাওঁফালে খালি ঠাই দেখিব। ওপৰৰ 'সম্পাদনা' টেব্টো টিপিলে ওপৰত থকা সঁজুলিবোৰৰ মাজত "OCR" বুলি দেখিব। সেইটোত ক্লিক কৰিলে দুই ছেকেণ্ডমানৰ ভিতৰত পাঠখিনি ইউনিক'ড ৰূপত ওলাই পৰিব। শেষ হ'লে তলত 'পৃষ্ঠা প্ৰকাশ কৰক' টিপক।
৮) পৰৱৰ্ত কাম মুদ্ৰণ সংশোধন বা প্ৰুফৰিডিং। OCR-ৰে ইউনিক'ডকৰণ কৰিলে বহু ত্ৰুটি ৰৈ যায়। বানান, ফৰ্মেটিং আদি পৰীক্ষা কৰি শুধৰাওক। ফৰ্মেটিঙৰ বাবে সম্পাদনা পৃষ্ঠাৰ ওপৰত থকা চিহ্ন আৰু সঁজুলিবোৰ ব্যৱহাৰ কৰিব পাৰে।
৯) প্ৰুফৰিডিঙৰ পাছত অন্য এজন সদস্যই পুনৰ পৰীক্ষা কৰি পৃষ্ঠাবোৰৰ বৈধকৰণ (Validation) কৰিব লাগে।
১০) এইখিনি কাম শেষ হ'লে ইউনিক'ড ৰূপত পৃষ্ঠাবোৰ একেলগে পাবলৈ আন এটা কাম কৰিব লাগিব। এই পৃষ্ঠাটোৰ দৰে কিতাপখনৰ নামেৰে এটা পৃষ্ঠা সৃষ্টি কৰক:https://as.wikisource.org/wiki/%E0%A6%AD%E0%A6%BE%E0%A6%A8%E0%A7%81%E0%A6%AE%E0%A6%A4%E0%A7%80 । তাত কি কি ভৰাব লাগিব 'সম্পাদনা'ত ক্লিক কৰিলে দেখা পাব। সৰ্বোচ্চ ৭০-৮০ পৃষ্ঠাৰ কিতাপৰ বাবে এই কায়দাই কাম দিব। তাতকৈ বেছি ডাঙৰ কিতাপৰ বাবে মাত্ৰ এখন পৃষ্ঠা কৰিলে অসুবিধা হ'ব। তেনে ক্ষেত্ৰত অধ্যায়বোৰৰ বাবে বেলেগ বেলেগ এনেকুৱা পৃষ্ঠা কৰিব লাগিব।
- প্ৰুফৰিডিঙৰ কেইটামান প্ৰস্তাৱিত নিয়ম
প্ৰতিটো শব্দ, দাৰি, কমা আদি মূল কিতাপৰ দৰেই ৰাখক। বানান ভুল যেন দেখিলেও শুধৰাব নালাগে (বহু ক্ষেত্ৰত পুৰণি বানান ৰীতি আজিৰ লগত নিমিলে)।
পৰিচ্ছেদ আৰম্ভ কৰোঁতে কিতাপত থকাৰ দৰে শাৰীৰ আৰম্ভণিত খালি ঠাই এৰিব নালাগে। তেনে কৰিলে সজ্জা ওলট-পালট হয়। এণ্টাৰ টিপি এশাৰী স্পে'ছ এৰি পৰৱৰ্তী শাৰী আৰম্ভ কৰিলেই হ'ব। খালি ঠাই এৰা কামটো অভিজ্ঞ সদস্যই ৱিকি সংকেতেৰে কৰিব পাৰে যদিও নকৰিলে লোকচান নহয়। কিন্তু এটা পৃষ্ঠাত কৰিলে গোটেইবোৰত কৰিব লাগিব, গতিকে এইটো নকৰিলেই উজু হ'ব।
টাইপ কৰোঁতে যতি চিহ্নৰ আগত খালি ঠাই দিব নালাগে, পাছতহে এটা খালি ঠাই দিব। গতিকে দাৰিৰ পিছত এটা স্পে'ছ এৰিহে পৰৱৰ্তী শাৰীটো লিখিব, কমাৰ পিছত এটা স্পে'ছ দিহে পিছৰ শব্দটো লিখিব।
শিৰোনামা মাজলৈ অনা, গাঢ় কৰা, আকাৰ ডাঙৰ কৰা আদি কামবোৰ অভিজ্ঞ সদস্যই পাছত কৰিব। নতুনসকলে সাধাৰণভাৱে লিখি গ'লেই হ'ল।
পৃষ্ঠাৰ ওপৰত মূল কিতাপৰ দৰে নামটো আৰু পৃষ্ঠা সংখ্যা দিব নালাগে।
ইউনিক'ডকৰণৰ পাছত পৃষ্ঠা প্ৰকাশ কৰিলে ডিফল্ট ছেটিং অনুসৰি গুলপীয়া ৰঙেৰে "এই পৃষ্ঠাটোৰ মুদ্ৰণ সংশোধন কৰা হোৱা নাই" বুলি দেখা পোৱা যায়। লিখাৰ পাছত ভালকৈ শুদ্ধাশুদ্ধি পৰীক্ষা কৰি পৃষ্ঠা স্থিতি অংশত এবাৰতে হালধীয়া ৰং বাছনি কৰিব পাৰি (মুদ্ৰণ সংশোধন- Proofread)। কিন্তু এই কামটো এবাৰত বা এজনে কৰাতকৈ দুবাৰত বা বেলেগ এজনে কৰিলে ভুলৰ সম্ভাৱনা কমিব।
গুলপীয়া হৈ থকা পৃষ্ঠাবোৰ এজনে ভালকৈ পৰীক্ষা কৰি মুদ্ৰণ সংশোধন (হালধীয়া) কৰি যাব। পাঠ্যখিনি 'সুষম' বা 'লাচিত চেনিটাইজাৰ' ছফ্টৱেৰৰ সহায়ত ছেকি পুনৰ পে'ষ্ট কৰক। এনে কৰিলে OCR বা টাইপিং সঁজুলিত থকা ইউনিক'ডৰ ত্ৰুটিবোৰ আঁতৰি যাব।
মুদ্ৰণ সংশোধন হৈ যোৱাৰ পাছত আন এজন সদস্যই পুনৰ পৃষ্ঠাটো পৰীক্ষা কৰি 'বৈধকৰণ' (সেউজীয়া) কৰক। একেজন মানুহেই মুদ্ৰণ সংশোধন আৰু বৈধকৰণ কৰিব নোৱাৰি। গোটেই পৃষ্ঠাবোৰ বৈধকৰণ হোৱাৰ পাছত ওপৰৰ ১০ নং প্ৰণালীত কোৱা পৃষ্ঠাটো সাজিলেই ডিজিটেলাইজেচনৰ কাম শেষ!