দ্য ফরচুন-টেলার ফিচারিং মেশিন লার্নিং

করোনা ভাইরাস এর কারণে এখন অনেক কিছুই আগের মত নেই। কিন্তু সব কিছু তো থামিয়ে দেওয়া যাচ্ছে না তাই বিকল্প পদ্ধতি অনুসরণ করে কাজ চালাতে হচ্ছে। শিক্ষাক্ষেত্রে  এর প্রভাবও পড়েছে ব্যাপকভাবে। এইচ এস সি বা সমমানের পরীক্ষা এখনো হয় নি। ও লেভেল, এ লেভেল পরীক্ষাও অনুষ্ঠিত হয় নি তবে তারা এইবার শিক্ষার্থীদের সুযোগ দিয়েছিল যে চাইলে শিক্ষার্থীরা পরীক্ষার জন্য অপেক্ষা করতে পারে কিংবা প্রেডিক্টেড গ্রেড নিয়ে পরবর্তী পড়াশুনা চালু করতে পারে। যারা প্রেডিক্টেড গ্রেড নিতে রাজি হয়েছে তাদেরকে প্রেডিক্টেড গ্রেড দিয়ে দেওয়া হয়েছে। প্রশ্ন হলো পরীক্ষা না দিয়েই এত বড় একটা পরীক্ষার ফলাফল তারা দিয়ে দিলো (ক্যামব্রিজের দেওয়া ফলাফল নিয়ে যে অসন্তুষ্টি দেখা দিয়েছিল সেটা ওরা এক–দুই সপ্তাহের মধ্যেই সমাধান করে গ্রেড আপডেট করে দিয়েছে) এবং দেওয়াটা কতটা যৌক্তিক?

এইখানেই আমাদের ভরসা করতে হবে পরিসংখ্যানের উপর। আমরা আসলে দৈনন্দিন জীবনে নিজের অজান্তেই পরিসংখ্যান এর ভিত্তিতে কথা বলি বা অনেক কিছুই অনুমান করে  সিদ্ধান্ত নিয়ে ফেলি। যেমন, আমরা অনেক সময়েই বলি, অমুক তো ভালো রেজাল্ট করবে, ফার্স্ট হবে বা অমুক অঙ্কে দূর্বল-এইরকম অনেক কিছু এবং এগুলো বলতে পারার পিছনে কারণ হলো, বিগত কয়েক বছরে তার ফলাফল কেমন ছিল এটা সম্পর্কে পাওয়া ধারণা। আবার দেখা যায় নতুন বছরের শুরুতেই ভার্সিটির ছাত্র-ছাত্রীরা তাদের সিনিয়রদের কাছ থেকে ধারণা নিয়ে রাখে যে কোন স্যার কেমন নম্বর দেন, কিংবা কোন কোর্স সহজ, কোন কোর্স কঠিন আর সেই মাফিক তারা পড়ার ধরন ঠিক করে। এই ধারণাগুলো কিন্তু মোটেই ফেলনা নয়। বরং বেশ গুরুত্বপূর্ণ এবং সঠিকভাবে কাজে লাগানো গেলে বেশ কিছু সমস্যার সমাধান সহজেই করে ফেলা যায়।

অনেক বিশ্ববিদ্যালয় কোর্স অফার করে থাকে শিক্ষার্থীরা কেমন ফলাফল করছে সেটার উপর ভিত্তি করে। তবে ফলাফল পেতে পেতে দেখা যায় অনেক দেরি হয়ে যায় এবং শেষ মূহুর্তে বিভিন্ন কোর্স ড্রপসহ বিভিন্ন জটিলতায় পড়তে হয়। এই সমস্যার সমাধান করা যায় ডেটা মাইনিং ও মেশিন লার্নিং এর কিছু সহজ এ্যালগরিদম ব্যবহার করে।

এজন্য যা করতে হবে সেটা হলো, একটা কোর্স যেমন ধরি, Stat H-101 কোর্সে বিগত কয়েক বছরের ফলাফল দেখতে হবে। এটা থেকে বোঝা যাবে কোর্সটি কেমন? সহজ নাকি কঠিন। এরপর দেখতে হবে কোর্স শিক্ষকের ডেটা। সেটা হলো তিনি কেমন নম্বর দেন? সেই শিক্ষক যেসব কোর্স নিয়েছেন বিগত বছরগুলোতে সেই কোর্সগুলোতে দেওয়া তার গ্রেডগুলো থেকে এই ডেটা পাওয়া যাবে। এরপরে সাথে ইনপুটে যাবে মিডটার্ম, এ্যাসাইনমেন্ট, কুইজ এসব কিছুর ডেটা। আউটপুট হবে গ্রেড।

উল্লেখ্য যে, এই এ্যালগরিদমগুলো দিয়ে ১০০% একুরেসি পাওয়া সম্ভব না। এর বাঁধাধরা কোন একুরেসি লেভেল নেই, যেটা ১০০ এর বেশি কাছাকাছি যাবে সেটাই বেশি ভাল। আর্টিকেলটি লেখা হচ্ছে একটা পেপার থেকে (লিংক আর্টিকেলের শেষে সংযুক্ত করা হলো)। সেই পেপারে তারা বেশ কয়েকটি মেশিন লার্নিং এ্যালগরিদম ব্যবহার করেছে এবং দেখেছে কোনটি সবচেয়ে ভাল ফলাফল দেয়। এ্যালগরিদমগুলো হলো, ID3, K-Nearest Neighbor, Naïve Bayes and Rule Induction method.

এই গ্রাফটি সরাসরি উল্লেখিত পেপার থেকে তুলে দেওয়া। দেখা যাচ্ছে যে, Rule Induction method  সবচেয়ে বেশি একুরেসি দিচ্ছে। এই এ্যালগরিদমগুলো কীভাবে কাজ করে এই সম্পর্কে জানতে চাইলে ইউটিউব টিউটোরিয়াল থেকেই জানা যাবে। তবে মূল কথা হলো যে, কোর্সের ডেটা এবং কোর্স শিক্ষকের ডেটাগুলো দিয়ে এই এ্যালগরিদমগুলোকে ট্রেইন করা হয় এবং তার ভিত্তিতে এ্যালগরিদমগুলো ইকুয়েশন দেয় এবং সেইখান থেকেই প্রেডিক্টেড গ্রেডগুলো পাওয়া যায়।

এবং সবশেষে বহুল প্রচলিত কিছু কথা-

“আমরা ইনকোর্সে খারাপ করি কিন্তু ফাইনালে আগের রাতে পড়ে ভালো রেজাল্ট করি”- এইটা কি এইসব মেশিন লার্নিং বুঝবে নাকি?

উত্তর হলো, বিগত বছরগুলোতে যারা ছিল তারা কি এই কাজ করতো না? যদি করে তাহলে এইটা অবশ্যই বিবেচিত হবে!

“এইখানে যারা হাই সিজি, ওদের মিডে নাম্বার বেশি, মিডে কম নম্বর নিয়ে ফাইনালে ভালো করি সেটা কি বিবেচনায় আসবে?”

উত্তর হলো, অবশ্যই আসবে! এই উত্তরে বিশ্বাস না হলে নিজেই গুগল, ইউটিউব সার্চ করে দেখে নেওয়া যেতে পারে!

https://www.researchgate.net/publication/304689292_Grade_Prediction_Using_Supervised_Machine_Learning_Techniques

কমেন্ট করুন
শিক্ষার্থী | পরিসংখ্যান বিভাগ, ঢাকা বিশ্ববিদ্যালয়

সেশন ২০১৫-১৬

শিক্ষার্থী | পরিসংখ্যান বিভাগ, ঢাকা বিশ্ববিদ্যালয়

সেশন ২০১৫-১৬

0