fbpx

ক্রিকেট যখন পরিসংখ্যান মডেল

চলছে ক্রিকেট বিশ্বকাপ। এই বিশ্বকাপের আমেজ ছড়িয়ে পড়েছে সারা বিশ্বে। উন্মাদনার কমতি নেই আমাদের দেশেও। কেন না প্রথমত আমরা জাতি হিসেবে অনেক আবেগী এবং দ্বিতীয়ত অন্য সব বারের চেয়ে আমাদের দল এবার অনেক ইতিবাচক সম্ভাবনা নিয়ে বিশ্ব জয় করতে পারি দিয়েছে ইংল্যান্ডের মাটিতে।

ক্রিকেটের ক্ষেত্রে খেলা যে দলেরই হোক না কেন খেলা দেখতে বসলেই আমাদের নজর থাকে টিভি পর্দায় কিছুক্ষণ পর পর ভেসে ওঠা “প্রজেক্টেড স্কোর” এর দিকে। “প্রজেক্টেড স্কোর” এক ধরনের ফোরকাস্টিং যেটা দিয়ে ব্যাটিং দলের মোট সংগ্রহ কেমন হবে ইনিংস শেষে সে সম্পর্কে ধারণা পাওয়া যায়। এ বিষয়টা অবশ্য আমরা কম-বেশি সবাই জানি। কিন্তু যেটা অনেকেই জানি না সেটা হচ্ছে ক্রিকেট খেলায় এই “প্রজেক্টেড স্কোর” নির্ভুল ভাবে বের করার ক্ষেত্রে পরিসংখ্যানের ভূমিকা। সেটা জানতে আমরা একটু ফিরে যাই ২০১৫ সালে।

আইসিসি বিশ্বকাপ ২০১৫ এর গ্রুপ পর্বের খেলা চলছে – বাংলাদেশ বনাম আফগানিস্তান। টসে জিতে ব্যাট করার সিদ্ধান্ত নিলেন আমাদের অধিনায়ক মাশরাফি। খেলার ২৯তম ওভার শেষে বাংলাদেশের সংগ্রহ ৩ উইকেটের বিনিময়ে ১১৯ রান। টিভির পর্দায় ভেসে উঠলো বাংলাদেশের সম্ভাব্য স্কোর অর্থাৎ প্রজেক্টেড স্কোর: চলতি রান রেটে ২০৫; ওভার প্রতি ৬ রানে ২৪৫; ওভার প্রতি ৮ রানে ২৮৭ এবং ওভার প্রতি ১০ রানে ৩২৯। মজার ব্যাপার হচ্ছে ম্যাচ শেষে বাংলাদেশের সংগ্রহ ছিলো ১০ উইকেটের বিনিময়ে ২৬৭ রান এবং বাংলাদেশ সম্পূর্ণ ৫০ ওভার ব্যাট করেছিলো। বাংলাদেশের সংগ্রহ প্রজেক্টেড স্কোর এর ধারে কাছ দিয়ে যায়নি।

সে সময়ে এমনটা হওয়ার মূল কারণ হচ্ছে প্রজেক্টেড স্কোরের হিসাবটাই করা হতো খুব মামুলী ভাবে। খেলার জটিল বিষয়গুলো যেমন, উইকেট, পিচের কন্ডিশন, আবহাওয়া ইত্যাদি বিবেচনায় না নিয়ে শুধু মাত্র ওভার প্রতি চলমান রান রেটকে বিবেচনায় নেয়া হতো। এছাড়াও প্রজেক্টেড স্কোর শুধুমাত্র দেখানো হতো ম্যাচের প্রথম ইনিংসে। এ থেকে খুব সহজেই বোধগম্য যে, প্রজেক্টেড স্কোরের ঐ গণনা পদ্ধতিতে যথেষ্ট সীমাবদ্ধতা ছিলো।

তবে এই সীমাবদ্ধতা কাটাতে খুব বেশি সময় লাগেনি। নিউজিল্যান্ডের ক্রাইস্ট চার্চ শহরের ইউনিভার্সিটি অফ ক্যান্টারবুরি এর অর্থনীতি বিভাগের পিএইচডি গ্রাজুয়েট ড. স্কট ব্রুকার ও তাঁর সুপারভাইজার ড. শেমাস হোগান লেগে যান বহুল আলোচিত ও সমালোচিত নিয়ম ডকওয়ার্থ-লুইস পদ্ধতির (ডিএল ম্যাথোড) একটি বিকল্প নিয়ম উদ্ভাবনে। উভয়ে চার বছরের পরিশ্রম ও অধ্যাবসায়ে সম্পূর্ণ ভিন্ন একটি বিষয় উদ্ভাবন করে ফেলেন। এটি হলো স্ট্যাটিসটিক্যাল মডেল যেটা পরবর্তীতে নামকরণ করা হয় ‘Winning and Score Predictor (WASP)’ নামে।

WASP মডেলের মূল ভিত্তি হলো হিস্টরিক্যাল ডেটা অর্থাৎ পূর্বে সংঘটিত হওয়া নির্ধারিত ওভারের আন্তর্জাতিক ক্রিকেট ম্যাচগুলোর পরিসংখ্যান গুলো ব্যবহার করে মডেলটি খেলার সম্ভাব্য মোট স্কোর কিংবা খেলায় জয়ের সম্ভাবনা নির্ণয় করে। ড. স্কট ব্রুকার ও ড. শেমাস হোগান তাঁদের এই গবেষণায় ১ জানুয়ারি ২০০১ থেকে ৩১ ডিসেম্বর ২০০৯ তারিখ পর্যন্ত সংঘটিত হয়ে যাওয়া ১৪০৫টি আন্তর্জাতিক এক দিনের ম্যাচগুলো থেকে ৭৮৪টি ম্যাচের পরিসংখ্যান ব্যবহার করেছেন। এক্ষেত্রে কিছু বিষয়ের দিকে লক্ষ্য রাখা হয়। সেগুলো হচ্ছে:

ক) ম্যাচটি অবশ্যই ১ জানুয়ারি ২০০১ থেকে ৩১ ডিসেম্বর ২০০৯ এর মধ্যে অনুষ্ঠিত হয়েছে।

খ) ম্যাচটি অবশ্যই অস্ট্রেলিয়া, ইংল্যান্ড, ভারত, নিউজিল্যান্ড, পাকিস্তান, দক্ষিণ আফ্রিকা, শ্রীলংকা, ওয়েস্ট ইন্ডিজ এর মধ্যে যে কোন দুই দলের মধ্যে অনুষ্ঠিত হয়েছে।

গ) ম্যাচটির প্রথম ইনিংস অবশ্যই ৫০ ওভার বল হয়েছে অথবা ১০ উইকেটের পতন হয়েছে।

ঘ) ম্যাচটির শেষে অবশ্যই একটি দলকে বিজয়ী ঘোষণা করা হয়েছে।

এ অনুমানগুলোর উপর ভিত্তি করে মডেলটি প্রস্তুত করা হয়। শুরুতে ২০০১ এর তথ্য নেয়া হলেও বর্তমানে ব্যবহৃত WASP মডেলের জন্য ২০০৬ সাল থেকে অদ্যাবধি সংঘটিত হওয়া নির্ধারিত ওভারের আন্তর্জাতিক ক্রিকেট ম্যাচগুলোর পরিসংখ্যান ব্যবহার করা হয়েছে।

WASP মডেলটি আসলে কী করে? – এ প্রশ্নটা আসা খুব স্বাভাবিক। WASP মডেলটি মূলত দুইটি বিষয়ে প্রজেকশন করে। প্রথমত খেলায় প্রথম ইনিংসে যে দল ব্যাট করে তাদের মোট রানের সংগ্রহ কেমন হবে তার একটি অনুমান করে; এবং দ্বিতীয়ত দ্বিতীয় ইনিংসে যে দল ব্যাট করছে তাদের জয়ের সম্ভাবনা অনুমান করে। WASP মডেলের সবচেয়ে গুরুত্বপূর্ণ বিষয় যেটি সেটি হচ্ছে এটি একটি গতিশীল মডেল। অর্থাৎ ম্যাচের শুরু থেকে শেষ পর্যন্ত প্রত্যেকটা বলের আউটকাম দ্বারা এটি প্রভাবিত হয় এবং নতুন করে সম্ভাবনা হিসাব করতে পারে।

স্কাই স্পোর্টস্ নিউজিল্যান্ড এর কল্যাণে সর্বপ্রথম WASP মডেলের প্রয়োগ দেখা যায় ২০১২ সালে নিউজিল্যান্ডের ঘরোয়া ক্রিকেটের একটি টি-টুয়েন্টি ম্যাচে। ম্যাচটি সংঘটিত হয় অকল্যান্ড এবং ওয়েলিংটন এর মধ্যে। পরবর্তীতে ২০১৪ সালে ভারতের নিউজিল্যান্ড সফরে প্রথমবারের মতো আন্তর্জাতিক এক দিনের ম্যাচে WASP মডেলটি ব্যবহার করা হলে এটি সকলের নজরে আসে।

WASP মডেলটি অনেকের নজরে আসার ক্ষেত্রে একটি গুরুত্বপূর্ণ কারণ হচ্ছে মডেলটির প্রজেকশন অপেক্ষাকৃত ভালো। মডেলটি প্রথম ইনিংসে যে দল ব্যাট করছে তাদের মোট সংগ্রহ অনুমানের ক্ষেত্রে দলের অব্যবহৃত ওভারের পরিমাণ এবং হাতে কতগুলো উইকেট রয়েছে তা বিবেচনা করে। এছাড়াও যে বিষয়গুলো প্রাধান্য দিয়ে থাকে সেগুলো হচ্ছে: দুই দলের প্রত্যেকটি খেলোয়াড়ের দক্ষতা, মাঠের পরিধি, পিচের কন্ডিশন ও আবহাওয়া পরিস্থিতি প্রভৃতি। মূলত একটি গড়পরতা ব্যাটিং দল যদি একটি গড়পরতা বোলিং দলের বিপক্ষে একই পরিস্থিতিতে একই পরিমাণ উইকেট হাতে রেখে এবং একই বল হাতে রেখে ব্যাট করে তখন প্রথম ইনিংসে ঐ দলের মোট সংগ্রহ কত রান হতো সেটা খুব সহজেই অনুমান করতে পারে WASP মডেল। আর দ্বিতীয় ইনিংসে যে দল ব্যাট করছে তাদের জয়ের সম্ভাবনার ক্ষেত্রে probit regression মডেল ব্যবহার করা হয়ে থাকে। এক্ষেত্রে পরিসংখ্যানিক পদ্ধতিতে সম্ভাবনা যাচাই ও টেস্ট অফ হাইপোথেসিস এর মাধ্যমে সম্ভাবনার নিখুঁত পরিমাণ নির্ণয় করা হয়। WASP মডেলটি দীর্ঘ সময়ের ডেটা এবং প্রতি মূহুর্তের পরিবর্তিত তথ্য ব্যবহার করে প্রজেকশন করায় এটি বেশ সহজেই ফলাফলের খুব কাছাকাছি পর্যন্ত অবস্থান নির্ণয় করতে পারে।

তামিম আলম

সেশন: ২০১৪-২০১৫