এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম


টাইমস প্রতিবেদক
Published: 2018-06-25 06:48:19 BdST | Updated: 2018-09-24 20:28:04 BdST

গবেষণাপত্রে নিজস্ব উপাত্তের নামে যা খুশি তা লিখে চালিয়ে দেওয়ার দিন শেষ। গবেষণাপত্রে উপস্থাপিত উপাত্তের ফাঁকফোকর পরীক্ষা ও গবেষকের অসততা ধরার পদ্ধতি চলে এসেছে। ইকোনমিস্টের এক প্রতিবেদনে বলা হয়েছে, প্রকাশিত গবেষণার ফাঁকফোকর পরীক্ষা করার উপযোগী কম্পিউটার অ্যালগরিদম তৈরি করেছেন যুক্তরাষ্ট্রের কয়েকজন গবেষক। তাঁদের তৈরি এ অ্যালগরিদম সেট জার্নাল বা সাময়িকীর সম্পাদকদের জন্য সম্ভাব্য আশীর্বাদ হয়ে উঠতে পারে।

ইকোনমিস্ট বলছে, অনেক সময় বৈজ্ঞানিক গবেষণার কাজে যেসব উপাত্ত ব্যবহার করা হয়, তা সবার জন্য উন্মুক্ত থাকে না। তখন গবেষকেদের কাছে ওই উপাত্তের উৎস সম্পর্কে জানতে চাওয়া হয়। কিন্তু অনেক সময় তা পাওয়া সম্ভব হয়ে ওঠে না। অবশ্য এখন মানসিকতার কিছু পরিবর্তন ঘটেছে। তারপরও অনেক গবেষক এখনো তাঁদের উপাত্ত উৎসের মালিকানা নিজের বলেই দাবি করে থাকেন। এসব উপাত্ত তাঁরা সংগ্রহ ও বিশ্লেষণ করে নিজেদের সিদ্ধান্তে পৌঁছেছেন বলে দাবি করে থাকেন এবং অন্য প্রতিদ্বন্দ্বীদের সঙ্গে বিনিময় করতে চান না।

গবেষকেদের এই মনোভাব ‘আত্মকেন্দ্রিক’ বলে মনে হলেও এর কারণ অজানা নয় এবং তা স্বাভাবিক বলেই মনে করা হয়। কিন্তু গবেষণার উপাত্ত নিজের বলে দাবি করার খারাপ দিকও থাকে। অনেক সময় এর মাধ্যমে গুপ্ত উদ্দেশ্য সাধন করা হতে পারে। কোনো গবেষণাপত্রে যে পরিসংখ্যান তুলে ধরা হয়, তা নির্দিষ্ট ও আকাঙ্ক্ষিত ফল অর্জনের জন্য কারসাজি করা হয়ে থাকতে পারে। অন্য অর্থে বলতে গেলে লেখক বা গবেষক প্রতারণার আশ্রয় নিতে পারেন। তিনি যদি ওই উপাত্তের প্রকৃত উৎস উন্মুক্ত করে দেন, তবে তাঁর প্রতারণার বিষয়টি সুস্পষ্ট হয়ে দাঁড়াতে পারে এবং তিনি প্রতারক হিসেবে ধরা পড়ে যেতে পারেন। তাই তিনি চান, উৎস যেন যেন গোপন থাকে।

তবে সে সুযোগ ভবিষ্যতে আর নাও থাকতে পারে। কারণ, তথ্য গোপন করা কঠিন হবে। বিশেষ করে ডেটা সেটের ক্ষেত্রে পরিচিত সীমার মধ্যে পূর্ণ সংখ্যার কোনো ডেটা সেট হলে তা আরও কঠিন হবে। যেমন মানসিক পরীক্ষার ক্ষেত্রে অনেক প্রশ্নের উত্তর। গবেষক যদি এ ধরনের ডেটা সেটের ক্ষেত্রে প্রতারণার আশ্রয় নেন, সহজেই ধরা পড়ে যাবেন।

যুক্তরাষ্ট্রের ইলিনয় বিশ্ববিদ্যালয়ের গবেষক শন উইলনার ও তাঁর সহকর্মীরা মিলে বিষয়টির একটি সমাধান বের করেছেন। তাঁরা তৈরি করেছেন বিশেষ ধরনের একটি অ্যালগরিদম। ‘সাইয়্যিভিক প্রিপ্রিন্টস’ নামের একটি গবেষণা নিবন্ধে তাঁরা বিষয়টি তুলে ধরেছেন। তাঁরা ফলাফল নির্ণায়ক যে অ্যালগরিদম তৈরি করেছেন, তার নাম দিয়েছেন ‘কমপ্লিট রিকভারি অব ভ্যালুস ইন ডায়োফ্যান্টাইন সিস্টেম বা সংক্ষেপে করভিডস।

গবেষকেরা দাবি করেছেন, কোনো গবেষণার উপাত্ত পরীক্ষার ক্ষেত্রে করভিডস কাজে লাগানো যাবে। যদি কোনো ফল দেখানোর সময় করভিডসে বৈধ ডেটা সেট দেখাতে না পারে, তবে ওই ফলাফল সুস্পষ্টভাবেই সন্দেহজনক বলে ধরতে হবে। যদি তা সুসংগঠিত ডেটা সেট দেখাতে পারে, তবে এটি বিশ্বাসযোগ্য কি না, তা সহজেই বোঝা যাবে।

করভিডসের কৌশল হচ্ছে—এটি গাণিতিক সূত্র ব্যবহার করে সংখ্যার সব সম্ভাব্য সমন্বয় খুঁজে দেখে। সম্ভাব্য অনিয়ম বের করতে করভিডস সম্ভাব্য ডেটা সেটগুলোকে হিস্টোগ্রামসে রূপান্তর করে এবং ত্রিমাত্রিক চার্ট তৈরি করে। এতে যেকোনো অস্বাভাবিক গঠন দৃশ্যমান হয়। এ পদ্ধতিতে তথ্য সংগ্রহে কোনো পক্ষপাত থাকলে বা উপাত্তে জালিয়াতি থাকলে তা ধরা পড়ে।

যাঁরা একাডেমিক জার্নাল পর্যালোচনা করেন বা সম্পাদনা করেন, তাঁদের কাছে করভিডস আশীর্বাদ হয়ে আসতে পারে। তাঁদের কাছে জমা হওয়া গবেষণাপত্রের সমস্যা শুরুতেই ধরতে পারবেন। এরপর সে সমস্যার বিষয়টি লেখক বা গবেষককে জানিয়ে দিতে পারবেন। এতে প্রতিটি গবেষণার সঙ্গে যুক্ত উপাত্ত আলাদা করে গ্রহণ করে পরিসংখ্যান বের করার প্রয়োজন হবে না। কোনো অসমাধানযোগ্য সমস্যা থাকলে পদ্ধতিগত বিষয়গুলো নিয়ে কাজ করার সুযোগ তৈরি হবে।

করভিডসের কিছু দুর্বলতাও রয়েছে। কিছু ক্ষেত্রে এটি চালানোর জন্য দীর্ঘ সময় লাগতে পারে।

অবশ্য করভিডসে যে ঘাটতি আছে, তা পূরণ করতে ‘স্যাম্পল প্যারামিটার রিকনস্ট্রাকশন ভায়া ইটারেটিভ টেকনিকস’ বা ‘স্প্রাইট’ নামের আরেকটি অ্যালগরিদম রয়েছে।

যুক্তরাষ্ট্রের বস্টনে নর্থ ইস্টার্ন বিশ্ববিদ্যালয়ের জেমস হিদারস ‘পিয়ারজ প্রিপ্রিন্টস’ সাময়িকীতে স্প্রাইট সম্পর্কে বর্ণনা দেন। তাঁর মতে, স্প্রাইট হচ্ছে ‘হিউরিস্টিক সার্চ অ্যালগরিদম’। এর অর্থ হচ্ছে, এ পদ্ধতিতে সব সম্ভাব্য ফলাফল দেখাতে পারে না। তবে এর গতি দ্রুত প্রাথমিক কাজ সারতে পারে। এতে যদি কোনো অদ্ভুত ডেটা পদ্ধতি প্রদর্শিত না হয়, তবে তা বিশ্বাসযোগ্য হতে পারে।

ইকোনমিস্ট বলছে, গবেষণা নিবন্ধের ক্ষেত্রে পরিসংখ্যানের অনেক অপদ্ধতিগত প্রতিবেদন ছড়িয়ে পড়েছে। এখন অনেক সহজলভ্য সাজানো গবেষণা হচ্ছে। করভিডস ও স্প্রাইটের মতো অ্যালগরিদম আসার ফলে এ ধরনের ফাঁকিবাজি সহজে ধরা যাবে। বৈজ্ঞানিক গবেষণা নিবন্ধ বিশ্বাসযোগ্যতার ক্ষেত্রে আরও এক ধাপ এগিয়ে যাবে।

টিআর/ ২৫ জুন ২০১৮

সকল প্রকাশিত/প্রচারিত কোনো সংবাদ, তথ্য, ছবি, আলোকচিত্র, রেখাচিত্র, ভিডিওচিত্র, অডিও কনটেন্ট কপিরাইট আইনে পূর্বানুমতি ছাড়া ব্যবহার করা যাবে না।