![]() |
![]() |
নির্বাচিত পোস্ট | লগইন | রেজিস্ট্রেশন করুন | রিফ্রেস |
ব্যাপক অলস তবে আড্ডা দিতে আর ঘুরাঘুরি করতে পছন্দ করি। ডাটা মাইনিং নিয়ে কুইন্সল্যান্ড ইউনিভার্সিটি অব টেকনোলজিতে পিএইচডি করছি। থাকি অস্ট্রেলিয়ার ব্রিজবেনে। মাঝে মাঝে লেখালেখি করতে ইচ্ছে করে কিন্তু অলসতার জন্য হয়ে উঠে না। [sb]এই ব্লগে আমার নিজের লেখা যেসব পোস্ট করেছি, তার সর্ব সত্ত্ব সংরক্ষিত। আমার লিখিত অনুমতি ছাড়া কোনো মাধ্যমে পুনঃপ্রকাশ করা যাবে না। [/sb]
এবার দেশে গিয়ে ক্লাস নাইনের এক ছোট ভাইকে ‘সার্চ ইঞ্জিন কি জিনিস’ সেটা বুঝাচ্ছিলাম। এটা সে বর্ননার দ্বিতীয় পর্ব।
[ আগের পর্ব পড়তে এখানে ক্লিক করুনঃ Click This Link ]
- এখন প্রশ্ন হচ্ছে আমরা ইন্ডেক্স (দ্বিতীয় ছবিটা) থেকে দেখতেছি ‘plum’ শব্দটা আছে ৪টা পেজে--৬৮, ৯৭, ৯৮ এবং ১০৮ নম্বর পেজে। কিন্তু তুমি আগে কোন পেজ খুলবা? কেমনে বুঝবা কোন পেজ খুললে তুমি ‘plum’ সম্পর্কে যে তথ্য খুঁজতেছ সেটা পাবা?
- প্রথম থেকে একটা একটা করে দেখব (আগে ৬৮, তারপর ৯৭, তারপর ৯৮ এবং সবশেষে ১০৮)।
- ইন্টারনেটেতো হাজার হাজার, লাখ লাখ পেজ পাবা যেগুলা ‘plum’ রিলেটেড (গুগল ১৩১,০০০,০০০ পেজে খুঁজে পেয়েছে যেগুলা ‘plum’ রিলেটেড)। এতোগুলা পেজ কি একটা একটা করে দেখা সম্ভব হবে?
- কই? গুগলেতো অল্প কয়টা দেখায় মাত্র। ঐগুলা দেখলেইতো পাওয়া যায়।
- তুমি যদি গুগল সার্চ পেজের উপরের দিকে তাকাও তাহলে দেখবে লেখা আছে ‘About 131,000,000 results (0.59 seconds)’। তার মানে গুগল ০.৫৯ সেকেন্ডের মধ্যে ‘plum’ রিলেটেড ১৩১,০০০,০০০ পেজ খুজে পেয়েছে। তার মধ্য থেকে সে কায়দা কানুন করে তোমাকে প্রথম পেজে হয়তো ১০ ওয়েবপেজের লিংক দেখায়। তুমি পরের পেজে গেলে দেখবে আরো ১০টা ওয়েবপেজের লিংক। এভাবে চলতে থাকবে।
- কিন্তু আমাদেরতো পরের ওয়েবপেজগুলাতে যেতে হয় না।
- হুম। এখানেই গুগলের সাফল্য। সে ‘plum’ রিলেটেড যত ওয়েবপেজ খুঁজে পেয়েছে তাদের একটা র্যাঙ্ক তৈরি করে। ঐ র্যাঙ্কে যে আগে আছে তাকে আগে দেখায় আর যে পরে আছে তাকে পরে দেখায়। ঐ র্যাঙ্কিং যত ভাল হবে তুমি তত তাড়াতাড়ি তোমার দরকারি ওয়েবপেজটা পেয়ে যাবে। র্যাঙ্কিং এর এই কাজটা যে এলগোরিদম বা সফটওয়ার করে তাকে বলে র্যাঙ্কার। প্রত্যেকটা সার্চ ইঞ্জিনের সাফল্য নীর্ভর করে এই র্যাঙ্কিং এলগোরিদমের উপর। এবং মেইনলী এই র্যাঙ্কিং এলগোরিদমের ভিন্নতার কারনেই একটা সার্চ ইঞ্জিন আরেকটা সার্চ ইঞ্জিন থেকে আলাদা। গুগল, বিং, ইয়াহু প্রত্যেকের নিজস্ব র্যাঙ্কিং এলগোরিদম আছে এবং তারা আলাদা আলাদা। শুধু তাই নয়, সবাই নিজেদের র্যাঙ্কিং এলগোরিদম খুব গোপন রাখে যেন তাদের প্রতিদন্ধি বা অন্য কেউ না জানতে পারে। স্পেমাররা যদি হুবহু জেনে যায় কোন একটা সার্চ ইঞ্জিনের র্যাঙ্কিং এলগোরিদম কেমন করে কাজ করে তাহলে সহজেই স্পেমিং করে বিভিন্ন ওয়েব পেজের র্যাঙ্কিং চেঞ্জ করে ফেলতে পারবে।
র্যাঙ্কিং এর জন্য বিভিন্ন সার্চ ইঞ্জিন কোম্পানি বিভিন্ন ফ্যাক্টর বিবেচনা করে, এরমক শতাধিক ফ্যাক্টর রয়েছে। তবে মোটামুটিভাবে কমন ফ্যাক্টরগুলো হলঃ কোন একটা পেজের জনপ্রিয়তা, তুমি যে শব্দটা খুঁজতেছ সেটা ঐ পেজে কতবার আছে, ঐ পেজের কোন পজিশনে শব্দটা আছে (যেমনঃ হেড লাইনে, বডিতে, নাকি ইউআরএল-এ), কতগুলো অন্য ওয়বপেজে এই পেজটাকে রেফার (লিংক) করা হয়েছে ইত্যাদি। এসব ফেক্টরকে একসাথে বিবেচনায় নিয়ে র্যাঙ্কিং এলগোরিদম ডিজাইন করা হয়।
উদাহরণ হিসেবে, মনে কর—একটা ওয়বপেজে ‘plum’ শব্দটা আছে ১০ বার, আরেকটা ওয়েবপেজে ‘plum’ শব্দটা আছে ১৫ বার এবং তৃতীয় ওয়েবপেজে ‘plum’ শব্দটা আছে ৫ বার। এখন তুমি যদি শুধু এই ওয়ার্ড কাউন্টকে বিবেচনায় নিয়ে এই তিনটি ওয়েব পেজের একটা র্যাঙ্কিং তৈরি কর, তাহলে যে ওয়েবপেজে ‘plum’ শব্দটা ১৫ বার আছে সেটা আসবে সবার আগে, তারপর আসবে যেটাতে ‘plum’ শব্দটা ১০ বার আছে এবং সবার শেষে আসবে যেটাতে ‘plum’ শব্দটা ৫ বার আছে।
[চলবে...]
০৯ ই নভেম্বর, ২০১৫ সন্ধ্যা ৭:৩৩
বাসার বলেছেন: ধন্যবাদ। আশা করি খুব শিগ্রই পরের লেখা নিয়ে আসব।
২| ০৯ ই নভেম্বর, ২০১৫ রাত ৯:০৭
প্রামানিক বলেছেন: গুরুত্বপূর্ণ পোষ্ট। ধন্যবাদ
০৯ ই নভেম্বর, ২০১৫ রাত ৯:১০
বাসার বলেছেন: ধন্যবাদ প্রামানিক ভাই।
৩| ১০ ই নভেম্বর, ২০১৫ বিকাল ৩:২৮
এহসান সাবির বলেছেন: ভালো শেয়ার।
১০ ই নভেম্বর, ২০১৫ বিকাল ৩:৩৮
বাসার বলেছেন: ধন্যবাদ। ভাল থাকবেন।
©somewhere in net ltd.
১|
০৯ ই নভেম্বর, ২০১৫ সন্ধ্যা ৭:২৪
বিজয় কেতন বলেছেন: ধন্যবাদ বাশার ভাই। গুগল সম্পর্কে আরো জানতে চাই। পরের লেখার অপেক্ষায় আছি...