নির্বাচিত পোস্ট | লগইন | রেজিস্ট্রেশন করুন | রিফ্রেস

সরল ভাষায় বিজ্ঞান চাই

বাসার

ব্যাপক অলস তবে আড্ডা দিতে আর ঘুরাঘুরি করতে পছন্দ করি। ডাটা মাইনিং নিয়ে কুইন্সল্যান্ড ইউনিভার্সিটি অব টেকনোলজিতে পিএইচডি করছি। থাকি অস্ট্রেলিয়ার ব্রিজবেনে। মাঝে মাঝে লেখালেখি করতে ইচ্ছে করে কিন্তু অলসতার জন্য হয়ে উঠে না। [sb]এই ব্লগে আমার নিজের লেখা যেসব পোস্ট করেছি, তার সর্ব সত্ত্ব সংরক্ষিত। আমার লিখিত অনুমতি ছাড়া কোনো মাধ্যমে পুনঃপ্রকাশ করা যাবে না। [/sb]

বাসার › বিস্তারিত পোস্টঃ

গুগল সার্চ (সার্চ ইঞ্জিন) কেমনে কাজ করে? দ্বিতীয় পর্ব--র‍্যাঙ্কিং। [শুধু বাচ্চাদের জন্য]

০৯ ই নভেম্বর, ২০১৫ দুপুর ২:৫৭





এবার দেশে গিয়ে ক্লাস নাইনের এক ছোট ভাইকে ‘সার্চ ইঞ্জিন কি জিনিস’ সেটা বুঝাচ্ছিলাম। এটা সে বর্ননার দ্বিতীয় পর্ব।

[ আগের পর্ব পড়তে এখানে ক্লিক করুনঃ Click This Link ]

- এখন প্রশ্ন হচ্ছে আমরা ইন্ডেক্স (দ্বিতীয় ছবিটা) থেকে দেখতেছি ‘plum’ শব্দটা আছে ৪টা পেজে--৬৮, ৯৭, ৯৮ এবং ১০৮ নম্বর পেজে। কিন্তু তুমি আগে কোন পেজ খুলবা? কেমনে বুঝবা কোন পেজ খুললে তুমি ‘plum’ সম্পর্কে যে তথ্য খুঁজতেছ সেটা পাবা?

- প্রথম থেকে একটা একটা করে দেখব (আগে ৬৮, তারপর ৯৭, তারপর ৯৮ এবং সবশেষে ১০৮)।

- ইন্টারনেটেতো হাজার হাজার, লাখ লাখ পেজ পাবা যেগুলা ‘plum’ রিলেটেড (গুগল ১৩১,০০০,০০০ পেজে খুঁজে পেয়েছে যেগুলা ‘plum’ রিলেটেড)। এতোগুলা পেজ কি একটা একটা করে দেখা সম্ভব হবে?

- কই? গুগলেতো অল্প কয়টা দেখায় মাত্র। ঐগুলা দেখলেইতো পাওয়া যায়।

- তুমি যদি গুগল সার্চ পেজের উপরের দিকে তাকাও তাহলে দেখবে লেখা আছে ‘About 131,000,000 results (0.59 seconds)’। তার মানে গুগল ০.৫৯ সেকেন্ডের মধ্যে ‘plum’ রিলেটেড ১৩১,০০০,০০০ পেজ খুজে পেয়েছে। তার মধ্য থেকে সে কায়দা কানুন করে তোমাকে প্রথম পেজে হয়তো ১০ ওয়েবপেজের লিংক দেখায়। তুমি পরের পেজে গেলে দেখবে আরো ১০টা ওয়েবপেজের লিংক। এভাবে চলতে থাকবে।

- কিন্তু আমাদেরতো পরের ওয়েবপেজগুলাতে যেতে হয় না।

- হুম। এখানেই গুগলের সাফল্য। সে ‘plum’ রিলেটেড যত ওয়েবপেজ খুঁজে পেয়েছে তাদের একটা র‍্যাঙ্ক তৈরি করে। ঐ র‍্যাঙ্কে যে আগে আছে তাকে আগে দেখায় আর যে পরে আছে তাকে পরে দেখায়। ঐ র‍্যাঙ্কিং যত ভাল হবে তুমি তত তাড়াতাড়ি তোমার দরকারি ওয়েবপেজটা পেয়ে যাবে। র‍্যাঙ্কিং এর এই কাজটা যে এলগোরিদম বা সফটওয়ার করে তাকে বলে র‍্যাঙ্কার। প্রত্যেকটা সার্চ ইঞ্জিনের সাফল্য নীর্ভর করে এই র‍্যাঙ্কিং এলগোরিদমের উপর। এবং মেইনলী এই র‍্যাঙ্কিং এলগোরিদমের ভিন্নতার কারনেই একটা সার্চ ইঞ্জিন আরেকটা সার্চ ইঞ্জিন থেকে আলাদা। গুগল, বিং, ইয়াহু প্রত্যেকের নিজস্ব র‍্যাঙ্কিং এলগোরিদম আছে এবং তারা আলাদা আলাদা। শুধু তাই নয়, সবাই নিজেদের র‍্যাঙ্কিং এলগোরিদম খুব গোপন রাখে যেন তাদের প্রতিদন্ধি বা অন্য কেউ না জানতে পারে। স্পেমাররা যদি হুবহু জেনে যায় কোন একটা সার্চ ইঞ্জিনের র‍্যাঙ্কিং এলগোরিদম কেমন করে কাজ করে তাহলে সহজেই স্পেমিং করে বিভিন্ন ওয়েব পেজের র‍্যাঙ্কিং চেঞ্জ করে ফেলতে পারবে।

র‍্যাঙ্কিং এর জন্য বিভিন্ন সার্চ ইঞ্জিন কোম্পানি বিভিন্ন ফ্যাক্টর বিবেচনা করে, এরমক শতাধিক ফ্যাক্টর রয়েছে। তবে মোটামুটিভাবে কমন ফ্যাক্টরগুলো হলঃ কোন একটা পেজের জনপ্রিয়তা, তুমি যে শব্দটা খুঁজতেছ সেটা ঐ পেজে কতবার আছে, ঐ পেজের কোন পজিশনে শব্দটা আছে (যেমনঃ হেড লাইনে, বডিতে, নাকি ইউআরএল-এ), কতগুলো অন্য ওয়বপেজে এই পেজটাকে রেফার (লিংক) করা হয়েছে ইত্যাদি। এসব ফেক্টরকে একসাথে বিবেচনায় নিয়ে র‍্যাঙ্কিং এলগোরিদম ডিজাইন করা হয়।

উদাহরণ হিসেবে, মনে কর—একটা ওয়বপেজে ‘plum’ শব্দটা আছে ১০ বার, আরেকটা ওয়েবপেজে ‘plum’ শব্দটা আছে ১৫ বার এবং তৃতীয় ওয়েবপেজে ‘plum’ শব্দটা আছে ৫ বার। এখন তুমি যদি শুধু এই ওয়ার্ড কাউন্টকে বিবেচনায় নিয়ে এই তিনটি ওয়েব পেজের একটা র‍্যাঙ্কিং তৈরি কর, তাহলে যে ওয়েবপেজে ‘plum’ শব্দটা ১৫ বার আছে সেটা আসবে সবার আগে, তারপর আসবে যেটাতে ‘plum’ শব্দটা ১০ বার আছে এবং সবার শেষে আসবে যেটাতে ‘plum’ শব্দটা ৫ বার আছে।
[চলবে...]

মন্তব্য ৬ টি রেটিং +০/-০

মন্তব্য (৬) মন্তব্য লিখুন

১| ০৯ ই নভেম্বর, ২০১৫ সন্ধ্যা ৭:২৪

বিজয় কেতন বলেছেন: ধন্যবাদ বাশার ভাই। গুগল সম্পর্কে আরো জানতে চাই। পরের লেখার অপেক্ষায় আছি...

০৯ ই নভেম্বর, ২০১৫ সন্ধ্যা ৭:৩৩

বাসার বলেছেন: ধন্যবাদ। আশা করি খুব শিগ্রই পরের লেখা নিয়ে আসব। :)

২| ০৯ ই নভেম্বর, ২০১৫ রাত ৯:০৭

প্রামানিক বলেছেন: গুরুত্বপূর্ণ পোষ্ট। ধন্যবাদ

০৯ ই নভেম্বর, ২০১৫ রাত ৯:১০

বাসার বলেছেন: ধন্যবাদ প্রামানিক ভাই।

৩| ১০ ই নভেম্বর, ২০১৫ বিকাল ৩:২৮

এহসান সাবির বলেছেন: ভালো শেয়ার।

১০ ই নভেম্বর, ২০১৫ বিকাল ৩:৩৮

বাসার বলেছেন: ধন্যবাদ। ভাল থাকবেন।

আপনার মন্তব্য লিখুনঃ

মন্তব্য করতে লগ ইন করুন

আলোচিত ব্লগ


full version

©somewhere in net ltd.