توضیحات

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

 تحقیق در مورد موتور های جستجو دارای 33 صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

فایل ورد تحقیق در مورد موتور های جستجو  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی تحقیق در مورد موتور های جستجو،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن تحقیق در مورد موتور های جستجو :

مقدمه
رشد اینترنت شگفت‌آور شده است. با توجه به تحقیق میدانی در سال 1996 این رشد تصاعدی همچنان ادامه دارد. و تخمین زده شده كه شبكه از نظر اندازه و حجم هر 12 تا 15 ماه دوبرابر می‌شود. بطور تقریبی 000/100 وب‌گاه در اگوست 1995 وجود داشته و این تعداد در اگوست 1996 به 041/536 رسیده است. از آنجائی كه هر پایگاه می‌تواند بسیاری از

صفحات وب را در خود داشته باشد این باعث می‌شود كه تعداد بیشتری از صفحات وب بوجود آید. در حالیكه كیفیت بسیاری از صفحات ممكن است مورد سؤال باشد و نگهداری بسیاری از صفحات پراكنده است. اما صفحات معتبری هم وجود دارد كه اطلاعات با ارزشی در مورد بسیاری از موضوعات ارائه می‌دهد. آنچه استفاده‌كنندگان به آن نیاز دارند یك سیستم جداكننده است كه مو از ماست بكشد.

تلاشهای زیادی صورت گرفته كه این وظیفه را آسان كند: كتابداران و متخصصان موضوعی راهنماهای موضوعی را گردآوری كرده‌اند.«اخبار كتابخانه‌های تحقیقاتی و دانشكده‌ای»1 بطور دوره‌ای راهنماهای منابع اینترنتی را در موضوعات انتخابی منتشر می‌كند. علاوه بر آن فهرستنویسان Intercat را (كه یك فهرست آزمایشی برای اینترنت است) بوجود آورده‌اند. OCLC نیز پایگاه Netfirst را برای نمایه‌سازی منابع اینترنت با سرعنوانهای موضوعی كتابخانه كنگره و اعداد طرح دهدهی دیویی ایجاد كرده است. كتابداران مرجع یك پایگاه وب را به نام

Infofilter بوجود آورده‌اند كه مرور منابع اینترنتی را به اشتراك بگذارند و كتابداران رده‌بندی موضوعی را برای سازماندهی منابع اینترنت مورد آزمایش قرار داده‌اند. اما چیزی كه بیشترین توجه استفاده‌كنندگان اینترنت را به خود معطوف داشته است، احتمالاً عنكبوتها و روباتهایی هستند كه خدمات جستجو را انتخاب می‌كنند. برای بسیاری از جستجوگران اینترنت، این

موتورها با راه دادن آنها به فضای اطلاعاتی عظیم كمك موقتی ارائه می‌دهند. كاربران اینترنت بزودی فهمیدند كه این موتورها كامل و مناسب نیستند زیرا آنها منطقه جغرافیایی خاصی را پوشش می‌دهند، بصورت متفاوت نمایه‌سازی می‌شوند و منابع را با كلیدواژه‌ها بازیابی می‌كنند. استفاده‌كنندگان هرگز نمی‌توانند اعتماد كنند كه یك جستجو جامع یا قطعی باشد. با وجود اینكه نتایج بازیابی ظاهراً بوسیله میزان ارتباط مرتب شده است و استفاده‌كنندگان مبارزه با ریزش كاذب مواد تكراری و نامربوط را ادامه می‌دهند. در كل پیشرفت خوبی در كمك به استفاده‌كنندگان برای جهت‌یابی در اینترنت بوجود آمده، اما این ابزارها آنقدر زیاد هستند كه انتخاب صحیح یكی از آنها كار سختی است.

علاوه بر آن انتخاب موتورهای جستجوی مناسب ممكن است برای استفاده‌كنندگان عمومی و نیز كتابداران، به علت رویه‌های پیچیده، مهمتر باشد. بعنوان مثال، اینفوسیك سرویس رایگان دارد، اما سرویسهای هزینه بر، یعنی متخصصان اینفوسیك، نمایهء بزرگتر و قابلیتهای جستجوی قویتر ارائه می‌دهند.

وب كروكر یك درخواست حق عضویت دارد كه زمانی آن را تحمیل می‌كند. اگر این عمل در مقابل هزینه برای خدمات یك رویه شود، لازم خواهد بود برای استفاده كنندگان و بخصوص كتابداران كه بدانند كدامیك از موتورهای جستجو را باید به خدمت بگیرند.

این تحقیق تلاش كرده كه كارآیی موتورهای كاوش را در آدرس دهی نیازهای اطلاعاتی ارزیابی كند. آیا آنها می‌توانند جوابهایی برای سؤالات مرجع واقعی بازیابی كنند؟ آیا آنها منابع خوبی برای سؤالات موضوعی ارائه می‌دهند؟ آنها تا چه حد نتایج جستجو را براساس میزان ارتباط مرتب می‌كنند؟ كدامیك از موتورهای جستجو بهتر عمل می‌كنند؟ جواب این سؤالات به ما كمك خواهد كرد كه نقاط ضعف و قوت موتورهای كاوش را بهتر بفهمیم و ما را قادر می‌سازد كه برای برطرف كردن نیازهای اطلاعاتی موتور كاوش مناسب را انتخاب كنیم.
پیشینه پژوهش

موتورهای كاوش بسیاری موجود هستند و براحتی در دسترس قرار می‌گیرند Netsearch متعلق به نت اسكیپ و www by subject or keyword مربوط به كتابخانه كنگره، هر دو با هم موتورهای كاوش اصلی را گرد آورده‌اند. همچنین ابرموتورهایی وجود دارد كه به جستجوگران اجازه می‌دهد كه سریعاً به چندین موتور كاوش دسترسی پیدا كنند، اما فقط Savy search قادر به جستجوی بیش از 5 پایگاه در یك زمان است. “All-in-one” گروهی دیگر از ابزارهائی را كه ارائه دهنده نمونه‌های جستجو بسیاری از موتورهای كاوش در یك پایگاه وب برای آسان‌سازی عمل جستجو هستند را نشان می‌دهد.

كار عنكبوتها، روباتها و دیگر برنامه‌های خودكار بوسیله پروسیس خلاصه شده است. (1995) و محدودیتهای این ابزارها بوسیلهء كاستر تجزیه و تحلیل شده‌اند. (1995) چندین مقاله ادعا كرده‌اند كه ابزارهای جستجوی اینترنت را ارزیابی كرده‌اند، اما اغلب آنها توصیفهایی از شبكه جهانی وب یا موتورهای كاوش ارائه داده‌اند. برینكلی و بیورك (1995) هایتلنت، آرچی، گوفر، و ایزو شبكه جهانی وب را شرح داده‌اند. كورتولیس، بیرواستارك (1995) پرسشهایی بكار برده‌اند برای اینكه موتورهای كاوش و نمایه‌های وب را آزمایش كنند. اما گزارش آنها

بیشتر توصیفی است. كایمل (1996) تاریخچه‌ای از پایگاههای تولید شده بوسیله رباتها را ارائه داده و به جستجوگران مبتدی راهنمائی‌های خوبی در مورد موتورهای كاوش پیشنهاد كرده است. وندیتو(1996) هفت موتور كاوش را آزمایش كرده و ویژگیهای جستجوی آنها را شرح داده است. گزارشهای مشابه در مورد اینترنت فراوان است و بسیاری از آنها را می‌توان در لیت كمپبل پیدا كرد. نمونه‌های خوب بسیار كم هستند. مثل گزارشهای لین (1995)، وین شیپ (1995) وبستر و پانول (1995).

مطالعات ارزشیابی نسبتاً كمی وجود داشته كه شامل تحقیق میدانی در مورد موتورهای جستجو باشد. دسای (1995) قدرت بازیابی سیزده ابزار جستجو را با یك سؤال آزمایش كرده است. او قادر بود با جستجوی نامش تعیین كند كه چگونه بسیاری از اسناد وبی او بازیابی شده است. اینفوسیك و لایكاس با بازیابی هفت سند از 24 سند بهتر عمل كردند. در حالیكه دیگر موتورها و نمایه‌ها نظیر وب كرولر و یاهو ضعیف عمل كردند. لیتون (1995) عملكرد اینفوسیك، لایكاس، وب كرولر و ورلد واید وب وارم را با استفاده از 8 سؤال مقایسه كرده است.

او این آزمایش را با 4 معیار انجام داد-نسبت تكراری بودن، دقت، دقت كامل و حداكثر 10 دقت- و نتیجه گرفت كه لایكاس و اینفوسیك بهتر از بقیه عمل كردند. پكروتومایولو 2 سؤال مرجع را در آلتاویستا، ماژلان، اینفوسیك، لایكاس و یونیت جستجو كردند. امتیاز دقت آنها مبتنی بود بر 10 نتیجه اول، آنها فهمیدند كه آلتاویستا بهترین عملكرد را داشت بعد از آن اینفوسیك،

لایكاس، ماژلان و پوینت. مقابقاب (1995) 5 سؤال را برای امتحان كردن 5 موتور كاوش با اجرای جستجوهای اصلی و اصلاح شده در هر موتور بكار برد. او دقت نتیجه اول را تغییر داد. با استفاده از 25 نتیجه بعنوان پایه و مبنا. او یاهو را بعنوان بهترین عمل كننده شناخت. یافته‌های این مطالعات بطور قطعی بهترین موتورهای كاوش را مشخص نكرد بعلت سؤالات مختلف، تعداد متفاوت سؤالات و مقیاسهای مختلف بكار رفته برای ارزشیابی. با این وجود، این مطالعات شیوه‌های مختلف ارزیابی موتورهای كاوش را ثابت كرد و معیارهای جدید و منطقی برای اجرای جستجو پیشنهاد كرد.

روش‌شناسی
این مطالعه هشت موتور كاوش را كه مشهور هستند و برای عموم رایگانند ارزیابی می‌كند. این موتورها عبارتند از: آلتاویستا، اكسایت، اینفوسیك، گاید، لایكاس، ماژلان، این تكست، وب كرولر و ورد واید وب وارم.

عوامل بسیاری ممكن است برای موفقیت یك جستجو مشاركت كنند. درك صحیح از تقاضای جستجو، استراتژی جستجو، پایگاه اطلاعاتی، موتور كاوش، و قضاوت میزان ارتباط بوسیلهء جستجوگران. در این تحقیق تعدادی از این معیارها كنترل شده بودند بنحوی كه تفاوت موتورهای كاوش قابل مشاهده بود. موتورهای كاوش از نظر اندازه، محتوای پایگاه اطلاعاتی‌شان، خط‌مشی‌های نمایه‌سازیشان، كنترل كیفیت، شیوه‌های بازیابی و ارائه نتایج جستجو متفاوتند. فرض بر این شد كه سؤالات آزمایشی با پیچیدگی و وضع متفاوت در تعیین بهترین موتور جستجو با ارزش‌تر خواهد بود. با این وجود، مطالعات پیشین مشخص كردند كه امكان اینكه یك موتور جستجو در جوابگویی همه نوع سؤالات بهتر از همه باشد، وجود ندارد. ما تقاضاهای جستجو را با استفاده از 20 سؤال مطرح شده در میز مرجع استاندارد كردیم. و 5 سؤال موضوعی كه در حوزه‌هایی كه منابع اینترنتی بسیاری داشت، بوجود آمده بود-سرگرمی، تجارت، سیاست اقتصاد و بهداشت. سؤالات مرجع گردآوری شده شامل سؤالات تخصصی و پرسشهای موضوعی وسیع بود و از نظر اینكه توانایی موتورهای كاوش را در جوابگویی به سؤالات مرجع واقعی مورد آزمایش قرار داد با ارزش بودند. 5 سؤال موضوعی ساختگی بودند، اما این طراحی ما را قادر می‌ساخت كه تجزیه و تحلیل معنی‌دار بیشتری انجام دهیم. با این همه، هیچ ارزشیابی خیلی خردمندانه نبود اگر ما از سؤالاتی كه برای آن هیچ چیز قابل بازیابی نبود، استفاده می‌كردیم.

مجموعه داده‌ها2 به هشت موتور كاوش چهار جستجو اختصاص یافته بود برای اطمینان از اینكه هر سؤال دو بار در یك موتور جستجو شده است. به جستجوگران آموزش داده شد كه از مرورگر نت اسكیپ برای دسترسی به اینترنت استفاده كنند و سؤالات داده شده را در موتورهای كاوش تعیین شده جستجو كنند و نسخه‌های چاپی از نتایج جستجو ارائه دهند. جستجوگران كار را در آوریل شروع كردند و در ژوئن 1996 نتیجه‌گیری انجام شد. جمله‌بندی سؤالات مرجع برای جستجوهای اینترنتی كمی تغییر داده شد. برای اطمینان یافتن از

تكنیكهای مشابه بكار رفته، كلیدواژه‌ها تعیین شده بودند و پارامترهای اساسی در مورد اینكه در هر موتور كاوش جستجو به چه صورت انجام شود ارائه شدند. به جستجوگران گفته شد كه بهترین قضاوتشان را در ارزیابی ارتباط منابع بازیابی شده بكار گیرند.

یكی از سؤالات مرجع دو بخش داشت، بنابراین سئوالات مرجع به 21 تبدیل شد. هر كدامیك از سؤالات 21 گانه مرجع و 5 سؤال موضوعی دو بار در هر موتور، جستجو شده بود. اما در اكسایت 4 بار جستجو شد، زیرا در این موتور، جستجوگر قادر به جستجوی كلیدواژه‌ای و نیز جستجوی مفهومی می‌باشد. در میانه راه با ماژلان جستجوگران گزینه‌ای از جستجو را در بخش خاصی از پایگاههای اطلاعاتی یا كل پایگاهها به منظور هماهنگی و یكدستی همه جستجوگران در كل پایگاهها انجام دادند. در كل 468 جستجو انجام شده بود.

متغیرهای وابسته. چهار متغیر برای این تحقیق اندازه‌گیری شدند. «دقت»3 كه بطور سنتی تعریف شده بود: تعداد منابع مرتبط بازیابی شده تقسیم بر تعداد منابع بازیابی شده و یك معیار استانداردی برای سیستمهای بازیابی اطلاعات بوده است. از آنجائی كه ارزیابی ارتباط تعداد زیاد صفحات بازیابی شده بوسیلهء موتورهای كاوش غیرممكن بود .
این متغیر در این تحقیق بطور عملیاتی چنین تعریف شده:

دقت: تعداد منابع مرتبط در 10 گزینه اول
شیوه استفاده از ده گزینه اول قابل توصیه است، زیرا این گزینه‌ها بیشتر امكان دارد كه به وسیله جستجوگران دیده شود. این معیار را لیتون، پیكروتومایولو بكار برده است. اما برخلاف تحقیق لیتون، این تحقیق پایگاههای ارجاعی و تكراری را در معیار دقت درنظر می‌گیرد. زیرا آنها بالقوه مفید بودند (در صورتی كه گزینه‌های تكراری مرتبط باشد) و حذف آنها باعث می‌شد كه پایهء مقایسه (كه ده تا بود) كوچكتر شود.

«تكراری بودن»4: در همان اوایل جستجو در موتورهای كاوش گزارشهای حكایت گونه‌ای از تكراریها بوجود آمد. در نتیجه این معیار در ارزیابی‌های ما وارد شد. تكراری بودن بطور عملیاتی «تعداد گزینه‌هایی كه تكرار شدند و قبل از آن نیز ارائه شده بودند» تعریف شده بود. پایگاههای ارجاعی هم جزء تكراریها به حساب آمدند. در این مطالعه ما تعداد گزینه‌های تكراری را بر اساس ده نتیجه اول در نظر گرفتیم.

«امتیاز مرتبط‌ترین گزینه»5: همه موتورهای كاوش انتخابی، نتایج بازیابی را با استفاده از الگوریتم متفاوت مرتب می‌كنند و بهترین تطبیقها را اول ارائه می‌دهند. اما تنظیم همیشه مفید نبوده است. این متغیر برای امتحان كردن توانایی درجه‌بندی موتورهای كاوش طراحی شده بود. كه بر این فرضیه مبتنی است كه شیوه درجه‌بندی مؤثر، مرتبط‌ترین گزینه‌ها را در بالاترین لیست نتایج جستجو قرار می‌دهد. جستجوگران، بطور عملیاتی مرتبط‌ترین گزینه از بین ده گزینه تعریف كردند و به آن بخاطر جایگاهش یك امتیاز دادند. اگر این گزینه در اولین، دومین یا

سومین گزینه بود این موتور امتیازی بین 1 یا 2 یا سه می‌گرفت. اگر این گزینه جای دیگر ظاهر می‌شد به آن امتیاز 6 داده می‌شد. عدد 6 به این علت انتخاب شده بود كه نشان می‌داد این گزینه در خارج از اولین نیمه لیست ده تایی قرار گرفته است. امتیاز پائین در مورد مرتبط‌ترین گزینه نشان دهنده این بود كه آن موتور بهترین درجه‌بندی گزینه‌های مرتبط را داشته است.
«امتیاز درجه‌بندی میزان ارتباط»6: این متغیر نیز درجه‌بندی میزان ارتباط در موتورهای كاوش را ارزیابی كرد اما به شیوه‌ای متفاوت. این متغیر به عنوان درصد گزینه‌های مرتبط كه در اولین نیمه لیست ده گزینه‌ای ظاهر شدند تعریف شد. این تعریف مبتنی بود بر این فرضیه كه میزان ارتباط گزینه‌ها كاهش خواهد یافت هر چقدر كه به گزینه‌های پائین‌تر می‌رسیم.

جستجوگران تعداد گزینه‌های مرتبط را در هر نیمه از لیست ده گزینه‌ای ثبت كردند و مأموران تحقیق این تعداد را با توجه به فرمول زیر برای رسیدن به امتیاز درجه‌بندی براساس میزان ارتباط تبدیل كردند:
تعداد گزینه‌های مرتبط در اولین لیست
كل تعداد گزینه‌های مرتبط در لیست ده‌تایی
«بازیابی»7: یكی دیگر از معیارهای استاندارد برای بازیابی اطلاعات است و چنین تعریف شده: تعداد گزینه‌های مرتبط بازیابی شده تقسیم بر كل تعداد گزینه‌های مرتبط در یك فایل اطلاعاتی. این معیار برای استفاده دشوار بود زیرا جستجوگران می‌بایست همه گزینه‌های مرتبط را در كل یك پایگاه یا فهرست شناسائی كنند. این مشكل در شبكه جهانی وب خیلی شدیدتر است. با هزاران هزار صفحه وب نمایه شده به وسیله موتورهای جستجو انتخابی غیرممكن بود كه همه صفحات وب مرتبط با موضوع جستجو شناسایی شود. به این ترتیب بازیابی در این مطالعه استفاده نشد.
«تجزیه و تحلیل داده‌ها»8: از 468 جستجوی انجام شده 4 معیار برای هر جستجو در موتور كاوش ثبت شد. بسامد و میانگین این معیارها برای هر موتور جستجو با نوع سؤالات حساب شده بودند.

یافته‌ها
دقت
سؤالات مرجع عمومی متنوع بود بطوری كه شاید یك كتابدار مرجع برای یافتن پاسخ آنها از اینترنت استفاده نمی‌كرد. با این وجود همه سؤالات در موتورهای كاوش جستجو شده بودند كه توانائی‌شان را در پاسخگویی به سؤالات مرجع ارزیابی كنند. موتورهای كاوش این كار را بخوبی انجام ندادند. میانگین امتیاز دقت خیلی پائین بود. بین 31/0 و 93/2 این تكست بالاترین تعداد گزینه‌های مرتبط را بازیابی كرد. بعد از آن آلتاویستا و اینفوسیك و سپس لایكاس با اختلاف كم چهارم شد. برای نشان دادن جنبه دیگری از این جستجوها، اطلاعاتی در

مورد نقاط كور هر موتور در جدول 1 قرار گرفتند كه نشان داد اكسایت پائین‌ترین تعداد نقاط كور را داشت و بعد از آن این تكست و لایكاس. بر رویهم رفته، این دو مجموعه از داده‌ها این تكست را بعنوان بهترین موتور در برخورد با سؤالات مرجع معرفی كرد. این موتور صفحات وب را برای این سؤالات بازیابی كرد و نتایج جستجویش بالاترین امتیاز میزان دقت را داشت.

در این پژوهش موتورهای جستجو با سؤالات موضوعی ساختگی بهتر عمل كردند. سؤالات موضوعی پائین‌ترین میانگین امتیاز دقت (2/3) نسبت به بالاترین امتیاز میزان دقت (93/2) در سؤالات مرجع واقعی بالات بود. اینفوسیك بهتر عمل كرد بعد از آن ماژلان و این تكست و باز هم لایكاس با اختلاف كم چهارم شد. از آنجائی كه سؤالات مرجع برای حوزه‌هایی طراحی شده بودند كه در مورد آن اطلاعات بیشتری در وب موجود باشد، مشكل نقاط كور در این سؤالات خیلی جدی نبود. در سؤالات مرجع كیفیت گزینه‌های بازیابی شده، «دقت خاص» تعداد جستجوهایی كه بیش از 5 گزینه مرتبط را بازیابی كردند در نظر گرفته شد كه در جدول 2 آمده است.

اینفوسیك باز هم برنده ظاهر شد، بعد از آن ماژلان و این تكست و لایكاس و وب كرولر هر سه بطور مساوی در جایگاه سوم قرار گرفتند. این اطلاعات نشان داد كه اینفوسیك در برخورد با سؤالات بهترین بود. این موتور بیش از 5 گزینه مرتبط را برای اغلب پرسشهای موضوعی بازیابی كرد ونتایج جستجویش بالاترین امتیاز میزان دقت را داشت.
تكراری بودن

تكراریها در بازیابی زمان جستجوگران را تلف می‌كنند و باعث سردرگمی می‌شوند. علاوه بر قصه شكایت در مورد تكراریها، به هر حال، این مسأله به نظر می‌رسد كه در بیشتر موتورهای كاوش مطرح بوده است. میانگین تعداد موارد تكراری برای هر دو سؤالات مرجع و سؤالات موضوعی در هر موتور كاوش ناچیز است (كمتر از یك). اما سؤالات موضوعی شانسشان برای داشتن موارد تكراری بیشتر بود. این اطلاعات نشان می‌دهد كه نمایش داده‌های تكراری حتی زمانی كه گزینه‌های مرتبط زیادی بازیابی شده بود اهمیت چندانی نداشتند.
امتیاز مرتبط ترین گزینه

این امتیاز توانایی هر موتور كاوش را برای نشان دادن اولین گزینهء مرتبط اندازه‌گیری كرد. بخاطر اینكه امتیازی به محل گزینه‌ها اختصاص یافته بود، پائین‌ترین امتیازها عملكردهای بهتر را نشان می‌داد. برای سؤالات مرجع امتیاز موتورهای جستجو بین 3/3 و 3/5 قرار داشت، اول اپن تكست بعنوان برنده بعد از آن اكسایت و آلتاویستا قرار گرفتند. موتورهای كاوش با سؤالات موضوعی خوب عمل نكردند. امتیازات آنها بین 5/2 تا 2/4 قرار داشت. اپن تكست و بعد از آن اینفوسیك و وب كرولر بهترین عملكرد را داشتند. اپن تكست در ارائه مرتبط‌ترین گزینه همیشه بهترین بود.

امتیاز تنظیم براساس ارتباط
این امتیاز قدرت موتورهای كاوش را اندازه‌گیری كرد برای ارائه گزینه‌های مرتبط در اولین نیمه نتایج جستجو. برای سؤالات مرجع، امتیازات موتورهای كاوش بین 5/15% تا 1/45% و با پیشتازی اپن تكست و بعد از آن اینفوسیك و اكسایت قرار داشت. برای سؤالات موضوعی امتیازاتشان بین 23% تا 8/52% قرار گرفت. اینفوسیك بعنوان بهترین عمل كننده لایكاس در جایگاه دوم و اكسایت به عنوان سومین جایگاه.

عملكرد جامع
چهار معیار جنبه‌های قدرت بازیابی موتورهای كاوش را اندازه‌گیری كردند. نمودار 2 دقت، تكراری بودن و امتیاز مرتبط‌ترین گزینه‌ها را برای سؤالات مرجع خلاصه كرده است.
امتیاز رتبه‌بندی براساس میزان ارتباط در آن وارد نشد، زیرا دامنه آنها خیلی بالاتر بود و نمی‌توانست بطور كامل در این نمودار وارد شود. بهترین موتور جستجو بالاترین دقت، پائین‌ترین موارد تكراری، پائین‌ترین امتیاز مرتبط ترین گزینه و بهترین امتیاز تنظیم براساس دقت را دارد. این نتایج در نمودار 2 روشن است، به هر حال موتورهای كاوش چنین عمل كردند: اپن تكست بالاترین مانعیت و پائین‌ترین امتیاز مرتبط‌ترین گزینه را داشت. اما اكسایت و اینفوسیك پایین‌ترین تعداد موارد تكراری را داشتند. از این 4 معیار، اپن تكست بهترین امتیاز را از بین آنها داشت و توانست بهترین عمل كننده برای این نوع سؤالات باشد. رتبه دوم مشخص نبود چون این موتورها فقط در یك یا دو معیار ممتاز بودند. با این وجود این امكان وجود داشت كه آنها را به دو گروه تقسیم كنیم: آلتاویستا، اكسایت، اینفوسیك و لایكاس نسبتاً بهتر از ماژلان، وب كرولر و ورلدواید وب وارم عمل كردند.

نمودار 3 شباهت دشواری را در تعیین برنده برای سؤالات موضوعی نشان می‌دهد. اطلاعات موجود بر روی نمودار 3 اینفوسیك را بهترین عملگر می‌داند و امتیاز تنظیم براساس ارتباط آنرا تقویت می‌كند. بقیه موارد برای اعلام كردن خیلی مشكل بود.
جستجو در اینترنت
در سال 2000 حدود یكصدمیلیون پایگاه وب بر روی شبكه جهانی اینترنت وجوددارد و پیش بینی می شود كه تنها پس از گذشت 2 سال ، در سال 2002 به 250 میلیون پایگاه برسد. با رشد تصاعدی حجم اطلاعات ، یافتن اطلاعات موردنظر در این دریای پهناور كار مشكلی است و بكارگیری ابزارهای جستجوی مناسب یكی از ضروریات كار باشبكه می باشد.
موتورهای جستجو از سال 1994 مورداستفاده قرار گرفتند. در ابتدا فعالیت آنها فقطجستجو در وب بود ولی با گذشت زمان ، خدمات دیگری از جمله فروش كالا، اجاره فضای وب و پست الكترونیك ، تحلیل سایتها و; به فعالیت آنها اضافه شد.

انواع موتور جستجو
موتورهای عمومی كه در كلیه پایگاهها فارغ از نوع آن جستجو می كنند. موتورهای عمومی معروف عبارتند از:
altavista.com, google.com, go.com, hotbot.com .
موتورهای تخصصی در یك رشته خاص مانند اخبار “news.com”، تجارت “deja.com”، شركتها “yellow pages.com”،افراد 2- “whowhere.com”، مقالات و انتشارات “infojump.com
بهترین پایگاه magellan .comو deja.com موتورهای تخصصی در خدمات اینترنت مانند گروههای خبری و مباحثه –3
– 4- موتورهای كلان ; این موتورها عبارت مورد جستجو را همزمان به چند موتورجستجو داده و پاسخها را اولویت بندی كرده و با ذكر نام
– mamma.com,savvysearch.com موتور جستجو نمایش می دهند.مانند:

5-نقطه شروع ; اینگونه سایتها موتورهای جستجو را برحسب موضوعات مختلف معرفی می كنند. درصورتی كه موتورهای تخصصی و عمومی رانمی شناسید از این پایگاهها شروع كنید. مانند:
6-موتور اختصاصی پایگاهها; بعضی از پایگاههای بزرگ مانند مایكروسافت ، جنرال الكتریك ،; از داخل پایگاه خود موتور جستجو دارند. جدیدا می توان از موتورهای جستجو عمومی مانند hotbot,altavista,; در یك پایگاه جهت جستجو در آن استفاده كرد.
تقسیم بندی دیگری كه از موتور جستجو می توان كرد، موتورهای جستجوگر، و دوم موتورهایی است كه پایگاهها را دسته بندی موضوعی -7 كرده اند و به آنها web directoryگفته می شود. معروفترین آنها webcrawear,yahooاست . درحال حاضر اكثر موتورهای جستجو دسته بندی موضوعی نیز دارند و در هر دسته و یا زیرشاخه های بعدی می توان جستجو كرد.
نحوه كار موتورهای جستجو

در این مقاله فقط نحوه كار موتورهای عمومی بررسی می شود. موتورهای عمومی ازبرنامه هایی معروف به crawler,robot و یا spiderبرای یافتن و مرور صفحات وب استفاده می كنند. نحوه كار این برنامه ها بدین صورت است كه با یافتن یك صفحه كلمات مورداستفاده در آن را شناسایی كرده و به جداول فهرست بانك اطلاعاتی خود اضافه می كنند درواقع موتورها صفحات وب را در بانك اطلاعاتی نگهداری نمی كنند بلكه دربانك اطلاعاتی فهرستی از كلمات وآدرس صفحات مشمول این كلمات می باشد.
كار دیگر این برنامه ها این است كه به صفحات فهرست شده قبلی مراجعه كرده ودرصورت به روز شدن صفحات ، مجددا آنها را فهرست بندی می كنند. ممكن است پایگاه موردنظرموجودنبوده ویاآدرس آن عوض شده باشد.

عوامل مهم در فهرست كردن یك صفحه وب ، تعداد وقوع كلمه در صفحه ، محل قرارگیری آن ، نوع فایلهای مورداستفاده در صفحه ، درجه اهمیت كلمه در صفحه با توجه به كلید واژه های تعیین شده توسط مالك صفحه و توضیحات آمده در بخش دستورات meta در شناسنامه صفحه می باشد.موتورهای جستجو باتوجه به حجم بانك اطلاعاتی و برنامه هایشان به پایگاههای جدید مراجعه می كنند ولی مطمئن

تمام پایگاههای وب را شامل نمی شوند. بزرگترین موتور جستجوی عمومی حدود 500 میلیون صفحه وب را شامل می شود. درصورتی كه می خواهید پایگاه وب شما به بانك اطلاعاتی یك موتور جستجو اضافه شود پایگاه وب خود را به آن موتور جستجو معرفی كنید در صفحات وب ، در بخش دستورات شناسنامه ای صفحه ، كلید واژه های موردنظر خود را معرفی كنید. موتورهای جستجوعمومی به دو روش كلمات را فهرست بندی می كنند.

برای دریافت اینجا کلیک کنید

سوالات و نظرات شما

برچسب ها

سایت پروژه word, دانلود پروژه word, سایت پروژه, پروژه دات کام,
Copyright © 2014 icbc.ir