مروري بر تحقيقات نمايه نويسي پس از سال 1980-بخش دوم

 
ارسال شده در تاریخ 2/1/2017 توسط admin در زمینه
 

اگر مثالی که کوکو ارائه داده است را نشانگر همه مدارکی بدانیم که در پایگاه وجود دارند،متن افزوده شده در پایگاه وستلاو تقریبا دو برابر متن سرمقاله سردبیری است. بنابراین،به دشواری میتوان پذیرفت که جستجو در متن سرمقالات سردبیری نتای بیشتری را به دست داده باشد (913 در برابر 728، هرچند که نمیدانیم چه تعداد از آنها مرتبط بوده اند). درحقیقت، فرد منطقاً باید انتظار داشته باشد که دوبرابر کردن طول متش باید بیش از 20 بر تعداد مدارک بازیابیلی شده بیفزاید. درحقیقت، این افزایش بازیابی را نباید به حساب همپوشانی بین متن و سرمقالات سردبیری گذاشت. نتایج این بررسی از همان آغاز قابل پیش بینی بود؛ ما هرگز به تحقیقاتی نیاز نداریم که به ما بگویند دوبرابر کردنِ متن بر تعداو مدارک بازیابی شده خواهد افزود.

بلیر و مارون (1985) در یک پایگاه حقوقی و بر روی سیستم STAIRS تحقیقی نسبتاً گسترده تر را انجام دادند (حدود 350000 صفحه یا 40,000 مدرک و چهل درخواست). جمعی از شبه حقوقدانان جستجوهای درون خطی مفصل و دوسویه ای را انجام دادند و فقط زمانی دست از جستجو کشیدند که وکلای دعاوی که برای آنها کار می کردند اظهار داشتند که حداقل 75 از مدارک مرتبط بازیابی شده است. به هرحال، از طریق نمونه گیری از محققین تخمین زده شد که جامعیتی بیش از 20 درصد حاصل نیامده است. انها نتیجه گیری کردند که نتایج آنها، شبهاتی بسیار جدی درزمینه کارایی جستجوهای تمام متن ایجاد کرده است. آنها همچنین برپایه برخی از تحلیل های هزینه ای بسیار نامشخص نتیجه گرفتند که جستجوی تمام متن به نسبت سایر روش های جایگزین بسیار پرهزینه تر است. آنها در تحقیق خود به کلی این حقیقت را نادیده گرفتند که سیستم های عظیم واژگان کنترل شده نیز ممکن است نتایجی بهتر از نظام های تمام متن را ارائه ندهند. مثلاً در یک بررسی بر روی 535 جستجو در پایگاه مدلاین که با استفاده از 191 کاوشگر مختلف انجام شد، گفته شده است که جامعیتی با میانگین فقط 23 و مانعیتی برابر با 67 حاصل آمده است (وانگر” و دیگران، 1980). دابنی (1986a)، هرچند براساس نتایج بررسی های پلیر و مارون، بحث فوق العاده ای را درباره مشکلات بازیابی تمام متن در حوزه حقوق مطرح کرده است. دراینجا، اشاره به پاسخ های مک درموت ” (1986) و ریند ” و لیندبرگ (1986) به دابنی، و نیز اظهارنظر تکمیلی دابنی (b1986)در این خصوص خالی از فایده نخواهد بود. سالتونa1986) )در زمینه تحقیقات پلیر و مارون بررسی جامعی انجام داده است. او از حاصل بررسیهای آنها نتیجه میگیرد که پایگاه های نمایهسازی شده انسانی، به نسبت سایر پایگاه ها بهتر عمل میکنند. تئوپایر (1984) یکی از تحقیقات عالی در زمینه مقایسه جستجوی تمام متن با چکیده و نمایه سازی کنترل شده را انجام داده است. تنوپایر با انجام بیش از 31 جستجو بر روی پایگاه درون خطی گزارشی تجاری هاروارد” نتایج زیر را به دست آورده است:

جداول هزینه ای تنوپایر را نمی توان چندان جدی گرفت زیرا او برای دستیابی به قضاوت درباره ربط، هزینه های دریافت نسخه های مدارک را نیز محاسبه کرده است، در صورتی که در زندگی واقعی این مسئله به ندرت اتفاق میافتد (یعنی، باید براساس عناوین و / یا چکیدههایی که بهره گیران به صورت درون خطی مرور کردهاند قضاوت کرد). شاید نتیجه مهم حاصل از یافته های تنوپایر آن باشد که جستجو از طریق اصطلاح کنترل شده، مدارکی را بازیابی کرده است که از طریق جستجوی تمام متن به دست نیامد و برعکس. او همچنین بر ضرورت استفاده از هر دو روش تاکید میکند. اخیراً رو (1988) یک بررسی تکمیلی درباره پایگاه گزارش تجاری هاروارد انجام داد و نتایجی شبیه به بررسیهای تنوپایر به دست اورد.

Copyright © 2014 icbc.ir