ممکن است پایگاه هایی از این نوع را نویسندگان موضوعی تهیه کنند و نرم افزار نیز به صورت تجاری در بازار موجود باشد. بعضی از میزهای راهنمایی از روش های پیشرفته ای برای پردازش زبان طبیعی بهره میگیرند. مثلا
مک دونالد (1992) به طور کلی اشاره می کند که بهترین تجزیه گرهای امروزی فقط می توانند با جملاتی نسبتاً کوتاه و ساده سروکار داشته باشند. برای جملات طولانی تر و پیچیده تر، حداکثر کاری که این سیستم ها میتو
به نمایه سازی مجموعه های تخصصی کوچک به ویژه در حوزه موضوعی زیست پزشکی گرایش قابل توجهی وجود دارد. در یک نمونه (بورست و دیگران، 1992) و برای تعیین خودکار توصیفگرهای بالینی مرتبط، متن خلاصه های مربوط به
سیستم های خبره دیگری توسعه یافته اند تا بتوانند به آموزش نمایه سازان و نه به فعالیت های روزانه نمایه سازی کمک کنند؛ سیستم آموزش نمایه سازی رایانه ای (کایت)، سیستمی از این نوع است که در کتابخانه ملی کش
استخراج متن” یک مرحله از مقوله بندی متن بالاتر است. هدف از استخراج متن آن است که بخشهایی از متن (مثل پاراگراف ها) که با یک موضوع معین سروکار دارند، شناسایی و بیرون کشیده شوند. در بعضی موارد، این