ارائه روشی بر پایه کاوش معنایی به منظور بالا بردن دقت نتایج جستجو در نرمافزارهای قرآنی
چکیده
متن قرآن کریم خصوصیتهای منحصر بهفردی از نظر چگالی موضوعی، مفهومی و دانهبندی در مقایسه با سایر متون دارد. یکی از نکات مهم در این زمینه، لزوم مرجعیابی ضمیر است که به افزایش دقت نتایج جستجو کمک شایانی مینماید. هدف استفاده از دستهبندی خودکار متن (ATC)که یکی از شاخههای متنکاوی است، به گونهای است که باعث بهبود جستجو در نرمافزارهای قرآنی شود. در این مقاله، پس از تحلیل متن قرآن کریم و مقایسه آن با سایر متون، روشی ارائه شده است که با توجه به خصوصیات متن قرآن کریم قادر است آیات را ابتدا درون موضوعاتی از پیش تعریفشده دستهبندی کند. سپس، آیات همه سورهها را با توجه به وزن کلمات آن برای هر موضوع، درون دستهها طبقهبندی میکند. در این زمینه، از ارتباط موضوعات و مفاهیم مختلف برای دستهبندی، مدد جسته و فرآیند دستهبندی را بهبود میدهد. در پایان، با توجه به وزن کلمات هر آیه برای هر موضوع، میزان ارتباط آن آیه با موضوع محاسبه شده و دسته آیه مشخص میشود. الگوریتم ارائهشده، مبتنی بر TFIDF بوده و پارامترهای مؤثر، نظیر ضریب تفکیک متن، به شکلی تنظیم شده که خصوصیات قرآن کریم را در نظر بگیرد. روش پیشنهادی در قالب یک نرمافزار نمونه جستجوی موضوعی قرآن کریم پیادهسازی شده است. نتایج حاصل از این نرمافزار با سایر نرمافزارهای قرآنی و نیز با دستهبندی دستی آیات از لحاظ پارامترهای دقت و فراخوانی مقایسه شده؛ که نشاندهنده مزایای روش پیشنهادی است.