چکیده

متن قرآن کریم خصوصیت‌های منحصر به‌فردی از نظر چگالی موضوعی، مفهومی و دانه‌بندی در مقایسه با سایر متون دارد. یکی از نکات مهم در این زمینه، لزوم مرجع‌یابی ضمیر است که به افزایش دقت نتایج جستجو کمک شایانی می‌نماید. هدف استفاده از دسته‌بندی خودکار متن (ATC)که یکی از شاخه‌های متن‌کاوی است، به گونه‌ای است که باعث بهبود جستجو در نرم‌افزارهای قرآنی شود. در این مقاله، پس از تحلیل متن قرآن کریم و مقایسه آن با سایر متون، روشی ارائه شده است که با توجه به خصوصیات متن قرآن کریم قادر است آیات را ابتدا درون موضوعاتی از پیش تعریف‌شده دسته‌بندی کند. سپس، آیات همه سوره‌ها را با توجه به وزن کلمات آن برای هر موضوع، درون دسته‌‌ها طبقه‌بندی می‌کند. در این زمینه، از ارتباط موضوعات و مفاهیم مختلف برای دسته‌بندی، مدد جسته و فرآیند دسته‌بندی را بهبود می‌دهد. در پایان، با توجه به وزن کلمات هر آیه برای هر موضوع، میزان ارتباط آن آیه با موضوع محاسبه شده و دسته آیه مشخص می‌شود. الگوریتم ارائه‌شده، مبتنی بر TFIDF بوده و پارامترهای مؤثر، نظیر ضریب تفکیک متن، به شکلی تنظیم شده که خصوصیات قرآن کریم را در نظر بگیرد. روش پیشنهادی در قالب یک نرم‌افزار نمونه جستجوی موضوعی قرآن کریم پیاده‌سازی شده است. نتایج حاصل از این نرم‌افزار با سایر نرم‌افزارهای قرآنی و نیز با دسته‌بندی دستی آیات از لحاظ پارامترهای دقت و فراخوانی مقایسه شده؛ که نشان‌دهنده مزایای روش پیشنهادی است.

شما اينجا هستيد:خانه فهرست موضوعی نمایش موارد بر اساس برچسب: دسته بندی خودکار متون