سیستم هوشمند برچسب گذاری ادات سخن زبان عربی؛ لایه صرف
مقدمه
جهت فهم زبان عربی، سه دانش مهم، نقش اساسی را بر عهده دارند که عبارتاند از: علم لغت، صرف و نحو. علم لغت، یعنی فهم معنای حقیقی یک کلمه و همچنین آشنایی با برخی معانی مجازی و کنایی یک کلمه یا یک عبارت.
در کنار علم لغت، علم صرف و نحو نیز وجود دارد که مبتنی بر قواعدی است که فهم هوشمند از آنها را امکانپذیر میکند. بدون تردید، علم صرف را باید پیشنیاز علم نحو دانست. اینکه یک کلمه چه جایگاهی را در یک کلام دارد، ابتداء وابسته به این است که کلمه به خودی خود قابلیت کدام یک از نقوش نحوی را دارد؛ به طور مثال، فاعل یا مفعول شدن یک کلمه، در ابتداء وابسته به این است که آن کلمه اسم باشد و نه فعل یا حرف.
ملاحظاتی در باب تأسیس یک نهاد پژوهشی میان رشته ای در حوزه «فناوری اطلاعات و علوم اسلامی» با محوریت «داده کاوی علوم اسلامی»
اشاره
مرکز تحقیقات کامپیوتری علوم اسلامی بهزودی در چارچوب ساختار پژوهشی مورد تأیید وزارت علوم، تحقیقات و فناوری یک نهاد پژوهشی جانبی تأسیس خواهد کرد. آنچه در پی میآید، توضیحاتی درباره زمینههای فعالیت این نهاد نوپا است که در گام اول، در قالب یک گروه پژوهشی و در گامهای بعد و توسعه یافته خود، در قالب یک پژوهشکده زیر نظر «مرکز نور» فعالیت خواهد کرد. در اینجا ابتدا با توضیحاتی درباره زمینه علمی فعالیت آن و سپس درباره ساختار سازمانی آن مواجه میشوید.
کاربردهای داده کاوی در علوم اسلامی
دادهکاوی چیست؟
«دادهکاوی» یا فرایند کشف دانش در پایگاه داده، زمینهای نسبتاً نوظهور است. دادهکاوی، پل ارتباطی میان علوم آمار، مهندسی کامپیوتر، هوش مصنوعی، شناسایی آماری الگو، یادگیری ماشین و محاسبات رایانشی نرم است. دادهکاوی، فرآیند یا پروژهای نسبتاً پیچیده برای شناسایی الگوها و مدلهای صحیح، قابل استناد و مفید در حجم وسیعی از داده است؛ به گونهای که این الگوها و مدلها برای انسانها قابل درک باشند.
ارائه روشی بر پایه کاوش معنایی به منظور بالا بردن دقت نتایج جستجو در نرمافزارهای قرآنی
چکیده
متن قرآن کریم خصوصیتهای منحصر بهفردی از نظر چگالی موضوعی، مفهومی و دانهبندی در مقایسه با سایر متون دارد. یکی از نکات مهم در این زمینه، لزوم مرجعیابی ضمیر است که به افزایش دقت نتایج جستجو کمک شایانی مینماید. هدف استفاده از دستهبندی خودکار متن (ATC)که یکی از شاخههای متنکاوی است، به گونهای است که باعث بهبود جستجو در نرمافزارهای قرآنی شود. در این مقاله، پس از تحلیل متن قرآن کریم و مقایسه آن با سایر متون، روشی ارایه شده است که با توجه به خصوصیات متن قرآن کریم قادر است آیات را ابتدا درون موضوعاتی از پیش تعریفشده دستهبندی کند. سپس، آیات همه سورهها را با توجه به وزن کلمات آن برای هر موضوع، درون دستهها طبقهبندی میکند. در این زمینه، از ارتباط موضوعات و مفاهیم مختلف برای دستهبندی، مدد جسته و فرآیند دستهبندی را بهبود میدهد. در پایان، با توجه به وزن کلمات هر آیه برای هر موضوع، میزان ارتباط آن آیه با موضوع محاسبه شده و دسته آیه مشخص میشود. الگوریتم ارایهشده، مبتنی بر TFIDF بوده و پارامترهای مؤثر، نظیر ضریب تفکیک متن، به شکلی تنظیم شده که خصوصیات قرآن کریم را در نظر بگیرد. روش پیشنهادی در قالب یک نرمافزار نمونه جستجوی موضوعی قرآن کریم پیادهسازی شده است. نتایج حاصل از این نرمافزار با سایر نرمافزارهای قرآنی و نیز با دستهبندی دستی آیات از لحاظ پارامترهای دقت و فراخوانی مقایسه شده؛ که نشاندهنده مزایای روش پیشنهادی است.