نشست علمی پردازش هوشمند زبان عربی با موضوع بررسی تحلیلگر صرفی نور
اشاره
مرکز تحقیقات کامپیوتری علوم اسلامی (نور)، در حوزه متنکاوی فعّالیّتها و دستاوردهای متعدّد و ارزندهای داشته است. متنکاوی در سه مرحله: آمادهسازی، پردازش و تحلیل متون، در روند تولید محصولات نور جلوه دارد. در این میان، پردازش متون عربی، به سبب دشواریها و پیچیدگیهای خاصّی که این زبان برخوردار است، همواره با چالشهای جدّی مواجه است. ازاینرو، تحلیلگرهای صرفی در دنیا، با مشکلات و کاستیهایی جدّی روبهرو بودهاند. این امر، مرکز نور را بر آن داشت تا از سال 1389 اقدام به تولید یک تحلیلگر صرفی بومی نماید.
در این راستا، هشتمین نشست از سلسله نشستهای علمی علوم اسلامی و انسانی دیجیتال با موضوع «پردازش هوشمند زبان عربی (جلسه اوّل) با محوریت تحلیلگر صرفی نور»، در 19 خرداد 1401ش در سالن اجتماعات مرکز تحقیقات کامپیوتری علوم اسلامی (نور) برگزار گردید. دکتر حبیب سریانی (پژوهشگر گروه علمی قرآن و لغت نور) و حجّتالاسلام سید محمد دانش (توسعهدهنده متنکاوی نور) به عنوان کارشناس، و جناب دکتر محمود شکراللهی (عضو هیأت علمی دانشگاه تبریز) و حجّت الاسلام و المسلمین محمدرضا مدرسی (پژوهشگر حوزه علمیه) به عنوان ناقد در این نشست علمی حضور داشتند. در ذیل، خلاصهای از این نشست علمی، به همراه دستهبندی و تیترگذاری جدید، از نظر خوانندگان عزیز میگذرد. گزارش تفصیلی این نشست، در وبگاه نورسافت انعکاس یافته است.
قاموس نور؛ واژهنامه هوشمند عربی
چکیده
مراجعه به منابع لغوی برای درک صحیح معانی کلمات، یکی از نیازهای اولیه در فرآیندهای پژوهشی حوزه علوم اسلامی است. هر پژوهشگر، جهت فهم معانی کلمات یا عبارات مد نظر خود، هنگام مراجعه به منابع لغوی در نسخههای چاپی سنّتی، فرآیندی را در چندین مرحله طی مینماید تا به مقصود نهایی خویش، یعنی یافتن توصیفات مندرج ذیل مداخل لغوی، دست یابد. این فرآیندها، در خصوص زبان عربی که کلمات دستخوش تغییرات متعددی در ساختار صرفی خود شدهاند، پیچیدهتر است. هدف از طراحی و تولید «قاموس نور»، به عنوان یک لغتنامه هوشمند الکترونیکی، گذر از شیوههای سنّتیِ مراجعه به منابع لغوی متعدد و پیادهسازی حداکثری الگوهای ماشینیِ هوشمند جهت ارائه سریع پاسخهای صحیح به پژوهشگران است.
ساماندهی لغتنامههای متقدم عربی و نظامبندی این منابع ارزشمند بر اساس یک ساختار واحد و همچنین تحلیل صرفی کلمات ورودی کاربران توسط دو موتور قدرتمند تحلیلگر صرفی نور و استمر هوشمند نور جهت اتصال ماشینی به نزدیکترین مداخل لغوی، از دستاوردهای منحصربهفرد این واژهنامه هوشمند الکترونیکی است که در قالب پایگاه اینترنتی، نرمافزار رومیزی و تلفنهای همراه قابل استفاده است. همچنین، با ایجاد شبکه واژگانی بین مداخل، تطبیق بر آیات قرآن و روایاتِ سرشار از معارف غنی اهلبیت(ع)، اطلاعات متنوع و ارزشمند دیگری نیز در اختیار پژوهشگر قرار میگیرد که این واژهنامه هوشمند را از دیگر رقبای خود متمایز میسازد.
ابهام زدایی هوشمند صرفی نور
چکیده
یکی از چالش های پیش روی پردازش زبان طبیعی زبان عربی، رفع ابهام میان تحلیل های صرفی ممکن یک کلمه به تناسب جایگاه آن کلمه در جمله است. یک تحلیلگر صرفی، به ازای هر کلمه ورودی، ممکن است بیشتر از یک جواب صرفی داشته باشد. تشخیص اینکه کدام یک از تحلیل های ممکن، تحلیل صحیح کلمه مورد نظر است، توسط ابزارهای رفع ابهام صورت می گیرد. این مقاله، به یکی از قوی ترین ابزارهای رفع ابهام اشاره می کند که به صورت خاص، برای تحلیلگر صرفی نور (Noor Morphological Analyzer) طراحی شده است. این ابزار که ابهام زدای صرفی نور (Noor Morphological Disambiguation) نامیده شده، ترکیبی از الگوریتم های یادگیری و قاعده محور است. آزمایش های این تحقیق نشان می دهد که رفع ابهام صرفی نور می تواند با دقت 88 درصد خروجی های تحلیلگر صرفی نور را رفع ابهام نماید.
شناسایی خودکار سیر اشتقاق کلمات در زبان عربی
چکیده
به دست آوردن سیر اشتقاق تصریف از ریشه تا کلمه، پیداکردن کلمات مرتبط و در نهایت، تشکیل خانواده کلمات مربوط به هم، شرایط مساعدی را برای محققان پردازش زبان طبیعی فراهم می کند تا بتوانند از مرحله لفظ به دامنه وسیع لغات هم معنا، آنتولوژی، شبکه معنایی، تحلیل محتوا و در نهایت، درک معنا قدم بگذارند. در این بین، ساخت درخت سلسله مراتبی کلمات مرتبط با هم از ریشه(صرفی) تا برگ(کلمات متن)، اهمیت بسزایی دارد. در این مقاله، به چندین فایده از فواید «تحلیلگر صرفی نور» اشاره شده است. بعضی از این موارد، عملیاتی شده و هم اکنون در حال استفاده هستند و بعضی دیگر نیز نزدیک به اجرا می باشند. از جمله این موارد، بهره برداری در شناسایی خودکار سیر اشتقاق تصریف و تشکیل درخت سلسله مراتبی می باشد. عناصر داخل این درخت، همگی توسط تحلیلگر صرفی نور تولید می گردند. بعد از آن، عملیات دسته بندی و در نهایت ایجاد درخت مذکور صورت می پذیرد. تمام مسیرهای موجود از برگ ها تا ریشه، موضوعیت دارند که در این نوشتار به چند فایده از آن اشاره شده است.
تحلیلگر هوشمند صرفی نور
چکیده
در این مقاله قصد داریم به بررسی «تحلیلگر صرفی نور» که برنامه هوشمند پردازش صرفی زبان عربی است، بپردازیم. این سامانه، کلمات عربی را حتی الامکان با استفاده از قواعد معتبر زبان عربی تجزیه و تحلیل می کند و در صورت نیاز با حداقل استفاده از بانک های اطلاعاتی تعبیه شده در داخل سامانه، نتایج حاصل را به عنوان حالات معتبر مختلف صرفی برای هر کلمه ارائه می نماید.
ورودی این برنامه، یک فایل متنی زبان عربی و خروجی آن نیز یک فایل از نوع ایکس. ام. ال می باشد. از جمله قابلیت های مهم این سامانه، توانایی تحلیل متون، اعم از با اِعراب یا بدون اعراب است. قابلیت مهم دیگر، تحلیل و تجزیه یک کلمه به حالات مختلف پیشوندی، میانوندی و پسوندی معتبر است که هر کدام از این حالت ها، شامل مقادیر ممکن به ازای فیلدهای صرفی مختلف مثل: وزن، ریشه و سرواژه می باشد. به دلیل مبتنی بودن بر قواعد صرفی، برنامه می تواند انواع مختلف متون عربی با موضوعات گوناگون قرآنی، فقهی، سیاسی یا اجتماعی را با دقت بالایی تحلیل کند. به طور دقیق تر، این سامانه زیربنای پردازش های مورد نیاز، اعم از: تحلیل نحوی، معنایی، خلاصه سازی و ترجمه ماشینی روی متون عربی را فراهم می نماید.
مروری بر نرم افزار هوشمند صرف
مقدمه اول: با بررسی کوتاهی در طول زندگانی انسانها میفهمیم که همیشه نیازها، علت ساخت ابزارها بوده است. نقاط ضعف و مشکلات حل نشدنی، انسانها را واداشته که از نیروی خدادادی تفکر استفاده کنند و راه حلهایی برای رفع آن بیابند. همین روند، صاحب نظران را به این رساند که «نیاز، عامل ایجاد علوم بود».
سیستم هوشمند برچسب گذاری ادات سخن زبان عربی؛ لایه صرف
مقدمه
جهت فهم زبان عربی، سه دانش مهم، نقش اساسی را بر عهده دارند که عبارتاند از: علم لغت، صرف و نحو. علم لغت، یعنی فهم معنای حقیقی یک کلمه و همچنین آشنایی با برخی معانی مجازی و کنایی یک کلمه یا یک عبارت.
در کنار علم لغت، علم صرف و نحو نیز وجود دارد که مبتنی بر قواعدی است که فهم هوشمند از آنها را امکانپذیر میکند. بدون تردید، علم صرف را باید پیشنیاز علم نحو دانست. اینکه یک کلمه چه جایگاهی را در یک کلام دارد، ابتداء وابسته به این است که کلمه به خودی خود قابلیت کدام یک از نقوش نحوی را دارد؛ به طور مثال، فاعل یا مفعول شدن یک کلمه، در ابتداء وابسته به این است که آن کلمه اسم باشد و نه فعل یا حرف.