نشست علمی پردازش هوشمند زبان عربی با موضوع بررسی تحلیلگر صرفی نور
اشاره
مرکز تحقیقات کامپیوتری علوم اسلامی (نور)، در حوزه متنکاوی فعّالیّتها و دستاوردهای متعدّد و ارزندهای داشته است. متنکاوی در سه مرحله: آمادهسازی، پردازش و تحلیل متون، در روند تولید محصولات نور جلوه دارد. در این میان، پردازش متون عربی، به سبب دشواریها و پیچیدگیهای خاصّی که این زبان برخوردار است، همواره با چالشهای جدّی مواجه است. ازاینرو، تحلیلگرهای صرفی در دنیا، با مشکلات و کاستیهایی جدّی روبهرو بودهاند. این امر، مرکز نور را بر آن داشت تا از سال 1389 اقدام به تولید یک تحلیلگر صرفی بومی نماید.
در این راستا، هشتمین نشست از سلسله نشستهای علمی علوم اسلامی و انسانی دیجیتال با موضوع «پردازش هوشمند زبان عربی (جلسه اوّل) با محوریت تحلیلگر صرفی نور»، در 19 خرداد 1401ش در سالن اجتماعات مرکز تحقیقات کامپیوتری علوم اسلامی (نور) برگزار گردید. دکتر حبیب سریانی (پژوهشگر گروه علمی قرآن و لغت نور) و حجّتالاسلام سید محمد دانش (توسعهدهنده متنکاوی نور) به عنوان کارشناس، و جناب دکتر محمود شکراللهی (عضو هیأت علمی دانشگاه تبریز) و حجّت الاسلام و المسلمین محمدرضا مدرسی (پژوهشگر حوزه علمیه) به عنوان ناقد در این نشست علمی حضور داشتند. در ذیل، خلاصهای از این نشست علمی، به همراه دستهبندی و تیترگذاری جدید، از نظر خوانندگان عزیز میگذرد. گزارش تفصیلی این نشست، در وبگاه نورسافت انعکاس یافته است.
قاموس نور؛ واژهنامه هوشمند عربی
چکیده
مراجعه به منابع لغوی برای درک صحیح معانی کلمات، یکی از نیازهای اولیه در فرآیندهای پژوهشی حوزه علوم اسلامی است. هر پژوهشگر، جهت فهم معانی کلمات یا عبارات مد نظر خود، هنگام مراجعه به منابع لغوی در نسخههای چاپی سنّتی، فرآیندی را در چندین مرحله طی مینماید تا به مقصود نهایی خویش، یعنی یافتن توصیفات مندرج ذیل مداخل لغوی، دست یابد. این فرآیندها، در خصوص زبان عربی که کلمات دستخوش تغییرات متعددی در ساختار صرفی خود شدهاند، پیچیدهتر است. هدف از طراحی و تولید «قاموس نور»، به عنوان یک لغتنامه هوشمند الکترونیکی، گذر از شیوههای سنّتیِ مراجعه به منابع لغوی متعدد و پیادهسازی حداکثری الگوهای ماشینیِ هوشمند جهت ارائه سریع پاسخهای صحیح به پژوهشگران است.
ساماندهی لغتنامههای متقدم عربی و نظامبندی این منابع ارزشمند بر اساس یک ساختار واحد و همچنین تحلیل صرفی کلمات ورودی کاربران توسط دو موتور قدرتمند تحلیلگر صرفی نور و استمر هوشمند نور جهت اتصال ماشینی به نزدیکترین مداخل لغوی، از دستاوردهای منحصربهفرد این واژهنامه هوشمند الکترونیکی است که در قالب پایگاه اینترنتی، نرمافزار رومیزی و تلفنهای همراه قابل استفاده است. همچنین، با ایجاد شبکه واژگانی بین مداخل، تطبیق بر آیات قرآن و روایاتِ سرشار از معارف غنی اهلبیت(ع)، اطلاعات متنوع و ارزشمند دیگری نیز در اختیار پژوهشگر قرار میگیرد که این واژهنامه هوشمند را از دیگر رقبای خود متمایز میسازد.
کاربرد هوش مصنوعی در پژوهشهای علوم اسلامی
اشاره
آنچه در این مقاله از نظر شما خوانندگان محترم میگذرد، گزیدهای از متن وبینار مهندس احمد ربیعیزاده، مدیر محترم اداره پردازش هوشمند مرکز تحقیقات کامپیوتری علوم اسلامی است که در 24 آذرماه 1399 مصادف با هفته پژوهش ارائه شده بود. از آنجا که این وبینار، مشتمل بر نکات مفید در خصوص کاربرد هوش مصنوعی در پژوهشهای علوم اسلامی است، مناسب دیده شد در فصلنامه ره آورد نور انعکاس یابد. طی این وبینار، با مقوله هوش مصنوعی و کاربردهای آن در پژوهشهای علوم اسلامی و نمونههایی از این دستاوردها در تولیدات وبی و نرمافزارهای ویندوزی مرکز نور آشنا میشوید.
یکپارچه سازی محتواهای مرکز، نقش مهمی در تولید دانش دارد
اشاره
در سالهای گذشته، تولید محتوا و عرضه آن به کاربران، یکی از مؤلّفههای مطرح در حوزه فنّاوری اطّلاعات به شمار میرفت؛ امّا امروزه یکپارچهسازی دادهها به همراه تعامل با کاربران و استفادهکنندگان محصولات نرمافزاری، از اهمّیّت بسیار بالایی برخوردار است. نظر به اهمّیّت مباحث فنّی و هوش مصنوعی در مرکز تحقیقات کامپیوتری علوم اسلامی، با معاون محترم فنّی مرکز نور، جناب آقای مهندس، مهدی نیکنام، گفتوگو نمودیم.
در این مصاحبه، به مباحث و محورهایی همچون: جایگاه معاونت فنّی، بخش ادارهها و وظایف کلّی، بسترهای تولید نرمافزار در مرکز، یکپارچهسازی اطّلاعات (گراف دانش)، تعامل با مراکز علمی و مؤسسات پژوهشی دیگر، دادهمحوری و ارزیابی رفتار کاربران، خواهیم پرداخت. امید است که مورد توجّه و استفاده علاقهمندان قرار گیرد.
صرف و نحو و اعراب گذاری ماشینی متون، نتیجه هوشمندسازی تولیدات نور است
اشاره
مرکز تحقیقات کامپیوتری علوم اسلامی را میتوان نهادی دانست که با وارد شدن به مسیری نوین، جایگاهی ویژه در میان پژوهشگران عرصه دین یافته و در اندک زمانی تقریباً تمام آنان را مخاطب خود ساخته است و این، نیست جز با پیوند تواناییهای رایانهای و مجموعه دانشهای دینی. بدیهی است که این جایگاه، تنها زمانی حفظ خواهد شد که این نهاد همچنان همگام با پیشرفتها، بهویژه در عرصه هوشمندسازی گام بردارد؛ وگرنه جایگاه خود را به دیگران خواهد سپرد. در این شماره گفتوگویی با یکی از همکاران پُرسابقه مرکز نور انجام دادیم که از پژوهشگران «گروه متنکاوی و ادبیات» معاونت پژوهشی میباشد که به نظرتان میرسد.
شبکه ها و پردازش زبان طبیعی
اشاره
در طول چند سال گذشته، برخی از حوزه های پردازش زبان طبیعی کار خود را با به کارگیری فنون تصویرمبنا آغاز کرده اند. این حوزه ها در کنار سایر موارد، شامل: خلاصه سازی متن، تجزیه نحوی، عدم ابهام معنای کلمه، ایجاد هستی شناسی، تجزیه و تحلیل احساسات، تجزیه و تحلیل ذهنیت و خوشه بندی متن می باشد. در این مقاله، برخی از موفّق ترین بازنمون ها و الگوریتم های تصویرمبنا را که در پردازش زبان مورد استفاده قرار می گیرد، ارائه می دهیم و سعی می کنیم ساز و کار عمل آنها را شرح دهیم.
شبکه واژگانی زبان عربی با استفاده از فرآیند نیمه خودکار در داده های علوم اسلامی
چکیده
غنی سازی محتواهای علوم انسانی و اسلامی، از اهمیت ویژه ای برخوردار است. استفاده از شبکه واژگانی، از مهم ترین راهبردهای تحقیقاتی در رشته های مرتبط با علوم انسانی است. شبکه واژگانی، مجموعه ای از کلمات است که به واسطه ارتباطات معنایی به یکدیگر متصل شده و در سطحی جامع تر از یک لغت نامه در یادگیری یا استخراج اطلاعات مورد نیاز محققان کاربرد دارد. روند فعالیت در دستیابی خودکار به یک شبکه واژگانی منسجم، در گرو پردازش لفظی و پردازش معنایی بر اساس متن کاوی داده های عربی در منابع زبانی دقیق و مناسب است. استفاده از فرآیند ماشینی در هر یک از این مراحل پردازش و یافتن منابع عربی دقیق علوم اسلامی، با چالش های مختلفی رو به رو بوده که در این مقاله، به بررسی برخی جزئیات این طرح، به ویژه بر اساس دادگان موجود در مرکز تحقیقات کامپیوتری علوم اسلامی و روش مقابله با چالش ها پرداخته شده است.
ابهام زدایی هوشمند صرفی نور
چکیده
یکی از چالش های پیش روی پردازش زبان طبیعی زبان عربی، رفع ابهام میان تحلیل های صرفی ممکن یک کلمه به تناسب جایگاه آن کلمه در جمله است. یک تحلیلگر صرفی، به ازای هر کلمه ورودی، ممکن است بیشتر از یک جواب صرفی داشته باشد. تشخیص اینکه کدام یک از تحلیل های ممکن، تحلیل صحیح کلمه مورد نظر است، توسط ابزارهای رفع ابهام صورت می گیرد. این مقاله، به یکی از قوی ترین ابزارهای رفع ابهام اشاره می کند که به صورت خاص، برای تحلیلگر صرفی نور (Noor Morphological Analyzer) طراحی شده است. این ابزار که ابهام زدای صرفی نور (Noor Morphological Disambiguation) نامیده شده، ترکیبی از الگوریتم های یادگیری و قاعده محور است. آزمایش های این تحقیق نشان می دهد که رفع ابهام صرفی نور می تواند با دقت 88 درصد خروجی های تحلیلگر صرفی نور را رفع ابهام نماید.
شناسایی خودکار سیر اشتقاق کلمات در زبان عربی
چکیده
به دست آوردن سیر اشتقاق تصریف از ریشه تا کلمه، پیداکردن کلمات مرتبط و در نهایت، تشکیل خانواده کلمات مربوط به هم، شرایط مساعدی را برای محققان پردازش زبان طبیعی فراهم می کند تا بتوانند از مرحله لفظ به دامنه وسیع لغات هم معنا، آنتولوژی، شبکه معنایی، تحلیل محتوا و در نهایت، درک معنا قدم بگذارند. در این بین، ساخت درخت سلسله مراتبی کلمات مرتبط با هم از ریشه(صرفی) تا برگ(کلمات متن)، اهمیت بسزایی دارد. در این مقاله، به چندین فایده از فواید «تحلیلگر صرفی نور» اشاره شده است. بعضی از این موارد، عملیاتی شده و هم اکنون در حال استفاده هستند و بعضی دیگر نیز نزدیک به اجرا می باشند. از جمله این موارد، بهره برداری در شناسایی خودکار سیر اشتقاق تصریف و تشکیل درخت سلسله مراتبی می باشد. عناصر داخل این درخت، همگی توسط تحلیلگر صرفی نور تولید می گردند. بعد از آن، عملیات دسته بندی و در نهایت ایجاد درخت مذکور صورت می پذیرد. تمام مسیرهای موجود از برگ ها تا ریشه، موضوعیت دارند که در این نوشتار به چند فایده از آن اشاره شده است.
فنّاوری اطلاعات در خدمت اعراب گذاری احادیث اهل بیت (ع)
اعراب گذاری متون عربی کار با سابقه ای است و پیشینه آن به صدر اسلام باز می گردد. مشهور این است که اصول نقطه گذاری واعراب قرآن را ابوالاسود دوئلی به دستور امام علی ابن ابیطالب پایه گذاری کرده است. با وجود اینکه عربی، زبان مادری عربها بوده است، ولی آنان بر درست نویسی و درست خوانی متن قرآن کریم اهتمام ویژه ای داشته اند و ائمه دین هم بر این مسئله تأکید می نموده اند؛ چنان که وقتی کسی قرآن را نزد امیر مؤمنان(ع) به غلط خواند، حضرت به ابوالاسود دوئلی دستور داد تا اصول نحو عرب را تدوین نماید، که با راهنمایی آن حضرت(ع) و به کوشش ابوالاسود پایه بنیادین و اصول نحو عرب شکل گرفت.
گفته می شود نخستین نظام اعراب گذاری که در نظر گرفته شد، عبارت از این بود که فتحه (زبر) با گذاردن یک نقطه بالای حرف، و کسره (زیر) باگذاردن یک نقطه زیر حرف، و ضمه (پیش) با گذاردن یک نقطه در داخل شکل حروف نشان داده و روی حرف ساکن نیز دو نقطه می گذاشتند. این اقدام اوّلین گام در پیدایش علم نحو و ادبیات عرب محسوب میشود.