از این رو، مرکز تحقیقات کامپیوتری علوم اسلامی، یکی از پیشگامان این عرصه، با تأسیس «گروه پژوهشی متن کاوی نور» بدین مهم توجه نمود و به دستاوردهای ارزشمندی چون: صرف هوشمند زبان عربی، دسته بندی خودکار متون، تشخیص روایات مشابه و اعراب گذاری ماشینی دست یافت. حاصل این موارد، پژوهشگران را یاری می کند تا سریع تر و مطلوب تر به نتایج پژوهشی مورد نظر خود نایل آیند.
در راستای برگزاری «سمینار فناوری های پردازش هوشمند متون اسلامی» در مرکز تحقیقات کامپیوتری علوم اسلامی، به حضور دکتر بهروز مینایی، دبیر این سمینار رسیدیم تا از نزدیک با اهداف و برنامههای این گردهمایی علمی آشنا شویم. آنچه در ذیل میخوانید، حاصل این گفتگو است.
♦ جناب آقای دکتر مینایی، این سمینار با چه اهدافی برگزار شده است؟
◊ «سمینار پردازش هوشمند متون اسلامی» تلاش میکند بخشی از مرحله ی اساسی و حیاتی انتقال دادههای علوم اسلامی به فضای دیجیتال و امکانات جستجو و بازیابی آنها را بازتاب دهد و در این مسیر به فربهتر کردن این امکانات میاندیشد. اکنون در موقعیتی قرار گرفتهایم که حجم عظیمی از دادههای علوم اسلامی به محیط دیجیتال منتقل شدهاند و زمان آن است که علاوه بر تداوم بیش از پیش ورود اطلاعات و دیجیتالسازی دادههای علوم اسلامی، به فرایندها و فناوریهای کشف دانش نهفته در این دادهها و دیگر امکانات مرتبط با آن بپردازیم.
فرایندها و فناوریهای پردازش هوشمند متون و از جمله دانش دادهکاوی، به ما امکان شناسایی الگوها، مدلها و ارتباط میان عناصر مختلف در پایگاه داده را میدهد تا اطلاعات نهفته در دادهها را کشف و نهایتاً این یافتهها را به دانش کاربردی و اطلاعات تبدیل کنیم. متون و نصوص اسلامی و بهویژه متون فقهی اسلامی هم تمام ویژگیها و مختصات لازم جهت ایجاد زمینهای فعال و پویا در پژوهشهای علوم رایانهای و استفاده از فناوری سیستمهای خبره در ایجاد ابزارهای مؤثر جهت ارائه ی خدمات به محققان و دانشمندان علوم اسلامی را دارا است.
مرکز تحقیقات کامپیوتری علوم اسلامی قصد دارد با برگزاری این سمینار زمینه را برای ایجاد فضایی مناسب جهت معرفی و گسترش فناوریهای نوین پردازش هوشمند و نیز کاربردهای متنکاوی در علوم اسلامی فراهم سازد.
♦ تعریف شما از پردازش هوشمند متون در حوزه علوم اسلامی چیست؟
◊ پردازش هوشمند متون، به طور معمول در دو مرحله انجام می پذیرد؛ ابتدا در مرحله پایه ای «پردازش زبان طبیعی»، سامانه هایی عهده دار تحلیل زبانی متن هستند، مانند مواردی همچون: تشخیص واژه ها، عبارت ها و جمله ها از یکدیگر؛ تجزیه صرفی واژهها؛ ترکیب نحوی واژه ها و عبارت ها؛ یافتن مرجع ضمایر؛ ابهام زدایی واژگانی و ساختاری؛ حرکت گذاری و اعراب گذاری واژهها؛ اصلاح املایی واژه ها؛ تشخیص روابط منطقی بین کلمه ها، جمله ها و بندهای متن؛ و بسیاری موارد دیگر.
در مرحله بعدی، سامانه های «پردازش زبان طبیعی کاربردی» عهده دار درک کاربردی متون هستند، همچون: ترجمه به زبانهای دیگر، ایجاد اصطلاح نامه های تخصصی، خلاصه سازی متون، استخراج درخت واره های مفهومی از متون، استخراج روابط معنادار بین مفاهیم متون، استخراج جریان های فکری و تاریخی در متون، یافتن شباهت ها و تفاوت ها بین متون، ردهبندی و دسته بندی موضوعی متون، تشخیص نویسنده یا مترجم متون، و بسیاری موارد دیگر. حاصل این موارد، پژوهشگران را یاری می کند تا سریع تر و کارآمد تر به نتایج پژوهشی مورد نظر خود دست یابند.
هدف از پردازش هوشمند متون، ایجاد نرم افزارهایی است تا فرایند استخراج اطلاعات از متون را همانند فرایند درک انسان انجام و ذهن وی را یاری دهند. با وجود توانایی های درکی بسیار بالا در انسان، ذهن او در فرایند درک اطلاعات با حجم بسیار بالا که امروزه بسیار اتفاق می افتد، دارای محدودیت های جدی است. اول اینکه به جهت محدودیت ظرفیتی «حافظه کوتاهمدت» انسان در پردازش اطلاعات دریافتی، ذهن وی توانایی کنار هم گذاشتن و درک درست این اطلاعات را ندارد. در مواردی هم که درک حجم بالای اطلاعات بین افراد تقسیم می شود، به جهت فردی و متفاوت بودن درک ایشان، نمی توان به درکی منسجم رسید. دوم اینکه به جهت محدودیت های سلول های عصبی، سرعت ذهن انسان در انتقال و پردازش حجم بالای اطلاعات پایین است و این در حالی است که امروزه سرعت تولید اطلاعات بشری، بسیار بالا است. مطلب دیگر اینکه، بهخصوص در مورد متون اسلامی، تربیت و دست یابی به افراد خبره به تعداد کافی برای درک حجم بسیار بالای این متون خیلی گران، زمانبر و گاهی غیر ممکن است. حال با استفاده از توانمندی های بسیار بالای رایانه در پردازش اطلاعات با حجم زیاد، نقاط ضعف ذهن انسان را می توان جبران کرد.
♦ آیا تاکنون نرمافزار علوم اسلامی با برخورداری از هوش مصنوعی طراحی و پیادهسازی شده است؟
◊ بر اساس فناوری هوش مصنوعی، سیستم خبره اطلاعاتی علم رجال تنظیم شد که به شناسایی و تعیین هویت افراد واقع شده در سلسله سند احادیث میپردازد و با جمعآوری اعتبار افراد واقع در سند، به استنتاج صحت و سقم و ضعیف و قوی بودن سند حکم میکند. درایة النور، اولین نرمافزاری است که در حوزه علم رجال که یکی از علوم مقدماتی فقه اسلامی است، تنظیم شده بود. ادامه این پروژه، در گروه پژوهشی متنکاوی معاونت پژوهش مرکز در حال بررسی و انجام است.
مرکز تحقیقات کامپیوتری علوم اسلامی در سال 1389 با تأسیس گروه پژوهشی متنکاوی نسبت به انسجام فعالیتهای پراکنده هوش مصنوعی اقدام نمود و در حال حاضر، به دستاوردهایی چون: موتور برچسبگذاری صرفی زبان عربی و قرآن، دستهبندی خودکار متون، تشخیص ماشینی روایات مشابه، اعرابگذاری ماشینی، نرمافزار هوشمند صرف و شناسایی خودکار آیات در متون دست یافت. شایان ذکر است گروهی در معاونت این مرکز در تهران نیز به دستاوردهایی در زمینه زبان فارسی چون ویراستیار (خطایاب هوشمند) دست یافتند. علاوه بر این، فعالیتهایی با حمایت شورای عالی اطلاعرسانی در زمینه علوم اسلامی انجام شده که از آن میتوان به سامانه پردازش دستوری واژگان عربی یاد کرد.
♦ دعوتشدگان به سمینار چه تعدادند و از چه تخصصهایی بهرهمند هستند؟
◊ حدود 300 نفر از صاحبنظران حوزه علومی چون: رایانه، زبانشناسی و علوم اسلامی و نیز متخصصان و فعالان در زمینه متنکاوی و پردازش زبان طبیعی به این سمینار علمی دعوت شدهاند.
♦ چشمانداز پردازشهای هوشمند را در علوم اسلامی و انسانی چگونه ارزیابی میکنید؟
◊ پردازش هوشمند متون، دریچه راهگشایی را جهت درک متن توسط رایانه و طراحی سیستم فقیهیار و دستیارهای متعددی در علم: فلسفه، منطق، اصول، تفسیر و فقه و سایر حوزههای علوم انسانی ارائه مینماید. از این رو، رسیدن به چشمانداز درک متن توسط ماشینهای رایانهای، زیرساختی برای طراحی این سیستمهای هوشمند یاری کننده پژوهشگر علوم اسلامی و انسانی فراهم خواهد کرد.
♦ از فرصتی که در اختیار رهآورد نور قرار دادید، متشکریم.