ابزارهای هوشمند فناوری در محصولات نور

    سخنرانی حجت الاسلام والمسلمین دکتر حمید شهریاری، رئیس مرکز تحقیقات کامپیوتری علوم اسلامی(نور) در آیین رونمایی از نرم افزار مقتل الحسین(ع)(پنجشنبه 1396/6/23)

چهارشنبه, 29 آذر 1396 ساعت 11:46
این مورد را ارزیابی کنید
(1 رای)

بسم الله الرحمن الرحیم. خدمت حضار محترم، مهمانان گرامی و همکاران عزیزمان در مرکز تحقیقات کامپیوتری علوم اسلامی و نیز پژوهشگران مؤسسات تحقیقاتی و آموزشی حاضر در این مراسم، عرض سلام و ادب دارم. همچنین، بسیار متشکرم از مرجع عالی قدر شیعه، حضرت آیت الله العظمی مکارم شیرازی و دفتر معظم ایشان که با پیام شیوا و گهربار خود، ابراز لطف نمودند و با کلمات گوهربار خودشان، ما را در راستای اهداف و اقداماتی که در سال های گذشته انجام دادیم و ان شاء الله در سال های آینده نیز در حال انجام آنها هستیم، تشویق کردند. البته بنا بر این بود که از محضر مبارک معظم له نیز استفاده کنیم؛ ولی به دلیل کسالتی که برای ایشان عارض شد، چنین توفیقی از ما سلب شد. امیدواریم به مدد الهی هرچه سریع تر بهبودی کامل برای معظمٌ له حاصل شود.

جایگاه و توسعه محصولات نور

امروز بنا گذاشتم علاوه بر اینکه خطاب به مهمانان گرامی و عزیزان و پژوهشگران حاضر سخن بگویم، مجموعه همکارانم در مرکز تحقیقات کامپیوتری علوم اسلامی نور را نیز مخاطب خود بدانم.

از وقتی بنده در این مرکز در خدمت شما بودم، چیزی حدود بیست و یک سال می گذرد که خودش واقعاً یک عمر است و شهادت می دهم در طول این سال ها، حداقل نیمی از اوقات مفید خویش را برای مرکز صرف کردم و اگر روزی این توفیق حاصل شود که رجعتی حاصل گردد و ما بتوانیم تصمیمات مجددی راجع به زندگی مان بگیریم، بنده همین تصمیمی را می گرفتم که تا به امروز گرفته ام. امروز می خواهم دریچه ای را در مقابل شما باز کنم؛ البته این مطالب، برای برخی از دوستان ما که در متن این کارها هستند، تکرار مکرّرات است؛ بلکه خودشان تولیدکننده این کلمات و مفاهیم هستند و من مسؤولیت بازخوانی و بازگویی آنها را بر عهده دارم. در این فرصت کوتاه، می خواهم با نگاه راهبردی و کلان به مسأله ای که بنده متصدی آن هستم، نگاه کنم؛ یعنی با نگاه کلان به سوی آینده این مرکز بنگرم و آنچه را می بینم، تا حدّی که برایم مقدور است، برای شما ترسیم نمایم.

از همان روزی که مسؤولیت این مرکز را به عهده گرفتم، آرزو و آرمانم تولید نرم افزار جامع فقه بود. آن قدر به فقه علاقه داشتم و دارم که آن روز تصمیم گرفته بودم اگر چنین نرم افزاری را تولید کردم، دیگر کار اجرایی را کنار بگذارم و مشغول تحقیقات فقهی بشوم. حدود پانزده سال طول کشید تا ما به تولید نرم افزار جامع فقه دست یافتیم. روزهای پُرتلاطمی را نیز در طول آن پانزده سال تجربه نمودیم و بسیاری نیز کار ما را تکراری می دانستند؛ ولی ما مصمّم بودیم که کارمان تکراری نیست؛ بلکه در نوع خود، جدید و بی نظیر است.

بحمدالله، امروز می توانیم ادعا کنیم مجموعه محصولات نرم افزاری نور، فضای آموزشی و پژوهشی در حوزه های علمیه را دچار تحول جدّی کرده است و خود محققان و طلاب علوم اسلامی، به این معنا اذعان دارند. به برکت این ابزارهای نوین فناوری که در اختیار طلبه ها قرار گرفته، همگان به راحتی به منابع فقهی و اسلامی دسترسی دارند و این تحول جدّی در نظام آموزشی و پژوهشی حوزه های علمیه، به برکت بیست و چند سال خدمت این مرکز و مجموعه ای از دست اندرکاران آن بوده است. از همین رهگذر است که می توانیم ادعا کنیم مرکز تحقیقات کامپیوتری علوم اسلامی، بزرگ ترین تولیدکننده دیجیتالی اطلاعات علوم اسلامی در جهان اسلام است؛ یعنی هیچ مرکزی در دنیا به اندازه ما اطلاعات دیجیتالی اسلامی و شیعی در اختیار ندارد و بحمدالله، این مسیر همچنان ادامه نیز دارد.

افتخارات کسب شده مرکز تحقیقات کامپیوتری علوم اسلامی (نور)

حرکت به سوی هوشمندسازی نرم افزارهای نور

نکته ای که در ابتدای عرایضم باید یادآور شوم، این است که فضای فناوری اطلاعات دچار برخی تحولات شده است و اگر فرصت کنم، در فرصتی که در اختیار بنده قرار داده شده، آن را خدمت شما بازگو می کنم. بخشی از این تغییرات، به حوزه هوشمندسازی و معنایی مربوط می شود و ما حدود هفت سال است که به این مهم رسیده ایم و تاکنون فعالیت هایی زیرساختی و ارزشمندی را نیز انجام داده ایم؛ اما هنوز آن طوری که دلمان می خواهد، موفق نشده ایم همه کارهای خودمان را به محصولِ قابل عرضه و استفاده تبدیل کنیم و در اختیار پژوهشگران و علاقه مندان قرار بدهیم؛ ولی در عین حال، امروز می خواهم گزارشی اجمالی از این نوع کارها ارائه دهم که بعضی از آنها عرضه شده و بسیاری نیز هنوز به مرحله عرضه نرسیده است.

به نظرم، حوزه های علمیه امروزه نیازمند تحول دیگری هستند که بنده اسم آن را «تحول دوم» می گذارم. اگر تحول اوّل را «آشنایی با فناوری اطلاعات و محتواهای دیجیتالی در محدوده الفاظ» بدانیم، اکنون تحول دوم را باید «دسترسی به محتواهای رقومی از طریق ابزارهای هوشمند و داده کاوی معنایی» بنامیم.

در اینجا چند مرحله از فعالیت های تشکیلاتی، زیرساختی و نمونه هایی از طرح ها و اقدامات نرم افزاری برای طراحی و تولید ابزارهای هوشمند یا نیمه هوشمند را که در گستره دانش های حوزوی و زمینه خط و زبان عربی و فارسی انجام داده ایم، برای شما عرضه خواهم کرد.

- ایجاد تشکیلات زیربنایی:

در بخش تشکیلات، چند فعالیت تأسیسی انجام دادیم؛ اوّل اینکه از سال 1389 گروهی به نام «گروه پژوهشی متن کاوی» راه اندازی نمودیم که آغازی برای تولید محتواهای دیجیتالی معنامحور و به عبارت دیگر، مقدمه ای بر ایجاد ساز و کارهای مفهومی در بازیابی محتوا بود. در واقع، تا چند سال پیش در تولیدات نرم افزاری، تمرکزمان بیشتر روی بازیابی متون بر اساس الفاظ بوده است؛ اما از سال 1389، به برکت این گروه، تحول چشمگیری در فرایند محصولاتمان شکل گرفت و توجه ما از الفاظ به معنا و محتواها در گستره مفاهیم گرایش پیدا کرد.

پایگاه گروه متن کاوی نور

دوم اینکه در سال 1391، پژوهشکده فناوری اطلاعات و علوم اسلامی را راه اندازی نمودیم و این، اوّلین پژوهشکده ای بود که به اعتبار و همسو با علوم حوزوی و حوزه علمیه تأسیس شد. بسیاری از پژوهشکده ها بوده و هستند که اعتبارشان را از دانشگاه ها گرفته اند؛ یعنی مراجع رسمی دانشگاهی به آنها مجوز فعالیت داده اند؛ اما پژوهشکده ما، نخستین پژوهشکده ای است که از متن حوزه برخاسته و از شورای عالی حوزه مجوز گرفته است و هم اینک نیز در حال توسعه آن هستیم.

سوم آنکه به دنبال تشکیل گروه ادبیات عرب و تحلیل صرفی و نحوی خط و زبان عربی در مرکز قم که از توفیقات خوبی برخوردار بود، گروهی را در معاونت تهران این مرکز، با عنوان «خط و زبان فارسی» به وجود آوردیم که آنها هم از بدو تأسیسِ این معاونت، مشغول انجام پژوهش های کاربردی در این زمینه بودند و بحمدالله از پژوهشگران خوبی نیز در این بخش برخورداریم.

با این سه بخش تشکیلاتی، فعالیت خودمان را در خصوص کارهای مطالعاتی و عملیاتی در بهره گیری از هوش مصنوعی شروع کردیم و با استفاده از محتواهای غنی مرکز در موضوعات اسلامی، به مباحث ارزیابی سند روایات به شکل هوشمند و حرکت گذاری هوشمند متون عربی ورود کردیم.

- اعراب گذاری ماشینی:

حدود پانزده سال، تیم هایی از دوستانمان مشغول اعراب گذاری روی متون عربی بودند که نتایج خوبی را به دنبال داشت؛ این کار را می توان زیربنایی برای اعراب گذاری هوشمند ماشینی دانست؛ یعنی امروز می توانیم متون عربی بدون اِعراب را به شکلی هوشمند و از طریق ماشین، حرکت گذاری کنیم. واقعاً ابزار حرکت گذاری هوشمند متون عربی، کار بزرگی است که در این مرکز به ثمر نشسته است و امروزه، گره خیلی از مشکلات را باز می کند. بنده شبیه این ابزار را در جاهای دیگر هم دیده ام؛ اما اشکالات بسیاری داشته و نمی توانسته پاسخگوی نیاز محققان و اهل فن باشد.

رسیدن به الگوی اعراب گذاری ماشینی، یک تلاش بیست ساله بوده که از همکاران عزیزم در مرکز تشکر می کنم؛ زیرا کار واقعاً طاقت فرسایی بوده و الآن یکی از دارایی های مرکز، اِعرابی است که روی کلمات خورده است. در ابتدای امر، مرکز مجلدات بحار الأنوار را اِعراب زد؛ در آن زمان، بحارِ معرَّب (اِعراب گذاری شده) اصلاً وجود نداشت. بعد، برخی از ناشران آن را با اجازه یا بدون اجازه ما، چاپ کردند. این اعراب گذاری، اوّل به صورت دستی بود و سپس، الگوهای آن استخراج گردید و به ماشین داده شد و الگوریتم های متعددی طراحی شد و پس از بارها تجربه و به کارگیری دانش های روزآمد، هم اینک اعراب گذاری به صورت خودکار و توسط رایانه انجام می شود. این کار مهم، از نخستین دستاوردهای مرکز محسوب می شود. الآن این برنامه ها زیاد شده؛ اما دقت کار در برنامه نور، بسیار بالاست و ما اکنون واجد متونی هستیم که دارای اعراب های متقن و مطمینی است.

- مشابه یابی متون:

از دیگر فعالیت های ما در استفاده از تکنیک های هوشمند رایانه ای، قابلیت مشابه یابی لفظی احادیث است که در نرم افزار جامع الأحادیث نسخه سه و نیم عرضه شده است و در آن، کار مشابهت یابی معنایی احادیث انجام می شود؛ یعنی می توانیم به وسیله نرم افزار، الفاظ متفاوت را که هم معنا، مترادف یا مرتبط هستند، پیدا کنیم و نمایش دهیم. کار دیگر، شناسایی هوشمند عبارات قرآنی در متون عربی و فارسی است و بیشتر نرم افزارهای نور، از این قابلیت مهم برخوردار است که می تواند متون قرآنی را استخراج کند و به طور هوشمند نشانی دهی نماید.

تقلب یابی در خصوص مقالات علمی یا همان کشف سرقت علمی، موضوع مهمی است. متأسفانه، رونوشت برداری به نام خود، در برخی مراکز دانشگاهی و حوزوی دیده می شود و کشف این موارد، از مباحث لازم است. ما ابزاری تهیه کردیم که می تواند میزان متون سرقت شده از منابع دیگر را نشان دهد. برای استنادسنجی مقالات و متون علمی با بهره گیری از تکنیک های جدید برنامه نویسی، نرم افزاری تولید کرده ایم که به صورت هوشمند این عملیات را انجام می دهد. اصولاً یکی از مسائل خیلی مهم که دنیای غرب به آن توجه ویژه دارد و ما کمتر به آن پرداخته ایم، استنادسنجی در متون کهن است؛ یعنی هر کدام از دانشمندان متأخر، چه اخذ و اقتباس هایی از دانشمندان متقدم خودشان کرده اند. این موضوع، برای پژوهشگران تاریخ علم، خیلی مهم است؛ بنابراین، ریشه یابی متون فعلی در کتب قدیمی تر، بسیار کاربردی و مهم است. در همین راستا، سامانه جست و جوگر هوشمند نیز از اهمیت وافری برخوردار است و ما معتقدیم که به طور کلی، ابزارهای هوشمند، کمک وافری به ما خواهد کرد و در واقع، خدمات ارزنده ای را به جهان اسلام و آینده علم و دانش ارزانی خواهد داشت.

- نمایه زنی ماشینی:

در حال حاضر، ابزارهایی را در دست تولید داریم که امکان استخراج نمایه ها را دارد؛ مثلاً نمایه زنی ماشینی، از مقوله های پیشرفته در حوزه برنامه نویسی رایانه ای و بهره گیری از هوش مصنوعی است .

- تجزیه و ترکیب ماشینی:

از دیگر فعالیت های نوآورانه در مرکز نور، تجزیه و ترکیب ماشینی است تا از این طریق، رایانه، تجزیه و ترکیب صرفی و نحوی را به صورت هوشمند انجام دهد؛ یعنی نرم افزار می تواند عبارات و جملات و کلمات را تشخیص بدهد. بدیهی است که اگر موفق شویم لایه های چهارگانه پنهان لفظ را که شامل لایه های: صرفی، نحوی، معنایی و گفتمانی است، کشف کنیم، آن وقت می توانیم محتوای مورد نظر خویش را سریع تر از گذشته استخراج نماییم و به آن دست یابیم و یا به محتواهایی برسیم که ممکن است به ذهن پژوهشگر هم خطور نکند؛ برای مثال، کلمه «عَلِیٍّ» به شکل مجرور، در یک جمله عربی، چه موقعیت نحوی دارد و چه رابطه ای با مسند و مسندالیه دارد. در این صورت است که یک محقق با کشف این رابطه، به مفاهیم متنوعی دست پیدا می کند. ما فقط برای دریافت مفاهیم تازه به تجزیه و ترکیب نحوی زبان نیاز نداریم؛ بلکه برای ترجمه ماشینی هم به آن نیازمندیم . امروزه، برخی مراکز هزینه های گزافی را برای ترجمه های کتب حدیثی و غیرحدیثی انجام می دهند. بسیاری از این متون، به دلیل عدم انسجام و یکپارچگی محتواها و عدم اطلاع مترجمان از عبارات و روایات تکراری، دوباره ترجمه می شوند؛ درحالی که ترجمه ماشینی با دسترسی به بانک داده های ترجمه شده و بهره مندی از هوش مصنوعی، کار ترجمه را آسان و سریع و با کمترین هزینه انجام می دهد. اگر چه این کار در اوّل راه است، اما تلاش مرکز در تکمیل این فعالیت ها و فرآیندهای ماشینی، موجب شده به موفقیت هایی دست یابد. الآن ما تا حدودی این زحمات و هزینه ها را متقبل شده ایم و ترجمه های مختلف یک متن را در برخی از موضوعات در دسترس قرار داده ایم تا محقق بتواند به آسانی آنها را بررسی و مقایسه کند. در همین راستا، برچسب گذاری صرفی زبان عربی، یعنی تعیین اینکه فلان واژه، «فاعل» است یا «مفعول»، چه نوع مفعولی است، مضاف است یا مضافٌ الیه و یا مواردی از این دست که در بازیابی هوشمند محتوا اهمیت فراوانی دارند، توسط همکاران ما صورت گرفته و حاصل زحمات دوستان، الگویی برای برچسب گذاری ماشینی شده است.

- تصحیح املایی خودکار:

از دیگر کارهای ما در این حوزه، تصحیح املایی واژه های عربی و فارسی است؛ یعنی شما می توانید نگارش خود را تصحیح کنید. این کار، در زبان انگلیسی بیش از بیست و پنج سال است که انجام شده؛ ما نیز امروزه موفق شده ایم به تصحیح املایی متن بپردازیم. در خصوص رده بندی هوشمند متون و فرهنگ افعال زبان فارسی نیز کارهایی صورت داده ایم که فرصت توضیح آنها نیست .

- گنجینه بزرگ علوم اسلامی و انسانی:

به طور کلی، در طی این بیست و چند سال فعالیت مرکز تحقیقات کامپیوتری علوم اسلامی، واجد گنجینه ای بزرگ از محتوای دیجیتالی علوم اسلامی و انسانی و به ویژه در معارف شیعی شده ایم که در مرکز داده نور قرار داده شده و ان شاء الله با راه اندازی شبکه ملی اطلاعات، قابلیت عرضه در سطح وسیع و گسترده جهانی را دارد. در اینجا اشاره ای به این محتواها می کنم و آمار مختصری از داده های الکترونیکی مرکز نور را ارائه می دهم.

تا کنون حدود بیست و دو هزار جلد کتاب را تایپ و تصحیح کرده ایم و بیش از چهل و دو هزار جلد کتاب را به صورت دیجیتالی تصویربرداری نموده ایم. همچنین، در حوزه مجلات و جراید نیز ده میلیون صفحه مقالات متنی و تصویری را به صورت الکترونیکی در اختیار داریم که از آنها، یک میلیون و صد هزار مجله، به شکل تصویری و بیش از پانصد هزار مجله، در قالب متنی است. همچنین، درصدد هستیم با استفاده از ابزار جدید، متون تصویری خود را به متن تبدیل کنیم. قریب پنج میلیون کلمه غیرتکراری تصحیح شده فارسی و عربی داریم که ریشه دو میلیون کلمه عربی استخراج گردیده و به اصل آن، متصل شده است. این فرایند، در طی پانزده سال صورت گرفته است.

- فرمت های تخصصی:

فعالیت دیگر ما، فرمت های تخصصی است که متخصصان این مرکز روی کتب: تاریخی، فقهی، اصولی، کلامی، فلسفی و دیگر علوم زده اند. همچنین، کدگذاری قریب سیصد و پنجاه هزار روایت، بیش از سیصد و هفتاد هزار سند، بیش از یکصد و بیست و شش هزار کلام غیرمعصوم در داخل متن روایات، شصت و هشت هزار فعل یا تقریر معصوم که از متون اسلامی استخراج شده و همچنین، پنجاه و پنج هزار فهرست اَعلام کتب و بیست و پنج هزار فهرست اَعلام اشخاص، صرفاً بخش کوچکی از فعالیت هایی است که در مرکز نور انجام شده و در این فرصت کوتاه، مجال بیان همه آنها نیست.

- استخراج متن از تصویر:

کار دیگری که دوستان ما در حوزه متن کاوی انجام داده اند، استخراج متن از تصاویر متون است؛ یعنی توانسته ایم با الگوریتم خاصی، متن تصویری را به متن تایپی تبدیل کنیم. همان طور که می دانید، تصویر، یک نوع قالب اطلاعاتی است. وقتی شما از یک صفحه متن عکس می گیرید، تمام صفحه به یک قلم اطلاعاتی تبدیل می شود؛ ولی اگر همان یک صفحه متن را تایپ کردید، به ازای هر کلمه، بلکه به ازای هر حرفی که وارد می کنید، یک قلم اطالاعاتی در اختیار دارید و بعداً این اقلام اطلاعاتی، توسط ماشین پردازش می شود؛ در حالی که اگر شما تصویر داشته باشید، نمی توانید چنین پردازش هایی را روی آن انجام دهید؛ چون فقط یک قلم اطلاعاتی در اختیار دارید؛ ولی وقتی عکس به متن تبدیل می شود، آن وقت است که قابلیت پردازش خواهد یافت. این نیز یکی از کارهایی است که مرکز انجام داده و در حال تکمیل آن است و بحمدالله به نتایج مطلوبی هم رسیده ایم.

- موتور مشابه یاب متون حدیثی:

همان گونه که اشاره کردم، موتور مشابه یاب حدیث نور در سال 1391 پیاده سازی شد و می توان گفت یکی از بزرگ ترین کارهایی است که مرکز انجام داده است. ما به روش معجم های جستجوی لفظی، موتور مشابهت یاب را طراحی کردیم. این موتور برای اولین بار به همراه قابلیت هایی ارزشمند، در نسخه سه و نیم نرم افزار جامع الأحادیث ارائه شد و شما می توانید در این برنامه، به دلخواه خود، میزان درصد مشابهت احادیث را تعیین کنید و آنگاه به کشف احادیث مشابه بپردازید که مثال ها و نمونه های بسیاری را می توان برای این امکانِ کاربردی بیان نمود؛ مثلاً متن توقیع شریف امام زمان(عج) که توسط اسحاق بن یعقوب از دست عثمان بن سعید عمری دریافت شده است و برای مبحثی همچون ولایت فقیه، بسیار کاربرد دارد. یکی از اسناد این حدیث، به محمد بن یعقوب کلینی بر می گردد که آن را در کتاب کافی نیاورده است و به همین جهت، برخی این توقیع شریف را مستند نمی دانند؛ در حالی که به نظر برخی از بزرگان، این چنین نیست و قطعاً اشکال سندی ندارد.

نرم افزار جامع الاحادیث

شما وقتی این متن را با استفاده از قابلیت مشابهت یاب احادیث که در نرم افزار جامع الأحادیث وجود دارد، مشابه یابی کنید، به حدیثی مثل روایت سعد بن عبدالله از اسحاق بن یعقوب مواجه می شوید؛ یعنی برنامه روایتی را نشان می داد که یک طرف آن، سعد بن عبدالله اشعری است. وی، از بزرگان قم است که دوران امامت امام حسن عسکری(ع) و دوران غیبت صغری و حضرت صاحب الزمان(عج) را درک کرد. در این حدیث، ایشان از اسحاق بن یعقوب نقل می کند. این مطلب، می تواند شاهدی باشد بر اینکه چنین توقیعی، توسط اسحاق بن یعقوب از جانب سعد بن عبدالله اشعری روایت شده است.

بنده وقتی این روایت را مشابهت یابی نمودم، مشاهده کردم حدیث مذکور در کتاب الإمامة والتبصرة شیخ صدوق نیز نقل شده است و با کمی تفاوت، در کتاب الخرایج والجرایح قطب راوندی نیز آمده است؛ اما سندی که قطب راوندی ذکر کرده، با آنچه صاحب الإمامة والتبصرة گفته، فرق دارد و در سند ایشان، واسطه اسحاق بن یعقوب نیست؛ بلکه وسایطی است که صحت سند را قطعی می سازد و آن، سعد بن عبدالله عن علی بن محمد رازی، معروف به علان رازی است. پس، معلوم می شود که اصل محتوا، تثبیت شده است و به وسیله شاهدی که توضیح دادم، می توان به این توقیع شریف اعتماد پیدا کرد. این ها فواید و برکاتی است که از ابزار مشابهت یابی احادیث، نصیب ما می شود و کار پژوهشی را جهت دهی نموده، به شکلی مطلوبی توسعه می دهد.

نظیر این مسأله، در بحث مشابهت یابی احادیث فریقین نیز پیاده سازی شده است؛ یعنی کتب اربعه شیعه را با صحاح سته اهل سنّت مقارنه کردیم و مشابهت های مربوطه را استخراج نمودیم و در نرم افزاری به نام «جامع احادیث فریقین» قرار دادیم که بسیار مفید و راهگشاست؛ برای مثال، به کمک قابلیت مشابهت یابی برنامه، سند «افتتاح الصلاة الوضوء» را از کتاب من لا یحضره الفقیه صدوق نقل کردیم. همین حدیث، با برخی تفاوت ها در مسند الدارمی تحت عنوان «مفتاح الصلاة الطهور» آمده است که بابِ بحث و تحقیق را برای اهل فن باز می کند و نکات جالبی را در معرض فهم و کشف قرار می دهد؛ از جمله اینکه به نظر بنده می توان به این نتیجه رسید که مثلاً شیخ صدوق، بسیاری از روایات را از منابع اهل سنّت گرفته است.

به هر حال، این ها نمونه های کوچکی است از آثار و نتایج بی شماری که این دست ابزارهای هوشمند در معرض استفاده محققان قرار داده است و ما معتقدیم زیرساخت های زبانی که سال ها روی آنها کار کرده ایم، باید سال های متمادی دیگر را نیز زحمت بکشیم تا به رشد مطلوب برسد و همان گونه که امروز واجد بزرگ ترین منابع لفظی در جهان اسلام شده ایم، به منابع دربردارنده محتواهای معنایی و مفهومی متون اسلامی نیز دست یابیم.

- موتور جست و جوی صوت:

بحمدالله، گام های بزرگی در این مرکز برداشته شده که آینده علوم اسلامی را دچار تحولی شگرف خواهد کرد؛ هم اینک زیرساخت های این مسأله آماده شده؛ اما محصولش هنوز بیرون نیامده است و در گذر زمان، به نتیجه خواهد رسید؛ از جمله آنها، موتور جستجوی صداست؛ یعنی شما از این پس می توانید روی صوت هایی که در محصولات نور عرضه شده، به جست و جو بپردازید؛ مثلاً وقتی کاربر لفظ خاصی را در یک فایل صوتی جست وجو کند، نرم افزار، او را به آن قسمت از صوت که دربردارنده کلمه مورد نظر است، منتقل می کند. این قابلیت، در نرم افزار «مقتل الحسین(ع)» که امروز مراسم رونمایی آن را برگزار می کنیم، ارائه شده است و شما می توانید علاوه بر متون، در فایل های صوتی برنامه نیز به جستجو بپردازید.

- تحلیل نحوی آیات قرآن:

از دیگر کارهای زیرساخت زبانی که در مرکز انجام شده، تحلیل نحوی آیات قرآن است که شما می توانید در محتوای آیات قرآنی به جست و جو بپردازید؛ مثلاً وقتی به دنبال آیاتی درباره پدر و مادر بگردید، برنامه تمامی آیاتی را که از نظر لفظی و معنایی به این موضوع اشاره دارد، نشان می دهد؛ برای مثال، هم آیه «و وصینا الإنسان بوالدیه إحسانا» را گزارش می کند و هم فراز «و صاحبهما فی الدنیا معروفاً» را فهرست می نماید که در آن اصلاً لفظ «والدین» نیامده و فقط ضمیر «صاحبهما» به آنها اشاره دارد. این، یک نوع کار محتوایی است که روی آیات انجام شده است.

- سامانه مشابه یاب متون (سمیم نور):

سامانه مشابهت یاب متون نور یا سمیم نور، از دیگر تولیدات ماست که مقالات را در گستره بانک غنی مقالاتی که در دسترس ماست، مشابهت یابی می کند و درصد مشابهت متن مقاله ها و پایان نامه ها و میزان کپی برداری آن را از سایر متون نشان می دهد. این ابزار، در دانشگاه ها، حوزه های علمیه و دیگر مراکز تحقیقاتی و علمی، کاربرد بسیاری دارد و بدیهی است که رواج آن در جامعه علمی، عرصه های جدیدی را در حوزه پژوهش باز خواهد کرد. این قابلیت در حال حاضر، در پایگاه اینترنتی سمیم نور عرضه شده و برای همگان قابل استفاده است و به راحتی می توان با ارائه متن مورد نظر خود، از میزان اعتبار و اصالت آن مطلع شد.

پایگاه سامانه مشابه یاب متون نور - سمیم نور

برای مثال، شما به کمک این ابزار به آسانی متوجه می شوید که چه مقدار از تولیدات بزرگان و نویسندگان اسلامی در قرون گذشته، از آنِ خودشان است و چه میزان از آن، از کتب یکدیگر نقل شده است؛ البته باید توجه داشت که نقل از کتب دیگران بدون ذکر سند، در زمان گذشته، یک سنّت بوده است.

- جست وجوی هوشمند در پایگاه نورمگز:

در وب گاهی مثل مجلات تخصصی نور نیز قابلیت های خوبی در دسترس قرار گرفته و ضمن اینکه شما قادر به جستجوی هوشمند هستید، برنامه نیز در خصوص موضوع تحقیقی تان، کلیدواژه ها و مقالات مرتبط را نیز پیشنهاد می کند و مسیر پژوهش را برایتان آسان می سازد؛ مثلاً وقتی موضوع «بیداری اسلامی» را در این پایگاه کاوش می کنید، بسیاری از موضوعات مرتبط با این مطلب نیز در دسترس قرار خواهد گرفت.

پایگاه مجلات تخصصی نور - نورمگز

- موتور جست و جوگر معنایی:

در اینجا لازم می دانم کمی درباره موتور جست و جوی معنایی که در برنامه ها و سایت های مرکز راه اندازی شده است، توضیح دهم؛ همچنان که می دانید، موتور جستجوی الفاظ در نرم افزارهای نور، سال هاست که طراحی شده و هر از مدتی، روزآمدسازی شده و اکنون از قوی ترین موتورهای کاوشگر لفظی است که در نرم افزارهای ایرانی به کار رفته است؛ اما موتور جستجوی معنایی، نیازمند بهره گیری از تکنیک های پیشرفته و هوشمندسازی برنامه و به کارگیری هوش مصنوعی است. در طراحی این موتور، همکاران متخصص و فنی مرکز، تلاش بسیاری کرده و موفقیت هایی کسب نموده اند که به کاربرد آن در برخی از نرم افزارها اشاره کردم.

لازم است در اینجا توضیح دهم که دستیابی به موتور جستجوگر هوشمند چقدر اهیمت دارد. وقتی ما واژه ای را در یک محتوا جست و جو می کنیم، در کاوش لفظی، تنها همان واژه و نهایتاً مشابهات لفظی آن را نمایش می دهد؛ ولی در موتور کاوشگر معنایی، نمایه ها ، عبارات و واژه های هم معنا و حتی مرتبط با معنا را بازیابی می کند؛ مثلاً روایتی در مورد روزه گرفتن فرزند را به رایانه داده ایم: «سُیِلَ عَنِ الصَّبِیِّ مَتَى یَصُومُ ؟ قَالَ إِذَا أَطَاقَهُ؛ از امام معصوم(ع) سؤال شد: فرزند ما چه وقت روزه بگیرد؟ امام فرمود: زمانی که طاقت آن را دارد.» موتور جست وجوگر مفهومی، روایات مربوط به سنّ وجوب نماز ، طاقت فرزند در روزه داری، سنّ احتلام ، شرایط تکلیف و مفاهیم مرتبط را نیز فهرست می کند؛ درحالی که در بسیاری از پاسخ ها، نه واژه «صبی» آمده و نه از لفظ «صوم» خبری است. این، به آن جهت است که در طراحی موتور مفهومی، اصلاً به لفظ توجه نمی شود؛ بلکه رایانه با تکنیک های هوشمند، بُردارهایی ریاضی برای مفاهیم ترسیم می کند و هر مفهومی که به بُردار مورد کاوش، نزدیک تر و همسان تر است، آن را نمایش می دهد و به ترتیبِ ارتباط و درصد نزدیکی به بُردار اصلی، پاسخ ها را فهرست می نماید . این کار، در حال تکمیل است و به زودی نسخه های کامل شده آن، در محصولات نور عرضه خواهد شد. به نظر ما، چنین کاری بسیار ارزشمند و تحول آفرین است و تولید علم را در حوزه های علمیه متحول خواهد ساخت.

- تحول در نظام آموزشی و پژوهشی:

در مجموع، همکاران عزیز ما در مرکز تحقیقات کامپیوتری علوم اسلامی، این افتخار را دارند که روی زیرساخت هایی از این دست کار می کنند که تحول شگرفی در نظام آموزشی و پژوهشی ما ایجاد خواهد کرد. در واقع، ما داریم با صرف هزینه زیاد، هوش مصنوعی را به حوزه علوم اسلامی وارد می کنیم. امروزه در جهان، از هوش مصنوعی در عرصه های بی شماری استفاده می کنند؛ برای مثال، آمریکا در صدد ساخت یک انسان هوشمند مصنوعی است که بتواند دشمن را از غیر دشمن تشخیص دهد و در میدان جنگ، به شکل خودکار با دشمن مبارزه کند. ساخت پهبادها و دیگر ابزارآلات جنگی امروزی نیز از این هوش بهره می برد و علاوه بر سطح نظامی، در دیگر حوزه ها و علوم و فنون و صنایع نیز کاربرد فراوان دارد.

البته کارهای بزرگ دیگری نیز در مرکز در دست انجام است که بخشی از آنها در معاونت تهران پیگیری می شود و متأسفانه، در این جلسه فرصت بازگویی همه آنها نیست و آن را به مجالی دیگر وامی نهیم.

پروژه های عظیم و ارزشمندی که در مرکز نور در دست انجام است، به یاری خداوند، به زودی نتایج ارزنده ای را عاید نظام علمی و پژوهشی کشور خواهد کرد که مایه افتخار جهان اسلام است. امروزه، ما بزرگ ترین بانک دیجیتالی اطلاعات اسلامی را در اختیار داریم و تصمیم گرفته ایم بزرگ ترین اطلاعات دیجیتالی نسخ خطی را نیز جمع آوری کنیم تا در این عرصه نیز خدمتگزار باشیم.

امیدوارم با همت همکاران و متخصصان ما در این مرکز و نیز مساعدت و همفکری همه شما عزیزان، بتوانیم در آینده نزدیک، آثار بهتر و کارآمدتری را به جامعه علمی، به خصوص حوزه های علمیه ارائه نماییم و همه این زحمات و فعالیت های خالصانه، در جهت رضای حق تعالی باشد و شایستگی آن را بیابیم که از یاران صدیق حضرت ولی عصر(عج) باشیم؛ به برکت صلوات بر محمد و آل محمد.

اطلاعات تکميلي

  • تاریخ انتشار نسخه چاپی: دوشنبه, 27 آذر 1396
  • صفحه در فصلنامه: صفحه 2
  • شماره فصلنامه: فصلنامه شماره 60
بازدید 9240 بار
محتوای بیشتر در این بخش: نگاهی به نسخه رومیزی کتابخوان نور »
شما اينجا هستيد:خانه