صرف و نحو و اعراب گذاری ماشینی متون، نتیجه هوشمندسازی تولیدات نور است

    گفت‌وگو با محمد حبیب‌زاده بیژنی، پژوهشگر گروه ادبیات و متن‌کاوی نور

پنج شنبه, 29 خرداد 1399 ساعت 16:51
این مورد را ارزیابی کنید
(3 رای‌ها)

اشاره

مرکز تحقیقات کامپیوتری علوم اسلامی را می‌توان نهادی دانست که با وارد شدن به مسیری نوین، جایگاهی ویژه در میان پژوهشگران عرصه دین یافته و در اندک زمانی تقریباً تمام آنان را مخاطب خود ساخته است و این، نیست جز با پیوند توانایی‌های رایانه‌ای و مجموعه دانش‌های دینی. بدیهی است که این جایگاه، تنها زمانی حفظ خواهد شد که این نهاد همچنان همگام با پیشرفت‌ها، به‌ویژه در عرصه هوشمندسازی گام بردارد؛ وگرنه جایگاه خود را به دیگران خواهد سپرد. در این شماره گفت‌وگویی با یکی از همکاران پُرسابقه مرکز نور انجام دادیم که از پژوهشگران «گروه متن‌کاوی و ادبیات» معاونت پژوهشی می‌باشد که به نظرتان می‌رسد.

» لطفاً خودتان را معرّفی کنید و درباره سوابق کاری خویش در مرکز نور توضیح دهید.

◊ محمد حبیب‌زاده بیژنی هستم و در سال 1371 و در سنّ بیست‌ودو سالگی وارد مرکز تحقیقات کامپیوتری علوم اسلامی شدم و در مدّت این 28 سال، به طور مداوم، در زمینه های گوناگونی چون: قرآن، حدیث، فقه، شخصیت و کتاب‌شناسی، لغت، تصحیح و ویرایش متون و در نهایت، متن‌کاوی و هوشمندسازی پژوهش‌ها، با این نهاد فرهنگی همکاری داشته‌ام.

طبیعتاً کارهای ابتدائی ما در مقایسه با فعّالیّت‌های کنونی، چندان پیچیده نبود؛ به عنوان نمونه، در اوّلین گامی که در مسیر فعّالیّت‌های قرآنی ـ و قبل از شکل‌گیری رسمی گروه قرآن ـ انجام شد، تنها متن این کتابِ مقدس تایپ و تصحیح گردید و به صورت رقومی و در قالب فلاپی‌دیسک در اختیار مخاطبان قرار گرفت (سال 1372) که علاوه بر ارائه متن و یک ترجمه، امکان جست‌وجویی در آن گنجانده شد که کاربران را از مراجعه به کتاب‌هایی چون «المعجم المفهرس» برای یافتن کلمات قرآنی بی‌نیاز می‌کرد. چنین قابلیتی، در آن زمان، پیشرفت خوبی به شمار می‌آمد و استقبال مناسبی نیز از آن صورت گرفت. گام دوم، ارائه نسخه جدیدی از همان نرم‌افزار با افزودن تفسیر «المیزان» بود که در این نسخه، فراتر از قابلیت‌های گذشته می‌توانستیم ذیل هر آیه، تفسیر مرتبط با آن را از این کتاب تفسیری مشاهده کنیم. گرچه این نرم‌افزار در آن زمان نام خاصّی نداشت، امّا از آنجا که بستری برای شکل‌گیری نرم‌افزار جامعی با عنوان نور الأنوار بود، همان نرم‌افزار تحت سیستم عامل DOS ارائه و مورد استقبال عموم قرار گرفت. در این میان، آماده‌سازی متن قرآن کریم به خط عثمان طه بر عهده بنده قرار گرفت که در برخی نرم‌افزارهای بعدی، از آن استفاده شد.

آن دوره به دلیل محدود بودن حجم فلاپی‌دیسک‌ها، قادر نبودیم تفاسیر دیگر را به نرم‌افزار اضافه کنیم؛ تا هنگامی که با در دسترس قرار گرفتن سی‌دی‌ها، فعّالیّت پژوهشی در کتاب‌های تفسیری دیگری مانند: مجمع البیان، شبّر و نمونه ادامه یافت و با ضمیمه شدن برخی ترجمه‌ها، تفاسیر روایی و امکانات چندرسانه‌ای و نیز بعضی پژوهش‌های موضوعی، نرم‌افزار جامع قرآن با نام «نور الأنوار نسخه 2» عرضه شد. این کار، به همراه نرم‌افزار جامع حدیثی نور 2 که به صورت موازی بدان می‌پرداختیم، موفقیتی شایان را در ارائه معارف برگرفته از ثقلین برای مرکز به دست آورد که ادامه این شجره طیبه، در قالب نرم‌افزارهای جامع تفاسیر نور و جامع الأحادیث، امروزه روشنایی‌بخش بیشتر فعّالیّت‌های دین‌پژوهان است.

به دنبال استقبال گسترده جامعه هدف از این نرم‌افزارها، انگیزه برای تولید محصولات دیگری در دانش‌های گوناگون و با روش‌های مختلف نیز فراهم شد که به همراه دیگر همکاران در تهیه بسیاری از آنها، به‌ویژه کتابخانه‌های فقه، تراجم و قاموس، مشارکت فعّال داشتم. پرداختن به تمام آنها، بیش از ظرفیت این نوشتار است؛ امّا به صورت خلاصه باید گفت که برخی از تولیدات مرکز، خوش درخشیده‌اند و نیازهای مهم پژوهشگران را برآورده نموده‌اند؛ امّا پاره‌ای از نرم‌افزارها، تنها به صورت جزیره اطّلاعاتی کوچکی بوده‌اند و عملاً مخاطب چندانی را جذب نکرده‌اند. بخش‌هایی چون امور کاربران، می‌توانند به ارزیابی بازخورد هر نرم‌افزار در جامعه هدف بپردازند و در این باره، نکات ارزنده‌ای را برای تولید محصولات بعدی گوشزد نمایند.

به‌هرحال، در دو دهه ابتدائی همکاری‌ام با مرکز، علاوه بر فعّالیّت‌های گروهی، با هماهنگی مدیران مرکز، برخی فعّالیّت‌های فردی را نیز دنبال می‌کردم و در ده سال اخیر نیز فعّالیّت این‌جانب بر پروژه‌های مرتبط با هوشمندسازی متمرکز بوده است که توسعه و بهینه‌سازی آن را مهم‌ترین زمینه فعّالیّت مرکز در آینده ارزیابی می‌کنم.

» در ابتداء فعالیت مرکز، چند خط تولید وجود داشت و شیوه کار چگونه بود؟

◊ آن زمان، دو خط تولید وجود داشت؛ اوّل، مجموعه‌ای که مستقیماً با متن سروکار داشت و شامل فعّالیّت‌هایی مانند: تایپ، تصحیح، فرمت‌های عمومی و تخصّصی و نیز اِعراب می‌شد. خط تولید دیگری هم وجود داشت که فعّالیّت مستقیمی بر روی متون نداشت؛ بلکه با مطالعه کتب، به‌ترتیب ابتداء موضوعاتی از آنها استخراج می‌گشت و سپس، با بررسی موضوعات، نمایه و کلیدواژه‌های مرتبط شناسایی شده، در فیش‌های کاغذی ثبت می‌شد. البته خروجی این خط تولید، در سال‌های ابتدائی مرکز در قالب نرم‌افزاری ارائه نگردید و بعدها در قالب نرم‌افزارهایی مستقل و یا در حاشیه نرم‌افزارهای لفظی مانند نور الأنوار عرضه شدند.

» بحث هوشمند‌سازی در اِعراب متون عربی چه زمانی مطرح شد؟

◊ در ابتداء فعّالیّت مرکز، سیستم‌های رایانه‌ای تنها به عنوان انبار و مخزنی برای نگهداری متون و فیش‌ها به علاوه امکان جست‌وجوی آسان در چنین اطّلاعاتی به شمار می‌آمد؛ امّا در ادامه و در همان سال‌های اوّلیه، بحث هوشمندسازی مطرح شد؛ یعنی این پرسش جدّی مطرح گردید: تا چه زمانی می‌خواهیم تمام کارها را به صورت دستی انجام بدهیم؟ چرا پژوهشگر باید در جریان صفر تا صد فعّالیّت‌ها به صورت پُررنگ نقش داشته باشد؟ آیا نمی‌توان برخی فعّالیّت ها را به‌تدریج به ماشین سپرد؟

به همین دلیل، فعّالیّت‌های پراکنده‌ای به صورت آزمون و خطا شکل گرفت و در برخی مراحل، هوشمندسازی‌های اوّلیه‌ای در راستای کمک به پژوهشگران ایجاد شد که دو مورد آنها عبارت‌اند از:

الف. اِعراب‌گذاری خودکار: بعد از آنکه تعداد قابل قبولی از کتاب‌های روایی اِعراب‌گذاری شد، این نتیجه به دست آمد که درصد بالایی از منابع باقیمانده حدیثی، به‌نوعی تکرار واژه‌ها و عبارات کتاب‌های گذشته است. ازاین‌رو، ابزاری طراحی شد تا با یادگیری از اِعرابهای گذشته، اِعرابی را به صورت هوشمند برای متون باقیمانده اعمال کرده، پژوهشگر تنها با مروری در آنها، مواردی را که نیازمند ویرایش هستند، اصلاح کند. این ابزار، سرعت اعراب گذاری را چند برابر کرد.

ب. راستی‌آزمایی متون و نشانی‌های قرآنی: در ابتداء کار، برای تشخیص و برجسته‌سازی عبارات قرآنی در کتاب‌ها، با فرمتی خاصّ، ابتداء و انتهاء متون قرآنی مشخّص شده، نشانی‌دهی می‌شد. از طرفی، در این روش که تنها با استفاده از توان فکری پژوهشگر انجام می‌شد، امکان بروز چند نوع از اشتباه وجود داشت؛ از جمله آنکه در متنی غیرقرآنی به‌اشتباه فرمتِ آیه اعمال شود و یا آنکه متن قرآنی باشد، امّا اغلاطی املائی در آن وجود داشته و یا نشانی آن به‌اشتباه درج شده باشد.

به دنبال آن بود که جناب آقای سقائی، معاون فنّی آن زمان، برنامه‌ای را طراحی کرد و در اختیار این‌جانب قرار داد. این برنامه، با محور قرار دادن یک فایل تصحیح‌شده از قرآن کریم، متونی را که در کتاب‌ها به عنوان آیه مشخّص شده بود، به صورت هوشمند مورد بررسی قرار می‌داد و در صورت صحیح بودن، نشانی آن را به صورت خودکار اعمال می‌نمود و در صورت قرآنی نبودن متن و یا وجود اشتباهات املائی، این موضوع هشدار داده شده، به اصلاح آن اقدام می‌کردیم و در نهایت، آیات قرآن موجود در متنهای خروجی، از دقّت بالاتری برخوردار می‌شد. گویا همان ابزار اوّلیه با اندک تغییراتی هنوز نیز مورد استفاده قرار می‌گیرد.

البته حیطه ابزار یادشده تنها در ارتباط با آیاتی بود که از قبل توسط پژوهشگر عملیاتی شده بود و ازاین‌رو، طرح تکمیلی دیگری ارائه شد تا ابزار به گونه‌ای ارتقاء یابد که بتواند به صورت هوشمند در متونی که فاقد علامت و فرمت بودند نیز به شناسایی آیات قرآن بپردازد. بعد از ماه‌ها تلاش و با همکاری معاونت فنّی، نسخه آزمایشی خوبی از چنین ابزار ارتقاءیافته‌ای را با دقّت بالای نود درصد به مرحله تولید رسید.

» چه مراحلی برای هوشمند‌سازی در اِعراب طی می‌شود؟

◊ هوشمندسازی، در فرایندهای گوناگون می‌تواند متفاوت باشد و آنچه در مرکز بدان نیاز داریم، تقویت و توسعه هوشمند‌سازی فعّالیّت‌های مرتبط با زبان طبیعی است. در همین راستا، لازم است به‌تدریج و پله‌پله به جایی برسیم که رایانه مانند انسان به درک معنا برسد. برای رسیدن به این هدف، باید مراحل فراوان و دشواری طیّ شود؛ توضیح بیشتر آنکه می‌دانیم که یک انسان، تنها زمانی می‌تواند به درک درستی از متن کتاب و یا مقاله‌ای برسد که چند دانش را فراگرفته باشد و به عنوان نمونه، در زبان عربی بداند که کلمه مورد نظر در کدام ریشه و یا حالت صرفی قرار دارد؛ جایگاه نحوی کلمات و عبارات در جمله چیست و یا این کلمه، چند معنا دارد و در متن مورد نظر و با توجّه به عبارتی که در آن قرار گرفته، کدام‌یک از معانی متعدّد آن، مراد گوینده و یا نویسنده است و چنین کلمه‌ای با چه کلمات دیگری مشابه و مترادف بوده و چه کلمات دیگری در برابر آن قرار دارند و مسائلی از این دست.

اگر انسان در هر کدام از آنچه گفته شد، دانش لازم را نداشته باشد، درکی که از معنا خواهد داشت، نادرست و یا ناقص خواهد بود. در مدلی مشابه، یک سیستم رایانه‌ای نیز برای درک درست و دقیق معنا باید قدرت تجزیه و تحلیل تمام موارد فوق را داشته باشد.

بیان این نکته نیز لازم است، همان‌گونه‌که قوانین ادبیات عرب یا قیاسی‌اند و یا سماعی، هوشمندسازی‌ها مبتنی بر دو محور «قانون عام الشمول» و «یادگیری از متون انبوه» می‌باشد که در بخش اوّل، باید پژوهشگران، قانون نوشته‌شده را در سیستم پیاده‌سازی کنند؛ امّا در بخش دوم، خود سیستم به قانون‌های نانوشته‌ای دست خواهد یافت و آن را معیار تحلیل‌های بعدی خود قرار خواهد داد.

به‌هرحال، برای استفاده از رایانه جهت هوشمندسازی پژوهش دینی باید در مسیر مشابه یا مسیری حرکت کنیم که یک پژوهشگر دینی آن را در یادگیری‌های خود پشت سر گذاشته است و به عبارت دیگر، مسیر طی‌شده توسط این پژوهشگران را برای رایانه بازسازی کنیم.

در همین راستا، قبل از آنکه گروه متن‌کاوی به صورت متمرکز در مرکز شکل بگیرد، گروهی از همکاران، پیکره‌ای را بدون استفاده از رایانه تولید کرده بودند که در آن بیش از چهارصد هزار کلمه غیرتکراری موجود در روایات، با ریشه‌های مرتبط پیوند خورده بود. از آنجایی که نزدیک به سه میلیون کلمه غیرتکراری در کل متون عربی مرکز وجود داشت و این آمار پیوسته در حال افزایش بود، پیکره موجود که تنها شامل کمتر از یک پنجم کلمات ـ آن هم تنها کلمات موجود در روایات ـ می‌شد، قدرت پوشش تمام متون مرکز را نداشت و از طرفی، تکمیل آن با روش های گذشته بسیار زمان‌بر و هزینه‌بر بود.

ازاین‌رو، ابزاری که بعدها به نام «موتور صرف» شناخته شد، ایده‌پردازی و در مرحله اجراء قرار گرفت. این ابزار با استفاده از برخی قوانین ثابت و نیز با بهره‌گرفتن از یادگیری های مبتنی بر پیکره ها، برای هر کلمه ورودی، یک یا چند ریشه را به عنوان ریشه مرتبط با آن پیشنهاد می‌داد و پژوهشگر، تنها به قبول و یا ردّ پیشنهادهای ارائه‌شده و یا در مواردی نادر، به درج ریشه‌ای می‌پرداخت که در فهرست پیشنهادها نبود. البته مشکلی در پیکره سابق وجود داشت که در ابتداء تدوین ابزار هوشمند صرف نیز راه حلّی برای آن در نظر گرفته نشده بود. مشکل، آن بود که برای تعیین وضعیت صرفی یک کلمه، تنها یک راه انحصاری و آن هم اتّصال کلمه به ریشه در نظر گرفته شده بود؛ امّا کلمات فراوانی در متون وجود داشت که نمی‌توانستیم آن را با ریشه‌ای مرتبط بدانیم؛ به عنوان نمونه، ادات حرفی و اسمی دارای ریشه نبوده و نیز برای تمام صدها هزار کلمه دخیلی که در متون عربی وجود داشت، نمی‌توانستیم ریشه‌ای را مشخّص کنیم. بنابراین، در ابزار قابلیتی ایجاد شد که این انحصار شکسته شود. بدین ترتیب، با افزودن گزینه هایی چون «ادات» و یا «کلمات دخیل»، موفّق شدیم تا وضعیت صرفی این دسته از کلمات را مشخّص کنیم؛ بدون آنکه خود را ملتزم بدانیم که حتماً آن را به ریشه ای متّصل کنیم.

امروزه، ابزار هوشمند صرف در کلمات ورودی جدید، با دقّت بسیار بالایی می تواند وضعیت صرفی آنها را ـ حتّی بدون دخالت پژوهشگر ـ مشخّص کند. مجموعه های مرتبط با هوشمندسازی در مرکز به‌تدریج توانستند هوش مصنوعی را تا حدّ قابل قبولی در زمینه های دیگری نیز پیاده‌سازی کنند که می توانند هم به صورت مستقل و هم به عنوان پازل‌هایی برای یک طرح بزرگ‌تر مورد استفاده قرار گیرند؛ در اینجا به برخی از این موارد اشاره می‌کنم:

تشخیص وضعیت نحوی کلمات و عبارات، تشخیص کلمات مترادف و متضاد، ارتباط هوشمند متون با ترجمه‌ها و شرح‌ها، تشخیص ارتباط میان واژه ها و عبارات با استفاده از هم‌نشینی، تشخیص هوشمند اَعلام، تشخیص هوشمند اینکه یک متن به چه دانشی می‌پردازد، تشخیص ابتداء و انتهاء جملات.

» با توجه به سابقه حدود سه دهه همکاری شما با مرکز نور، نقاط قوت کار این مرکز را چطور می‌بینید؟

◊ به نظرم نقاط قوّت کار مرکز نور را می‌توان در سه محور کلّی بیان کرد:

1. تبدیل شدن مرکز به یک برند معتبر: مهم‌ترین نقطه قوّت مرکز، تبدیل شدن آن به برندی معتبر است؛ به‌طوری‌که امروزه تقریباً همه آن را می‌شناسند. به‌سرعت، نرم‌افزارهای مرکز با نام «نور» شناخته شد و جای خود را در جامعه علمی باز نمود. همین شناخته شدن مرکز به عنوان مهم‌ترین نهاد تولیدکننده نرم‌افزارهای دینی، بزرگ‌ترین امتیاز آن است که باید برای نگاه داشتن آن تلاش نمود و رضایت مخاطبان را جلب کرد؛ به عنوان نمونه، پایگاه اینترنتی نورلایب که مرکز نور آن را راه اندازی کرده، تمام کتب و محتواهای این مرکز را به صورت یکجا به کاربران ارائه می‌دهد، این کار فعّالیّتی ارزشمند و کم‌نظیر جهت افزایش رضایت آنان خواهد بود و هم‌زمان هرچه بر قابلیت‌های تخصّصی این پایگاه افزوده شود، رضایتمندی بیشتری را به دنبال خواهد داشت. توجّه به نظرات کاربران نور در ارائه خدمات مرکز، هم در محصولات برخط و هم برون‌خط حائز اهمیت است. ازاین‌رو، در ارتقاء و ارائه خدمات و تسهیلات بهتر برای کاربران، باید کوشش بیش از پیش صورت پذیرد.

2. تجربه‌های ارزشمند: امتیاز بزرگ دیگر مرکز، کسب تجربه های فنّی و پژوهشی است و آزمودن بسیاری از راه‌ها و برخورد با موفقیت‌ها و احیاناً برخی شکست‌هاست، این تجربه‌اندوزی‌ها هزینه‌های بسیار داشته و در طول سی سال با فرازونشیب‌های فراوان فراهم شده است که در صورت ارزیابی دقیق، می‌تواند به برنامه‌ریزی‌های بهتر برای فعّالیّت‌های آینده کمک کند.

3. پذیرش رسمی به عنوان نهادی فرهنگی: فعّالیّت‌های مرکز به اندازه‌ای برجسته و افتخارآمیز بوده که نظام اسلامی خود را متعهّد به پشتیبانی از آن می‌داند و ازاین‌رو، نیازی ندارد تا تنها به فعّالیّت‌های بازارپسند پرداخته و تمام مخارج خود را از درآمد حاصله از فروش نرم‌افزارها تأمین نماید. بنابراین، می‌توان با جدیت بیشتری به فعّالیّت‌های تخصّصی پرداخت؛ امّا چنانچه با اعتماد به این حُسن سابقه، به سوی تولید پُرحجم نرم‌افزارها و پایگاه‌های متنوّع و جزیره‌ای حرکت کنیم و از کیفیت تولیدات بکاهیم، این جایگاه وزین تضعیف خواهد شد و ممکن است اعتماد کاربران و پشتیبانی‌کنندگان را از دست بدهیم.

» به عنوان یک پژوهشگر پُرسابقه در مرکز نور، از جنبه آسیب‌شناسانه کارهای مرکز را چگونه ارزیابی می‌کنید و چه پیشنهادهایی دارید؟

◊ بدیهی است، زمانی موفّق‌تر خواهیم بود که به نقد خود بپردازیم و به نقد دیگران نیز بهاء دهیم. در همین راستا، اگر بخواهیم از نگاه آسیب‌شناسانه به مرکز بنگریم، شاید به طور کلّی، پنج مورد ارزش بررسی داشته باشد:

1. لزوم پالایش مستمرّ اطّلاعات در محصولات ارائه شده نور:

به عنوان مقدّمه عرض می‌کنم که در تولید محتوای دیجیتالی، اگر متن و یا محتوای اشتباهی در کتاب و منبعی معتبر وجود داشته باشد و یا در تبدیل متون به منابع دیجیتالی از سوی اپراتور و واردکننده اطّلاعات خطایی پیش بیاید، این اشتباه می‌تواند به صورت سلسله‌وار در تولیدات و محصولات نرم‌افزاری ادامه یابد. اکنون به نمونه‌ای می‌پردازم که برای پژوهشگران، قابل ارزیابی است. شیخ طوسی در تفسیر «التبیان» در موارد فراوانی به نقل نظرات ابوجعفر طبری، صاحب تفسیر «جامع البیان» پرداخته و برای بیان نظرات او، از عبارت «قال ابوجعفر» استفاده می‌کند. در نسل‌های بعدی، صاحب تفسیر «مجمع البیان» نیز با مطالعه تبیان شیخ طوسی، نقل‌های ایشان از طبری را به گونه‌ای بازگو می‌کند که گویا نظر طبری، روایتی از امام ابوجعفر باقر(ع) است! و در ادامه، منابع بعدی، مانند بحار الأنوار، این نظرات را به عنوان حدیثی از امام پنجم(ع) نقل می‌کنند.

چنین اشتباهاتی می‌تواند در استناد به نرم‌افزارهای مرکز نیز رخ دهد و از آنجا که پژوهشگران، این نرمافزارها را به عنوان منابعی قابل اعتماد ارزیابی می‌کنند، خود را محتاج نمی‌دانند که به اصل کتابی که تصویر آن در حاشیه متن نیز ضمیمه شده، مراجعه کنند و بین آن دو انطباق دهند. ازاین‌رو، اگر اشتباهی در متن، و حتّی موضوعات، نمایه‌ها، اعراب‌ها و یا فرمت‌ها، در مجموعه اطّلاعات مرکز وجود داشته باشد، ممکن است به صورت پیاپی در متون بعدی پژوهشگرانی که از نرم‌افزارها و پایگاه‌های ما استفاده می‌کنند، تکرار شود. به همین جهت، معتقدم با آنکه شاید در یک مقاله و یک کتاب، وجود برخی اغلاط املائی قابل اغماض باشد، امّا نباید از وجود حتّی یک غلط لفظی یا موضوعی در نرم‌افزارهای مرکز چشم‌پوشی کرد.

در ابتداء فعّالیّت مرکز، مصحّحان بدون در اختیار داشتن ابزارهای هوشمند، با مراجعه به منابع، لغتنامه‌ها و حتّی گفت‌وگو و مباحثه فراوان، تلاش در تصحیح حدّاکثری متون داشتند؛ ولی آن روش هم زمان‌بر بود و هم هزینه فراوانی را به دنبال داشت. به همین دلیل، آماده‌سازی نرم‌افزارها را طولانی‌تر می‌کرد. ازاین‌رو، قرار شد که فرایند تولید داده‌ها و فراداده‌ها سرعت بیشتری یابد و برخی دقّت‌ها فعلاً انجام نشود و به زمان دیگری موکول گردد. استدلال این قضیه، چنین بود که اگر نرم‌افزاری با چند غلط املائی، امّا سریعتر به دست کاربران برسد، ارزشمندتر از آن خواهد بود که محصولی بدون غلط، امّا بسیار دیر در اختیار آنان قرار گیرد. این استدلال با توجّه به درخواست‌های مکرّر پژوهشگران و مراکز نهادهای پژوهشی برای بهره‌مندی از محصولات نور، در جای خودش، استدلالی صحیح و قابل پذیرش بود؛ امّا مشروط به اینکه اغلاط باقیمانده در متون، به ورطه فراموشی سپرده نشود؛ بلکه پالایش اطّلاعات به صورت فعّالیّتی مستمرّ و با روش های گوناگون ادامه یافته، نتیجه آن، در نسخه های بعدی اِعمال شود؛ امّا به دلیل کثرت تولیدات و مشکلات منابع اعتباری و نیروهای انسانی، چنین فعّالیّتی به صورت یک فعّالیّت رسمی و مستمرّ در مرکز ایجاد نشد. بنابراین، پیشنهاد می‌شود با استفاده از روش های گوناگون و ابزارهای هوشمند که چند سال قبل، برخی از آنها را در قالب طرحی به نام «ماشین تصحیح» عرضه گردید، انواع اطّلاعات موجود در مرکز به صورت مداوم مورد بررسی و پالایش قرار بگیرد و به تصحیح سریع و اوّلیه آنها بسنده نشود.

در این خصوص بحمدالله، این گروه که بنده در آن مشغولم، ضمن فعّالیّت تعریف‌شده‌ای که برای تعیین وضعیت صرفی کلمات موجود در کل دیتای مرکز داریم، به صورت یک کار فرعی و حاشیه‌ای، اغلاط موجود در آنها را نیز با تگ‌هایی مشخّص می‌کنیم که به صورت فهرستی آماده ‌شده و در انتظار اصلاح است.

2. انبار شدن و نگه‌داشت اطّلاعات و پژوهش‌ها:

در نشر مکتوب و نیز محتواهای دیجیتال به صورت برون‌خط، همواره این امکان وجود دارد که نتیجه برخی فعّالیّت‌های پژوهشی به‌تدریج گردآوری و انبار شود تا در زمان مناسب، در اختیار مخاطبان قرار گیرد؛ امّا امروزه این روش، معنایی ندارد. در همین راستا، اکنون بسیاری از تولیدات مرکز به صورت فوری و روزآمد در پایگاه ها در اختیار کاربران قرار می گیرد؛ ولی هنوز روش ذخیره و انبارسازی اطّلاعات به صورت کامل در مرکز منسوخ نشده و به همین دلیل، انبوهی از پژوهش‌های گذشته در بانک اطّلاعات مرکز وجود دارد که احتمال به فراموشی سپردن آنها می‌رود. ازاین‌رو، باید به سمت‌وسویی برویم که نه پژوهش‌ها و نه منابع انبارشده ای از گذشته داشته باشیم و نه در آینده اطّلاعاتی را انبار کنیم؛ بلکه به صورت روزآمد، محتواها و تولیدات پژوهشی را برخط ارائه نماییم.

3. ارائه نشدن خلاصه دانش:

می‌دانیم که مطالب موجود در بسیاری از کتاب‌ها و منابع، دانشی است که بارها و بارها در منابع دیگر تکرار شده‌اند و این امر، در نشر مکتوب، نه تنها یک عیب نیست، بلکه ارزش استنادی اثر را در مواردی بالا می‌برد. از طرفی امروزه، با توجّه به امکان دسترسی سریع به انبوه داده‌ها، نوشتن کتاب و مقاله بسیار ساده‌تر شده است؛ به‌ویژه اگر نگارش با هدف خلاصه‌سازی یک اثر و یا تلفیق چند اثر باشد.

افزودن مداوم منابع و محتواهای سنگین به نرم‌افزارهای نور و ارائه متون کامل کتب در بازیابی داده‌ها در برخی از محصولات مرکز، نوعی تکرار دانش و محتوا به شمار می‌رود. این دانش تکراری در داده‌های کلان رقومی، ارزش افزوده بسیار اندکی دارد و در موارد بسیاری، حتّی به عنوان نوعی سرعت‌گیر در جست‌وجوهای لفظی و تحلیل‌های هوشمند مبتنی بر دیتا عمل می‌کند؛ به عنوان نمونه، تألیف کتاب «مختصر المیزان» برای کاربرانی که فضای کافی برای نگهداری کتاب را ندارند و یا به دنبال مرور سریع مطالب مهم در کتاب اصلی می‌باشند، می‌تواند کاربردی و مفید باشد؛ امّا درج هم‌زمان آن را با کتاب اصلی در برخی از نرم‌افزارهای نور، مفید نمی‌دانم؛ به‌ویژه آنکه می‌توان با نوعی فرمت‌گذاری ـ احیاناً با استفاده از همان کتاب مختصر ـ مطالب مهم کتاب اصلی را مشخّص کرد. ازاین‌رو، برای آسان و سریعتر شدن پژوهش‌های عادّی و هوشمند، به‌ناچار باید به سوی خلاصه‌سازی دانش‌ها گام برداشت. این توضیح را لازم می دانم که خلاصه سازی دانش در نشر مکتوب، با این مشکل روبه‌روست که بسیاری از پژوهشگران مطمئن نیستند در خلاصه ارائه‌شده، هیچ بخشی از دانش از بین نرفته است؛ امّا در خلاصه‌سازی رقومی و نرم افزاری، می توان انبوه دانش تکراری را حذف نکرد؛ بلکه آن را در لایه زیرین نگهداری نمود و تنها در لایه بیرونی به ارائه چکیده دانش پرداخت و آن دو لایه را با کدهایی به هم مرتبط نمود. پس، جایی برای بی‌اعتمادی باقی نخواهد ماند. به نظر می رسد، بیشتر اطّلاعات موجود در نرم‌افزارهای دانش‌محور مرکز نور، قابل انتقال به لایه زیرین باشد. در همین راستا و به عنوان یک نمونه، در پایگاه لغت‌نامه نور، روش خلاصه‌سازی دانش را هدف قرار دادیم و در مسیر آن قرار گرفتیم و تا اندازه بسیاری نیز موفّق شدیم. در پایگاه جامع الأحادیث مرکز نیز تا حدّ فراوانی این موضوع مورد توجّه قرار گرفته است.

4. کم‌رنگ بودن نیازسنجی مخاطبان:

برای بیان این نقد، ابتداء مخاطبان اطّلاعات را از یک نگاه به سه گروه تقسیم می‌کنم:

  • الف. آنان‌که شنونده و مصرف‌کننده دانش‌اند و نقش چندانی در تحلیل و بررسی دانش‌ها و گفته ها ندارند.
  • ب. آنان‌که تنها پژوهش خاصّی را به صورت بسیار محدود و آن هم به صورت مقطعی دنبال می‌کنند.
  • ج. پژوهشگرانی که زندگی خود را وقف یادگیری، پژوهش و تولید علم و آموختن به دیگران قرار داده‌اند.

گروه اوّل را می توان مخاطبانی عمومی دانست که پرداختن به نیازهای آنان، هر چند ارزشمند است، امّا با توجّه به وجود افراد و نهادهای بسیار متعدّدی که متصدّی ارتباط با آنان و تأمین نیاز آنان هستند، به نظر می‌رسد لزوم چندانی برای ورود مرکز نور برای رفع نیاز این دسته از مخاطبان نیست؛ به این معنا که اگر مرکز نور خود را موظّف به ورود به این فضا نیز نماید، ناخودآگاه از برخی اهداف اصلی خویش دور می‌شود و سرعت رسیدن به آن اهداف کاهش خواهد یافت. به‌هرحال، چنین فعّالیّت‌های عمومی، تنها در صورتی توجیه‌پذیر است که توان فنّی ـ پژوهشی مرکز را درگیر خود نکند و با تعریف پروژه‌های مشخّص و هدفمند، با برون‌سپاری و مدیریت ستادی، از افراد و گروه‌های غیرتخصّصی برای این تولیدات بهره‌مند شود.

در مورد گروه دوم نیز معتقدم که خودِ آنها باید کمی بیشتر تلاش کنند و به نتیجه مورد نظر خود دست یابند؛ به عنوان نمونه، فردی که تصمیم به نگارش پایان‌نامه و یا مقاله‌ای در مورد شیخ بهایی دارد، باید از طریق منابع و نرم‌افزارهای مختلف به آنچه می‌خواهد، دست یابد. بر این اساس، به نظرم این وظیفه مرکز نیست که محصولی تولید کند که در راستای سامان بخشیدن به پژوهشی باشد که مثلاً یک شخص به عنوان یک اثر علمی محدود، متقبّل انجام آن شده است؛ زیرا تولید یک نرم‌افزار و محصول با موضوعی محدود و معین، مانند محصولات شخصیت‌محور، در مرکز نور هزینه‌های بسیاری دارد. ازاین‌رو، مرکز می‌تواند با برخی فیلترگذاری‌ها و هوشمندسازی‌ها در نرم‌افزارهای دانش‌محور و دائرة‌المعارفی، افزون بر آنچه اکنون در این محصولات طراحی شده است، امکانی را فراهم سازد که با محدود ساختن محتوا، مطالب مورد نیاز این گروه از کاربران در دسترس‌شان قرار گیرد؛ مثلاً در پایگاهی که همه منابع مرکز در آنجا ارائه شده، با طراحی فیلترهایی مشخّص، همه محتواهای مربوط به شیخ بهایی یکجا ارائه و مورد پژوهش قرار گیرد.

امّا گروه سوم که پژوهشگران و مؤسّسات و نهادهایی دانش‌محوری هستند، همه‌جانبه در علوم اسلامی ورود کرده‌‎اند و مولّد علم و دانش محسوب می‌شوند و سایر مراکز و نهادهای علمی و آموزشی را تغذیه می‌نمایند. اینان مخاطبان اصلی مرکز نور به شمار می‌آیند. نیازهای این گروه، همواره باید به صورت همه‌جانبه و با استفاده از روش های مختلف، از سوی مرکز سنجیده شود و موضوعاتی که نیاز بیشتری به توجّه دارند یا در زمینه آنها خلأ وجود دارد، در دستور و اولویت کار قرار گیرد؛ زیرا از اهداف اصلی مرکز نور، خدمت‌رسانی به این گروه از مخاطبان است.

 5. تلاش در جذب نیروهای پُرانگیزه و سعی در جهت حفظ این انگیزه‌ها:

در طول این سه دهه، همواره نیروهای پُرتلاش و باانگیزه فراوانی به همکاری با مرکز پرداخته‌اند؛ ولی روند جذب و نگهداری منابع انسانی در مرکز، غالباً به شیوه‌ای مطلوب نبوده و با آنکه افراد مستعدّی شناسایی و دعوت به همکاری شده‌اند، امّا معمولاً اطّلاع‌رسانی و آزمون عمومی برای جذب نیرو انجام نشده است و نیز برای تعلّق خاطر و حفظ انگیزه نیروهای موجود نیز به اندازه کافی برنامه‌ریزی نشده است. ازاین‌رو، در مواردی می‌بینیم که در صورت به وجود آمدن زمینه‌های شغلی بهتر برای برخی از دوستان، از ادامه همکاری با آنان محروم می‌شویم. متأسّفانه، باید اذعان کرد که این روند، کم‌وبیش در بیشتر نهادهای علمی و پژوهشی دیده می‌شود.

به‌هرحال، نقدهایی که بیان شد، لزوماً نقد از یک فرد و یا قسمتی از مرکز نیست و ممکن است حجم سنگین کارها و نیز تحمیل برخی شرایط، مانند محدودیت منابع و دشواری فعّالیّت‌های فرهنگی در کشور، منجر به آن شده باشد و در نتیجه، ناخواسته از برخی امور غفلت شود.

» در پایان، اگر مطلبی باقی مانده است، بیان بفرمایید.

◊ در پایان عرایضم، می‌خواهم روی نکته‌ای مهم در جهت پویایی بیشتر کار مرکز تأکید کنم؛ البته ممکن است تمام آنچه در این گفت‌وگو بیان شد، مورد پذیرش همه همکاران و یا دیگر متخصّصانی که نظرشان برایم بسیار محترم است، نباشد؛ امّا به صورت خلاصه، پویایی و رشد مرکز را در این می‌بینم که همواره در مسیر پژوهش و تحقیق گام بردارد و دیگر امور را حتّی اگر ارزشمند باشند، به دیگران بسپارد؛ مگر آنکه بتوان آنها را به عنوان مقدمه‌ای برای تحقیق و ایجاد پیکره‌ها و شناسایی نیازها و مسائلی از این دست، رده‌بندی کرد.

علاوه بر آن، پژوهشی که در مرکز انجام می‌شود، باید تنها پژوهشی مبتنی بر فنّاوری اطّلاعات باشد و با پیشرفت دانش رایانه‌ای، نوع این پژوهش‌ها نیز پیشرفت کند و از تحقیقات علمی غیرمرتبط با رایانه، هر چند بسیار ارزشمند باشد، خودداری گردد و این اجازه داده شود که افراد و نهادهای مرتبط، عهده‌دار آن دسته از پژوهش‌های تخصّصی، امّا غیرمرتبط با رایانه شوند.

همچنین، دایره فعّالیّت‌های مرکز، تنها بر محور دانش اسلامی شکل گیرد و به فعّالیّت‌هایی پرداخته نشود که در پیشرفت دانش اسلامی تأثیرگذار نخواهد بود.

این‌گونه است که سه رکن مرکز که در نامش نیز گنجانده شده، یعنی «تحقیقی بودن»، «کامپیوتری بودن» و «اسلامی بودن»، به عنوان معیاری برای ارزشگذاری و پویایی فعّالیّت‌های مرکز قرار خواهد گرفت. مهم‌تر از تمام موارد فوق، یکپارچه کردن تمام فعّالیّت‌ها و خروجی‌ها و توقّف تدریجی تمام فعّالیّت‌های جزیره‌ای و ناپیوسته است.

از فرصتی که فصلنامه ره‌آورد نور در اختیار بنده قرار داد، متشکرم. پیشرفت روزافزون برای مرکز نور و همه همکاران و عزیزان در این مجموعه پُرتلاش و خدوم را از درگاه الهی مسئلت دارم.

اطلاعات تکميلي

  • تاریخ انتشار نسخه چاپی: دوشنبه, 26 خرداد 1399
  • صفحه در فصلنامه: صفحه 40
  • شماره فصلنامه: فصلنامه شماره 70
بازدید 7159 بار
شما اينجا هستيد:خانه فهرست موضوعی فصلنامه شماره 70 (بهار 1399) صرف و نحو و اعراب گذاری ماشینی متون، نتیجه هوشمندسازی تولیدات نور است