* لطفاً خودتان را معرّفی کنید و بفرمایید محتوای رقومی مرکز نور، از چه پیشینهای برخوردار است؟
◊ بنده سید علیرضا رضوی هستم. از سال ۱۳۷۹ به عنوان عضوی از خانواده بزرگ مرکز نور مشغول به فعّالیت شدهام. در ابتدا، در بخش فرمتگذاری اطّلاعات که زیرمجموعه معاونت پژوهش - در آن زمان معاونت تحقیقات - بود، مشغول به کار شدم.
حدود یک دهه را صرف فرمتگذاری منابع کتابخانهای مرکز با استفاده از فرمتهای تخصّصی و عمومی کردم. پس از آن، حدود ۱۰ سال در سمت مدیریت پروژه فعّالیت داشتم و با تشکیل بخش «مدیریت پروژه» در معاونت پژوهش، و سپس انتقال آن به حوزه ریاست، مسئولیت این بخش را بر عهده گرفتم. در نهایت، از حدود ۳ سال پیش، به پژوهشکده علم اطّلاعات مرکز نور پیوستم.
تاریخچه دیجیتالسازی اطّلاعات در مرکز نور
مرکز نور از آغاز فعّالیت خود در دهه ۷۰، با هدف جمعآوری و دیجیتالیسازی منابع اسلامی، گامهای مهمی برداشته است. با توجّه به محدودیتهای سختافزاری آن دوره، امکان واردکردن اطّلاعات به صورت گسترده وجود نداشت. به همین دلیل، در ابتدا تنها بخش کوچکی از متون اسلامی، عمدتاً متون روایی و تفسیری و منابع اوّلیه، به صورت محدود بر روی فلاپی دیسکها ذخیره میشد.
توسعه و تحوّلات دیجیتالسازی
با پیشرفت فنّاوری در دهه ۸۰، امکان ذخیرهسازی اطّلاعات بر روی هارددیسک فراهم شد. این تحوّل، جهشی در فرایند دیجیتالسازی مرکز نور ایجاد کرد. در این دوره، ورود اطّلاعات با توسعه منابع هدف، به طور قابل توجّهی گسترش یافت؛ تا جایی که از اواخر دهه 80، سالانه حدود ۲۰۰۰ جلد کتاب به مجموعه دیجیتال نور افزوده میشد؛ هرچند در برخی سالها به دلیل مشکلات بودجهای، با کاهش تایپ متون مواجه بودیم.
در همین دوره، یکی از پروژههای مهم مرکز با عنوان «نورمگز (وبگاه مجلّات تخصّصی نور) آغاز شد. مجلّات و مقالات، حاوی قسمت مهمی از دانش علوم اسلامی و انسانی این مرزوبوم بود و بدون دسترسپذیر شدن آن، نیازهای محقّقان برآورده نمیشد. ازاینرو، دیجیتالسازی مجلّات به صورت کامل (متن و تصویر) آغاز شد و پس از دو دهه تلاش مستمرّ، دارای بزرگترین بانک اطّلاعاتی مقالات شدیم که اکنون روزانه بیش از 250 هزار نفر بازدیدکننده دارد.
در همین راستا، افزودن مقالاتی که در مجلّات منتشر نشده و به شکل مجموعه مقالات انتشاریافته و یا در همایشهای مختلف ارائه گردیده، از برنامههای آینده نورمگز است.
از دیگر داراییهای مرکز، اطّلاعاتی است که سایر مراکز علمی و فرهنگی و افراد فرهیخته در اختیار مرکز قرار دادهاند. از دهه ۹۰، همکاری با شرکای فرهنگی بهشدّت گسترش یافت و با انعقاد تفاهمنامه و قراردادهای مختلف با ناشران و مؤسّسات علمی و شخصیتها، یک نسخه از اطّلاعاتی که در اختیار آنان بود، به مرکز داده شد.
از سال ۱۴۰۰، مرکز تصمیم گرفت گام بزرگ دیگری را در جهت دیجیتالسازی منابع اسلامی و انسانی بردارد. بر اساس سند چشمانداز ما، باید نسخه رقومی کلیه متون علوم اسلامی و انسانی را در اختیار داشته باشیم. بنابراین، در مرحله نخست، تمرکز بر جمعآوری منابع از کتابخانههای تخصّصی قم در دستور کار قرار گرفت. این پروژه، با چالشهای مختلفی همراه بود. یکی از مهمّترین چالشها، تأمین زیرساختهای سختافزاری موردنیاز برای اسکن حجم عظیمی از منابع کتابخانهها بود که خوشبختانه، با حمایت همهجانبه ریاست مرکز، این مشکل برطرف شد.
چالش دیگری که با آن مواجه بودیم، تعامل با مسئولان کتابخانهها بود. کتاب، یک دارایی ارزشمند است و واگذاری آنها برای دیجیتالسازی، نیازمند اعتمادسازی بود. بااینحال، با تلاشهای مستمرّ و ایجاد ارتباطات مؤثّر، موفّق شدیم با بسیاری از کتابخانههای قم تعامل کنیم و در پی آن، با استقبال و همکاری بسیار خوب متصدیان کتابخانهها همراه شدیم و تاکنون فرایند فهرستنویسی و تصویربرداری از منابع بیش از ده کتابخانه تخصّصی مانند: کتابخانه مؤسّسه معارف اسلامی (امام رضا(علیه السلام))، کتابخانه تخصّصی تفسیر و علوم قرآنی، کتابخانه تاریخ ایران و اسلام، کتابخانه دارالحدیث، کتابخانه جامعة المصطفی، کتابخانه تخصّصی کلام، کتابخانه تخصّصی فقه و اصول و برخی کتابخانههای دیگر، به اتمام رسیده است و سایر کتابخانههای قم و در گام بعد خارج از قم نیز در دستور کار قرار دارد.
هدفگذاری تعداد منابع برای تصویربرداری در امسال، افزودن ۲۵ هزار جلد کتاب به مجموعه است که این هدف، با توجّه به منابع موجود و تلاش گروه، کاملاً دستیافتنی است و میتوانیم در سالهای آتی، در صورت افزایش بودجه، بیش از این تعداد را نیز به مجموعه بیفزاییم.
گفتنی است که فرایند افزودن کتابها، به این سادگی نیست. هر کتابخانهای دارای مجموعه متنوّعی از کتابهاست که نیازمند بررسی دقیق است. بسیاری از کتابها، ممکن است تکراری یا غیرمرتبط با حوزه فعّالیت ما باشند. به همین دلیل، تیم کارشناسی ما، پس از بازدید از هر کتابخانه، به بررسی دقیق کتابها میپردازد و صرفاً کتابهای ارزشمند و مورد نیاز را انتخاب میکند.
پس از انتخاب کتابها، یک تیم دیگر، وظیفه مقایسه این کتابها با مجموعه موجود را بر عهده دارد؛ تا از تکراری بودن آنها جلوگیری شود. در برخی موارد، ممکن است دو نسخه از یک کتاب، با تصحیحهای مختلف در مجموعه وجود داشته باشد که هرکدام ارزش خاصّ خود را داشته باشند و لازم باشد ما هر دو نسخه را دارا شویم.
این فرایند، دقّت و زمان زیادی میطلبد؛ بهخصوص با افزایش حجم منابع مرکز. بااینحال، با برنامهریزی دقیق و استفاده از ابزارهای مناسب، امیدواریم به هدف خود دست یابیم.
یکی دیگر از منابع مهم، پایاننامهها هستند. اگرچه جمعآوری پایاننامهها به دلیل مسائل مربوط به مالکیت معنوی با چالشهایی همراه است، امّا تلاش میکنیم تا با همکاری دانشگاهها، به این منبع ارزشمند نیز دسترسی پیدا کنیم.
نسخههای خطّی نیز به عنوان بخش مهمی از میراث فرهنگی ما، در اولویت جمعآوری قرار دارند. بسیاری از این نسخهها در کتابخانههای عمومی و یا خصوصی نگهداری میشوند. دسترسی به این نسخهها و دیجیتالسازی آنها، به پژوهشگران کمک خواهد کرد تا به منابع اوّلیه دسترسی داشته باشند.
هدف نهایی ما، ایجاد یک پایگاه داده جامع و یکپارچه است که تمامی منابع مورد نیاز پژوهشگران در حوزههای اسلامی و انسانی را در برگیرد.
* فرایند تولید محتواهای رقومی و تبدیل به اطّلاعات قابل پردازش چگونه است؟
◊ فرایند دقیق تولید محتوا و غنیسازی اطّلاعات در مرکز نور
مرکز نور برای تولید محتوای دیجیتال با کیفیت بالا، از فرایندهای چندمرحلهای و دقیقی استفاده میکند. در مرحله اوّل، متن دو بار توسط دو نفر با دقّت بالا و حدّاقل اشتباه، تایپ میشود. سپس، هر دو متن با نرمافزاری دقیق مقایسه میشود و در صورت اختلاف دو تایپ، یک محقّق متن را مانند نسخه چاپی تصحیح میکند.
در برخی متون که اهمّیّت بیشتری دارند، تصحیح دیگری بر روی آن انجام میشود. در این فرایند، فهرستی از کلمات به صورت غیرتکراری استخراج شده و توسط گروهی از کارشناسان متخصّص، بهدقّت بررسی میشود. هدف از این کار، شناسایی و تصحیح خطاهای احتمالی در املا، نگارش و اصطلاحات است. به دلیل حسّاسیت بالای برخی پروژهها، مانند پروژههای حدیثی و تفسیری، انجام این فرایند، برای آنها اجباری است.
پس از تصحیح نهایی متن، مرحله تگگذاری و فرمتگذاری آغاز میشود. در این مرحله، با استفاده از برچسبهای خاصّ، عناصر مختلف متن مانند: سرصفحهها، عناوین و زیرعنوانها، پاورقیها، آیات، روایات و شعر، مشخّص میشود و ارتباط بین متنها نیز تعیین میگردد. این کار، به ایجاد ساختار منظم و قابل جستوجوی اطّلاعات کمک میکند و امکان استخراج اطّلاعات خاصّ را فراهم میسازد.
* در حال حاضر هم به همین روش کار میکنید؟ یا اینکه از هوش مصنوعی در جمعآوری اطّلاعات استفاده مینمایید؟
◊ روشهای جاری تولید محتوای دیجیتال در مرکز نور
مرکز نور همچنان به رویکرد سنّتی خود در تولید محتوای باکیفیت و دقیق، پایبند است. با وجود پیشرفتهای چشمگیر در حوزه OCR و همچنین هوش مصنوعی، مرکز برای اطمینان از دقّت و صحّت اطّلاعات، همچنان از روش تایپ دستی و تصحیح چندمرحلهای استفاده میکند. اعتماد کاربران و پژوهشگران، برای ما بسیار مهم است. بنابراین، باید متنی با اتقان صددرصد در اختیارشان قرار دهیم و وجود خطا در تولیدات مرکز، هرچند با درصدهای پایین، موجب سلب اطمینان از ما میشود. پس، همچنان مانند سابق ورود اطّلاعات میشود و این رویکرد، اگرچه زمانبر است، امّا تضمینکننده کیفیت بالای دادههای تولیدی است.
فرایند تولید تصاویر دیجیتال
پس از شناسایی یک کتاب ارزشمند برای افزودن به مجموعه، کتاب ابتدا فهرستنویسی میشود. سپس، کتاب برای اسکن به بخش مربوطه ارسال میشود. تصاویر اسکنشده، تحت پردازشهایی روتوش، تنظیم اندازه و بهبود کیفیت قرار میگیرند. پس از اطمینان از کیفیت مناسب تصاویر و همچنین بررسی مجوز نشر، درصورتیکه هیچ محدودیت حقوقی وجود نداشته باشد، تصاویر اسکنشده بر روی پلتفرم نورلایب نیز منتشر میشوند.
* به طور کلّی، محتواهای رقومی مرکز در چه نوع دستهبندیهایی قرار دارند؟
◊ دستهبندی محتوای دیجیتال در مرکز نور
محتوای دیجیتال موجود در مرکز نور، به طور کلّی به چهار دسته اصلی تقسیم میشود:
- کتاب چاپی: این دسته، شامل کتابهایی است که پس از دیجیتالیشدن، به پایگاه دادههای مرکز اضافه شدهاند.
- مقاله: مقالات علمی و پژوهشی که معمولاً در مجلّات تخصّصی منتشر میشوند، دسته دوم محتوای دیجیتال مرکز را تشکیل میدهند.
- پایاننامه: پایاننامههای دانشجویی در مقاطع مختلف تحصیلی نیز بهعنوان منبع ارزشمند در این مرکز نگهداری میشوند.
- نسخه خطّی: نسخههای خطّی کتابها و متون که قدمت تاریخی دارند و به صورت دستی نگاشته شدهاند، دسته چهارم محتوای دیجیتال مرکز را شامل میشوند.
این دستهبندی، به مرکز کمک میکند تا محتوای خود را به صورت منظم و قابل دسترس سازماندهی کرده، کاربران را در یافتن منابع مورد نظر خود یاری کند.
* از نظر آماری، اطّلاعات ذخیرهشده یا تولیدشده نور، چه حجمی را به خود اختصاص داده است؟
◊ مرکز نور با گذشت سالها فعّالیت مستمرّ، موفّق به گردآوری حجم عظیمی از اطّلاعات دیجیتال شده است. این اطّلاعات، در چهار دسته اصلی: کتاب، مقاله، پایاننامه و نسخه خطّی طبقهبندی میشوند که شرح هر دسته، بدین قرار است:
- - کتاب: مرکز نور دارای 140,000 عنوان کتاب است. از این تعداد، 115,000 جلد در پایگاه نورلایب مرکز قابل دسترسی است.
- - مقاله: بیش از 1.5 میلیون مقاله علمی در پایگاه دادههای مرکز موجود است.
- - پایاننامه: مرکز نور در حال حاضر، 150,000 پایاننامه را در اختیار دارد و 80,000 پایاننامه با متن یا تصویر در پورتال نورداک قابل دسترسی است.
- - بانک سمیم نور: پایگاه سمیم نور به منظور مشابهیابی متون، دارای بانکی غنی مشتمل بر 45 هزار جلد کتاب، بیش از 900 هزار مقاله، 150 هزار پایاننامه و 4.5 میلیون صفحات وب است.
اهمّیّت مجوزهای نشر
مرکز نور برای عرضه هرگونه محتوا، حتماً مجوز لازم را از مؤلّف یا ناشر اخذ میکند. تاکنون بیش از 3500 نفر از فرهیختگان کشور به مرکز نور مجوز استفاده از آثار خود را دادهاند. همچنین، بیش از 2600 قرارداد با سازمانها و مراکز علمی برای عرضه دادههای آنان منعقد شده است که این امر، نشان از اعتماد بالای جامعه علمی به مرکز نور و اهمّیّت این مرکز در حفظ و نشر آثار علمی و فرهنگی دارد.
مرکز برای دستیابی به اهداف بلندمدّت خود، نیازمند حمایتهای مستقیم حاکمیتی در جهت اخذ مجوز انتشار و رفع موانع حقوقی نشر اطّلاعات است.
* چشمانداز مرکز را در این باره چگونه میدانید؟
◊ مرکز نور با حجم عظیمی از دادهها و بیش از 3 دهه تجربه و مهمّتر از همه، جایگاه و اعتمادی که در جامعه علمی ایجاد کرده است، جزیی از زیستبوم پژوهشی در حوزه علوم اسلامی و انسانی شده است و بر اساس سند چشمانداز نور، باید حایز رتبه اوّل در این زمینه شویم. از سوی دیگر، این مرکز با بهرهگیری از فنّاوریهای نوین و ایجاد زیرساختهای قدرتمند فنّی، به دنبال ایجاد یک اکوسیستم پویا و هوشمند است که در آن، کاربران بتوانند بهسرعت و سهولت به اطّلاعات مورد نظر خود دسترسی پیدا کنند و از ابزارهای پیشرفته برای تحلیل و بررسی دادهها استفاده نمایند.
اهداف کلیدی نور
- - توسعه پایگاه داده: افزایش سالیانه تعداد عناوین دیجیتالیشده به ۲۵ هزار که اکثر قریب به اتّفاق منابع مورد نیاز پژوهشگران حوزه مأموریت ما را پوشش دهد.
- - ارتقاء کیفیت دادهها: تضمین صحّت، دقّت و کاملبودن اطّلاعات موجود در پایگاه داده، با استفاده از فرایندهای کنترل کیفیت دقیق و بهروزرسانی مستمرّ.
- - توسعه خدمات ارزش افزوده: ارائه خدمات مبتنی بر داده، مانند: جستوجوی هوشمند، تحلیل متن، استخراج اطّلاعات و ایجاد ارتباطات معنایی بین منابع.
- - تعامل با جامعه علمی: ایجاد یک جامعه کاربری فعّال و جمعآوری بازخوردهای آنها برای بهبود مستمرّ خدمات و توسعه ابزارهای جدید.
- - همکاریهای بینالمللی: مشارکت در پروژههای بینالمللی و تبادل دانش با مراکز مشابه در سطح جهان.
با تحقّق این اهداف، مرکز نور بهعنوان یک مرجع معتبر در سطح ملّی و بینالمللی شناخته خواهد شد و به توسعه دانش و پژوهش در حوزه علوم اسلامی و انسانی کمک شایانی خواهد کرد.
شاخصهای موفّقیت مرکز
- افزایش تعداد کاربران و میزان استفاده از منابع؛
- افزایش تعداد استنادات به منابع مرکز در مقالات علمی؛
- توسعه ابزارها و خدمات نوآورانه؛
- ارتقاء رضایتمندی کاربران.
ما معتقدیم که دسترسی آزاد به دانش، یکی از مهمّترین عوامل توسعه و پیشرفت جوامع است. به همین دلیل، مرکز نور با حفظ حقوق مالکیت معنوی، تلاش میکند تا محتوا را به صورت گسترده در اختیار عموم قرار دهد و به این ترتیب، به ارتقاء سطح علمی و فرهنگی جامعه کمک کند.
* از فهرستهای آماده در کتابخانهها در خصوص شناخت کتابها هم استفاده میشود؟
◊ فهرستهای کتابخانهها، اطّلاعات محدودی مانند: نام کتاب، نویسنده، سال نشر و... را در اختیار ما قرار میدهند. این اطّلاعات، برای تصمیمگیری در مورد ارزش یک کتاب کافی نیست. به همین دلیل، ما بر بررسی و رؤیت نسخه چاپی کتابها توسط کارشناسان، تأکید میکنیم. کارشناسان با مطالعه بخشهایی از کتاب، میتوانند به طور دقیقتر در باره ارزش آن قضاوت کنند.
این رویکرد دقیق، بهویژه هنگامی که با بودجه محدودی روبهرو هستیم، ضروری است. افزودن کتابهای نامرتبط به مجموعه، نه تنها هدردادن منابع مالی است، بلکه میتواند به کاهش سطح کیفی منابع نیز منجر شود.
* لطفاً ضمن معرّفی پژوهشکده علم اطّلاعات و دانششناسی که جنابعالی ریاست آن را بر عهده دارید، اهداف و برنامههای آن را توضیح دهید؟
◊ پژوهشکده علم اطّلاعات و دانششناسی، با هدف گردآوری، سازماندهی و ارائه دسترسی آسان به منابع علمی، بهویژه در حوزههای اسلامی و انسانی، تأسیس شده است. پیش از این، فعّالیتهای پژوهشکده به صورت مجزا در گروههای مختلف انجام میشد؛ امّا از سال ۱۴۰۰، با هدف افزایش بهرهوری و هماهنگی، تمامی این گروهها تحت یک مدیریت واحد تجمیع شدند.
ساختار و وظایف واحدهای پژوهشکده
پژوهشکده علم اطّلاعات و دانششناسی، با هدف شناسایی منابع علوم اسلامی و انسانی و گردآوری و رقومیسازی آن تأسیس شد؛ تا با سازماندهی این منابع با شیوههای نوین، دسترسپذیری و اشتراکگذاری اطّلاعات و خدمترسانی به محقّقان، تسهیل و تسریع گردد.
این پژوهشکده، از چهار گروه تشکیل شده است:
- اداره شناسایی منابع: شناسایی، ارزیابی و جمعآوری اطّلاعات منابع علمی مرتبط با حوزه فعّالیت پژوهشکده، از جمله: کتابها، مقالات، پایاننامهها و سایر اسناد.
- واحد اطّلاعات منابع: تأمین منابع مورد نیاز، ایجاد فهرستهای دقیق و طبقهبندی منابع جمعآوریشده برای دسترسی آسانتر پژوهشگران.
- واحد خدمات فرهنگی: ارتباطگیری با مؤسّسات و پژوهشگران مرتبط با حوزه مأموریت مرکز، به منظور همکاری و همافزایی متقابل و بررسی حقوق مالکیت معنوی منابع، اخذ مجوزهای لازم برای استفاده از آنها و تضمین رعایت قوانین کپیرایت.
- کتابخانههای دیجیتال: این کتابخانهها، عهدهدار عرضه نسخه رقومی منابع مورد نیاز پژوهشگران علوم اسلامی و انسانی در سکوهای مختلف هستند که عبارتاند از:
- - نورلایب: پایگاه ارائه کتابهای الکترونیکی با بیش از ۱۱۰ هزار بازدید روزانه.
- - نورداک: پایگاه ارائه پایاننامهها.
- - نورمگز: پایگاه ارائه مقالات علمی.
- - بانک سمیم: ابزاری قدرتمند برای تشخیص شباهت متون و بررسی اصالت آنها.
دستاوردها و چشمانداز آینده
پژوهشکده تاکنون موفّق به جمعآوری حجم عظیمی از منابع علمی شده است و با ایجاد زیرساختهای دیجیتال، دسترسی به این منابع را برای پژوهشگران آسان نموده است.
مهمّترین چشماندازهای آینده پژوهشکده، عبارتاند از: توسعه بیشتر پایگاه دادهها، بهبود ابزارهای جستوجو و تحلیل اطّلاعات، و افزایش همکاریهای بینالمللی است.