مسیرهای جدید، فراروی مرکز تحقیقات کامپیوتری علوم اسلامی

    گزارشی از چهاردهمین نشست علوم اسلامی انسانی دیجیتال با موضوع «رشد علم و اخلاق پژوهش»

چهارشنبه, 31 خرداد 1402 ساعت 15:01
    نویسنده: به کوشش: هیئت تحریریه فصلنامه ره‌آورد نور
این مورد را ارزیابی کنید
(1 رای)

اشاره

چهاردهمین نشست از سلسله‌نشست‌های علمی علوم اسلامی انسانی دیجیتال، با موضوع «رشد علم و اخلاق پژوهش» در تاریخ 14 اسفندماه 1401ش در مرکز تحقیقات کامپیوتری علوم اسلامی برگزار گردید. در ابتداء جلسه، آقای دکتر نیکنام به عنوان دبیر نشست، ضمن تبریک اعیاد شعبانیه و خوشامدگویی به میهمانان، ریاست پژوهشگاه علوم و فنّاوری اطّلاعات ایران آقای دکتر محمد حسن‌زاده را معرّفی نمود. ایشان، استادتمام علم اطّلاعات و بحث دانش‌شناسی و عضو هیأت علمی دانشگاه تربیت مدرّس است. در رزومه علمی و سوابق اجرایی دکتر حسن‌زاده آمده است: عضو کمیته علوم انسانی مرکز تحقیقات سیاست علمی کشور، عضو کمیته داوران جشنواره بین‌المللی فارابی، رئیس انجمن ارتقاء کتابخانه‌های عمومی ایران، مدیرمسئول و سردبیر و عضو هیئت تحریریه بیش از ده نشریه علمی - پژوهشی، دبیر کمیته برنامه‌ریزی رشته در شورای برنامه‌ریزی آموزش عالی، استاد سرآمد آموزشی دانشگاه تربیت مدرّس در سال 1401، پژوهشگر برتر دانشگاه تربیت مدرس در سال 1399 و برگزیده جشنواره بین‌المللی فارابی.

در این نشست همچنین، جناب آقای دکتر فرهاد شیرانی، عضو هیأت علمی پژوهشگاه علوم و فنّاوری اطّلاعات ایران نیز حضور داشت. ایشان دانش‌آموخته دکترای تخصّصی مدیریت با گرایش مدیریت دانش از دانشگاه تکنولوژی مالزی است. هم‌اکنون به عنوان استادیار پژوهشکده فنّاوری اطّلاعات در گروه پژوهشی کسب‌وکار الکترونیک در پژوهشگاه علوم و فنّاوری اطّلاعات مشغول به فعالیت است. از جمله سوابق مدیریتی ایشان، عبارت است از: رئیس کتابخانه، مدیریت اسناد و اطّلاعات، معاون اطّلاع‌رسانی پژوهشگاه و رئیس مرکز اطّلاعات مدارک علمی ایران. ایشان مقالات متعدّدی در موضوعات مختلف مدیریت اطّلاعات و دانش کارآفرینی، دانش آرشیوهای الکترونیکی و کسب‌وکارهای دانش‌بنیان و... دارد.

آنچه در این نوشتار می‌آید، خلاصه‌ای است از مطالب و مباحثی که در این نشست علمی مطرح شده است.

دکتر محمد حسن‌زاده:

مرکز نور، تسهیل‌گر پژوهش‌های انسانی و اسلامی

آقای دکتر حسن‌زاده ضمن تشکر بابت برگزاری جلسه، مرکز تحقیقات کامپیوتری علوم اسلامی را به‌مثابه یک تسهیل‌گر در حوزه علوم انسانی اسلامی خواند و فعالیت‌ها و آثار مرکز را بی‌نظیر دانست. ایشان در ادامه گفت:

«این مرکز، به خواست الهی، مسیرهای جدیدی در حوزه‌های نو باز خواهد کرد و قطعاً به عنوان یک پژوهشگر و یک دانشجو برای من و همه پژوهشگران علوم انسانی و اسلامی، این محصولات قابل استفاده بوده و برکات فراوانی داشته است. لازم است جلساتی علمی و بدون تشریفات، راجع به مسائل مشترک گذاشته شود تا گام‌های مثبتی برای پیشبرد علم و فنّاوری در کشور برداشته شود.»

علم و فنّاوری، موضوعی راهبردی

ایشان در ادامه، از اهمیت علم و فنّاوری به عنوان یک موضوع راهبردی گفتند و خاطرنشان کرد:

«امروز هیچ شخصی نمی‌تواند نقش اساسی و تعیین‌کننده علم و فنّاوری را نفی کند. علم و فنّاوری، در بین مسئولان ارشد نظام جمهوری اسلامی ایران به عنوان یک حوزه راهبردی مورد توجّه قرار دارد و باید گفت در هیچ زمانی، نگاه تکنیکی یا تاکتیکی به علم و فنّاوری وجود نداشته است. شاهد این مدعا، برنامه‌های توسعه‌ای کشور و سیاست‌های کلی ابلاغی مقام معظم رهبری است که در همه آنها، علم و فنّاوری و نوآوری، جزو مهم‌ترین اولویت‌ها قرار دارد. البته این مهم در سایر کشورها نیز همین اندازه در رشد، خوداتکائی و اعتمادبه‌نفس ملّی، تعیین‌کننده بوده است.»

دکتر حسن‌زاده راجع به پیشرفت علم و فنّاوری در حوزه علوم اسلامی انسانی گفت:

«آنچه امروز مشاهده می‌شود، این است که متخصّصان علوم اسلامی در حوزه‌های فنی و فنّاوری اطّلاعات، جزو سردمداران هستند.»

ایشان در ادامه از لزوم حمایت از مرکز تحقیقات کامپیوتری علوم اسلامی گفت و ابراز داشت:

«منظورم از حمایت، صرفاً حمایت بودجه‌ای نیست؛ بلکه باید همه صاحب‌نظران و محقّقان در حوزه‌های مختلف، به هر نحوی به ارتقای این محصولات کمک کنند، تا این حوزه هویتی، دچار خطا و کندی در حرکت نگردد.»

چهاردهمین جلسه از سلسله نشست های علوم انسانی اسلامی دیجیتال با موضوع «رشد علم و اخلاق پژوهش؛ قابلیت‌ها و چشم‌اندازهای همانندجوی ایرانداک»»

ایرانداک؛ برنامه‌ها و راهبردها

دکتر حسن‌زاده در ادامه راجع به دانشگاه علوم و فنّاوری اطّلاعات ایران (ایرانداک) صحبت کرد و گفت:

«این دانشگاه 54ساله در طول این سالیان، دارای افت‌وخیزهای زیادی بوده است؛ اما امروز در مسیر رشد قرار دارد. اوّلین پایان‌نامه‌ها و رساله‌هایی که در کشور دفاع شده، از سال 1320 تا الآن، در اینجا ثبت شده است. پایان‌نامه و رساله ایرانیان خارج از کشور نیز در دیتای ما وجود دارد. این، افتخار بسیار بزرگی است که ما الآن می‌توانیم به میلیون‌ها رکورد دسترسی داشته باشیم که نتیجه زحمات همکاران ما در طیّ این سال‌های متمادی بوده است.»

ایشان در ادامه، از مشقت‌های پیشینیان در امر پژوهش گفت؛ به عنوان نمونه، در گذشته برای پیداکردن یک کتاب، چندین شهر را می‌پیمودند تا به منبعی دست پیدا کنند.

دکتر حسن‌زاده با اشاره به اهمیت جمع‌آوری پایان‌نامه‌ها به ذکر یک نمونه پرداخت و گفت:

«در یکی از سال‌ها، یکی از بناهای ملّی در تهران را با استفاده از دینامیت‌گذاری ستون‌ها می‌خواستند تخریب کنند. به دنبال این بودند که فروریختن بنا به شکلی باشد که آسیب به همسایه‌ها وارد نشود. به همین جهت، در جست‌وجوی نقشه این بنا بودند که در نهایت، به ایرانداک می‌رسند. با بررسی نقشه‌ها و طرح ستون‌ها و فونداسیون، به این نتیجه می‌رسند که این ساختمان، نه تنها نیاز به تخریب ندارد؛ بلکه می‌تواند برای صدها سال دیگر، به حیات خودش ادامه دهد.»

در ادامه، دکتر حسن‌زاده راهبرد ایرانداک را برشمرد و گفت:

«هدف ما از ابتدا فراهم نمودن دسترسی به اطّلاعات برای پژوهشگران بوده است. در گذشته، طرحی به نام «غدیر» و «امین» اجرا شد که افراد عضو ایرانداک می‌شدند و ایرانداک هزینه اشتراک با کتابخانه‌ها را پرداخت می‌کرد و کتاب‌ها را به پژوهشگران می‌رساند. ایرانداک بابت ارائه اطّلاعات، از مخاطبان خود هزینه‌ای دریافت نمی‌کند؛ اما برای نگهداشت دیتا، هزینه جزئی دریافت می‌نماید. دومین راهبرد ما، تأمین منابع علمی برای دانشگاه‌هاست. ایرانداک به عنوان دبیرخانه تأمین منابع علمی کشور، مفتخر است که با وجود تحریم‌ها و محدودیت‌ها، دسترسی به پایگاه‌های اطّلاعاتی کل دنیا را برای دانشگاه‌ها فراهم نموده است. سومین راهبرد ما، تنظیم‌گری است که در قالب تدوین استانداردها برای کتابخانه‌ها، دستورعمل‌ها و شیوه‌نامه‌ها انجام می‌گیرد. شیوه‌نامه ایران، مبتنی بر دیدگاه‌های نرم‌افزاری امروزه با قابلیت انطباق با شیوه‌های نشانی‌دهی طراحی شده و روزآمدسازی می‌شود؛ صدها پروتکل و برنامه‌های مختلفی که در طول زمان در ایرانداک تولید و عرضه شده و قابلیت استفاده در بخش‌های مختلف را نیز دارد؛ به عنوان نمونه، با وجود اینکه حوزه کشاورزی، حوزه تمرکز ایرانداک نیست، اصطلاح‌نامه کشاورزی را ایجاد نمودیم. اصطلاح‌نامه فنی مهندسی و اصطلاح‌نامه آب محیط زیست نیز از این دست هستند. امروز ما مجموعه‌ای از اصطلاح‌نامه‌ها را داریم که برای کتابخانه‌ها و مراکز اطّلاعات، به عنوان یک نقطه شروع می‌تواند خوب باشد و در ادامه، می‌خواهیم اینها را به آنتولوژی (هستی‌شناسی) تبدیل کنیم. فرایند تحوّل یکی از اصطلاح‌نامه‌ها، هفته گذشته شروع شد و ان‌شاءالله بتوانیم در یک زمان مشخّص، اصطلاح‌نامه‌ها را به آنتولوژی (هستی‌شناسی) تبدیل نماییم. این کار، برای ما استفاده دوگانه دارد: اوّل آنکه بتوانیم از آنها در جست‌وجوها و نمایه‌سازی‌ها استفاده کنیم. دوم اینکه دیگران نیز بتوانند از این امکان بهره‌برداری نمایند. به همین منظور، ارتباطات خوبی در این زمینه برقرار کردیم تا مثلاً در حوزه کشاورزی، سازمان تحقیقات کشاورزی و سایر سازمان‌ها از این قابلیت‌ها استفاده نمایند.»

ایشان در ادامه، راجع وضعیت ثبت پایان‌نامه‌ها در سامانه همانندجو گفت:

«پایان‌نامه‌های وزارت علوم و مراکز زیرمجموعه آن، در این سامانه ثبت می‌شود. از مجموعه وزارت بهداشت، حدود 5درصد از دانشجویان پایان‌نامه خود را در این سامانه ثبت می‌کنند. ما به دنبال این هستیم که این نهاد به عنوان یک نهاد حاکمیتی ملی، گستره و وسعت کار آن، نزدیک به 100درصد پایان‌نامه‌های کشور باشد. ان‌شاءالله در آینده بتوانیم حوزه‌های علمیه و مراکز دیگری را که در تولید آثار مشارکت دارند، بتوانیم در این مهم همراه کنیم. مأموریت ما به معنای واقعی، این است که این کار در سطح ملی انجام گیرد.

نکته مهم، این است که هرچقدر در جامعه‌ای کمیت آثار علمی بالا رود، قاعدتاً کیفیت به همان اندازه رشد نمی‌کند. شاید در گام‌های اوّل، رابطه معکوسی بین کمّیت و کیفیت وجود دارد؛ از این جهت که عدم رعایت استانداردهای اخلاق پژوهش در جامعه علمی، به کج‌روی‌ها، کج‌خلقی‌ها و به عبارتی سرقت علمی منجر می‌شود که ممکن است نظام علمی ما را در داخل کشور و نیز در تعامل با نظام‌های بین‌المللی، دچار آسیب کند. من در مصاحبه‌های مختلف عرض کردم که این عارضه در نظام علمی ما، به نسبت تولیدات علمی، مقدار قابل توجّهی نیست. ما بعد از بررسی‌های مختلف متوجّه شدیم که علّت بخش عمده‌ای از این سوء استفاده یا به عبارتی استفاده‌های نامناسب، ناآگاهی است؛ به عنوان نمونه، گاهی مطلبی را بدون استناد ذکر می‌کنند که به معنای سوء استفاده تلقی می‌شود. انواع مختلف استنادات وجود دارد و ناآگاهی افراد به این موارد، باعث می‌شود که ناخواسته مرتکب بی‌اخلاقی در امر پژوهش باشیم. جهت جلوگیری از این موارد، ما در ایرانداک کارهایی را شروع کردیم.»

چهاردهمین جلسه از سلسله نشست های علوم انسانی اسلامی دیجیتال با موضوع «رشد علم و اخلاق پژوهش؛ قابلیت‌ها و چشم‌اندازهای همانندجوی ایرانداک»»

دکتر حسن‌زاده با اشاره به تصویب قانون مجلس در سال 1396 مبنی بر لزوم ثبت و همانندجویی قرارگرفتن رساله‌ها و پایان‌نامه‌های مراکز علمی کشور گفت:

«پس از تصویب این قانون، همکاران ما در ایرانداک با درایت، ایثار و تلاش شبانه‌روزی تلاش کردند تا این سامانه را به نتیجه برسانند. در ابتدا ما همانندجویی‌های مختلف به این شکل نداشتیم.

همکاران ما با زحمت فراوان، همراه با عشق و علاقه توانستند این ابزار مورد نیاز برای اجراء قانون را در اختیار دانشگاه‌ها قرار دهند. طبق قانون دانشگاه‌ها موظف‌اند که پایان‌نامه‌ها و رساله‌های آنان را قبل از دفاع، همانندجویی کنند. اگر همانندجویی اتّفاق نیفتد، طبق قانون، امکان پرداخت حق‌الزحمه به استاد راهنما، داور یا هر نوع پرداختی مرتبط با این پایان‌نامه، خلاف قانون محسوب می‌شود. علاوه بر بند قانونی، برای ما بسیار مهم بود که از نظر تکنیکال و فنی، ایرانداک بتواند این کار را به انجام برساند و الحمدلله، این ساماندهی صورت گرفت که آقای دکتر شیرانی نیز در این زمینه توضیحات لازم را خواهند داد. بررسی ما نشان می‌دهد در مدّت زمانی که از اجرای قانون می‌گذرد، مشابهت از میانگین بالای 80درصد به زیر 30درصد کاهش یافته است. بنابراین، اگر این قانون و ابزار در اختیار ما نبود، امروز ممکن بود که بالای 80درصد همانندی در تولیدات علمی داشتیم.
در روایتی، از حضرت علی (علیه السلام) نقل شده که ایشان فرموده: «من تساوی یوماه فهو مغبون.» این در پایان‌نامه هم صادق است؛ یعنی یک پایان‌نامه مشترک از دو نفر هم مغبون است. علاوه بر جلوگیری از سرقت علمی، هدررفت نیروی انسانی نیز با این کار اتّفاق نمی‌افتد. امروز مجموعه‌هایی که با ما همکاری نمی‌کنند، معلوم نیست چه میزان همانندی در تولیدات علمی داشته باشند. کمک به توسعه اخلاق پژوهش، افتخاری برای ماست که در ایرانداک این مهم نهادینه شده است و الحمدلله می‌توانیم ادعا کنیم که پایان‌نامه‌هایی که دفاع شده‌اند، سطحی از نوآوری، مبتنی بر عدم تشابه را دارند. قطعاً خطاها و آسیب‌هایی ممکن است که وجود داشته باشد و ما هم منکر این نیستیم. به هر حال، زمانی که صنعتی شکل بگیرد، مثلاً شغلی به اسم رفع همانندجویی دیده می‌شود، جلوگیری از این موارد، نیازمند تحقیق و توسعه جدی است.»

در ادامه جلسه، دکتر حسن‌زاده اظهار داشت:

«مرکز مدارک علمی ایران، از سال 1388 تا به امروز در قالب پژوهشگاه اداره می‌شود و ایرانداک، یکی از معاونت‌های پژوهشگاه است. در این بخش، حدود 140 نفر کارشناس به صورت 24ساعته مشغول فعالیت هستند. ما تعطیلی نداریم؛ زیرا ثبت و همانندجویی، پیوسته در سامانه اتّفاق می‌افتد.

در حوزه مدیریت اطّلاعات علم و فنّاوری، این افتخار را داریم که اگر اسم کشور ایران در هر رتبه علمی در رسانه‌های دنیا اعلام شود، ما در سامانه خود بلافاصله این مطلب را منعکس می‌کنیم و اعلام می‌نماییم کشور ما در سال‌های قبل هم چه رتبه‌ای داشته است و در بین کشورهای منطقه، حائز چه رتبه‌ای است. بیش از 90 شاخص برای پژوهشگران، مجلات، دانشگاه‌ها و نظام علم فنّاوری و نوآوری در رتبه‌های مختلف از قاره اروپا، آمریکا و آسیا به صورت برخط و رایگان در اختیار همه پژوهشگران قرار دارد. افراد می‌توانند این دیتا را در قالب اکسل و... دریافت کنند. دانش ایران در قالب پایگاه‌هایSCOPOST یا همان ISI سابق، به صورت مداوم در قالب سامانه ارائه می‌شود. سامانه تأثیر پژوهشی نیز در آینده نزدیک رونمایی می‌شود. در این سامانه، تأثیرات اقتصادی، اجتماعی، سیاسی و غیره نظام علم و فنّاوری در کشور ما ارائه می‌شود. همچنین، دانشگاه‌ها و پارک‌های علم و فنّاوری، از منظر ویزیبلیتی (پدیداری/ دیداری) رتبه‌بندی می‌شوند و ما خواهیم دید که پارک‌ها و دانشگاه‌های ما، تا چه اندازه در نظر مردم، صنعتگران و جامعه قرار دارند. این کار، یک رقابت سالم و سازنده‌ای را در بین دانشگاه‌ها و پارک‌ها ایجاد خواهد کرد.

ما بیش از 200 دوره آموزشی دارای مجوز از شورای گسترش برگزار کردیم. بعضی از این دوره‌ها، بالای 170 مرتبه تکرار شده است. اخیراً رویکرد ما در این زمینه، از دوره منفرد به دوره اسکول یا مدرسه تغییر یافته است. هدف ما این است که شخصی که وارد مدرسه می‌شود، از صفر تا صد موضوع را یاد بگیرد. اوّلین دوره ما، راجع به مالکیت فکری بود که با همکاری مرکز مالکیت فکری قوه قضاییه برگزار شد. در این دوره، شخص از ابتدا تعریف ایده، مالکیت فکری و چگونگی و پایگاه‌های ثبت آن و استانداردهای آن را فرا می‌گرفت. دومین اسکول یا مدرسه، مدرسه اخلاق پژوهش است.»

دکتر حسن‌زاده در ادامه سخنان خود خاطرنشان کرد:

«موارد مختلفی از این مدرسه‌ها توسعه پیدا کرده و فرصت خیلی خوبی برای همکاری فراهم شده تا مدرسه‌ای که برای کل کشور می‌تواند مفید باشد، توسط مدرسان شما ایجاد شود و به صورت مشترک، این دوره‌ها به صورت مجازی و حضوری برگزار شود.»

چهاردهمین جلسه از سلسله نشست های علوم انسانی اسلامی دیجیتال با موضوع «رشد علم و اخلاق پژوهش؛ قابلیت‌ها و چشم‌اندازهای همانندجوی ایرانداک»»

دکتر حسن‌زاده در ادامه، راجع به پژوهشگاه علوم و فنّاوری اطّلاعات گفت:

«ما قلمرو پژوهشی متنوّعی در سه پژوهشکده داریم که 29 عضو هیئت علمی با درجه استادیار و دانشیار در گروه‌ها و دپارتمان‌های: اصطلاح‌شناسی، زبان‌شناسی، علم‌سنجی، مدیریت فنّاوری اطّلاعات و غیره مشغول به فعالیت‌اند. پروژه‌های تحقیقاتی زیادی در حوزه‌های تقاضامحور انجام شده است. همچنین، آزمایشگاه‌هایی را هم ایجاد نمودیم. برای راه‌اندازی مرکز کارآفرینی و رشد نیز مجوز اصولی گرفتیم. ایده سرزمین نوآوری در فضای 20 هکتاری، کاری است که با همکاری شهرداری، بنیاد مستضعفان، کمیته امداد و... شروع کردیم. این مجموعه ملی، در سطح و تراز جمهوری اسلامی ایران، در حوزه نوآوری در زمینه علوم و فنّاوری اطّلاعات قرار است ایجاد شود.»

دکتر حسن‌زاده به توضیح در باره روبوداک ایرانداک گفت و اظهار داشت:

«این سیستم، با مخاطب صحبت و جست‌وجو انجام می‌دهد و سپس، سؤال مخاطب را بازیابی می‌کند. هدف ما این است که روبوداک، در مسیر توسعه به عنوان یک رباط سخنگو برای حوزه‌های ذخیره و بازیابی اطّلاعات، عمومی‌سازی شود. در سیاست علم و فنّاوری ما در آزمایشگاه، نرم‌افزار شبیه‌سازی قانون‌گذاری ایجاد شده که شخص، قبل از تصویب قانون، از تبعات آن آگاه شود. این کار، با همکاری مرکز پژوهش‌های مجلس و شورای عالی انقلاب فرهنگی در حال توسعه است. نشریه ما با وجود فارسی بودن، در SCOPOST نمایه شده است. به همین جهت، همایشی تحت عنوان همایش ملی مدیران فنّاوری اطّلاعات در دستور کار داریم که آقای دکتر شیرانی دبیر آن خواهند بود. در این همایش، مرکز تحقیقات کامپیوتری علوم اسلامی نیز می‌تواند شرکت کند و با توجّه به ویژگی‌های محصولات مرکز، این شایستگی وجود دارد که از جوایز ما که فنّاوری اطّلاعات برتر هست، بهره‌مند شوند.»

ایشان در ادامه، از گام‌های توسعه‌ای در زمینه اخلاق پژوهش گفت و بیان داشت:

«نگاه ما در حوزه اخلاق پژوهش، نگاه هم‌افزایی بوده و نمی‌خواهیم تضاد منافع ایجاد کنیم. بر آنیم تا با همکاری، این آسیب را ریشه‌کن و به توسعه علم و فنّاوری و اعتلای نام پژوهشگران و کشور بپردازیم. من در این زمینه، نامه‌ای به وزیر محترم ارشاد و مرکز مالکیت معنوی نوشتم که قبل از ممیزی کتاب‌ها، به کمک سامانه همانندجو، از مالکیت فکری آثار باخبر شوید. واقعیت این است که بعضی مواقع، به دلیل نبودِ مکانیزم نظارتی، این مشکلات تبدیل به یک عارضه می‌شوند. با مرکز نشر دانشگاهی تفاهم‌نامه امضا کردیم که فایل کل کتاب‌ها را به ما بدهند و ما خدمات همانندجویی به آنها ارائه کنیم. با سازمان سَمت و سایر مراکز، در حال رایزنی و عقد تفاهم‌نامه هستیم تا شبکه کاملی را ایجاد کنیم. الحمدلله، با زحماتی که همکاران ما کشیدند، اتّصال الگوریتم به مقالات را برقرار کردیم و مقالات به استخر دانش ما اضافه شده است. همچنین، صفحات وب با یک طرح نظام‌مند، امکان همانندجویی در شبکه جهانی اینترنت هم دارد.»

در ادامه، دکتر حسن‌زاده ابراز امیدواری کرد که:

«با توجّه پیشرفت‌ها و بسترهای خوبی که مرکز تحقیقات کامپیوتری علوم اسلامی در حوزه علوم و معارف اسلامی ایجاد کرده، بتوانیم با هم‌افزایی کاری بزرگ برای کشور در این حوزه انجام دهیم. ما باید فرصت امروز را غنیمت بشماریم و فکر کنیم در چه مواردی می‌توانستیم همکاری کنیم و این کار را نکردیم.»

چهاردهمین جلسه از سلسله نشست های علوم انسانی اسلامی دیجیتال با موضوع «رشد علم و اخلاق پژوهش؛ قابلیت‌ها و چشم‌اندازهای همانندجوی ایرانداک»»

دکتر فرهاد شیرانی:

سامانه همانندجو؛ جایگاه و قابلیت‌ها

در بخش دوم جلسه، دکتر شیرانی راجع به سامانه همانندجو گفت:

«سامانه همانندجو، یکی از ابزارهایی است که به توسعه اخلاق پژوهش و پیشگیری از تقلب در تهیه آثار علمی کمک می‌کند. این سامانه، بر اساس قانون پیشگیری و مقابله با تقلب در تهیه آثار علمی در پژوهشگاه علوم فنّاوری اطّلاعات ایران تولید و مورد استفاده قرار گرفت. ما دو بستر قانونی برای مقابله با تقلب در تهیه آثار علمی داریم؛ اوّل، قانون مقابله با تقلب که مجلس شورای اسلامی آن را مصوب نموده و در ادامه، آیین‌نامه اجرایی این قانون که مصوبه هیئت وزیران است. در تبصره 9 این قانون، به‌صراحت ذکر شده که حوزه‌های علمیه، دانشگاه‌ها، پژوهشگاه‌ها، مؤسسه‌های آموزش عالی و مجموعه وزارت علوم تحقیقات فنّاوری وزارت بهداشت، دانشگاه آزاد اسلامی و مجموعه مؤسسه‌های وابسته به دستگاه‌های اجرایی موظف‌اند کلیه مراحل پایان‌نامه یا رساله خود، اعم از پروپزال را قبل از دفاع، همانندجویی کنند و بعد از دفاع، الزاماً در سامانه ثبت نمایند. دانشجویان با ثبت پایان‌نامه خود در ایرانداک، کد ثبتی دریافت می‎کنند. پرداخت مالی استادهای راهنما، مشاور و داور و حتی امتیازاتی که در ترفیع و ارتقا مؤثّرند، همگی منوط به انجام این کار است.

چالش قانونی امروز ما، این است که فعالیت‌هایی که در حوزه‌های علمیه انجام می‌شود، در ایرانداک ثبت و همانندجویی نمی‌شود. کمتر از یک درصد وزارت بهداشت، با این سامانه کار می‌کند. دانشگاه آزاد اسلامی، حدود 30درصد همکاری دارد و 70درصد از مجموع دانشگاه آزادی اسلامی هم با این سامانه کار نمی‌کند. در مجموعه وزارت علوم، بیش از 97درصد کار با این سامانه انجام می‌شود.

ما در سامانه همانندجو، سه بخش بسیار مهم داریم؛ بخش اوّل، نوشتارهایی است که بارگذاری و ارسال می‌شود و لازم است از کیفیت و استاندارد خاصّی برای بارگذاری برخوردار باشند تا فعالیت‌های همانندجو درست انجام بگیرد. بخش دوم، همانندی دقیق است و بخش سوم که وارسی هوشمند نام‌گذاری شده، این است که تغییراتی را که در متون اتّفاق افتاده، کشف می‌کند. وارسی هوشمند، با استفاده از هوش مصنوعی صورت می‌گیرد. سپس، بعد از تشخیص سیستم، قضاوت سیستم توسط انسان کنترل می‌شود تا اطمینان از درستی آن صورت بگیرد. معماری کلی سامانه، با به‌کارگیری دو سامانه همانندجو و وارسی هوشمند محقّق شده است.

در بخش همانندجویی، فرایندهای پروپوزال‌ها، پایان‌نامه‌ها، رساله‌ها، مقالات، کتب و طرح‌های پژوهشی، در حال حاضر در سامانه موجود است. پایگاه داده‌هایی که این مجموعه را حمایت می‌کند، عبارت‌اند از: پایگاه داده پروپزول‌ها یا پیشنهادها، پایان‌نامه‌ها و رساله‌ها که به نام «پارسا» شناخته می‌شود. کتب مقاله و سایر اطّلاعات موجود در وب نیز دیتایی است که از این مجموعه حمایت می‌نماید. برای انجام این کار، سه زیرساخت در غالب زیرسامانه وجود دارد؛ از جمله مدیریت گواهی‌ها و دسترسی‌ها، بخش احراز هویت و بخشی که آمار توصیفی را می‌سازد و در حقیقت، داشبوردهای بی. آی که در واقع برای سیاست‌گذار، اطّلاعاتی را تولید می‌کند و در نهایت، بخشی که با استفاده از زیرساخت‌ها و مستندات خود با مواردی که خارج از فرایندهای معمولی دیتایی را بارگذاری می‌کنند، مواجهه می‌کند. در حال حاضر، 50,000 مقاله، 320,000 پروپزول و 620,000 رساله یا پایان‌نامه را زیرمجموعه این بخش داریم که حدود 1,440,000 رکورد اطّلاعات وجود دارد و 124,000,000 برگ اطّلاعاتی، علاوه بر این دو دیتابیس وجود دارد. یکی از دیتابیس‌ها الآن مرتباً به مجموعه اضافه می‌شود؛ یعنی مثلاً اگر دانشجویی فصل اوّل پایان‌نامه‌اش را نوشت و بارگذاری کرد، بلافاصله به دیتابیس اصلی اضافه شده و بعد از آن، هیچ شخصی نمی‌تواند همان فصل اوّل را بارگذاری نماید. بنابراین، نفر بعدی که با کسری از ثانیه بارگذاری می‌کند، سامانه اعلام می‎کند با قبلی مشابهت دارد و این، مربوط به فرد قبلی است. بیش از 8,000,000 رکورد مقالات لاتین هم آماده شده که امیدواریم به‌زودی در سیستم قرار بگیرد.»

عضویت در سامانه همانندجو

«فرایند عضویت سامانه همانندجو، به این شکل است که ابتدا باید سازمانی که بناست کار همانندجویی را انجام دهد، عضو شود. سپس، دانشگاه یا مؤسسه یا ناشر یا برگزارکننده سمینار یا سازمانی که طرح پژوهشی را سفارش می‌دهد، به عنوان کارفرمای طرح پژوهشی در سامانه ثبت‌نام کند. این ثبت‌نام باید از یک طریقِ شفاف و روشن با نامه کتبی و... اتّفاق افتد؛ زیرا نماینده سازمان مذکور در نهایت، مدیریت سامانه همانندجو در آن سازمان را به عهده می‌گیرد. سپس، فرم‌های مشخّصی به صورت آنلاین پُر می‌شود و در آخر، نماینده سازمان، اعضای هیئت علمی را عضو این سیستم می‌کند.

گام دوم این است که عضو هیئت علمی به عنوان یک فرد کامفیرم‌شده و شناخته‌شده در سیستم تلقی شده و فعالیت‌های دانشجو و سایر فعالیت‌ها در ارتباط مستقیم با عضو هیأت علمی و استاد مورد نظر قرار می‌گیرد. این فرایند تکمیل می‌شود تا اینکه دانشجو بخواهد عضو شود. عضویت دانشجو، با دریافت نام کاربری و رمز عبور صورت می‌گیرد. سپس، اعلام می‌کند از کدام مؤسسه یا دانشگاه ثبت‌نام نموده است، با این کار، ارتباط بین دانشجو، مؤسسه و استاد برقرار می‌شود. پس از این، هر فعالیتی که دانشجو انجام دهد، یک نسخه از فعالیت به نماینده دانشگاه و استاد نمایش داده می‌شود و استاد می‌تواند این روند را پیگیری کند.»

فرایند همانندجویی

در ادامه، دکتر شیرانی راجع به فرایند همانندجویی گفت:

«کارتابل فرایند همانندجویی با توجّه به ویژگی‌های هرکدام از اعضا در اختیار آنها قرار می‌گیرد، هر عضو، کارتابل مخصوص به خود را با تمام اطّلاعات موردِ نیاز دارد. مشخّصات محتوای ارسالی را مشخّص می‌نماید و سپس، دیتا را ارسال کرده، در صورت لزوم، هزینه آن را پرداخت می‌کند. پس از این، فرد می‌تواند نتیجه درخواست خود را مشاهده نماید و گواهی آن را دریافت کند. در بخش گزارش تشریحی یا گزارشی که به همراه جزئیات ارائه می‌گردد، مشخّص می‌شود که از کدام منبع این مطالب برداشته شده و فهرست منابع را نیز نمایش می‌دهد. ارتباط بین منابع را مشخّص نموده، درصد همانندی را به صورت روشن اعلام می‌کند که هرکدام از این منابع، در کدام بخش وجود دارند. در فرایند جست‌وجو، مسئله این است که مثلاً اگر پاراگرافی را در 10 منبع پیدا کنید، سیستم به صورت هوشمند متوجّه می‌شود که بیشترین میزان از کدام‌یک اخذ شده است. بنابراین، سیستم ابتدا منبعی را نمایش می‎دهد که بیشترین مشابهت را داشته است. منابع به صورت تکراری نمایش داده نمی‌شود. هر منبعی یک بار نمایش داده شده و بعد با رنگ دیگری منبع جدید مشخّص می‌شود. در نهایت، گواهی صادر می‌شود تا میزان و کیفیت همانندی در اختیار دانشجو قرار گیرد. دانشجو یا استاد، با کلیک روی بخش‌هایی که رنگی هستند، بلافاصله منبع اصلی را می‌بیند. اگر این منبع مجله باشد، متصل به وبگاه مجله می‎شود. اگر منبع، پایان‌نامه باشد، در ایرانداک نمایش داده می‌شود. اگر این منبع کتاب باشد، به کتابخانة ملّی متّصل شده و مشخّصات آن ارائه می‌گردد.»

چالش‌های فرایند همانندجویی

دکتر شیرانی در ادامه اظهار داشت:

«روش ما در ایرانداک، برای صدور گواهی، بسیار سخت‌گیرانه است. از نظر ما، مسئولیت کار پایان‌نامه دانشجو، با استاد است و ایرانداک به عنوان ابزار در اختیار استاد گذاشته شده است.

یکی از پیچیدگی‌هایی که در فرآیند همانندجویی با آن مواجهیم، چسباندن کلمات به یکدیگر است. وقتی سیستم، این‌همانی را بررسی می‌کند، این واژه را با واژه دیگر مقایسه می‌کند. اگر واژه‌ها در یکی جدا، و در دیگری به هم چسبیده باشد، مفهومش این است که واژه جدیدی تولید شده است. حال اگر تعداد این به‌هم‌چسبیده‌ها در متن زیاد باشد، مفهومش این است که این متن، مثل دیگری نیست؛ درحالی‌که دقیقاً عین هم هستند. در نتیجه، باید سیستم قادر باشد تا به‌هم‌چسبیدگی‌ها را تشخیص دهد. علاوه بر این، باید قادر باشد تا تکرار محتوا در یک متن را نیز شناسایی کند. اینجا یک تحلیل درون‌متنی صورت می‌گیرد و سیستم می‌گوید از 200 صفحه پایان‌نامه، 10 صفحه مطلب بیشتر نیست و مابقی تکرار است. بنابراین، امکان صدور گواهی برای این متن وجود ندارد و به عنوان یک پایان‌نامه تلقی نمی‌شود.

تغییر و جایگزینی واژه‌های هم‌معنا و... به جای یکدیگر نیز دیگر چالش ماست؛ مثلاً به جای «برند»، از واژه جدید «نمانام» استفاده کنند و یا اینکه همه «است»ها را جایگزین «بود» می‌کنند و یا واژه «قرارداد» را به جای «عقود» می‌گذارند که در این متن در آیه قرآن نیز عبارت «أوفوا قراردادها» دیده می‌شود که کاملاً غلط است.

یکی دیگر از مصادیق این کار، کم‌وزیادکردن نقطه‌ها و حروف است؛ مثلاً به جای «نتایج»، «نثایج» می‌نویسند و یا به جای «ر» «ز»، «ص» «ض» و... قرار می‌دهند. در این موارد، سیستم می‌گوید متن مغشوش است و قابلیت صدور گواهی را ندارد. همچنین، گاهی درون متن هیچ کاراکتری آشکارا دیده نمی‌شود؛ ولی با استفاده کاراکترهای پنهان در درون متن که چشم نمی‌بیند، مثلاً بعد از هر کلمه‌ای نقطه گذاشتند. با این کار، سیستم مشابهت کشف نمی‌کند. در این موارد، سیستم، همه کاراکتر «ست‌ها» را کنترل می‌نماید و سپس، اگر کاراکتر «ستی» با کاراکتر «ست» فارسی همخوان نباشد و استفاده شده باشد، آن را استخراج می‌کند. بنابراین، در چنین وضعیتی ما علاوه بر همانندجویی، باید تشخیص دهیم که این متن، غیرقابل‌استفاده است.»

در ادامه بحث، دکتر شیرانی افزود:

«اگر مشابهت متنی زیر 30درصد باشد، از نظر کارشناسان ما بررسی می‌شود و اگر بالای 30درصد بود، باید محتوای آن توسط استاد دیده شود. در صورت تشخیص مشابهتِ کمتر از 30درصد، کارشناس مشاهده می‌کند که ماشین اشتباه نکرده باشد؛ مثلاً فرمول‌های شیمی خیلی به‌هم‌پیوسته و بزرگ هستند و سیستم تشخیص می‌دهد که این به‌هم‌پیوستگی، خیلی زیاد است؛ ولی کارشناسان با توجّه به ویژگی فرمول‌های شیمی، این به‌هم‌پیوستگی را تأیید می‌کنند. در این سیستم، می‌توان نظر کارشناس را نیز ملاحظه نمود.

مشابهت زیاد در برخی متون، مورد قبول است. ازاین‌رو، ما اینها را به استاد ارجاع می‌دهیم؛ مثلاً حاشیه کتاب عروة الوثقی، شاید کلّ صفحاتی که نوشته شده، از 10 صفحه تجاوز نکند؛ اما این، اشکالی ندارد. بنابراین، مسئولیت تأیید این متن، به عهده استاد راهنماست. یکی از چالش‌ها در پایان‌نامه‌های حوزوی نیز همین مسئله است. ما در این متون، مواردی که شبیه متون دائمی هستند، نظیر: آیات، روایات، اشعار و... را در یک مرحله کنار می‌گذاریم و بعد مشابهت‌یابی انجام می‌دادیم.»

چهاردهمین جلسه از سلسله نشست های علوم انسانی اسلامی دیجیتال با موضوع «رشد علم و اخلاق پژوهش؛ قابلیت‌ها و چشم‌اندازهای همانندجوی ایرانداک»»

چشم‌اندازها و راهبردها

دکتر شیرانی درباره چشم‌انداز و راهبردهای مربوط به سامانه همانندجویی در ایرانداک گفت:

«در این باره سه مسئله وجود دارد. مسئله اول، توسعه محتوا و پایگاه‌هایی است که آن را توسعه می‌دهد. ما در این بخش، کتاب‌های دانشگاهی را فعلاً در دستور کار داریم و شاید نقطه ضعف ما در زمینه منابع غیردانشگاهی، علوم اسلامی است. تلاش می‌کنیم که این محتوا را توسعه بدهیم. در بخش آکادمیک (علمی)، به صورت خیلی وسیع‌تری به دنبال این توسعه هستیم. بنابراین، بخش مقالات بعد از گذشت ده سال، تقریباً تکمیل شده است. از ابتدای آکادمیک آنچه در دسترس وجود دارد و فایل‌های پی. دی. اف از آن تهیه شده، 1,380,000 مقاله در بخش دانشگاهی تولید شده که بالغ بر 150,000 عدد از اینها را ما الآن در اختیار داریم؛ مانند مقالات دانشگاه آزاد، وزارت بهداشت و وزارت علوم.

در توسعه بخش کتاب، با ناشران وارد گفت‌وگو شدیم و ناشران بزرگی به مجموعه اضافه شدند. طرح‌های پژوهشی را با وزارت علوم گفت‌وگو کردیم که اضافه شوند. بنابراین، توسعه دیتابیس‌های پشتیبان، یکی از استراتژی‌های ما افزون بر اضافه‌کردن بخش لاتین است. نرم‌افزار همانندجو، قابلیت جست‌وجوی لاتین، عربی یا هر زبان دیگری را دارد؛ یعنی محدودیت زبانی در جست‌وجوی همانندی نداریم؛ تنها محدودیت ما، در توسعه دیتابیس‌های پشتیبان است. امکان جست‌وجو در اینترنت را داشتیم؛ امّا به دلیل مشکلاتی نظیر ممانعت گوگل، فعلاً این بخش متوقّف است. در عین حال، تعداد 80,000 صفحه از وب را که اعتبار مناسبی دارند، جمع‌آوری و اضافه کردیم. تعداد 8,000,000 رکورد مقالات لاتین را آماده کردیم که ان‌شاءالله سال آینده، بخش لاتین را با قوّت اضافه کنیم. سه ماه پیش، کار دیگری در این زمینه اتّفاق افتاد و آن، اضافه‌شدن همانندجوی کتاب‌ها و طرح‌های پژوهشی بود. توسعه در حوزه نرم‌افزار نیز همان‌طور که جنابعالی واقف هستید، به صورت دائمی صورت می‎گیرد.»

دکتر مهدی نیکنام:

کاستی‌ها و بایسته‌ها

در ادامه بحث، دبیر این نشست علمی، دکتر مهدی نیکنام، معاون فنی مرکز تحقیقات کامپیوتری علوم اسلامی، از ارائه‌دهندگان محترم تقاضا نمود تا با حضور در نشست‌های آتی، بحث‌های نظری بیشتری را در این حوزه مطرح نمایند. آنگاه دبیر نشست، آقای دکتر نیکنام اظهار داشت:

«راجع به سرقت علمی در کشور، نیاز به یک طرح بزرگ‌تری داریم؛ از این جهت که مفهوم سرقت علمی، به طور کامل روشن نیست و همان‌طور که در مقالات هم می‌خوانیم، هنوز این موضوع محل بحث است. علاوه بر کپی، پارافریز هم با شرایطی، ممکن است سرقت محسوب شود. در زبان‌ها و رشته‌های مختلف، این مطلب متفاوت است. ازاین‌رو، به نظر می‌رسد که چهارچوبی برای این مبحث ترسیم نشده است. به همین جهت، از قانون‌گذار انتظار می‌رود که چارچوب مناسبی آماده‌سازی کند.

لازم است سامانه‌ای که طراحی شده، بررسی شود که کدام‌یک از مصادیق سرقت علمی را پوشش نمی‌دهد. تصوّر اینکه الآن با سامانه همانندجو به طور کامل از سرقت علمی جلوگیری می‌کنیم، تصوّر دقیقی نیست؛ چراکه در برخی موارد، صرفاً دانشجو در نتیجه پایان‌نامه، عدد نادرستی را ادعا می‌کند. یا اینکه مثلاً سامانه ما در مقابل پارافریز چه رفتاری باید داشته باشد؟ راجع به ارجاعات پژوهشگر، چه رفتاری باید صورت گیرد؟ به عنوان مثال، اگر ارجاعات پایان‌نامه مشابهت زیادی با سائر مکتوبات داشت، آیا این هم سرقت علمی محسوب می‌شود؟ به نظر می‌رسد که برای بررسی دقیق‌تر این مباحث، باید یک‌سری نشست‌های علمی داشته باشیم.

اینکه مشابهت در پاراگراف اوّل متن با آخر متن، مثلاً قسمت چکیده و نتیجه‌گیری که حساسیت بیشتری دارد، متفاوت است، اینها موضوعاتی است که باید تأملاتی راجع به آن صورت بگیرد. به نظر می‌رسد که به‌ازای هر رشته، ما نیاز داریم که از متخصّصان و اساتید آن حوزه استفاده کنیم که ویژه رشته تحصیلی خود سرقت علمی را تعریف کنند. ما دو تجربه خوبی که در این زمینه داشتیم، یکی کنفرانس پن بود که در سال 2016 برگزار شد و یکی هم مسابقات شناسایی سرقت علمی بود که در راستای مسابقات رباتیک در دانشگاه امیرکبیر سال 1394 جهاد دانشگاهی برگزار کرد. بنابراین، به نظر می‌رسد از این دست کنفرانس‌ها و برنامه‌ها، برای رسیدن به این چارچوب لازم باشد.»

دکتر حسن‌زاده:

قانون‌محوری و ایجاد رقابت

در ادامه و در بخش پایانی این نشست، دکتر حسن‌زاده خاطرنشان کرد:

«دو مسئله وجود دارد؛ اوّل، بحث قانون سرقت علمی است که قانون‌گذار می‌گوید باید گواهی‌نامه داده شود که سرقت صورت گرفته است یا نه. دوم، بحث در حوزه فنّاوری است که یک هماوردی‌طلبی، رقابت و پیشرفت باید وجود داشته باشد. این دو مقوله، از یکدیگر جدا هستند. در حوزه اجرای قانون، تا زمانی که قانون تغییر پیدا نکرده، ما موظف به اجرای آن هستیم. به همین جهت، گواهی‌ها را دقیق صادر می‌کنیم؛ یعنی گواهی‌ها به شکلی نباشد که دارای اشکال باشد.

بنده خودم به عنوان عضو هیئت علمی، با اکانتی که دارم، وارد سامانه می‌شوم و گاهی این موارد را چک می‌کنم؛ مثلاً در جلسه دفاع دانشجو، بنده نه به عنوان استاد راهنما و داور، بلکه تنها به عنوان مدیر گروه حضور داشتم. در انتها وقتی همه تأیید کردند، گفتم: از این دانشجو سؤال دارم. به این دانشجو گفتم: نگاه کن تو چشم من و بگو که این پایان‌نامه را خودت نوشتی یا دیگری نوشته؟ این پایان‌نامه، اصلاً نوشته شده یا نه؟ ایشان گفت: استاد من نمی‌توانم دروغ بگویم. من پایان‌نامه را ننوشتم. ما به خاطر صداقت این دانشجو، او را اخراج نکردیم و به او زمان دادیم تا دوباره کار کند و پایان‌نامه جدید بنویسد. حدود ده روز پیش ایشان دفاع کرد. من در سامانه وضعیت این پایان‌نامه را نگاه کردم. سیستم، بار اوّل 99درصد مشابهت نشان داده که در طی چند مرحله، درصد مشابهت به 4درصد رسیده بود. خیلی جالب است که سامانه به این 4درصد گفته که این متن، غلط یا خطاست (false)؛ ولی کارشناس، گزینه صحیح (true) را انتخاب کرده است. در واقع، سامانه این پایان‌نامه را استاندارد نمی‌دانسته است و کارشناس این را به هر دلیلی تأیید کرده است. ما تلاشمان به عنوان پژوهشگاه، این است که این درصد خطاها، هرچه سخت‌گیرانه‌تر، کمتر شود.

البته همیشه دزد از پلیس جلوتر است؛ یعنی این‌گونه نیست که بگوییم چون پلیس و تکنولوژی‌های نو وجود دارد، هیچ دزدی اتّفاق نمی‌افتد؛ اما در حوزه‌ای که مربوط به هماوردی‌ها و رقابت‌هاست، باید خیلی همکاری‌ها را توسعه داد. ممکن است الگوریتمی را اینجا شما طراحی کرده باشید که این الگوریتم بسیار قوی‌تر بوده باشد. چرا از این الگوریتم ما بهره نبریم؟ اصولاً مقوله همانندی چرا نباید به مثابه کسب‌وکار، رشد کند؟

یکی از مشکلات ما این است که در مراحل مختلف، استادان پاسخ سامانه را نگاه نمی‌کنند. اگر استاد نگاه کند که این پایان‌نامه ابتدا 99درصد مشابهت داشته و سپس 60درصد و بعد 40درصد شده، مانع از ادامه این پایان‌نامه می‌شود.

اگر صنعت همانندجویی به مثابه یک حوزه کسب‌وکار در کشور رشد کند، به نفع ایرانداک، جامعه علمی و قانونی است و در نهایت، به نفع همگان خواهد بود.

ما تلاش کردیم، با وجود اینکه زیاد مورد مراجعه هستیم، سرعت سامانه را به‌روز نگه داریم. یک‌سوم اعضای هیئت علمی ما، در حوزه بازیابی و روی الگوریتم‌های جدید کار می‌کنند.»

پرسش و پاسخ

در انتهاء جلسه، یکی از حضار در مورد تکنیک‌های شباهت‌سنجی سؤالاتی را مطرح کرد و گفت:

«در صورتی که تغییر پیشرفته در متن صورت بگیرد، مثلاً بین کلمات یک متن جابه‌جایی صورت بگیرد یا فراتر از این پارافریزینگ اتّفاق بیفتد، این موارد تا چه اندازه پشتیبانی می‌شود؟ راجع به شباهت معنایی، کاری انجام گرفته است؟ همچنین، راجع به مشابهت‌سنجی‌های بین زبانی در صورتی که تقلب اتّفاق بیفتد، مثلاً حجم زیادی از یک مقاله انگلیسی صرفاً بازنویسی و یا برگردان به فارسی شود، آیا شناسایی این موارد، در دستور کار هست؟»

دکتر حسن‌زاده:

«شناسایی الگوها، حوزه پویایی است؛ به‌خصوص اگر بین زبانی و سیمنتیک باشد، این یک مسئله جدی است و ما قاعدتاً به این سمت حرکت می‌کنیم. ما باید به جایی برسیم که سبک افراد در نگاشتن را الگوسازی کنیم. اگر مثلاً آقای حسن‌زاده نوشته، بگوییم این سبک، قلم شما نیست. اگر به اینجا برسیم، فوق‌العاده است. راجع به مسائلی که فرمودید، لایه‌های مختلف شناسایی مشابهت در برنامه همانندجو هست؛ ولی در این زمینه‌ها، ادعایی نداریم که ما همه کار را انجام دادیم. ما در حال یادگیری هستیم و در این مسیر، تلاش پیگیر داریم و تحقیق می‌کنیم و از تجربیات مرکز تحقیقات کامپیوتری علوم اسلامی نیز استفاده خواهیم کرد. من تصمیمی گرفتم که دوستان ما در پژوهشگاه، یک جلسه بازدیدی از اینجا داشته باشند و راجع به بحث‌های فنی با همکاران شما صحبت کنند و این گفت‌وگوها، حتماً برکات خوبی برای ما خواهد داشت.»

دکتر شیرانی:

«اگر شخص در یک پاراگراف، کلمه‌ای را اضافه کند، سیستم به شما خواهد گفت که کل این پاراگراف، نوشته دیگری است و فقط زیر کلمه یا کلماتی که اضافه‌شده خط می‌کشد. در صورت جابه‌جایی کلمات هم سیستم مشابهت‌سنجی انجام می‌دهد و تشخیص مشابهت می‌دهد؛ اما در بحث بازنویسی، طبق موضع قانون، ما به دنبال همانندجویی دقیق هستیم. از این جهت که چالش‌های مشابهت‎سنجی در متون بازنویسی‌شده، بسیار زیاد است؛ به عنوان مثال، اگر شخصی، جمله «توانا بود هرکه دانا بود» را تبدیل کرد به جمله «دانایی، توانایی است» یا «هرکس داناتر است، تواناتر است»، آیا این کار، کپی‌کردن محسوب می‌شود؟ اگر بگوییم هر جمله‌ای که مفهوم «توانا بود هرکه دانا بود» را القاء کند، سرقت علمی محسوب می‌شود، پس چگونه افراد بنویسند؟ به همین جهت، ما مسئولیت این موارد را متوجّه استاد راهنما می‌دانیم. بنابراین، در این باره ورود پیدا نمی‌کنیم. اگرچه الگوریتم‌ها طراحی و انجام شده است، امّا در عمل، نمی‌توان صرفاً با اینها کار را انجام داد؛ به عنوان مثال، اگر دانشجوی زبان انگلیسی صرفاً ترجمه کرد، با توجّه به رشته آن، شاید وظیفه‌اش صرفاً ترجمه باشد.

راجع به سرقت علمی یا مسئله اخلاق پژوهش نیز این نکته لازم است گفته شود این بحث، بسیار گسترده و یک اکوسیستم است که اوّل، مسئله فرهنگی و سپس، مالکیت فکری و بعد، سایه‌نویسی و مسائل مربوط به آن را شامل می‌شود. دزدیدن ایده نیز نوعی سرقت علمی محسوب می‌شود که با استفاده از نرم‌افزار، قابل تشخیص نیست.»

اطلاعات تکميلي

  • تاریخ انتشار نسخه چاپی: دوشنبه, 29 خرداد 1402
  • صفحه در فصلنامه: صفحه 68
  • شماره فصلنامه: فصلنامه شماره 82
بازدید 1702 بار
شما اينجا هستيد:خانه سایر مقالات فصلنامه شماره 82 (بهار 1402) مسیرهای جدید، فراروی مرکز تحقیقات کامپیوتری علوم اسلامی