نشست نقد و بررسی محتوا و قابلیت‌های پایگاه قاموس نور

دوشنبه, 22 آذر 1400 ساعت 17:20
    نویسنده: به کوشش: هیئت تحریریه ره آورد نور
این مورد را ارزیابی کنید
(1 رای)

اشاره

نشست علمی «قاموس هوشمند نور؛ ساماندهی نوین مداخل لغات و توصیفات و ایجاد شبکه واژگانی زبان عربی»، روز چهارشنبه 12 آبان 1400 در سالن اجتماعات مرکز تحقیقات کامپیوتری علوم اسلامی، به صورت حضوری و هم‌زمان به صورت مجازی، برگزار گردید.

در این جلسه، کارشناسان پایگاه، جناب حجت‌الاسلام والمسلمین آقای مسیح توحیدی، مدیر پژوهشکده متن‌کاوی نصوص دینی مرکز و آقای دکتر حبیب سریانی، کارشناس حوزه متن‌کاوی، ادبیات و لغت مرکز نور، ضمن معرفی «پایگاه قاموس نور»، توضیحاتی در خصوص امکانات و فعالیت‌های صورت‌گرفته در این وبگاه ارائه نمودند و در ادامه، ناقدان مدعو، آقایان دکتر علی زاهدپور، پژوهشگر و مترجم زبان عربی و دکتر محمد ملکی، عضو هیئت علمی دانشگاه ادیان و مذاهب، به نقد و بررسی پایگاه و توضیحات کارشناسان پرداختند. در ادامه، مهم‌ترین مطالب مطرح‌شده در این نشست علمی، از زبان کارشناسان و ناقدان پایگاه از نظر می‌گذرد.

کارشناس پایگاه: دکتر سریانی: معرفی پایگاه و بیان موضوع نشست علمی

«بعد از آنکه نرم‌افزار قاموس نور به صورت رومیزی تولید شد، تصمیم بر آن شد که برای اوّلین‌بار بتوانیم در زمینه لغت و فرهنگنامه‌های لغت عربی، یک پایگاه رسمی داشته باشیم. بنابراین، پایگاهی تحت عنوان «قاموس نور» راه‌اندازی شده است. مقرر شد که نشست‌های تخصصی در این خصوص داشته باشیم تا بتوانیم نظر ناقدان و ایده‌های آنها را دریافت نماییم و در راستای غنای پایگاه استفاده کنیم. آنچه الآن عرضه می‌شود، نسخه آزمایشی است و ممکن است در بعضی از موارد، نقص‌هایی هم داشته باشد.

در زبان عربی، ارائه لغت‌نامه کار خیلی سختی هست. بنابراین، شما تا قبل از این، هیچ لغت‌نامه‌ و پایگاهی را پیدا نمی‌کردید که مثلاً «یَقُلنَ»، صیغه دوازده فعل را درست تحلیل کند و به «قَالَ» یا «یَقُولُ» برگرداند.

برای جبران این ضعف‌ها، سعی کردیم قاموس هوشمند نور را تهیه کنیم. در نامگذاری این پایگاه، دو واژه آن برای ما خیلی مهم هست؛ یکی لفظ «قاموس»، دیگری لفظ «هوشمند». قاموس، بین زبان‌های عربی و فارسی، لفظ مشترکی است و برای کاربران هم رساست و البته نسبت به الفاظی مثل واژه‌نامه یا لغت‌نامه، از عمق بیشتری نیز برخوردار است. کلمه «قاموس» از ریشه «قَمس» گرفته شده است؛ یعنی غوص و غور در لغت. ما در مرکز نور، این اهداف بلندمدت را داریم که در بحث لغت‌نامه، فقط به تجمیع بعضی از لغت‌نامه‌های عربی و آسان‌سازی دسترسی به آنها اکتفا نکنیم؛ بلکه به این سوی برویم که با استفاده از فرایندهای هوشمندسازی، بتوانیم تولید محتوا هم داشته باشیم؛ یعنی بگوییم با توجه به این کلمه و این معانی و این استعمالات و شواهد، این معنا رتبه یک را دارد و آن معنا، رتبه دو دارد. این توصیفات را می‌شود استنتاج و استنباط کرد و خود ما در این زمینه تلاش کنیم که مثل خیلی از لغت‌نامه‌های امروزی مثل المعجم الوسیط که مثلاً توسط هشت نفر از اُدبای مصری تهیه شد، یا مثل المنجد فی اللغة العربیة المعاصرة که توسط اُدبای لبنانی تهیه شده، ما هم در مرکز به این سمت برویم که یک لغت‌نامه مستقل داشته باشیم.

فقط نکته حائز اهمیت، این است که چون فعلاً فاز یک کار بود، سعی کردیم کتاب‌هایی را بیاوریم که استخراج و ساماندهی اطلاعات آنها راحت‌تر هست.

نکته آخر اینکه به بحث هوشمندسازی، در نشست بعدی خواهیم پرداخت. تلاش ما این است که در این نشست، نقدها و طرح‌ها درباره تولید وبگاه قاموس را بشنویم و بررسی کنیم.»

کارشناس پایگاه: حجت‌الاسلام توحیدی: بیان مراحل کار در پایگاه قاموس نور

«ابتدا تشکر می‌کنم از مجموعه دوستانی که در شکل‌گیری این جلسه، سعی و تلاش داشتند.

ما در انتخاب منابع برای استخراج و قرار دادن در پایگاه قاموس، یک ملاک داشتیم و آن، انسجام ساختارمندِ کتاب بوده است؛ به عبارت دیگر، اگر یک متن از نظر علامت‌گذاری غنای کافی داشته باشد، ما بهتر می‌توانیم از ماشین برای استخراج اطلاعات استفاده کنیم.

بعد از آنکه مداخل و توصیفات را از کتاب‌های مختلف استخراج می‌کنیم، با این مطلب مواجه می‌شویم که مدخلی مانند «کَتَبَ النَّاقَة»، در کتاب‌های لسان اللسان، تاج العروس و اقرب الموارد آمده و هرچند یک مدخل هست، ولی از نظر اعراب‌گذاری، به سه گونه ارائه شده است. یکی از کارهایی که ما در ایجاد انسجام باید انجام می‌دادیم، هماهنگ‌سازی اینها بود که اگر این کار صورت نمی‌گرفت، باید این سه مدخل به صورت سه پاسخ به کاربر ارائه می‌شد. اگر شما در پایگاه ملاحظه کنید، می‌بینید موارد «کَتَبَ النَّاقَة» تجمیع شده و سه توصیف ذکرشده در سه کتاب، ذیل یک مدخل آمده است. پس، این یکی از اقدامات ما بود که بتوانیم اطلاعات اولیّه استخراج‌شده را هماهنگ کنیم.

از زاویه دیگر، مشاهده می‌کنیم که در کتب مختلف، برای ارائه یک مدخل و توضیح آن، از تعابیر متنوعی استفاده می‌شود؛ به عنوان نمونه، برای فعل ماضی «کَتَبَ» و توصیف مفهوم و معنای آن، گاهی آمده است: «کَتَبَ سِقَا.» گاهی نیز می‌گویند: «کَتَبَ اِربَع»؛ ولی در تمام موارد، به دنبال بیان معنا و مفهوم «کَتَبَ» هستند. ما برای اینکه این تشتت و تعدد را ساماندهی کنیم، به ‌اصطلاحِ «مدخل نماینده» رسیدیم؛ یعنی متوجه شدیم تمامی این مداخل، از یک مدخل نماینده‌ای برخوردار هستند که می‌توانیم همه اینها را با وجود تنوع و تعددی که در متن مدخل آنها و هم توصیفات خود دارند، ذیل آن مدخل نماینده قرار بدهیم.

در حال حاضر، تعداد مداخل لغوی استخراج‌شده از کتب، حدود یک میلیون و دویست هزار عدد می‌باشد که ذیل حدود صد و پنجاه هزار مدخل نماینده ارائه داده‌ایم.

با شکل‌گیری «مدخل نماینده» و اتصال آن با مداخل لغوی، دریچه‌ای باز ‌شد تا بتوانیم از اطلاعات دیگری که در منابع لغوی و یا حتی غیر لغوی وجود دارد و می‌تواند مرتبط با مدخل نماینده بشوند نیز استفاده کنیم.

به عنوان مثال، در منابع لغوی در خلال توصیف مداخل، گاهی از آیات قرآن به عنوان شاهد بهره می‌گیرند و معانی خاص آن کلمه را در قرآن هم ذکر می‌نمایند. در این موارد، ما آیه قرآن را به عنوان یک مدخل در نظر می‌گیریم و و به همراه توصیف ارائه‌شده در کتاب نسبت به واژه موجود در آیه، اقدام به قرار دادن این مدخل قرآنی ذیل مدخل نماینده می‌کنیم.

به طور مثال، آیه «فَاَرسَلنَا علیهم الطوفان و الجَرَاد و القُمَّل و الضَفَادِعَ و الدَّمَ»، ذیل مدخل «الدَّم» آمده است؛ چرا؟ به جهت کلمه «الدم» که در آیه قرآن به کار رفته و مجمع البحرین نیز به آن پرداخته است. این مسئله، باعث شده که بتوانیم این مدخل قرآنی را به عنوان شاهد در کنار توصیف معنایی ارائه کنیم.

همچنین، توانستیم از شواهد متنی که در اصطلاح از آنها به «غریب الحدیث» یاد می‌شود و در کتاب‌هایی مثل الفائق زمخشری و نهایه ابن‌اثیر یا در خلال منابع لغوی مثل لسان العرب یا کتاب‌های دیگر وجود دارند، به عنوان مدخل و ذیل مداخل نماینده و در دسته‌بندی جداگانه استفاده کنیم که آمار آنها تاکنون، صد و چهل و یک هزار شاهد است.

بر همین اساس، توانستیم به‌تدریج ارتباط بین مداخل نماینده را نیز برقرار کنیم. با استفاده از منابعی که به رابطه ترادف و یا تضاد بین مداخل پرداخته بودند، توانستیم شبکه ارتباطی بین مداخل نماینده را بر محور ترادف یا تضاد در اختیار کاربران قرار دهیم. همچنین، ارتباط موضوعی بین مداخل نماینده را که در منابعی همچون «فقه اللغة ثعالبی» به آن پرداخته شده، در این پایگاه به نمایش گذاشتیم.

آنچه تا اینجا به عرض رسید، در خصوص محتوای ساختارمند پایگاه قاموس بود؛ اما در خصوص هوشمندی این پایگاه و امکان ارائه بهترین پاسخ به درخواست کاربر که موضوع نشست بعدی خواهد بود، به طور اجمال و در قالب مثال به استحضار می‌رسانم:

فرض کنید کسی معنای واژه «لُمتُنَنِی» را که در قرآن آمده (فَذلِکُنَّ الذِی لُمتُنَّنِی فِیهِ)، می‌خواهد بفهمد؛ به طور معمول، نخست باید اطلاعات صرفی داشته باشد و بداند حرف «نون» در واژه «لُمتُنَّنِی»، وقایه است و حرف «یاء»، یای متکلم است و «لمتنّ»، صیغه دوازدهم است و ریشه آن، «لام واو میم» است تا بعد از این تحلیل ذهنی، بتواند با مراجعه به کتاب لغت، ذیل ریشه شناسایی‌شده به مطلوبش برسد. قاموس نور این امکان را به شما می‌دهد که همان «لُمتُنَّنی» را کاوش کنید و مبتنی بر پردازش های هوشمند، نزدیک‌ترین پاسخ را دریافت کنید.»

ناقد پایگاه: دکتر زاهدپور: اشکالات مربوط به توضیحات و مداخل در پایگاه قاموس نور

«مطالبی که بنده عرض می‌کنم، به عنوان پیشنهاد برای تکمیل کار است؛ نه به عنوان عیب و نقص. این مطالب، در دو بخش کلی است؛ بخش اوّل، به بیان اشکال‌های کلی اختصاص دارد.

در توضیحات و درباره‌هایی که برای پایگاه تنظیم شده، ابهام وجود دارد. باید توضیحات برای همه گویا و قابل فهم باشد؛ مثلاً نوشته شده است که «از مجموعه تقریبی دو میلیارد کلمه که در اختیار مرکز بود، در ابزاری وضعیت آنها از حیث ریشه و برچسب‌گذاری بررسی شد.» از حیث ریشه، معلوم هست؛ یعنی ریشه کلمات را ما بررسی کردیم؛ اما برچسب‌گذاری، یک مفهوم سیاسی است. در اینجا منظور از این اصطلاح چیست؟ به جای آن می‌توانستید بگویید «ویژگی‌های لغوی کلمه» نوشته شد.

نمونه دیگر، اینکه مکرر کلمه «توصیف» را به‌کار می‌برید؛ چرا نمی‌گویید «توضیح». البته ممکن است بعضی از کتب تخصصی در زمینه لغت بگویند مدخل و توصیف آن؛ ولی آنچه بیشتر به ذهن می‌آید، توضیح است. خود من اوّل که توصیف را دیدیم، برای من غریب بود که این توصیف چیست. بعد فهمیدم منظور از آن، توضیح است.

یا مثلاً در عبارت «بازبینی اطلاعات استخراج‌شده توسط محققین به منظور تکمیل یا اصلاح موارد»، منظور از «موارد» چیست؟ یا مثلاً اصطلاح «مدخل نماینده»، معلوم نیست دقیقاً مراد از آن چیست؟ این موارد، چون نوعی جعل اصطلاح است، باید واضح باشد و به‌خوبی توضیح داده شود.

مطلب دیگر اینکه کلمه «توصیف» که در فارسی به‌کار می‌بریم، در عربی به این معنا نیست. در عربی می‌گویند «وصف».

یکی هم «الأداة العالیة» است که دقیقاً یعنی ابزار ماشینی؛ چون «آلیَة» یعنی ماشین، و «ادوات» هم یعنی ابزار. بهتر بود که به جای ماشینی، بگویید کامپیوتری؛ یعنی نیاز نیست اصلاً کلمه «ماشین» را به کار ببرید؛ همان‌طورکه مداخل به وسیله کامپیوتر استخراج شده‌اند.»

ایشان در بخش دوم، به بیان برخی اشکال‌های محتوایی پرداختند که توسط کارشناسان پاسخ داده شد.

ناقد پایگاه: دکتر ملکی: مبنای انتخاب کتاب‌های لغوی در پایگاه قاموس نور

«کاری که انجام شده، واقعاً خدمت عظیمی است و یک دانش جدید به شمار می‌رود و در حوزه علمیه، به این شکل کار نشده است. بنده مطالبی را که به نرم‌افزار و پایگاه مربوط می‌شود، به صورت مکتوب می‌نویسم و در فرصت مناسب ارائه می‌کنم؛ اما اجازه می‌خواهم در این فرصت، مطلب دیگری را مطرح نمایم.

اگر عربی را دو قسمت کنیم، یک قسمت آن، عربی معاصر است و یکی هم عربی اصیل. عربی‌ای که پایه و اساس قرآن کریم و روایات است، عربی اصیل است و طلاب هم با آن سروکار دارند. پس، باید مقدمات این دو دسته را هم بیاوریم؛ یعنی مخاطب بداند که مبنای‌تان در مصادر و منابعی که آوردید، چیست؟ آیا این نرم‌افزار، همه منابع لغوی را قبول دارد؟ یعنی آیا مصادر لغوی که برای لغت نوشته شده‌اند، مبنای کار شما بوده است؟ یا کتاب‌های غریب القرآن و غریب الحدیث و مفردات، یا اشعار عرب و نصوص عرب هم مبنا بوده است؟ آیا همه اینها در تمام اعصار تاریخ، مبنای شما بوده‌اند؟»

کارشناس پایگاه: حجت‌الاسلام توحیدی: تبیین مبنای انتخاب کتاب‌های لغت

«تأکید ما، بر کار ماشینی بوده است؛ ولی پس از استخراج ماشینی، بازبینی‌ای که پژوهشگر انجام می‌دهد، کار را تمام می‌کند. برای استخراج ماشینی، ما با بررسی متن کتب منابعی را انتخاب می‌کنیم که از ساختار مناسب برخوردار بوده و از حیث علائم ویرایشیِ به‌کاررفته در آن، به گونه‌ای باشد که بتوانیم قواعد حاکم بر نگارش متن را استنتاج کنیم و با آموزش این قواعد به ماشین، اطلاعات مورد نیاز را استخراج کنیم. بنابراین، کتاب لسان العرب بابت نداشتن ساختار مورد نظر ما برای استخراج ماشینی، از اولویت کاری خارج شد؛ یعنی اگر می‌خواستیم، شاید می‌توانستیم فقط ده تا پانزده درصد، استخراج اطلاعات داشته باشیم.

اما الآن شما ملاحظه می‌کنید لسان العرب، بدون اینکه ما هیچ کار دستی‌ای روی آن انجام داده باشیم، در پایگاه ارائه شده دارد که این استخراج، مبتنی بر یادگیری ماشین از اطلاعات استخراج‌شده از سایر کتاب‌ها بوده است. در واقع، بنای ما، بر کار ماشینی است؛ ولی این کار ماشینی، نیازمند بازبینی است که عزیزان ما در معاونت پژوهش، آن را انجام می‌دهند که بخش مهمی هست.

نکته دیگر، ارائه توصیف از ریشه هاست که با استفاده از کتاب ارزشمند معجم مقاییس اللغة در پایگاه ارائه شده و این توصیفات، به همراه تمامی مداخل نماینده‌ای که از یک ریشه هستند، در صفحه مستقلی قابل دسترس می‌باشد.

همچنین، با استفاده از موتور صرف نور، یک تحلیل صرفی از مداخل نماینده عربی نیز در پایگاه عرضه شده است.

اگرچه تمرکز ما روی منابع عربی بوده، اما در یک سال اخیر، به منابع فارسی هم ورود پیدا کردیم؛ برای اینکه ساختار قاموس در قسمت عربی، با بخش فارسی آن متفاوت بوده است. ازاین‌رو، یک بخش مستقلی را به فارسی اختصاص داده‌ایم.

هم‌اکنون مداخل لغویِ هفت منبع از منابع لغت فارسی را در پایگاه داریم که مجموعاً سیصد و هفتاد و پنج هزار مدخل لغوی است و عمده آن، از لغت‌نامه دهخدا و فرهنگ نفیسی است.»

کارشناس پایگاه: دکتر سریانی: مشکلات پیش رو در پایگاه قاموس نور

«ما با برخی چالش‌ها مواجه هستیم که ـ ان‌شاءالله ـ ناقدان محترم به ما کمک کنند که با این چالش‌ها چگونه مواجه بشویم و چگونه آنها را حل کنیم.

یکی از این چالش‌ها، در مورد شیوه‌ای است که کتاب المنجد دارد و سعی کرده است به سبک بازگرداندن کلمات به معنای اصلی که ابن فارس در معجم مقاییس اللغة دارد، عمل کند؛ اما این شیوه، در خیلی جاها نقض دارد؛ یعنی یک ثلاثی مزید را ذیل یک ثلاثی مجرد آورده و ذیل ثلاثی مجرد دیگر، این کار را نکرده است.

آیا مثلاً بگوییم این ثلاثی مزید، عیناً مرتبط معنایی با این ثلاثی مجرد است و یا این صفت مشبهه، مربوط به این ثلاثی مجرد است؟ تردید داریم که آیا می‌توانیم قطعاً مثل المنجد عمل کنیم یا اینکه خیر؛ باید دست خودمان را مثل معجم‌نویس‌های دیگر همچون المعجم الوسیط، باز بگذاریم و خودِ کاربر تشخیص بدهد آیا این مدخل با مداخل دیگر، مرتبط هست یا نه.

چالش دوم، در مورد تجمیع مداخل است. آیا مداخل را تا جایی که امکان دارد، به هم متصل کنیم مثل المنجد، یا اینکه به دلیل نقض‌های بسیاری که در عمل وجود دارد، این کار را انجام ندهیم؟

چالش دیگر، در مورد تجمیع توصیفات هست. در فاز بعدی، می‌خواهیم سراغ تجمیع توصیفات برویم که آقای دکتر زاهدی فرمودند؛ اینکه واقعاً تا چه حد توصیفات را تجمیع کنیم؛ آنجایی که عین هم هستند یا آنجایی که این طور نیستند، مثلاً ممکن هست یک اختلاف در «با» و «فی» داشته باشند، آیا اینجا می‌توانیم تسامح قائل بشویم و بگوییم: این دو چیز، یک چیز هستند؟ یا اینکه ظرافت‌های لغوی را حفظ کنیم. مسئله تجمیع توصیفات هم یک مشکل است.

این مطلبی که ذکر شد، بیانگر آن است که سختی کار ما در مسیر هوشندسازی و شناسایی ماشینی کلمات، فوق‌العاده زیاد است. همه اینها از مواردی است که نیاز دارد بدانیم چقدر باید پیش برویم و تا چه اندازه در توصیف مداخل و اجتهاد کردن، دستمان باز است. آیا فقط در مرحله تجمیع باقی بمانیم یا اینکه مرکز نور مستقلاً به سوی ایجاد توصیفات جدید و تولید لغت‌نامه جدید گام بردارد. این مباحث، باید شفاف‌سازی شود.»

ناقد پایگاه: دکتر زاهدپور: ضرورت توسعه حداکثری منابع لغوی در پایگاه قاموس نور

«در تایپ عربی، حرف «وَ» به کلمه بعد می‌چسبد و در اینجا ما این «و» را جدا می‌بینیم؛ چرا؟ آیا عمدی بوده است؟

مسئله دیگر اینکه در لغت، کار اجتهادی نکنید. ما عرب‌زبان نیستیم و بدون مراجعه به لغت، نمی‌توانیم واژگان کتاب‌های لغت را معنا کنیم؛ مثلاً تصحیح امالی سید مرتضی، کار یک عرب‌زبان ادیب است. یک فارسی‌زبان، خیلی باید ادیب باشد تا بتواند امالی را تصحیح کند. بنده می‌گویم همین منابعی را که هست، بگذارید باشد. کار اجتهادی روی آنها نکنید. اصلاً از نظر روش‌شناسی هم اشتباه است. ما نمی‌توانیم این کار را انجام بدهیم؛ چون برای این کار، زبان مقصد، باید زبان مادری مترجم باشد.

جناب ملکی گفتند چطور شد این همه کتاب لغت را آوردید؟ آیا همه کتاب‌های لغت مورد تأیید هست؟ من عرض می‌کنم اصلاً عرب‌ها روی زبان خودشان کار نکردند؛ یعنی همین لسان العرب را اگر ابن منظور ننوشته بود، الآن لغت‌نامه‌ای به این گستردگی نداشتیم. خود عرب‌ها در زمینه آموزش مکالمه و لغت، کار درست و حسابی نکرده‌اند. در آموزش انگلیسی، هر سال کتاب عوض می‌شود؛ اما در عربی، چنین چیزی نداریم. بنابراین، مغتنم هست که هرچه کتاب در زمینه لغت عرب باشد، حتی منجد الطلاب، آن هم در برنامه وجود داشته باشد. چون بنده با کار ترجمه سروکار دارم، این نکته را عرض می‌کنم که همان کتاب‌هایی که به نظر ما قابل استفاده نیست، ممکن هست یک معادل برای یک لغت آورده باشد که خیلی راهگشا باشد؛ مثلاً در بین فرهنگ‌های قدیمی عربی ـ فارسی، فرهنگ اصطلاحات معاصر آقای سید مصطفی طباطبایی، در زمینه معادل‌یابی بسیار عالی است. پس، بنده موافق هستم هرچه کتاب لغت در دست شما هست، بیاورید.

اینکه گفتم روی زبان عربی از این نظر کار نشده، در قیاس با زبان انگلیسی است و عربی، بسیار عقب است. ثانیاً نمی‌گویم اصلاً کار نشده است؛ ولی وقتی بیست و دو کشور به زبان عربی حرف می‌زنند و تعداد قابل توجهی دانشگاه عربی داریم، از اینها انتظار می‌رود که کارهای خیلی حسابی و مفصلی در حوزه زبان عربی و واژه‌شناسی داشته باشند. ما در عربی، چیزی مثل وب‌سرویس دیکشنگری نداریم که هر سال ویرایش بشود. کدام فرهنگ لغت عربی معاصر را می‌توانیم با خیال راحت به آن استناد کنیم. من الآن یک مترجم رسمی هستم؛ گاهی سندهایی در خصوص احکام دادگاه تجدید نظر کویت برای من می‌آید و اصطلاحاتی در آن هست که هیچ فرهنگ عربی آن را ندارد. بنابراین، مجبورم به سایت دادگستری کویت مراجعه کنم و حکم‌های دیگری را که مشابه باشد، پیدا می‌کنم و ترجمه نمایم.

سایت المعانی که دوستان فرمودند، گل سرسبد کارهای عرب‌زبانان است؛ اما خیلی نقص دارد. ما الآن سیستم آموزش زبان عربی نداریم و انتظار داریم خود جهان عرب بیاید یک کتاب ارائه بدهد که سیستم آموزش امروزی داشته باشد.

مسئله مهم دیگر، مخاطب‌محور بودن است که شما بیان فرمودید. من واقعاً دست‌مریزاد می‌گویم به شما که کاربر با درج یک کلمه در خط جست‌وجوی سایت، حالت‌های دیگر آن کلمه نیز پیشنهاد داده می‌شود و او را به مقصود می‌رساند. این، کار خوبی است و باید در توضیحات خود، آن را برجسته کنید؛ البته نواقصی دارد؛ مثل اینکه وقتی واژه «شقی» را کاوش می‌کنم، علاوه بر پاسخ‌های مرتبط، کلمه‌ای مثل «مَشَقَ» هم می‌آید که ارتباطی به دیگر پاسخ‌ها ندارد. در مجموع، اینکه برنامه شما مخاطب‌محور است، بسیار ارزشمند است و بر حُسن کار شما می‌افزاید.

مسئله دیگر، درباره المنجد است که در این باره صحبت جدی دارم. مبنا در زمینه عربی، تا آنجا که می‌دانم، دو کتاب لغت بوده است که در توضیح یا توصیف مدخل‌ها، به معنای اصلی اشاره کرده‌اند. یکی، معجم مقاییس اللغة است که معانی متباین یک واژه را بیان می‌کند و مثلاً می‌گوید فلان کلمه، دارای سه معنای متباین است و در حقیقت، استعمال‌های مختلف را بیان می‌کند. دوم، کتاب المنجد است. شما اگر المنجد را ببینید، ذیل مادّه «ضربَ»، تا هشت معنا را شماره‌گذاری کرده است؛ یعنی همان ابتدا می‌گوید این «ض ر ب»، هشت معنای متباین دارد و بعد گفته «ضَرَبَ»‌ای که به معنای حرکت است، باب افعال است؛ یعنی «إضرب». این ویژگی المنجد، برای آموزش صرف و نحو و نیز ترجمه، بسیار عالی است.

پیشنهاد دیگر اینکه اگر متن طبری را که ترجمه شده، در کارتان در نظر بگیرید یا محصول جداگانه‌ای تولید نمایید، خیلی مفید است. مجموعه نور، با توجه به توانمندی‌هایی که دارد، می‌تواند این کار را انجام بدهد.»

ناقد پایگاه: دکتر ملکی: ضرورت اطلاع‌رسانی درباره امکانات پایگاه قاموس نور

«پیشنهاد بنده، این است که فعلاً ضرورت لاگین شدن را بردارید؛ تا کاربر بتواند به‌راحتی وارد پایگاه شود. در پایگاه، امکان ثبت نظر کاربر وجود داشته باشد تا کاربران ایرادهایی را که برمی‌خورند، ثبت کنند.

پیشنهاد دیگر، آن است که برای معرفی این برنامه‌ها باید در محدوده حوزه و دانشگاه، به‌خوبی اطلاع رسانی شود. افراد بسیاری هستند که نیاز به آن دارند؛ اما از آن بی‌اطلاع‌اند.

نکته دیگر اینکه یک مقدار علمی‌تر به منابع نگاه کنید؛ نه اینکه بخواهم بگویم نگاه علمی نشده؛ بلکه لازم است مقداری تأمل بیشتری بشود؛ البته تا آنجایی که می‌شود، هیچ منبعی را حذف نکنید؛ هرچند آن منبع، ضعیف باشد.»

کارشناس پایگاه: دکتر سریانی: استفاده از هوش مصنوعی در پایگاه قاموس نور

«یک مطلب عرض می‌کنم که پیش‌زمینه‌‎ای باشد برای نشست بعدی که ـ ان‌شاءالله ـ از حضور شما ناقدین محترم استفاده کنیم و آن، بحث هوشمندسازی فضای پایگاه است. وقتی کاربر کلمه‌ای را جست‌وجو می‌کند، اگر عین همان کلمه را داشته باشیم، همان را در اختیارش می‌گذاریم؛ یعنی سامانه به طور هوشمند به آن کلمه، یک الف و لام اضافه می‌کند و به شکل مدخل نماینده آن را بازیابی می‌نماید؛ مثل اینکه مثلاً کاربر در خط جست‌وجو واژه «ضَرَبتُ» را می‌نویسد و سیستم «ضرب» را در مداخل خودش دارد. هوش مصنوعی، کارش در اینجا این است که حرف «تِ» را از آن کلمه برمی‌دارد و آن را پیراسته می‌کند. در مرحله بعد، به سراغ کلماتی می‌رود که از موتور صرف به دست می‌آید. پس، نرم‌افزارهای هوشمند علاوه بر اینکه آن کلمه را پیراسته می‌کنند، یک مرحله جلوتر می‌روند و آن را واکاوی صرفی می‌کنند؛ مثلاً می‌گویند این کلمه، صیغه دوازده است و یا این کلمه، صیغه ششم است و یا این کلمه، صفت مشبهه است و بعد آن را به نزدیک‌ترین کلمه‌ای که در مداخل دارد، متصل می‌کند. این سه مرحله، فرایندی است که در فاز هوشمندسازی سیستم در حال شکل‌گرفتن و تکمیل است و امیدواریم بتوانیم در فازهای بعدی، عیناً کلمه را مشخص کنیم.»

اطلاعات تکميلي

  • تاریخ انتشار نسخه چاپی: شنبه, 27 آذر 1400
  • صفحه در فصلنامه: صفحه 26
  • شماره فصلنامه: فصلنامه شماره 76
بازدید 4238 بار
شما اينجا هستيد:خانه