اشاره

حدیث، از منابع متنی مهم در استنباط آموزه های شرعی، عقیدتی و اخلاقی در اسلام است. فزونی منابع حدیثی و ضرورت استفاده از آن در شناخت احکام اسلام، استفاده از فنون خودکار استخراج دانش از متون حدیثی را ضرورت می‏ بخشد. خصوصیات زبانی ویژه متون حدیثی (زبان عربی قدیم و متون روایت‏گونه)، مستلزم گردآوری و بهره گیری از شیوه های خاص پردازش زبان طبیعی شده است که در متون و زبان‏های دیگر استفاده از چنین پردازش‏های خاص نبوده است. در این مقاله، نخست استخراج خودکار دانش بر پایه فنون متن‏ کاوی بیان، و پژوهش‏های انجام شده برای استفاده از این شیوه ها در استخراج دانش از متون حدیثی، بررسی می‏ شود.

منتشرشده در فصلنامه شماره 60
پنج شنبه, 30 شهریور 1396 ساعت 15:21

داده های بزرگ؛ ویژگی ها و کاربردها

اشاره

در این مقاله، بهترین دستاوردهای داده های بزرگ را مورد بررسی قرار داده و سپس، مصارف عمومی داده های بزرگ را معرفی کرده، فناوری های مربوطه را بررسی می نماییم؛ مانند: محاسبات ابری، اینترنت اشیاء، مراکز داده ای و هادوپ. آنگاه بر چهار فاز زنجیره ارزشی داده های بزرگ تمرکز می کنیم؛ همچون: تولید داده، اکتساب داده، ذخیره داده و تحلیل داده. پس از این، چالش های فنی را در این زمینه مورد بحث قرار داده، آخرین پیشرفت ها را بررسی کرده در نهایت نیز به چندین نمونه از برنامه های کاربردی داده های بزرگ اشاره می نماییم؛ از جمله، مدیریت تجاری، اینترنت اشیاء، شبکه های اجتماعی آنلاین که همگی می توانند در مباحث علوم انسانی و اسلامی مورد استفاده قرار گیرند و یا دست مایه پژوهش برای دست اندرکاران مهندسان و متخصصان این حوزه قرار گیرد.

منتشرشده در فصلنامه شماره 59
چهارشنبه, 31 خرداد 1396 ساعت 15:30

استخراج مفهوم در داده کاوی

مقدمه

استفاده از رایانه در امور مختلف، باعث شده تا داده های بسیاری با سرعت های زیاد در پایگاه داده ها انباشته و ذخیره شوند. پردازش این داده های حجیم، خارج از توان انسان است. تلاش های فراوانی تاکنون انجام شده است تا نرم افزارها و سخت افزارها توسعه پیدا کنند و تولید، ذخیره و انتقال داده ها انجام گردد؛ اما تجزیه و تحلیل این حجم از داده ها توسط رایانه ها، بعد از ذخیره و پردازش، تاکنون انجام نشده است. داده ها در عصر حاضر، قلب تپنده هر سازمان را تشکیل می دهند و هر روز به میزان داده ها در سیستم های اطلاعاتی افزوده می شود. در واقع، سازمان ها در اطلاعات غرق شده اند؛ درحالی که تشنه دانش هستند. این امر، نشانگر آن است که سازمان ها نتوانسته اند از دانش درون داده ها به نحو مناسب استفاده نمایند. در درون حجم عظیمی از داده ها، الگوها و روابط بسیاری میان پارامترهای مختلف به صورت پنهان باقی می ماند که برای برنامه ریزی های استراتژیک و طولانی مدت می تواند حیاتی باشد. بنابراین، نیاز به ابزاری است تا داده ها را به گونه ای پردازش کند تا دانش حاصل از آن را در اختیار تصمیم گیران سازمان قرار دهد. یکی از راهکارهایی که امروزه در این زمینه ایجاد و در حال گسترش است، داده کاوی(1) است. داده کاوی، فرآیند کشف دانش پنهان درون داده هاست که با توصیف، تشریح، پیش بینی و کنترل پدیده های گوناگون پیرامونی، دارای کاربرد بسیار وسیعی در حوزه های مختلف است؛ به گونه ای که مرز و محدودیتی برای کاربرد آن در نظر گرفته نشده و زمینه های کاربردی آن را از ذرات کف اقیانوس تا اعماق فضاء می دانند (شهرابی، 1386).

منتشرشده در فصلنامه شماره 58

چکیده

غنی سازی محتواهای علوم انسانی و اسلامی، از اهمیت ویژه ای برخوردار است. استفاده از شبکه واژگانی، از مهم ترین راهبردهای تحقیقاتی در رشته های مرتبط با علوم انسانی است. شبکه واژگانی، مجموعه ای از کلمات است که به واسطه ارتباطات معنایی به یکدیگر متصل شده و در سطحی جامع تر از یک لغت نامه در یادگیری یا استخراج اطلاعات مورد نیاز محققان کاربرد دارد. روند فعالیت در دستیابی خودکار به یک شبکه واژگانی منسجم، در گرو پردازش لفظی و پردازش معنایی بر اساس متن کاوی داده های عربی در منابع زبانی دقیق و مناسب است. استفاده از فرآیند ماشینی در هر یک از این مراحل پردازش و یافتن منابع عربی دقیق علوم اسلامی، با چالش های مختلفی رو به رو بوده که در این مقاله، به بررسی برخی جزئیات این طرح، به ویژه بر اساس دادگان موجود در مرکز تحقیقات کامپیوتری علوم اسلامی و روش مقابله با چالش ها پرداخته شده است.

منتشرشده در فصلنامه شماره 57
پنج شنبه, 27 اسفند 1394 ساعت 15:03

ابهام زدایی هوشمند صرفی نور

چکیده

یکی از چالش های پیش روی پردازش زبان طبیعی زبان عربی، رفع ابهام میان تحلیل های صرفی ممکن یک کلمه به تناسب جایگاه آن کلمه در جمله است. یک تحلیلگر صرفی، به ازای هر کلمه ورودی، ممکن است بیشتر از یک جواب صرفی داشته باشد. تشخیص اینکه کدام یک از تحلیل های ممکن، تحلیل صحیح کلمه مورد نظر است، توسط ابزارهای رفع ابهام صورت می گیرد. این مقاله، به یکی از قوی ترین ابزارهای رفع ابهام اشاره می کند که به صورت خاص، برای تحلیلگر صرفی نور (Noor Morphological Analyzer) طراحی شده است. این ابزار که ابهام زدای صرفی نور (Noor Morphological Disambiguation) نامیده شده، ترکیبی از الگوریتم های یادگیری و قاعده محور است. آزمایش های این تحقیق نشان می دهد که رفع ابهام صرفی نور می تواند با دقت 88 درصد خروجی های تحلیلگر صرفی نور را رفع ابهام نماید.

منتشرشده در فصلنامه شماره 53

چکیده

به دست آوردن سیر اشتقاق تصریف از ریشه تا کلمه، پیداکردن کلمات مرتبط و در نهایت، تشکیل خانواده کلمات مربوط به هم، شرایط مساعدی را برای محققان پردازش زبان طبیعی فراهم می کند تا بتوانند از مرحله لفظ به دامنه وسیع لغات هم معنا، آنتولوژی، شبکه معنایی، تحلیل محتوا و در نهایت، درک معنا قدم بگذارند. در این بین، ساخت درخت سلسله مراتبی کلمات مرتبط با هم از ریشه(صرفی) تا برگ(کلمات متن)، اهمیت بسزایی دارد. در این مقاله، به چندین فایده از فواید «تحلیلگر صرفی نور» اشاره شده است. بعضی از این موارد، عملیاتی شده و هم اکنون در حال استفاده هستند و بعضی دیگر نیز نزدیک به اجرا می باشند. از جمله این موارد، بهره برداری در شناسایی خودکار سیر اشتقاق تصریف و تشکیل درخت سلسله مراتبی می باشد. عناصر داخل این درخت، همگی توسط تحلیلگر صرفی نور تولید می گردند. بعد از آن، عملیات دسته بندی و در نهایت ایجاد درخت مذکور صورت می پذیرد. تمام مسیرهای موجود از برگ ها تا ریشه، موضوعیت دارند که در این نوشتار به چند فایده از آن اشاره شده است.

منتشرشده در فصلنامه شماره 53
پنج شنبه, 30 بهمن 1382 ساعت 14:25

داده پردازی فقه شیعه، نیاز ها و چالش ها

گنجینه میراث فقهی تشیع، با گذشت قرون و اعصار گسترده شد و منابع و کتب فقهی بی شماری به نگارش در آمد. فقهاء در طول زمان، به رغم رویارویی با شرایط دشوار و مشکلاتی که گریبانگیرشان بوده، از تدوین اندیشه ها و آراء خود دست بر نداشته و آثار سرشار از مباحث نفیس و ارزشمند فقهی را فراهم آورده اند. اما میراث گذشتگان هر چند فاخر و غنی باشد، به تنهایی برای ماندگاری فقه کافی نیست. نیازهای روزافزون انسان ها، مسائل نوپیدا و ظهور و بروز آنها در گردونه زندگی، ضرورت دگرگونی در ساحت فقاهت را بیش از هر زمانی در کانون توجه قرار داده است.

منتشرشده در فصلنامه شماره 04
یکشنبه, 30 آذر 1393 ساعت 15:32

کاربرد متن کاوی در سازمان دهی دانش

چکیده

سازمان دهی دانش و متن کاوی، در بازیابی دقیق اطلاعات کاربرد بسیاری دارند. از این رو، متن کاوی می تواند کارکردهای بسیاری در بهبود سازمان دهی دانش داشته باشد. اگرچه متن کاوی، به ویژه در بخش یادگیری ماشینی و به دست آوردن اسناد و نمونه های آموزشی، نیازمند نظام های اصطلاح نامه، طبقه بندی، فهرست نویسی و نمایه سازی است، سازمان دهی برای تسریع کار خود، نیازمند فنون متن کاوی و نتیجه کارهای آن خواهد بود تا هم سرعت کار خویش را افزایش دهد و هم هزینه هایش را بکاهد. در این نوشتار، به کارکردهای متن کاوی در حوزه سازمان دهی دانش پرداخته خواهد شد.

منتشرشده در فصلنامه شماره 48

چکیده

هر حوزه‌ای از دانش، اصطلاح‌ها و عبارت‌هایی دارد که دارای تعاریف و معانی ویژه است و متخصصان آن حوزه برای آن‌ها در نظر گرفته‌اند. ممکن است هر یک از این اصطلاح‌ها در دیگر رشته‌های علوم، یا حتی در زیررشته‌های دیگر یک علم، معانی و تعاریف دیگری داشته باشند. در حوزه سازمان‌دهی اطلاعات که از مباحث مطرح در علم کتابداری و اطلاعات است، اصطلاح‌هایی خاص مطرح است که در ذیل به برخی از رایج‌ترین آنها پرداخته خواهد شد.

منتشرشده در فصلنامه شماره 48

چکیده

با گسترش روزافزون حجم اطلاعات، نیاز به سیستم‌های کامپیوتری جهت پردازش و تحلیل اطلاعات بیشتر احساس می‌شود. از آنجا که درصد قابل توجهی از اطلاعات تولید شده به صورت متنی غیر ساختار یافته(1) و نیمه‌ساختار یافته(2) است، سیستمی که بتواند این اطلاعات را تحلیل و پردازش کند، به‌شدت مورد توجه قرار خواهد گرفت. یکی از انواع سیستم‌هایی که در تحلیل و پردازش متون وجود دارد، سیستم‌های خلاصه‌ساز متن(3) است که حجم زیادی از متن را دریافت نموده و بر اساس الگوریتم‌ها و تکنیک‌های مختلف، آن را خلاصه می‌نماید. این مقاله به معرفی فرآیند خلاصه‌سازی متون فارسی می‌پردازد.

منتشرشده در فصلنامه شماره 34
صفحه1 از3
شما اينجا هستيد:خانه نمایش موارد بر اساس برچسب: داده کاوی