پنج شنبه, 30 شهریور 1396 ساعت 15:21

داده های بزرگ؛ ویژگی ها و کاربردها

اشاره

در این مقاله، بهترین دستاوردهای داده های بزرگ را مورد بررسی قرار داده و سپس، مصارف عمومی داده های بزرگ را معرفی کرده، فناوری های مربوطه را بررسی می نماییم؛ مانند: محاسبات ابری، اینترنت اشیاء، مراکز داده ای و هادوپ. آنگاه بر چهار فاز زنجیره ارزشی داده های بزرگ تمرکز می کنیم؛ همچون: تولید داده، اکتساب داده، ذخیره داده و تحلیل داده. پس از این، چالش های فنی را در این زمینه مورد بحث قرار داده، آخرین پیشرفت ها را بررسی کرده در نهایت نیز به چندین نمونه از برنامه های کاربردی داده های بزرگ اشاره می نماییم؛ از جمله، مدیریت تجاری، اینترنت اشیاء، شبکه های اجتماعی آنلاین که همگی می توانند در مباحث علوم انسانی و اسلامی مورد استفاده قرار گیرند و یا دست مایه پژوهش برای دست اندرکاران مهندسان و متخصصان این حوزه قرار گیرد.

منتشرشده در فصلنامه شماره 59
چهارشنبه, 31 خرداد 1396 ساعت 15:30

استخراج مفهوم در داده کاوی

مقدمه

استفاده از رایانه در امور مختلف، باعث شده تا داده های بسیاری با سرعت های زیاد در پایگاه داده ها انباشته و ذخیره شوند. پردازش این داده های حجیم، خارج از توان انسان است. تلاش های فراوانی تاکنون انجام شده است تا نرم افزارها و سخت افزارها توسعه پیدا کنند و تولید، ذخیره و انتقال داده ها انجام گردد؛ اما تجزیه و تحلیل این حجم از داده ها توسط رایانه ها، بعد از ذخیره و پردازش، تاکنون انجام نشده است. داده ها در عصر حاضر، قلب تپنده هر سازمان را تشکیل می دهند و هر روز به میزان داده ها در سیستم های اطلاعاتی افزوده می شود. در واقع، سازمان ها در اطلاعات غرق شده اند؛ درحالی که تشنه دانش هستند. این امر، نشانگر آن است که سازمان ها نتوانسته اند از دانش درون داده ها به نحو مناسب استفاده نمایند. در درون حجم عظیمی از داده ها، الگوها و روابط بسیاری میان پارامترهای مختلف به صورت پنهان باقی می ماند که برای برنامه ریزی های استراتژیک و طولانی مدت می تواند حیاتی باشد. بنابراین، نیاز به ابزاری است تا داده ها را به گونه ای پردازش کند تا دانش حاصل از آن را در اختیار تصمیم گیران سازمان قرار دهد. یکی از راهکارهایی که امروزه در این زمینه ایجاد و در حال گسترش است، داده کاوی(1) است. داده کاوی، فرآیند کشف دانش پنهان درون داده هاست که با توصیف، تشریح، پیش بینی و کنترل پدیده های گوناگون پیرامونی، دارای کاربرد بسیار وسیعی در حوزه های مختلف است؛ به گونه ای که مرز و محدودیتی برای کاربرد آن در نظر گرفته نشده و زمینه های کاربردی آن را از ذرات کف اقیانوس تا اعماق فضاء می دانند (شهرابی، 1386).

منتشرشده در فصلنامه شماره 58

چکیده

غنی سازی محتواهای علوم انسانی و اسلامی، از اهمیت ویژه ای برخوردار است. استفاده از شبکه واژگانی، از مهم ترین راهبردهای تحقیقاتی در رشته های مرتبط با علوم انسانی است. شبکه واژگانی، مجموعه ای از کلمات است که به واسطه ارتباطات معنایی به یکدیگر متصل شده و در سطحی جامع تر از یک لغت نامه در یادگیری یا استخراج اطلاعات مورد نیاز محققان کاربرد دارد. روند فعالیت در دستیابی خودکار به یک شبکه واژگانی منسجم، در گرو پردازش لفظی و پردازش معنایی بر اساس متن کاوی داده های عربی در منابع زبانی دقیق و مناسب است. استفاده از فرآیند ماشینی در هر یک از این مراحل پردازش و یافتن منابع عربی دقیق علوم اسلامی، با چالش های مختلفی رو به رو بوده که در این مقاله، به بررسی برخی جزئیات این طرح، به ویژه بر اساس دادگان موجود در مرکز تحقیقات کامپیوتری علوم اسلامی و روش مقابله با چالش ها پرداخته شده است.

منتشرشده در فصلنامه شماره 57
پنج شنبه, 27 اسفند 1394 ساعت 15:03

ابهام زدایی هوشمند صرفی نور

چکیده

یکی از چالش های پیش روی پردازش زبان طبیعی زبان عربی، رفع ابهام میان تحلیل های صرفی ممکن یک کلمه به تناسب جایگاه آن کلمه در جمله است. یک تحلیلگر صرفی، به ازای هر کلمه ورودی، ممکن است بیشتر از یک جواب صرفی داشته باشد. تشخیص اینکه کدام یک از تحلیل های ممکن، تحلیل صحیح کلمه مورد نظر است، توسط ابزارهای رفع ابهام صورت می گیرد. این مقاله، به یکی از قوی ترین ابزارهای رفع ابهام اشاره می کند که به صورت خاص، برای تحلیلگر صرفی نور (Noor Morphological Analyzer) طراحی شده است. این ابزار که ابهام زدای صرفی نور (Noor Morphological Disambiguation) نامیده شده، ترکیبی از الگوریتم های یادگیری و قاعده محور است. آزمایش های این تحقیق نشان می دهد که رفع ابهام صرفی نور می تواند با دقت 88 درصد خروجی های تحلیلگر صرفی نور را رفع ابهام نماید.

منتشرشده در فصلنامه شماره 53

چکیده

به دست آوردن سیر اشتقاق تصریف از ریشه تا کلمه، پیداکردن کلمات مرتبط و در نهایت، تشکیل خانواده کلمات مربوط به هم، شرایط مساعدی را برای محققان پردازش زبان طبیعی فراهم می کند تا بتوانند از مرحله لفظ به دامنه وسیع لغات هم معنا، آنتولوژی، شبکه معنایی، تحلیل محتوا و در نهایت، درک معنا قدم بگذارند. در این بین، ساخت درخت سلسله مراتبی کلمات مرتبط با هم از ریشه(صرفی) تا برگ(کلمات متن)، اهمیت بسزایی دارد. در این مقاله، به چندین فایده از فواید «تحلیلگر صرفی نور» اشاره شده است. بعضی از این موارد، عملیاتی شده و هم اکنون در حال استفاده هستند و بعضی دیگر نیز نزدیک به اجرا می باشند. از جمله این موارد، بهره برداری در شناسایی خودکار سیر اشتقاق تصریف و تشکیل درخت سلسله مراتبی می باشد. عناصر داخل این درخت، همگی توسط تحلیلگر صرفی نور تولید می گردند. بعد از آن، عملیات دسته بندی و در نهایت ایجاد درخت مذکور صورت می پذیرد. تمام مسیرهای موجود از برگ ها تا ریشه، موضوعیت دارند که در این نوشتار به چند فایده از آن اشاره شده است.

منتشرشده در فصلنامه شماره 53
پنج شنبه, 30 بهمن 1382 ساعت 14:25

داده پردازی فقه شیعه، نیاز ها و چالش ها

گنجینه میراث فقهی تشیع، با گذشت قرون و اعصار گسترده شد و منابع و کتب فقهی بی شماری به نگارش در آمد. فقها در طول زمان، به رغم رویارویی با شرایط دشوار و مشکلاتی که گریبانگیرشان بوده، از تدوین اندیشه ها و آرای خود دست بر نداشته و آثار سرشار از مباحث نفیس و ارزشمند فقهی را فراهم آورده اند. اما میراث گذشتگان هر چند فاخر و غنی باشد، به تنهایی برای ماندگاری فقه کافی نیست. نیازهای روزافزون انسان ها، مسائل نوپیدا و ظهور و بروز آنها در گردونه زندگی، ضرورت دگرگونی در ساحت فقاهت را بیش از هر زمانی در کانون توجه قرار داده است.

منتشرشده در فصلنامه شماره 04
یکشنبه, 30 آذر 1393 ساعت 15:32

کاربرد متن کاوی در سازمان دهی دانش

چکیده

سازمان دهی دانش و متن کاوی، در بازیابی دقیق اطلاعات کاربرد بسیاری دارند. از این رو، متن کاوی می تواند کارکردهای بسیاری در بهبود سازمان دهی دانش داشته باشد. اگرچه متن کاوی، به ویژه در بخش یادگیری ماشینی و به دست آوردن اسناد و نمونه های آموزشی، نیازمند نظام های اصطلاح نامه، طبقه بندی، فهرست نویسی و نمایه سازی است، سازمان دهی برای تسریع کار خود، نیازمند فنون متن کاوی و نتیجه کارهای آن خواهد بود تا هم سرعت کار خویش را افزایش دهد و هم هزینه هایش را بکاهد. در این نوشتار، به کارکردهای متن کاوی در حوزه سازمان دهی دانش پرداخته خواهد شد.

منتشرشده در فصلنامه شماره 48

چکیده

هر حوزه‌ای از دانش، اصطلاح‌ها و عبارت‌هایی دارد که دارای تعاریف و معانی ویژه است و متخصصان آن حوزه برای آن‌ها در نظر گرفته‌اند. ممکن است هر یک از این اصطلاح‌ها در دیگر رشته‌های علوم، یا حتی در زیررشته‌های دیگر یک علم، معانی و تعاریف دیگری داشته باشند. در حوزه سازمان‌دهی اطلاعات که از مباحث مطرح در علم کتابداری و اطلاعات است، اصطلاح‌هایی خاص مطرح است که در ذیل به برخی از رایج‌ترین آنها پرداخته خواهد شد.

منتشرشده در فصلنامه شماره 48

چکیده

با گسترش روزافزون حجم اطلاعات، نیاز به سیستم‌های کامپیوتری جهت پردازش و تحلیل اطلاعات بیشتر احساس می‌شود. از آنجا که درصد قابل توجهی از اطلاعات تولید شده به صورت متنی غیر ساختار یافته(1) و نیمه‌ساختار یافته(2) است، سیستمی که بتواند این اطلاعات را تحلیل و پردازش کند، به‌شدت مورد توجه قرار خواهد گرفت. یکی از انواع سیستم‌هایی که در تحلیل و پردازش متون وجود دارد، سیستم‌های خلاصه‌ساز متن(3) است که حجم زیادی از متن را دریافت نموده و بر اساس الگوریتم‌ها و تکنیک‌های مختلف، آن را خلاصه می‌نماید. این مقاله به معرفی فرآیند خلاصه‌سازی متون فارسی می‌پردازد.

منتشرشده در فصلنامه شماره 34

چکیده

در این مستند، به یکی از دغدغه‏ های بزرگ در زمینه زبان‏شناسی محاسباتی(1) با نام برچسب‏گذاری ادات سخن (part of speech tagging) پرداخته شده است. برچسب‏گذاری ادات سخن که یکی از پایه‏ای‏ترین نیازهای پردازش هوشمند متن به شمار می‏آید، وابسته به زبان متن مورد پردازش است. از این رو، فراهم شدن برچسب‏گذاری قوی برای زبان فارسی، جزو اولویت‌های کار ما قرار گرفت. تکنیک مورد کاربرد ما برای حل این مسأله، استفاده ازمدل مخفی مارکوف(2) بوده است. این تکنیک در بسیاری از شیوه‏ های برچسب‏گذاری به کاربرده می‏شود؛ برای نمونه، در برچسب‏گذار TNT[2] که یکی از قوی‌ترین برچسب‏گذارها در زبان‏های مختلف است[4, 5, 8]. طبق آزمایش‌های انجام شده ما، با استفاده از این برچسب‏گذار می‏توان با دقت 94.3% برچسب گونه صرفی کلمات فارسی را مشخص نمود.

منتشرشده در فصلنامه شماره 34
صفحه1 از3
شما اينجا هستيد:خانه نمایش موارد بر اساس برچسب: داده کاوی