کاوش الگوهای پرتکرار با روش Apriori و Fp Growth
در این پروژه قصد داریم، با استفاده از روش های کاوش در بیگ دیتا (داده های حجیم) و مفهوم الگوهای پرتکرار، در یک مجموعه داده (Basket_Itemset) ، به کمک الگوریتم های Fp Growth و روش Brute Force که در این پژوهش روش Apriori انتخاب شده است ، الگوهای پرتکرار را استخراج نماییم.
روش های Brute Force و FP Growth
هدف از انجام این پروژه این بوده است که روش های Brute Force و FP-Growth را بر روی یک مجموعه داده ی نمونه پیاده سازی نماییم و در ادامه Maximal Frequent Item Sets و Closed Item Sets را با توجه به پیاده سازی انجام شده توسط روش FP Growth تشخیص و خروجی دهیم.
مجموعه داده Basket_Itemset
مجموعه داده ی مذکور که در این پروژه مورد استفاده قرار گرفته است یک فایل متنی با نام Basket_Itemset است که قصد پیاده سازی الگوریتم Fp Growth و روش Apriori را بر روی این مجموعه داده داریم. در این مجموعه داده ۲۰ نوع آیتم مختلف وجود دارد که از صفر تا ۱۹ شماره گذاری شده اند و این مجموعه داده دارای ۱۰۰۰۰۰ رکورد است ( هر خط را یک رکورد فرض می نماییم ) که هر رکورد در حقیقت نمایانگر یک سبد خرید است.
نکاتی که در مورد سبد خرید وجود دارد :
- سبد خرید می تواند دارای تعداد دلخواهی آیتم باشد
- سبد خرید می تواند از یک آیتم بیش از یک عدد اختیار نماید (برای مثال از آیتم شماره ۱۹ دو عدد داشته باشیم)
- سبد خرید می تواند یک یا چند آیتم را شامل نباشد
برای درک بهتر یک رکورد از مجموعه داده را در ادامه مورد بررسی قرار داده ایم :

در تصویر بالا رکورد شماره ۹۶۲ را مشخص نموده ایم. این رکورد خود یک سبد خرید است که شامل آیتم های مشخص شده در جدول پایین می باشد

نکات مربوط به پیاده سازی :
- روش Brute Force که در این پروژه روش Apriori را انتخاب شده است ، با استفاده از مجموعه داده ی Basket_Itemset بر روی مسئله ی Frequent Item set پیاده سازی کرده ایم.
- روش FP Growth را با استفاده از دیتاست Basket_Itemset بر روی مسئله ی Frequent Item Set پیاده سازی کرده ایم.
- پیاده سازی FP Growth را بگونه ای گسترش داده ایم که برنامه ی Maximal Frequent Item Sets و Closed Item Sets را خروجی می دهد.
- این پروژه مربوط به مبحث داده کاوی می باشد و در نرم افزار متلب پیاده سازی شده است.
کارشناسان وب سایت MATLABDL قادر به انجام پروژه در زمینه های مشابه (پروژه های داده کاوی و…) نیز می باشند.
قیمت پروژه : ۹۰۰۰۰ تومان
حجم : ۲٫۸۰ مگابایت
توضیحات : پیاده سازی در نرم افزار متلب انجام شده است.
کلمات کلیدی: کاوش الگوهای پرتکرار,استخراج الگوهای پرتکرار,بیگ دیتا, روش های Brute Force,روش Apriori,پیاده سازی در نرم افزار متلب
منبع : مطلب دی ال
رمز فایل : www.matlabdl.com

دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.