مقایسه کارایی الگوریتم KNN و CART روی دیتاست رادار
مقایسه کارایی الگوریتم KNN و CART روی دیتاست رادار ، در این ساعت از مطلب دی ال پروژه ای دیگر را برای شما عزیزان آماده کرده ایم تحت عنوان مقایسه کارایی الگوریتم KNN و الگوریتم درخت تصمیم CART روی دیتاست رادار.در ادامه توضیحات مختصری در رابطه با پروژه و همچنین لینک دانلود پروژه آورده شده است.
مقدمه مقایسه کارایی الگوریتم KNN و CART روی دیتاست radar :
در این پروژه با استفاده از مجموعه داده radar ، که مجموعه داده ای برای دسته میباشد استفاده شده است. که هدف دستهبندی این مجموعه داده با استفاده از الگوریتمهای طبقهبند knn و درخت تصمیم میباشد. جهت ارزیابی مدل ها نیز از روش ۱۰-fold Cross Validation استفاده شده است.
دیتاست radar :
مجموعه داده radar در این پروژه استفاده شده است، این مجموعه داده داده ۳۴ ویژگی میباشد، و جهت کلاسهبندیهای دودویی به کار میرود. بنابراین دارای دو کلاس خوب (۱) و بد (۱-) میباشد. تعداد نمونهها این مجموعه داده برابر ۳۵۱، است.
پیش پردازش دادهها :
الف) مجموعه داده رادار داری مقادیر از دست رفته (Missing Vlaue)، نمیباشد. اما در صورتی که دارای مقادیر از دست رفته بود، می توانستیم با میانگین گیری به این موارد مقدار دهی نماییم.
ب) یکی از راه های درک دادهها و شناخت داده ها، بصری سازی داده (Visualization ) داده ها میباشد. بصری دادهها کمک میکند به خوبی دادهها را شناخته و بتوان با استفاده از این شناخت الگوریتمهای مناسب را جهت کلاسهبندی انتخاب کرد. یکی از این نمودارها BoxPlot میباشد.(اطلاعات بیشتر در گزارش پروژه به صورت مفصل آورده شده است)
دسته بندی :
الف) دستهبندی به روش KNN:
الگوریتم دستهبندی K- نزدیکترین همسایه یک الگوریتم دستهبندی مبتنی بر نمونه، باناظر و از دسته الگوریتمهای تنبل میباشد. اساس کار این الگوریتم مقایسهی میزان شباهت نمونهی جدید با نمونههای موجود در دیتاست اولیه (آموزشی) میباشد. بنابراین جهت بدست آوردن میزان شباهت دو نمونه از معیار فاصلهی دو نمونه استفاده میشود که روش های متفاوتی جهت بدست آوردن فاصله بین دونمونه در فضای جستوجوی مساله وجود دارد (اطلاعات بیشتر در گزارش پروژه به صورت مفصل آورده شده است)
ب) درخت تصمیم :
درخت کلاسه بندی و رگراسیون (CART) روشی است که از دادههای قبلی (تاریخی) جهت ساخت درخت تصمیم استفاده میکند. سپس از درخت تصمیم تولید شده جهت دستهبندی دادهی جدید استفاده میکند. درخت تصمیم با استفاده از سوالات که نمونهی آموزشی را به قسمتهای کوچک و کوچکتر تبدیل میکند نمایش داده میشود. درخت CART تنها سوالهای بلی/خیر را میپرسد که یکی از سوالهای ممکن به صورت مقابل است: ” آیا جنسیت فرد مورد نظر مذکر است؟ “. الگوریتم CART برای همهی متغیرها و مقادیر ممکن جهت پیدا کردن بهترین برش استفاده میکند برش (سوالی) که دادهها را به دوبخش با بیشترین شباهت تقسیم کند (اطلاعات بیشتر در گزارش پروژه به صورت مفصل آورده شده است)
نتایج به دست آمده :

همچنین بخوانید: پیاده سازی الگوریتم درخت تصمیم با نرم افزار متلب و weka
قیمت پروژه : ۶۵۰۰۰ تومان
حجم : ۱۳۰ کیلوبایت
منبع : مطلب دی ال
رمز فایل : www.matlabdl.com

دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.