طبقه‌ بندی,الگوریتم های classification,شبکه‌ های عصبی,درخت تصمیم ID3,درخت تصمیم J48,درخت تصمیم C4.5,درخت تصمیم CART,ماشین بردار پشتیبان,طبقه بند بیز ساده,K- نزدیکترین همسایه,KNN

طبقه‌ بندی classification و الگوریتم‌های طبقه‌بندی classification

طبقه‌ بندی (classification) یکی از زیر شاخه‌ های اساسی یادگیری ماشین و داده کاوی است. و اساس آن داده‌های جمع‌‌آوری شده از اعمال گذشته هستند. اعمالی که بر اساس دانش فرد خبره برچسب گذاری شدند. برای اینکه یک مدل طبقه‌ بند خوب داشته باشیم، باید با داده‌ها و ساختار آنها و نیز تعداد دسته‌ها (برچسب-کلاس-طبقه‌) اطلاع داشته باشیم.

آشنایی با طبقه‌ بندی classification و الگوریتم های طبقه‌ بندی

روش های یادگیری

همانگونه که در بخش مربوط به روش های یادگیری در شناسایی الگو گفته شد، انسان ها دانش خود را از راه های گوناگونی می آموزند.گاهی یک راهنما یا یک معلم پاسخ صحیح مساله را به ما می آموزد تا در موارد مشابه به کار آید.با الهام از این موضوع ، یک روش یادگیری در علم شناسایی الگو یادگیری نظارتی (Supervised Learning) می باشد. در این روش هر الگو یک برچسب (Lable) دارد که خروجی مطلوب (Desired) آن الگو می باشد.هدف این روش یادگیری تابعی است که الگوهای (بردارهای ویژگی) ورودی را به برچسب های متناظرشان نگاشت می کند.در واقع این کار در فاز آموزش انجام می گیرد.بدیهی است که برچسب های واقعی الگوهای آموزشی از قبل داده شده اند.در فاز تست الگوهایی که برچسب آنها مشخص نیست به سیستم داده می شوند و سیستم طراحی شده به کمک تابع یادگرفته شده ی خود خروجی یا برچسب آنها را پیش بینی می کند.حال اگر خروجی سیستم یادگیری گسسته در نظر گرفته شود مساله طبقه بندی (classification) نام می گیرد و تابعی که ورودی را به خروجی نگاشت می کند طبقه بندی کننده classifier نامیده می شود.

طبقه‌ بندی (classification)

همواره در زندگی ما، مواردی وجود دارند که دوست داریم بدانیم اگر یک کاری را انجام دهیم نتیجه‌ی خوب یا بدی دارد؟ این کار رو چگونه انجام خواهیم داد؟ اگر بخواهیم بر اساس تجارب خودمان عمل کنیم نیاز داریم بر اساس کارهایی که قبلا انجام دادیم، و تجاربی که کسب کردیم ( یک فرآیند یادگیری رخ داده است)، برای شرایط جدید تصمیم گیری نماییم. این پارگراف بیان ساده ای از یادگیری ماشین را بیان می‌کند که تعریف دقیق و علمی آن به صورت زیر است:
طبقه‌ بندی (classification) علمی است که بر اساس داده‌های قبلی که دارای برچسب هستند، مدلی برای پیش بینی برچسب داده‌های جدید می‌سازد.
طبقه‌ بندی classification یکی از زیر شاخه‌ های اساسی یادگیری ماشین و داده کاوی است. و اساس آن داده‌های جمع‌‌آوری شده از اعمال گذشته هستند. اعمالی که بر اساس دانش فرد خبره برچسب گذاری شدند. برای اینکه یک مدل طبقه‌ بند خوب داشته باشیم، باید با داده‌ها و ساختار آنها و نیز تعداد دسته‌ها (برچسب-کلاس-طبقه‌) اطلاع داشته باشیم. هر چند آشنایی با ساختار و نوع داده‌ها گاها عملی غیر ممکن است اما در صورت وجود یک آشنایی ساده گاها نیز می‌توان مدل طبقه بند درست را انتخاب کرد.
برای درک مفهوم طبقه‌ بندی classification یک بار دیگر پارگراف اول را بخوانید. به بیان دیگر؛ طبقه‌ بندی classification فرآیند قرار داده نمونه‌های جدید در طبقات مختلف بر اساس داده‌های قدیمی است و برای این‌کار به یک مدل طبقه‌بند یا الگوریتم طبقه‌بند نیاز است.

الگوریتم های طبقه‌ بندی یا الگوریتم های classification

  • شبکه‌های عصبی
  • درختان تصمیم (CART، C4.5، J48، ID3 و غیره)
  • K- نزدیکترین همسایه (KNN)
  • ماشین بردار پشتیبان (SVM)
  • رگرسیون لوجستیک
  • طبقه بند بیز ساده
  • و غیره.
الگوریتم های طبقه‌ بندی
الگوریتم های طبقه‌ بندی

انتخاب یک مدل طبقه بند می‌تواند به موارد زیر وابسته باشد

  • ساختار و نحوه‌ی توزیع داده ها
  • تعداد طبقه‌ها
  • پیچدگی زمانی ساخت مدل

با این حال در نظر داشته باشید اصلی در یادگیری وجود دارد تحت عنوان “ناهار غیرمجانی” که بیان می‌کند هیچ کدام از این الگوریتم های طبقه‌ بندی روی سایر الگوریتم های classification برتری مطلق ندارد و برای هر مجموعه داده ای الگوریتم ها کارایی متفاوتی دارند. این پارگراف می‌گوید که شما باید با آزمون خطا و تجاربی که احتمالا کسب کرده اید مدل مناسب برای داده‌های خود را انتخاب کنید، پس تا زمانی که از این الگوریتم ها استفاده نکردید در مورد آنها قضاوت نکنید. لطفا انجام دهید.

وب سایت مطلب دی ال با انجام پروژه های الگوریتم های طبقه‌ بندی در خدمت کاربران عزیز می باشد .