پروژه پیاده سازی PCA و مصورسازی داده های iris ، Seeds و Abalone
پروژه پیاده سازی PCA و مصورسازی داده های دیتاست های iris ، Wheat Seeds و Abalone با نرم افزار متلب یا به عبارتی دیگر پروژه آنالیز مولفه اصلی برای 3 دیتاست یادگیری ماشین (iris ، Wheat Seeds و Abalone) در نرم افزار متلب عنوان پروژه ای است که در این ساعت از مطلب دی ال برای دانلود قرار داده ایم.در ادامه توضیحات مختصری در مورد این پروژه و لینک دانلود پروژه آورده شده است.
پروژه پیاده سازی PCA و مصورسازی داده های دیتاست های iris ، Wheat Seeds و Abalone
این پروژه در زمینه داده کاوی می باشد و هدف این پروژه به تصویر کشیدن داده های دیتاست های iris ، Wheat Seeds و Abalone و آنالیز مولفه اصلی برای 3 دیتاست یادگیری ماشین مذکور می باشد.
پیاده سازی PCA
یکی از کاربردهای اصلیِ PCA در عملیاتِ کاهشِ ویژگی (Dimensionality Reduction) است، همانطور که از نامش پیداست میتواند مولفههای اصلی را شناسایی کند و به ما کمک میکند تا به جای اینکه تمامیِ ویژگیها را مورد بررسی قرار دهیم، یک سری ویژگیهایی را که ارزشِ بیشتری دارند، تحلیل کنیم. در واقع PCA آن ویژگیهایی را که ارزش بیشتری فراهم میکنند برای ما استخراج میکند.
معرفی دیتاست iris
اولین دیتاست مربوط به دیتاست iris است که شامل ویژگی های گلهای زنبق مختلف است. این دیتاست حاوی 150 نمونه گل زنبق است که از هر گل زنبق 4 ویژگی زیر برحسب سانتی متر ثبت شده است:
- طول کاسبرگ (sepal length)
- عرض کاسبرگ (sepal width)
- طول گلبرگ (petal length)
- عرض گلبرگ (petal length)
پس ما یک ماتریس 150*4 خواهیم داشت که برای 150 نمونه گل، 4 ویژگی مختلف ثبت شده است. گل های زنبق به سه کلاس زیر تقسیم بندی می شوند:
- ستوسا (Setosa)
- ویرجینیکا (Virginika)
- ورسیکالر (Versicolor)





دیتاست Wheat Seeds
دیتاست Wheat Seeds برای پیش بینی گونه های مختلف دانه گندم استفاده می شود و یک مسئله دسته بندی دو کلاسه متوازن است. تعداد مشاهدات 210، ورودی ها 7 عدد و یک خروجی می باشد. اسامی ویژگی های ورودی به شرح زیر می باشد:
- Area
- Perimeter
- Compactness
- Length of kernel
- Width of kernel
- Asymmetry coefficient
- Length of kernel groove
این گندم ها به سه کلاس 1، 2 و 3 تقسیم بندی می شوند.



دیتاست Abalone
دیتاست Abalone شامل پیش بینی سن صدف های دریایی می باشد. این دیتاست یک مسئله دسته بندی چند کلاسه است اما می تواند با تبدیلاتی به مسئله رگرسیون نیز تبدیل شود. توازن کلاس ها برقرار نیست و تعداد مشاهدات 4177 عدد بوده که شامل 8 ورودی می باشد و یک خروجی کلاس می باشد که نام های این ویژگی ها به ترتیب زیر می باشد:
- Gender ( کلاس با سه عنوان M، F و I)
- Length
- Diameter
- Height
- Whole weight
- Shucked weight
- Viscera weight
- Shell weight
- Rings



توجه:
یکی از مهارت هایی که در این پروژه مهم بوده است، استفاده از یک الگوریتم نوشته شده برای چند دیتاست است. یعنی به صورتی
الگوریتم نوشته شده است که به هنگام عوض کردن دیتاست و گرفتن نتایج آن ها کار سختی نداشته باشیم.
کارشناسان وب سایت MATLABDL قادر به انجام پروژه با موضوعات مشابه می باشند.
قیمت: 120000 تومان
کد پروژه: 202122002
توضیحات : پیاده سازی در نرم افزار متلب انجام شده است.
کلمات کلیدی: پروژه پیاده سازی PCA,مصورسازی داده های دیتاست های iris ، Wheat Seeds و Abalone,نرم افزار متلب,دیتاست Wheat Seeds,دیتاست iris,دیتاست Abalone
منبع : مطلب دی ال

دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.