0% Complete
صفحه اصلی
/
پنجمین کنفرانس بین المللی محاسبات نرم
مروری بر الگوریتم های مختلف KNN توسعه یافته
نویسندگان :
هادی محمدی
1
فاطمه عمرانی
2
فرشته رضائی
3
1- دانشگاه پیام نور
2- دانشگاه پیام نور
3- دانشگاه پیام نور
کلمات کلیدی :
الگوریتم KNN توسعه یافته،الگوریتم وزن دهی hubness و فازی،الگوریتم خوشه بندی تک گذر مقید،سناریوی چند برچسبی با انتخاب نمونه اولیه برای الگوریتم KNN
چکیده :
در دنیای امروزی در کاربردهایی مانند دستهبندی متن یا پیشبینی بارش در پیشبینی وضعیت شیء جدید، تشخیص اینکه با توجه به دادههای بزرگ فعلی داده ورودی جدید چه وضعیتی خواهد داشت، بسیار مهم است. بدین منظور یکی از تکنیکهای مهم دادهکاوی به نام دستهبندی (classification) استفاده میشود. در این مقاله الگوریتم KNN (K نزدیک ترین همسایه) مورد بررسی قرار گرفتهاست و مروری کلی از اینکه تاکنون از چه روشهایی برای بهبود این الگوریتم استفاده شدهاست، انجام گرفتهاست. الگوریتم KNN در عین سادگی، بی پارامتر بودن و کارائی دستهبندی بالا، دارای اشکالاتی مانند زمان پیچیدگی محاسباتی بالا، نسبتاٌ گران بودن دستهبندی شی جدید، حساسیت به انتخاب مقدار K و حساسیت نسبت به نویز است. لذا این الگوریتم باید توسعه یابد. الگوریتمهای KNN توسعه یافته مختلف که در این مقاله مورد بررسی قرار گرفتهاند به دو دسته مهم تقسیم میشوند: 1- طراحی الگوریتمهای سریع برای جستجوی k نزدیکترین همسایه شی جدید در کوتاهترین زمان. 2- انتخاب برخی نمونههای نماینده از نمونه های یادگیری اولیه یا حذف برخی از نمونههای یادگیری اولیه. بدین منظور در این مقاله الگوریتمهایی مانند درخت k-d، درخت k-d تصادفی، درخت R-tree ، درهمساز حساس به محل (LSH)، WKNN ، DWKNN ، الگوریتم وزندهی Exponential ، الگوریتم خوشهبندی تک گذر مقید(INNTC) و سناریوی چند برچسبی با استفاده از انتخاب نمونه اولیه پرداخته شدهاست و با یکدیگر مقایسه شدهاند. نتایج حاکی از عملکرد خوب برخی از الگوریتمها است. الگوریتم مبتنی بر درخت تصادفی در زمان جستجو بهبود ایجاد میکند. الگوریتم KNN مبتنی بر خوشهبندی وزن دار، الگوریتم خوشهبندی تک گذر مقید، الگوریتم مبتنی بر سناریوی انتخاب نمونه اولیه در دسته بندی چند برچسبی موفق هستند و روش وزندهی Hubness و فازی با کاهش نمونه آزمایشی باعث بهبود الگوریتم KNN می باشد.
لیست مقالات
لیست مقالات بایگانی شده
Classification model for Statlog heart disease prediction through evolutionary feature selection and GMDH neural network
Nasibeh Emami
تعیین پارامترهای طبقه بندی KSVM با استفاده از الگوریتم PSO در تصاویر MRI به منظور تشخیص بیماری کووید-19
مرضیه فریدی ماسوله - هدیه جعفری - احمد باقری
Death Rate (per million) of Confirmed Patients Infected by COVID-19 in the Pandemic Period: A Continental Comparison
Seyed Amir Hossein Tabatabaei - Kiyan Rezaee - Mohammad Kazemi
شناسایی و اولویت بندی فاکتورهای تاثیرگذار در موفقیت آموزش الکترونیکی با رویکرد تحلیل سلسله مراتبی فازی شهودی
نسرین طاهرخانی
بررسی تحلیلی سطح سواد رسانه ای و دیجیتالی در پرسنل آتش نشان (مورد کاربردی: پرسنل آتش نشان شهرستان های استان خراسان رضوی)
حسین کاردان مقدم - زهرا صادقی فر
Predicting students’ “Passing or Failing” status with the utilization of motivational factors by Machine Learning Methods
Mohammad Reza Moradi - Reza Ghasemi Najafabadi
A bio-inspired optimization algorithm for estimating the reservoir capacity of dams
Hojjat Emami - Somayeh Emami
ارزیابی مقاومت فشاری بتن حاوی پودر پرلیت با استفاده از GMDH
میلاد ابراهیم نژاد شلمانی - رضا کرمی کفترودی
Bayesian estimation of reliability for Rayleigh distribution under the entropy loss function
Najmeh Rashidi alavijeh - Nahid Sanjari farsipour
Analyze user behavior patterns on academic search engines
Somayeh Fatahi - Amir Hossein Seddighi - Mohammad Rabiei
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.2