0% Complete
صفحه اصلی
/
پنجمین کنفرانس بین المللی محاسبات نرم
انتخاب ویژگی گروهی با رویکرد تصمیمگیری چندمعیاره به منظور دستهبندی متون
نویسندگان :
فاطمه زریسفی کرمانی
1
1- دانشگاه جیرفت
کلمات کلیدی :
دستهبندی متن،انتخاب ویژگی گروهی،تصمیمگیری چندمعیاره،دستهبند بیزین ساده چندجملهای،دستهبند k-همسایه نزدیک
چکیده :
دستهبندی متن از ابعاد بالا و پراکندگی زیاد فضای ویژگی رنج میبرد. به همین دلیل، انتخاب ویژگی به عنوان مرحله مهمی از پیش پردازش در حوزه متن کاوی و بهویژه دستهبندی متن شناخته میشود. اخیراً رویکرد جدیدی به نام انتخاب ویژگی گروهی معرفی شدهاست که در آن، خروجی چندین روش انتخاب ویژگی برای به دست آوردن زیرمجموعهی نهایی از ویژگیها تجمیع میشوند. ادعا میشود که اصل "خرد جمعی" در بحث انتخاب ویژگی نیز میتواند منجربه انتخاب ویژگی قویتر و پایدارتر هنگام برخورد با داده هایی با ابعاد بالا گردد. بنابراین در اینکار، برای اولین بار از رویکرد انتخاب ویژگی گروهی در فاز آمادهسازی دادههای متنی، بهمنظور دستهبندی دقیقتر اسناد استفاده شدهاست. بطوریکه ابتدا مجموعهی ویژگیها با استفاده از 4 روش انتخاب ویژگی مبتنی بر فیلتر بصورت جداگانه رتبهبندی شده، سپس فرآیند تجمیع نتایج حاصله و رتبهبندی نهایی ویژگیها بعنوان یک مسئلهی تصمیمگیری چندمعیاره فرموله و به کمک تکنیک بیشترین بیشترینها حل میشود. به منظور اثبات ادعا، کارآمدی روش انتخاب ویژگی پیشنهادی در دستهبندی موضوعی مجموعه داده متنی رویترز، با استفاده از الگوریتمهای دستهبندی بیزین ساده چندجملهای و k-همسایه نزدیک براساس معیارهای دقت و F-score مورد ارزیابی قرار گرفتهاست. مقایسهی نتایج، نشاندهندهی افزایش حداقل 1درصدی و حداکثر 10 درصدی دقت دستهبندی نسبت به 4روش انتخاب ویژگی مبتنی بر فیلتر و 3 روش ساده تجمیع در استراتژی ناهمگن میباشد.
لیست مقالات
لیست مقالات بایگانی شده
A new perspective on the fuzzy Spearman correlation coefficient
Zahra Behdani - Majid Darehmiraki
بهبود یادگیری شبکههای عصبی با استفاده از ضرایب بهینه در الگوریتم لونبرگ-مارکوارت
رضا یظهری کرمانی - محمد ملائی امام زاده
شیوه های مسیریابی و تشخیص موقعیت نانوروباتها در بدن انسان بهکمک الگوریتمهای یادگیری ماشین و دادههای سنسور
مسعود اصغری - رضوان غفارزاده درخشان
ارزیابی روش های بهبود کارایی اینترنت اشیا (IoT) توسط محاسبات لبه (Edge Computing)
فاطمه رحمانی - مائده نوروزی - سید عبدالرضا حسام محسنی
انتخاب ویژگی مبتنی بر امتیاز فیشر با استفاده از دادههای برچسبدار و بدون برچسب
راضیه شیخ پور
ارائه یک روش جایگذاری ماشین های مجازی جهت کاهش ریسک امنیتی اپلیکیشن های اینترنت اشیا در محیط مه
نرجس واحد زحمتکش - دکتر رضا ابراهیمی آتانی
آنالیز مصرف انرژی در مجموعه بلوکی خانه های هوشمند با بهره گیری از توزیع شدگی در کلان داده
رضا داوری رودبرده - مسعود طالب ضیابری - مرضیه فریدی ماسوله
طبقه بندی بتن های توانمند بر اساس معیار اسلامپ با استفاده از شبکه عصبی مصنوعی تشخیص الگو
سید امیر بنی مهد
مروری بر مدل های پذیرش سیستم های اطلاعاتی در بیمارستانها
حامد حشمتی - محمد جواد جمشیدی - مهدی حسین پور
انتخاب سوییچهای بهینهسازی مناسب برای کامپایلر gcc با هدف افزایش سرعت اجرای برنامههای محاسباتی با استفاده از الگوریتم ژنتیک موازی
علی متقی - رضا مرتضوی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.2