0% Complete
صفحه اصلی
/
پنجمین کنفرانس بین المللی محاسبات نرم
An Analysis of Text Similarity Measures: Introducing a Lin Wang similarity measure
نویسندگان :
Alireza Pakgohar
1
Mehdi Fazli Aghdaei
2
1- دانشگاه پیام نور
2- دانشگاه پیام نور
کلمات کلیدی :
Lin-Wong Divergence،Similarity Measure،Editing Distance،Text Mining،Similarity Algorithm،Distance Measure
چکیده :
Accurately measuring the similarity between texts is crucial for numerous natural language processing tasks, from plagiarism detection to information retrieval. This paper delves into various approaches to calculating text similarity, exploring their strengths and limitations. We begin by analyzing character-based methods, including the Jaro and N-gram algorithms, suitable for detecting typos and minor edits. Semantic and corpus-based approaches are then addressed, offering deeper insights into meaning and context. This includes techniques like Dice coefficient, Euclidean distance, and Cosine distance, which compare texts based on vector representations and set intersections. Finally, we introduce the statistically robust Lin-Wong Similarity measure, which quantifies the commonality between probability distributions of words, providing a powerful tool for capturing semantic similarity. By comparing and contrasting these diverse methods, we highlight the importance of choosing the right measure for the specific task and dataset. Moving forward, the paper identifies promising avenues for future research, suggesting the potential of knowledge graphs and deep learning techniques to further refine and advance the field of text similarity measurement. This comprehensive exploration equips researchers and practitioners with valuable knowledge and insights for analyzing and comparing textual data.
لیست مقالات
لیست مقالات بایگانی شده
اثر یکنواختی خوشهبندیهای c-میانگین فازی، k-میانگین و سلسله مراتبی
محمد صیدپیشه - مارال تقی زاده
الگوریتم تقریبی برای مسئله حداقل پوشش راسی با رویکرد استراتژیک مبتنی بر توزیع درجات
معین منعمی - فاطمه ولیپور - روح الله عابدیان
Application of coupled kudryashov methods to solve a fractional coupled well-known equation
Zainab Ayati
ارزیابی خودکار عملکرد بیمار با شبکه عصبی عمیق پیچشی فازی با لایه آموزشپذیر در ربات فیزیوتراپی زانو مبتنی بر بازی
پرگل سادات طباطبائی - محمدرضا اکبرزاده توتونچی - علیرضا اکبرزاده - حسین نگهبان سیوکی
پیش بینی بیماری دیابت با استفاده از بازنمایی تنک مبتنی بر منیفلد
زهره کریمی - روح اله رمضانی
یادگیری عمیق برای تشخیص سرطان پستان با مدل DenseNet
زهره درانی
مروری بر الگوریتم های مختلف KNN توسعه یافته
هادی محمدی - فاطمه عمرانی - فرشته رضائی
تعمیم هایی از نامساوی های ویلکر و هویگنز، برخی ویژگی ها و نتایج جدید
سید حسین جعفری پطرودی - مریم پیروز - نرگس لاریجانی
Exploring the Impacts and Utilization of Colors in UI/UX Design for Websites and Applications
Anita Vojdani Roshan - Amirreza Seighali - Abdorreza Hesam Mohseni
ارزیابی مقاومت فشاری بتن حاوی پودر پرلیت با استفاده از GMDH
میلاد ابراهیم نژاد شلمانی - رضا کرمی کفترودی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.0.2