0% Complete
فارسی
Home
/
سیزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
طبقه بندی روش های شناسایی داده های تکراری در جهت تسهیل فرایند پاکسازی داده ها
Authors :
مهدی جعفری
1
احمد عبدالله زاده بار فروش
2
1- دانشگاه صنعتی امیرکبیر
2- دانشگاه صنعتی امیرکبیر
Keywords :
پاکسازی داده ها،شناسایی داده های تکراری،کیفیت داده ها،کلان داده
Abstract :
روز به روز حجم دادههای تولید شده توسط انسانها در حال افزایش است. این داده ها اگر به درستی مدیریت شوند می توانند در امر تجزیه و تحلیل و استخراج دانش از آنها مفید واقع شوند. داده ها اغلب پس از جمع آوری، یکپارچه سازی و ذخیره سازی با مشکلات کیفیتی روبرو می شوند. این مشکلات کیفیتی در جهت بهبود کیفیت داده ها و به دنبال آن استخراج دانش مفید از آنها در طی فرایند تجزیه و تحلیل باید در ابتدا شناسایی شده و سپس پردازش های متناسب در جهت مقابله با آنها انجام شود. داده های تکراری به عنوان یکی از مشکلات کیفیتی رایج و مهم مورد توجه این مقاله است. از گذشته تاکنون پژوهش های متعددی بر مبنای رویکردهای مختلف از جمله مبتنی بر قانون، مبتنی بر مفاهیم یادگیری، مبتنی بر خرد جمعی و ... در جهت شناسایی انواع مختلف داده های تکراری انجام و هر یک از آنها منجر به ارائه یک روش نوین در جهت مقابله با این مشکل شده است. هدف ما در این مقاله ارائه یک طبقه بندی از روش های شناسایی داده های تکراری و به دنبال آن بحث و تجزیه و تحلیل هر یک از روش های مطرح بر اساس طبقه بندی ارائه شده است.
Papers List
List of archived papers
شناسایی حملات فیشینگ با استفاده از الگوریتم عقاب آتشین و شبکه عصبی کانولوشن
علی کوشاری - مهدی فرتاش
AI-Driven Approach to Detect Equivalent Elements within Domain Models
Mohammad-Sajad Kasaei - Mohammadreza Sharbaf - Afsaneh Fatemi - Bahman Zamani
Recommendation Systems in Smart Agriculture: Pathway to a well-designed system
Ahmad Nameni - Amir Ghafarian Daneshmand - Omid Mahdi Ebadati E
تشخیص بیماری شبکوری با استفاده از ترکیب الگوریتمهای یادگیری عمیق
میثم فتاحی
بررسی روشها، مجموعههای داده و معیارهای ارزیابی در حوزهی پرسش از متون درون تصویر
کبری فرشیدی - حسن ختنلو - محرم منصوری زاده - الهام علی قارداش
کنترل کیفیت غیرمتمرکز مبتنی بر هوش ترکیبی در سیستمهای مشارکتی برخط
مهدیه طالب زاده - هاله امین طوسی - محمد اله بخش
تشخیص ارتباط معنایی در استکاورفلو با رمزگذار جمله جهانی
مجید دلیری - جعفر حبیبی - عیسی انامرادنژاد
PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph
Romina Etezadi - Mehrnoush Shamsfard
Similarity Measures in Medical Image Registration: A Review Article
Zohre Mohammadi - Dr Mohammad Reza Keyvanpour
Knowledge gap extraction based on the learner click behavior in interaction with videos using the association rule algorithm
Yosra Bahrani - Omid Fatemi
more
Samin Hamayesh - Version 42.5.2