0% Complete
فارسی
Home
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
Fast Duplicate Bug Reports Detector Training using Sampling for Dimension Reduction
Authors :
Behzad Soleimani Neysiani
1
Saeed Doostali
2
Seyed Morteza Babamir
3
Zahra Aminoroaya
4
1- دانشگاه کاشان
2- دانشگاه کاشان
3- دانشگاه کاشان
4- موسسه آموزش عالی علامه نائیتی
Keywords :
Information Retrieval, Natural Language Processing, Duplicate Detection, Bug Reports, Instance-based Learning, Online Query, Continuous Query, Incremental Learning
Abstract :
Duplicate bug report detection (DBRD) is an excellent problem in software triage systems like Bugzilla. It is vital to update the internal machine learning models of DBRD for real-world usage and continuous query of new bug reports. The training phase of machine learning algorithms is time-consumable and dependent on the volume of the training dataset. Instance-based learning (IbL) is a machine learning algorithm that reduces the number of samples in the training dataset to achieve fast learning for the incremental database. This research introduces a hybrid approach using clustering and straight forward sampling to improve the runtime and validation performance of DBRD. Two bug report datasets of Android and Mozilla Firefox are used to evaluate the proposed approach. The experimental evaluation shows acceptable results and improvement in both runtime and validation performance of DBRD versus traditional approach without IbL.
Papers List
List of archived papers
شکلدهی سه بعدی پرتو و بهبود نرخ امن در شبکههای مخابراتی بیسیم-تواندادهشده مبتنی بر صفحات بازتابی هوشمند
کوثر انصاری - دکتر مهدی مجیدی
A Comparison between Slimed Network and Pruned Network for Head Pose Estimation
Amir Salimiparsa - Hadi Veisi - Mohammad-shahram Moin
StockFM: پیش بینی قیمت بازار بورس ایران به کمک مدل بنیادین سری زمانی
فاطمه چیت ساز - سامان هراتی زاده
PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph
Romina Etezadi - Mehrnoush Shamsfard
بررسی روش m-ary در تولید زنجیرههای افزونه کوتاه
هادی صادقی کاجی - دکتر زهرا کریمی - دکتر محمد غلامی
طراحی و پیاده سازی بستر اجرای بازی جنگ سایبری
مریم نصراصفهانی - بهروز ترک لادانی - بهروز شاهقلی قهفرخی - حسین قجاوند بلتیجه - نوید شیرمحمدی - مهدی شمس - محمدامین آقاکبیری
شناسایی کمپلکس های پروتئینی با استفاده از داده های زیستی و خوشه بندی فازی
مریم مولی وردیخانی - دکتر سعید جلیلی مریم مولی وردیخانی - سعید جلیلی -
Automatic Analysis of Inconsistencies in Inter-Enterprise Business Processes: Introducing a Formal Adaptation Patterns Catalog
Somayeh Ashourian - Shohreh َAjoudanian
A Potential Solutions-Based Parallelized GA for Application Graph Mapping in Reconfigurable Hardware
Seyed Mehdi Mohtavipour - Hadi Shahriar Shahhoseini
بررسی روش یادگیری انتقالی جهت پیشبینی پیوند
علی روحانی فر - کمال میرزایی بدرآبادی
more
Samin Hamayesh - Version 41.3.1