0% Complete
English
صفحه اصلی
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
Fast Duplicate Bug Reports Detector Training using Sampling for Dimension Reduction
نویسندگان :
Behzad Soleimani Neysiani
1
Saeed Doostali
2
Seyed Morteza Babamir
3
Zahra Aminoroaya
4
1- دانشگاه کاشان
2- دانشگاه کاشان
3- دانشگاه کاشان
4- موسسه آموزش عالی علامه نائیتی
کلمات کلیدی :
Information Retrieval, Natural Language Processing, Duplicate Detection, Bug Reports, Instance-based Learning, Online Query, Continuous Query, Incremental Learning
چکیده :
Duplicate bug report detection (DBRD) is an excellent problem in software triage systems like Bugzilla. It is vital to update the internal machine learning models of DBRD for real-world usage and continuous query of new bug reports. The training phase of machine learning algorithms is time-consumable and dependent on the volume of the training dataset. Instance-based learning (IbL) is a machine learning algorithm that reduces the number of samples in the training dataset to achieve fast learning for the incremental database. This research introduces a hybrid approach using clustering and straight forward sampling to improve the runtime and validation performance of DBRD. Two bug report datasets of Android and Mozilla Firefox are used to evaluate the proposed approach. The experimental evaluation shows acceptable results and improvement in both runtime and validation performance of DBRD versus traditional approach without IbL.
لیست مقالات
لیست مقالات بایگانی شده
Open-domain question classification and completion in conversational information search
Omid Mohammadi Kia - Mahmood Neshati - Mahsa Soudi Alamdari
PeCoQ: A Dataset for Persian Complex Question Answering over Knowledge Graph
Romina Etezadi - Mehrnoush Shamsfard
ISPREC: Integrated Scientific Paper Recommendation using heterogeneous information network
Elaheh Jafari - Dr Bita Shams - Dr Saman Haratizadeh
Context Awareness Gate for Retrieval Augmented Generation
Mohammad Hassan Heydari - Arshia Hemmat - Erfan Naman - Afsaneh Fatemi
مکانیابی بهینه آلودگی در شبکههای توزیع آب با استفاده از تکنولوژی اینترنت اشیاء بر مبنای پیشبینی سری زمانی چند متغیره
زینب محزون - امید بوشهریان
ساخت پیکره برچسب خورده گزارش های آسیب شناسی
مسلم سمیعی پاقلعه - مهرنوش شمس فرد
شناسایی کمپلکس های پروتئینی با استفاده از داده های زیستی و خوشه بندی فازی
مریم مولی وردیخانی - دکتر سعید جلیلی مریم مولی وردیخانی - سعید جلیلی -
Presenting an Edge-based Air Quality Management System for Smart City Scenarios
Tina Samizadeh Nikoui - Ali Balador - Amir Masoud Rahmani - Hooman Tabarsaied
یک روش کارآمد جهت تشخیص آنلاین حملات DRDoS به سرویس های مبتنی بر UDP درمعماری SDN با استفاده از الگوریتم های یادگیری ماشین
میترا اکبری کهنه شهری - دکتر رضا محمدی - دکتر محمد نصیری میترا اکبری کهنه شهری - رضا محمدی - محمد نصیری -
To Kill a Mockingbird: Cryptanalysis of an Authenticated Key Exchange Scheme for Drones
Neda Toghraee - Hamid Mala
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 40.3.1