0% Complete
English
صفحه اصلی
/
شانزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
A hybrid CNN–transformer framework for retinal disease classification
نویسندگان :
Hanie Zomorrodi
1
Hassan Khotanlou
2
1- دانشگاه بوعلی سینا
2- دانشگاه بوعلی سینا
کلمات کلیدی :
convolutional neural network،retina،transformer encoder
چکیده :
Accurate diagnosis of retinal diseases is essential for preventing visual impairment and blindness. In this study, we propose a deep learning-based framework for automatic multi-class classification of retinal images that can detect 20 ocular diseases at once. The approach starts with preprocessing and improving fundus images, followed by data augmentation to boost the model’s generalization and strength. We extract features using a combined EfficientNet-ConvNeXt framework, which captures both local details and global context. Next, we refine the extracted features with a Transformer Encoder to model relationships across the entire retinal image. Finally, an MLP classifies the input. Experimental results show that our method achieves a Model Score of 0.903, surpassing earlier methods. These findings confirm that combining feature representations from the EfficientNet-ConvNeXt architecture with Transformer-based modeling significantly enhances the accuracy of retinal disease classification.
لیست مقالات
لیست مقالات بایگانی شده
کنترل کیفیت پیش_بینانه آمیزه_های لاستیکی مدلی یکپارچه بر اساس استاندارد پذیرش متغیرهای ANSI Z1.9 و پایش رئولوژیکی برخط
آکو یاری - فرهاد محمدزاده
UltraLearn: Next-Generation CyberSecurity Learning Platform
Saeed Raisi - Saeid Ghasemshirazi - Ghazaleh Shirvani
Predicting Concentration of Particulate Matter (PM2.5) in Hamedan using Machine Learning Algorithms
Anita Karim Ghassabpour - Hatam Abdoli - Muharram Mansoorizadeh - Saeid Seyedi
Low-Power Phase-Based Stochastic MAC for FPGA
Kooroush Manochehri - Amir arsalan Sakhtianchi - Mehrshad Khosraviani
ارزیابی و برنامهریزی اجرای پیشنهادی هوش مصنوعی در صنعت پتروشیمی ایران
امین رضا انصاری - احد قائمی - سید مهدی کوچک کوثری
Multi-Modal Longitudinal Tooth Labeling with Temporal Graph–Transformer Integration
Maral Mirza mohammadi - Mahdi Tarom
The risk prediction of heart disease by using neuro-fuzzy and improved GOA
Vahid Safari Dehnavi - Masoud Shafiee
طراحی و بهینه سازی زنجیره تأمین پلت چوبی از ضایعات چوب در ایران
فاضل حاجی زاده ابراهیمی - نجمه محمودی - احسان حیدریان فروشانی
کشف لبه در تصاویر پزشکی با استفاده از اتوماتای سلولی سلسله مراتبی
مریم علینقی زاده - علیرضا رضوانیان
روشی برای تشخیص مرحله پیشرفت آلزایمر در تصاویرFMRI مبتنی بر شبکه های عصبی چگال
فرساد زمانی بروجنی - عباس بهره دار
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2