0% Complete
فارسی
Home
/
شانزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
A hybrid CNN–transformer framework for retinal disease classification
Authors :
Hanie Zomorrodi
1
Hassan Khotanlou
2
1- دانشگاه بوعلی سینا
2- دانشگاه بوعلی سینا
Keywords :
convolutional neural network،retina،transformer encoder
Abstract :
Accurate diagnosis of retinal diseases is essential for preventing visual impairment and blindness. In this study, we propose a deep learning-based framework for automatic multi-class classification of retinal images that can detect 20 ocular diseases at once. The approach starts with preprocessing and improving fundus images, followed by data augmentation to boost the model’s generalization and strength. We extract features using a combined EfficientNet-ConvNeXt framework, which captures both local details and global context. Next, we refine the extracted features with a Transformer Encoder to model relationships across the entire retinal image. Finally, an MLP classifies the input. Experimental results show that our method achieves a Model Score of 0.903, surpassing earlier methods. These findings confirm that combining feature representations from the EfficientNet-ConvNeXt architecture with Transformer-based modeling significantly enhances the accuracy of retinal disease classification.
Papers List
List of archived papers
روشی برای تشخیص مرحله پیشرفت آلزایمر در تصاویرFMRI مبتنی بر شبکه های عصبی چگال
فرساد زمانی بروجنی - عباس بهره دار
تحویل بهینه جریان پخش زنده HTTP: یک رویکرد ترکیبی سرور- شبکه
فائزه امینی تهرانی - احمدرضا منتظرالقائم
A Foresight Approach to Cyber Threats Identification and Scenario Planning
MAHDI OMRANI - Masoud Shafiee - Siavash Khorsandi
مروری بر تشخیص جامعه در شبکه های اجتماعی
صفورا اخلاقی - محمدباقر منهاج - بهروز معصومی
پیاده سازی موازی یک طرح (t,n)-تسهیم چند تصویر با استفاده از GPU
سعیده کبیری راد
Exploring the Relationship Between Gameplay Log Data and Depression & Anxiety
Soroush Elyasi - Arya Varasteh Nezhad - Fattaneh Taghiyareh
Integration of Electric Vehicles in Smart Grid using Deep Reinforcement Learning
Farkhondeh Kiaee
STANet: Spatio-Temporal Attention-Enhanced WaveNet for Crime Hotspot Prediction
Rojan Roshankar - Mohammad Reza Keyvanpour
Agentic Username Suggestion and Multimodal Gender Detection in Online Platforms: Introducing the PNGT-26K Dataset
Farbod Bijary - Mohsen Ebadpour - Amirhosein Tajbakhsh
شناسایی حملات فیشینگ با استفاده از الگوریتم عقاب آتشین و شبکه عصبی کانولوشن
علی کوشاری - مهدی فرتاش
more
Samin Hamayesh - Version 42.5.2