0% Complete
فارسی
Home
/
سیزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
بررسی روشها، مجموعههای داده و معیارهای ارزیابی در حوزهی پرسش از متون درون تصویر
Authors :
کبری فرشیدی
1
حسن ختنلو
2
محرم منصوری زاده
3
الهام علی قارداش
4
1- دانشگاه بوعلی سینا همدان
2- دانشگاه بوعلی سینا همدان
3- دانشگاه بوعلی سیناهمدان
4- دانشگاه بوعلی سیناهمدان
Keywords :
پاسخگویی به سوالات دیداری متن،سازکار توجه،تشخیص کاراکتر نوری،ویژگیهای پیشآموزش،مبدلها
Abstract :
امروزه مسائل مربوط به روابط چندوجهی بین وجههای مختلف داده، بطور مثال بین وجههای تصویر، متن، صوت یکی از حوزههای تحقیقاتی پرکاربرد و پرطرفدار در بین پژوهشگران شده است. یکی از انواع این مسائل، مسئلهی پاسخگویی به سوالات دیداری است که در آن از دو وجه بصری و متنی در ورودی استفاده میشود. در نوع خاصی از این مسئله که با عنوان پاسخگویی به سوالات دیداری متنی شناخته میشود، هدف، کشف ارتباط بین تصویر بخصوص متون و علائم درون تصویر و سوال متنی پرسیده شده، دربارهی آن تصویر می باشد. پرسش از متون درون تصویر بخصوص اگر شامل عبارات مهم باشد اهمیت پیدا میکند . پژوهشگران توسط مدلهای یادگیری عمیق، معماری مبدلها، مکانیزم توجه توانستهاند به نتایج خوبی دست پیدا کنند. با توجه به انواع تلاشهای پژوهشگران در 4 سال اخیر هماکنون در دورهای هستیم که میتوان مروری برتلاشهای آنها داشته باشیم و آنها را مقایسه کنیم و مسیر رو به پیشرفت را ببینیم و اقدامات انجام شده را بازبینی کنیم. بر اساس اطلاعات بدست آمده این مقاله، اولین مقاله به زبان فارسی است که به جمعآوری و مقایسه مطالعات موجود دربارهی مسئلهی پاسخگویی به سوالات دیداری متن و چالشهای آن میپردازد.
Papers List
List of archived papers
A High-Speed Quantum Reversible Controlled Adder/Subtractor Circuit
Negin Mashayekhi - Mohammad Reza Reshadinezhad - Shekoofeh Moghimi
شکلدهی سه بعدی پرتو و بهبود نرخ امن در شبکههای مخابراتی بیسیم-تواندادهشده مبتنی بر صفحات بازتابی هوشمند
کوثر انصاری - دکتر مهدی مجیدی
شناسایی حملات فیشینگ با استفاده از الگوریتم عقاب آتشین و شبکه عصبی کانولوشن
علی کوشاری - مهدی فرتاش
Multi-label Classification of Steel Surface Defects Using Transfer Learning and Vision Transformer
Amirhossein Komijani - Farzaneh Vafaeinezhad - Javad Khoramdel - Yasamin Borhani - Esmaeil Najafi
Attention-Enhanced Ensemble Learning for Automated Stenosis Detection in X-ray Coronary Angiography Videos
Marzieh Sadat Hosseini - Ahmad R. Naghsh-Nilchi - Mehran Safayani - Masoumeh Sadeghi
Predicting Suicide Risk in Adolescents with Random Forest for Unbalanced Data Management
Fatemeh Rabbani - Dr Behrooz Masoumi - Dr Mohammad Reza Keyvanpour
یک روش کارآمد جهت تشخیص آنلاین حملات DRDoS به سرویس های مبتنی بر UDP درمعماری SDN با استفاده از الگوریتم های یادگیری ماشین
میترا اکبری کهنه شهری - دکتر رضا محمدی - دکتر محمد نصیری میترا اکبری کهنه شهری - رضا محمدی - محمد نصیری -
Revolutionizing Credit Scoring: The Synergy of Mamba State Space and CNN Models
Behnam Sabzalian
Design of low-latency Floating-Point units for Softmax Computation in Transformer-based Large Language Models
Hoda Ghabeli - Amir Sabbagh Molahosseini
Aspect-Based Sentiment Analysis of After-Sales Service Quality: A Case Study of Snowa and Competitors Using Digikala Reviews
Safiyeh Samadanian - Marjan Kaedi
more
Samin Hamayesh - Version 42.5.2