0% Complete
فارسی
Home
/
سیزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
بررسی روشها، مجموعههای داده و معیارهای ارزیابی در حوزهی پرسش از متون درون تصویر
Authors :
کبری فرشیدی
1
حسن ختنلو
2
محرم منصوری زاده
3
الهام علی قارداش
4
1- دانشگاه بوعلی سینا همدان
2- دانشگاه بوعلی سینا همدان
3- دانشگاه بوعلی سیناهمدان
4- دانشگاه بوعلی سیناهمدان
Keywords :
پاسخگویی به سوالات دیداری متن،سازکار توجه،تشخیص کاراکتر نوری،ویژگیهای پیشآموزش،مبدلها
Abstract :
امروزه مسائل مربوط به روابط چندوجهی بین وجههای مختلف داده، بطور مثال بین وجههای تصویر، متن، صوت یکی از حوزههای تحقیقاتی پرکاربرد و پرطرفدار در بین پژوهشگران شده است. یکی از انواع این مسائل، مسئلهی پاسخگویی به سوالات دیداری است که در آن از دو وجه بصری و متنی در ورودی استفاده میشود. در نوع خاصی از این مسئله که با عنوان پاسخگویی به سوالات دیداری متنی شناخته میشود، هدف، کشف ارتباط بین تصویر بخصوص متون و علائم درون تصویر و سوال متنی پرسیده شده، دربارهی آن تصویر می باشد. پرسش از متون درون تصویر بخصوص اگر شامل عبارات مهم باشد اهمیت پیدا میکند . پژوهشگران توسط مدلهای یادگیری عمیق، معماری مبدلها، مکانیزم توجه توانستهاند به نتایج خوبی دست پیدا کنند. با توجه به انواع تلاشهای پژوهشگران در 4 سال اخیر هماکنون در دورهای هستیم که میتوان مروری برتلاشهای آنها داشته باشیم و آنها را مقایسه کنیم و مسیر رو به پیشرفت را ببینیم و اقدامات انجام شده را بازبینی کنیم. بر اساس اطلاعات بدست آمده این مقاله، اولین مقاله به زبان فارسی است که به جمعآوری و مقایسه مطالعات موجود دربارهی مسئلهی پاسخگویی به سوالات دیداری متن و چالشهای آن میپردازد.
Papers List
List of archived papers
Predicting Suicide Risk in Adolescents with Random Forest for Unbalanced Data Management
Fatemeh Rabbani - Dr Behrooz Masoumi - Dr Mohammad Reza Keyvanpour
رویکردی در تشخیص خودکار بوهای بد در مدل های معماری سازمانی با استفاده از تحلیل گرافی
زهرا رحیمی تمندگانی - شهره آجودانیان
Enhancing Persian Speech Emotion Recognition with Contrastive Learning and Multimodal Fusion
Mobina Esmaeili - Vajiheh Sabeti
Improving Privacy Protection in a Collaborative Blockchain-based E-Health Records System
Arman Emam-Hoseini - Samane Sobuti - دکتر سیاوش خرسندی - Alireza Hashemi-Golpayeghani
Coded Sharding for Vehicular Blockchains: A Lagrange Interpolation-Based Approach to IoV Scalability
Behdad Alagha - Maedeh Mosharraf
A Swarm Intelligence Approach to Design Optimal Repeaters in Multilayer Graphene Nanoribbon Interconnects
Majid Sanaeepur - Maryam Momeni
A Potential Solutions-Based Parallelized GA for Application Graph Mapping in Reconfigurable Hardware
Seyed Mehdi Mohtavipour - Hadi Shahriar Shahhoseini
شناسایی و تحلیل ظرفیتهای استفاده از فناوری هوش مصنوعی در توسعه و بهبود شاخص مشارکت الکترونیکی
فرشاد حکمی زاده - عاطفه فرازمند
جمعآوری، تحلیل و خلاصه سازی نظرات کاربران فارسی زبان در شبکههای اجتماعی پیرامون بیماری فراگیر کووید-19
محمدرضا شمس - محمد یاسین فخار محمدرضا شمس - محمد یاسین فخار -
A qualitative spoofing detection system based on LSTMs for IoMT
Iman Jafarian - Amirmasoud Sepehrian - Siavash Khorsandi
more
Samin Hamayesh - Version 43.8.0