0% Complete
English
صفحه اصلی
/
سیزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
بررسی روشها، مجموعههای داده و معیارهای ارزیابی در حوزهی پرسش از متون درون تصویر
نویسندگان :
کبری فرشیدی
1
حسن ختنلو
2
محرم منصوری زاده
3
الهام علی قارداش
4
1- دانشگاه بوعلی سینا همدان
2- دانشگاه بوعلی سینا همدان
3- دانشگاه بوعلی سیناهمدان
4- دانشگاه بوعلی سیناهمدان
کلمات کلیدی :
پاسخگویی به سوالات دیداری متن،سازکار توجه،تشخیص کاراکتر نوری،ویژگیهای پیشآموزش،مبدلها
چکیده :
امروزه مسائل مربوط به روابط چندوجهی بین وجههای مختلف داده، بطور مثال بین وجههای تصویر، متن، صوت یکی از حوزههای تحقیقاتی پرکاربرد و پرطرفدار در بین پژوهشگران شده است. یکی از انواع این مسائل، مسئلهی پاسخگویی به سوالات دیداری است که در آن از دو وجه بصری و متنی در ورودی استفاده میشود. در نوع خاصی از این مسئله که با عنوان پاسخگویی به سوالات دیداری متنی شناخته میشود، هدف، کشف ارتباط بین تصویر بخصوص متون و علائم درون تصویر و سوال متنی پرسیده شده، دربارهی آن تصویر می باشد. پرسش از متون درون تصویر بخصوص اگر شامل عبارات مهم باشد اهمیت پیدا میکند . پژوهشگران توسط مدلهای یادگیری عمیق، معماری مبدلها، مکانیزم توجه توانستهاند به نتایج خوبی دست پیدا کنند. با توجه به انواع تلاشهای پژوهشگران در 4 سال اخیر هماکنون در دورهای هستیم که میتوان مروری برتلاشهای آنها داشته باشیم و آنها را مقایسه کنیم و مسیر رو به پیشرفت را ببینیم و اقدامات انجام شده را بازبینی کنیم. بر اساس اطلاعات بدست آمده این مقاله، اولین مقاله به زبان فارسی است که به جمعآوری و مقایسه مطالعات موجود دربارهی مسئلهی پاسخگویی به سوالات دیداری متن و چالشهای آن میپردازد.
لیست مقالات
لیست مقالات بایگانی شده
تشخیص خودکار اختلال عروقی ماکولا با عنوان عروق گسترش یافته در تصاویر آنژیوگرافی حاصل از تصویربرداری OCTA
راضیه گنجی - دکتر محسن ابراهیمی مقدم - دکتر رامین نوری نیا
طبقه بندی آسیبهای لیگامنت با استفاده از تحلیل تصاویر تشدید مغناطیسی توسط الگوریتمهای یادگیری عمیق
محسن اکبری - دکتر مریم مؤمنی محسن اکبری - مریم مؤمنی -
Improving Privacy Protection in a Collaborative Blockchain-based E-Health Records System
Arman Emam-Hoseini - Samane Sobuti - دکتر سیاوش خرسندی - Alireza Hashemi-Golpayeghani
Persian Language Understanding in Task-oriented Dialogue System for Online Shopping
Zeinab Borhanifard - Hossein Basafa - Seyedeh Zahra Razavi - Heshaam Faili
رویکردی در تشخیص خودکار بوهای بد در مدل های معماری سازمانی با استفاده از تحلیل گرافی
زهرا رحیمی تمندگانی - شهره آجودانیان
STANet: Spatio-Temporal Attention-Enhanced WaveNet for Crime Hotspot Prediction
Rojan Roshankar - Mohammad Reza Keyvanpour
تحلیل سازههای موثر بر پذیرش فناوری بلاکچین و استفاده از آن در صنعت بیمه ایران با استفاده از تکنیک معادلات ساختاری (مطالعه موردی: شرکت کارگزاری رسمی بیمه زندگی خوب)
احسان هنری - آفرین اخوان
خوشه بندی مقید داده ها به کمک اتوماتای یادگیر سلولی
شکوفه علی محمدی - احمدعلی آبین
تخلیهی باری وظایف اینترنت اشیاء بر روی مه محاسباتی با استفاده از الگوریتم حشره آبسوار
عفت تقی زاده بیلندی - آرش دلداری - علیرضا صالحان
NFV-Based Distributed Service Function Chaining with Imperfect Information
Mahsa Alikhani - Marzieh Sheikhi - Dr Vesal Hakami
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 41.3.1