0% Complete
فارسی
Home
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
خوشه بندی ویسیلاب های دو آوایی زبان فارسی در کاربرد لب خوانی
Authors :
مهسا هدایتی پور
1
یاسر شکفته
2
محسن ابراهیمی مقدم
3
1- shahid beheshti university
2- دانشگاه شهید بهشتی
3- دانشگاه شهید بهشتی
Keywords :
بازشناسی دیداری گفتار، لبخوانی ، نگاشت هجا به ویسیلاب، هجاهای دو آوایی
Abstract :
لبخوانی، فرآیند بازشناسی دیداری گفتار است. در این فرآیند تشخیص واحدهای کوچکتر گفتاری میتواند مبنای تشخیص واحدهای بزرگتر گفتاری باشد. یکی از چالشهای این فرآیند، مشابه بودن تصاویر برخی از واحدهای گفتاری بعلت جایگاه تولید یکسان در اندامهای گفتاری است. بدین منظور در فرآیند لبخوانی،خوشهبندی تصاویر اجزای گفتار و ساختن جداول نگاشت از شکل شنیداری اجزای گفتار به شکل دیداری اجزای گفتار از اهمیت اساسی برخوردار است. از آنجا که بازشناسی دیداری هجاهای دو آوایی گام نوینی در لبخوانی زبان فارسی است، در این پژوهش سعی شده است برای بازشناسی دیداری بهینه هجاهای دو آوایی زبان فارسی جداول نگاشت مناسبی بر مبنای روشهای یادگیری ماشین و یا دانش افراد خبره فراهم گردد. بیشینه دقت شناسایی برای نگاشت 9 گانه از هجاهای دو آوایی به ویسیلاب به مقدار 81/61 درصد حاصل شده است. با مدل سازی این ویسیلاب ها توسط مدل مخفی مارکوف و تزریق مناسب اطلاعات مدل زبانی سیلابها، دقت 18/41 درصد در شناسایی 30 کلمه فارسی حاصل شده است.
Papers List
List of archived papers
رویکردی در تشخیص خودکار بوهای بد در مدل های معماری سازمانی با استفاده از تحلیل گرافی
زهرا رحیمی تمندگانی - شهره آجودانیان
LuckyAgent2022: A Stop-Learning Multi-Armed Bandit Automated Negotiating Agent
Arash Ebrahimnezhad - Faria Nassiri-Mofakham
A Mathematical Optimization Approach for Preference Learning in Movie Recommender Systems with Shared Accounts
Milad Khademali - Fazlollah Aghamohammadi - Marjan Kaedi - Alireza Nasiri
ISAAF: بهبود چارچوب مجوز خودتطبیق SAAF با استفاده از پیادهسازی مبتنی بر عامل و مفهوم I-Shairing
الهام معین الدینی - دکتر منیره عبدوس - دکتر اسلام ناظمی
بهبود دقت و کارایی در شبکههای عصبی کانولوشنی با استفاده از روشهای محاسبات تقریبی
محمدرضا رفیعی نژاد - محمدرضا بینش مروستی - سید امیر اصغری
Exploring the Relationship Between Gameplay Log Data and Depression & Anxiety
Soroush Elyasi - Arya Varasteh Nezhad - Fattaneh Taghiyareh
A novel approach audio watermarking based on (GBT,DCT,SVD)
Mahdi Mosleh
روش مهاجرت خوشهای برای بهبود بستربندی به مشتری در گردشکارهای بدون سرویسدهنده
محمدامین قسوری جهرمی - مهرداد آشتیانی - فاطمه بخشی
Wireless Virtual-Reality by considering Hybrid Beamforming in IEEE802.11ay standard
Nasim Alikhani - Abbas Mohammadi
Open-domain question classification and completion in conversational information search
Omid Mohammadi Kia - Mahmood Neshati - Mahsa Soudi Alamdari
more
Samin Hamayesh - Version 42.5.2