0% Complete
English
صفحه اصلی
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
خوشه بندی ویسیلاب های دو آوایی زبان فارسی در کاربرد لب خوانی
نویسندگان :
مهسا هدایتی پور
1
یاسر شکفته
2
محسن ابراهیمی مقدم
3
1- shahid beheshti university
2- دانشگاه شهید بهشتی
3- دانشگاه شهید بهشتی
کلمات کلیدی :
بازشناسی دیداری گفتار، لبخوانی ، نگاشت هجا به ویسیلاب، هجاهای دو آوایی
چکیده :
لبخوانی، فرآیند بازشناسی دیداری گفتار است. در این فرآیند تشخیص واحدهای کوچکتر گفتاری میتواند مبنای تشخیص واحدهای بزرگتر گفتاری باشد. یکی از چالشهای این فرآیند، مشابه بودن تصاویر برخی از واحدهای گفتاری بعلت جایگاه تولید یکسان در اندامهای گفتاری است. بدین منظور در فرآیند لبخوانی،خوشهبندی تصاویر اجزای گفتار و ساختن جداول نگاشت از شکل شنیداری اجزای گفتار به شکل دیداری اجزای گفتار از اهمیت اساسی برخوردار است. از آنجا که بازشناسی دیداری هجاهای دو آوایی گام نوینی در لبخوانی زبان فارسی است، در این پژوهش سعی شده است برای بازشناسی دیداری بهینه هجاهای دو آوایی زبان فارسی جداول نگاشت مناسبی بر مبنای روشهای یادگیری ماشین و یا دانش افراد خبره فراهم گردد. بیشینه دقت شناسایی برای نگاشت 9 گانه از هجاهای دو آوایی به ویسیلاب به مقدار 81/61 درصد حاصل شده است. با مدل سازی این ویسیلاب ها توسط مدل مخفی مارکوف و تزریق مناسب اطلاعات مدل زبانی سیلابها، دقت 18/41 درصد در شناسایی 30 کلمه فارسی حاصل شده است.
لیست مقالات
لیست مقالات بایگانی شده
IoMT-Enabled Smart Healthcare: State-of-the-Art, Security and Future Directions
Shivam Tripathi - Vatsalkumar Makwana - Malaram Kumhar - Harshal Trivedi - Jitendra Bhatia - Sudeep Tanwar - Hossein Shahinzadeh
Revert Propagation: Who are responsible for a contagion initialization in a Diffusion Network?
Arman Sepehr - Mohammadzaman Zamani - Hamid Beigy - Shabnam Behzad
Face Recognition Based on Local Statistical Features and Artificial Neural Network
Mehdi Moghimi - Dr Hadi Grailu
Knowledge Graph Based Retrieval-Augmented Generation for Multi-Hop Question Answering Enhancement
Mahdi Amiri Shavaki - Pouria Omrani - Ramin Toosi - Mohammad Ali Akhaee
Vi-Net: A Deep Violent Flow Network for Violence Detection in Video Sequences
Tahereh Zarrat Ehsan - Seyed Mehdi Mohtavipour
Classification of mental states of human concentration based on EEG signal
Mehran Safari Dehnavi - Vahid Safari Dehnavi - Dr Masoud Shafiee
LLM-Driven Feature Extraction for Stock Market Prediction: A case study of Tehran Stock Exchange
Siavash Hosseinpour Saffarian - Saman Haratizadeh
Effective Design of Reversible 2×2 Vedic Multiplier With Low Cost
Mojtaba Noorallahzadeh - Mohammad Mosleh - Ali Shahidikia
Improved Weighting in the Automated Texts Classification using Fuzzy Method
Hamidreza Sadrarhami - S. Mohammadali Zanjani - Ghazanfar Shahgholian
Sparse Beamforming Design for Non-Coherent UD-CRAN with mm-Wave Fronthaul Links
Alireza M. Hosseini - Dr Abbas Mohammadi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.3.1