0% Complete
English
صفحه اصلی
/
شانزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
Listening with Precision: ASR-Guided Method and Fusion Strategy for Text-Dependent Speaker Verification
نویسندگان :
Mohammad Reza Molavi
1
Reza Khodadadi
2
Hossein Zeinali
3
1- دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)
2- دانشگاه صنعتی شریف
3- دانشگاه صنعتی امیرکبیر (پلیتکنیک تهران)
کلمات کلیدی :
speaker verification،text-dependent, ASR،speaker embedding fusion
چکیده :
This paper proposes a text-dependent speaker verification approach (TD-SV) that improves accuracy and robustness by leveraging automatic speech recognition (ASR) to guide the verification process and final fusion score. Our system inte- grates a Fast-Conformer-based ASR module to validate speech content, effectively filtering out target-wrong and impostor- wrong trials. We propose a feature fusion method for speaker verification that combines speaker embeddings from Wav2Vec- BERT and ReDimNet, leveraging self-supervised and task- specific representations for superior performance. This fusion significantly improves verification accuracy compared to indi- vidual embeddings. Our approach achieves a competitive nor- malized minDCF of 0.045 on the Iranian division of the TD- SV 2024 Challenge test set, demonstrating an optimal balance between performance and computational efficiency. Our best submission secured the second rank in the challenge.
لیست مقالات
لیست مقالات بایگانی شده
طرحی برای تبدیل نمودارهای رفتاری BPMN به نمودار UML و تولید کد از آن
مهدیس صفری - احمد عبدالله زاده بارفروش
Modified Gate Diffusion Input-based QCA RAMs Design
Hamidreza Sadrarhami - S. Mohammadali Zanjani - Mostafa Sadeghi
To Kill a Mockingbird: Cryptanalysis of an Authenticated Key Exchange Scheme for Drones
Neda Toghraee - Hamid Mala
COVID-19 Image Retrieval Using Siamese Deep Neural Network and Hashing Technique
Farsad Zamani Boroujeni - Doryaneh Hossein Afshari - Fatemeh Mahmoodi
ارائه مدل هشت مولفه ای استراتژی جامع هوش مصنوعی سازمانی
محمد کاظم صیادی - نیلوفر مرادحاصل - علیرضا یاری
Coded Sharding for Vehicular Blockchains: A Lagrange Interpolation-Based Approach to IoV Scalability
Behdad Alagha - Maedeh Mosharraf
A Hybrid Crow Search and Penguin Optimization Algorithm (CPMM) for Efficient Cloud Workflow Scheduling
Reza Akraminejad - Farhad Kazemipour - Mozhdeh Koreh Davoodi
Adaptive Stopping Criteria-based A-RANSAC algorithm in Copy Move Image Forgery detection
ZAHRA HOSEINNEJAD - Dr MEHDI NASRI
Embedding-Consistent Contrastive Learning: A Robust Approach for Imbalanced Classification
Sobhan Siamak - Eghbal Mansoori
شکلدهی سه بعدی پرتو و بهبود نرخ امن در شبکههای مخابراتی بیسیم-تواندادهشده مبتنی بر صفحات بازتابی هوشمند
کوثر انصاری - دکتر مهدی مجیدی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2