0% Complete
فارسی
Home
/
پانزدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
PersianRAG A Retrieval Augmented Generation System for Persian Language
Authors :
Hossein Hosseini
1
Mohammad Sobhan Zare
2
Amir Hossein Mohammadi
3
Arefeh Kazemi
4
Zahra Zojaji
5
Mohammad Ali Nematbakhsh
6
1- دانشگاه اصفهان
2- دانشگاه اصفهان
3- دانشگاه اصفهان
4- دانشگاه اصفهان
5- دانشگاه اصفهان
6- دانشگاه اصفهان
Keywords :
Retrieval Augmented Generation،Large Language Models،Persian،PersianRAG
Abstract :
Retrieval augmented generation (RAG) models, which integrate large-scale pre-trained generative models with external retrieval mechanisms, have shown significant success in various natural language processing (NLP) tasks. However, applying RAG models in Persian language as a low-resource language, poses distinct challenges. These challenges primarily involve the preprocessing, embedding, retrieval, prompt construction, language modeling, and response evaluation of the system. In this paper, we address the challenges towards implementing a real-world RAG system for Persian language called PersianRAG. We propose novel solutions to overcome these obstacles and evaluate our approach using several Persian benchmark datasets. Our experimental results demonstrate the capability of the PersianRAG framework to enhance question answering task in Persian.
Papers List
List of archived papers
استخراج موارد آزمون سطح برونمتد و درونکلاس از برنامههای شئگرا
محمد قرشی - حسن حقیقی
Combinatorial Auction Based on Social Choice in the Internet of Things
Maede Esmaeili - Faria Nassiri-Mofakham - Fatemeh Hassanvand
ارائه یک سیستم توصیهگر آگاه به زمینه مبتنی بر رفتار کاربر در شبکه اجتماعی با استفاده از پیامهای برچسب شده جغرافیایی
زهرا امینی - سید علیرضا هاشمی گلپایگانی - علی میرزائی
Kalman Filter–Based Anomaly Detection for User Authentication Failures in Enterprise Logs
Somayeh Soltani - Hossein Nikdel
جانمایی توزیعشده محتوا برای ذخیرهسازی موقت در شبکههای سلولی کوچک با حضور کاربران مخرب
زهرا رشیدی - دکتر وصال حکمی - حانیه سلمانطاهری زهرا رشیدی - وصال حکمی - حانیه سلمانطاهری -
A Comparison between Slimed Network and Pruned Network for Head Pose Estimation
Amir Salimiparsa - Hadi Veisi - Mohammad-shahram Moin
Sigma: A Secure Federated Network Gaming Platform
Keyhan Mohammadi - Reza Ebrahimi Atani
تحلیل سازههای موثر بر پذیرش فناوری بلاکچین و استفاده از آن در صنعت بیمه ایران با استفاده از تکنیک معادلات ساختاری (مطالعه موردی: شرکت کارگزاری رسمی بیمه زندگی خوب)
احسان هنری - آفرین اخوان
Traffic Aware Routing in P4 Based Software Defined Networks
Ahmad Hamid - Reza Mohammadi
HTCAR: Hierarchical Text Classification based on aggregation of Representations
Ali Bavand - Mohammad Mehdi Homayounpour - Ahmad Nickabadi
more
Samin Hamayesh - Version 43.8.0