0% Complete
فارسی
Home
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
دستهبندی متون خبری فارسی با یادگیری فعال
Authors :
مینا طباطبائی
1
سعیده ممتازی
2
1- دانشگاه صنعتی امیرکبیر
2- دانشگاه صنعتی امیرکبیر
Keywords :
دستهبندی، بیزین ساده، یادگیری فعال، داده برچسبدار
Abstract :
به دست آوردن برچسب موضوعی متون از جمله موارد مهم و پرکاربرد در متنکاوی است که میتواند کاربردهای متنوعی داشته باشد. بهعنوان مثال در سایتهای خبری برچسبگذاری خودکار میتواند راهنمای کاربران در دستیابی به اطلاعات مورد علاقه خود باشد. در مقاله حاضر به طراحی و پیادهسازی یک سیستم تشخیص موضوع متون خبری با استفاده از یادگیری ماشین پرداختهایم. ﺩﺭ ﺑﺴﻴــﺎﺭﯼ ﺍﺯ ﻣﺴـــﺎﺋﻞ ﻳﺎﺩﮔﻴﺮﯼ ﻭﺍﻗﻌﯽ بهدﺳﺖ ﺁﻭﺭﺩﻥ ﻧﻤﻮﻧـﻪﻫـﺎﯼ ﺑﺮﭼﺴﺐﺩﺍﺭ فرایندی زمانبر و ﺑﺴﻴﺎﺭ ﭘﺮﻫﺰﻳﻨﻪ ﻣﻲباشد. ﺩﺭ ﺍﻳﻦ مقاله ﺭﻭﺷﻲ ﺑﺮﺍﻱ ﺩﺳﺘﻪﺑﻨﺪﯼ ﻣﺘﻮﻥ ارائه ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺩﺭ ﺁﻥ ﺍﺑﺘﺪﺍ ﻳﮏ ﺩﺳﺘﻪﺑﻨﺪ ﺑﻴﺰﻳﻦ ﺳﺎﺩﻩ ﺍﻭﻟﻴﻪ ﺑﺎ ﺗﻌﺪﺍﺩ ﮐﻤﯽ داده ﺑﺮﭼﺴﺐﺩﺍﺭ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﺩ، ﺳﭙﺲ ﺑـﺎ ﺍﺳـﺘﻔﺎﺩﻩ ﺍﺯ ﻳـﺎﺩﮔﻴﺮﯼ ﻓﻌﺎﻝ ﻭ ﺑﮑﺎﺭﮔﻴﺮﯼ ﺭﻭﺵ ﻧﻤﻮﻧﻪﮔﻴﺮﯼ ﺑﺮ ﺍﺳﺎﺱ ﻋﺪﻡ ﺍﻃﻤﻴﻨﺎﻥ ﺑﻪ ﺻﻮﺭﺕ هوشمندانه ﻧﻤﻮﻧﻪﻫﺎﯼ ﻣﻔﻴﺪ ﺭﺍ ﺑﺮﭼﺴﺐﮔﺬﺍﺭﯼ کرده و به داده آموزش دستهبند اضافه میکنیم. این کار به صورت چرخشی ادامه مییابد. ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺗﻌﺪﺍﺩ ﻧﻤﻮﻧﻪهای ﺑﺮﭼﺴﺐﺩﺍﺭ ﻣﻮﺭﺩ ﻧﻴﺎﺯ برای رسیدن به دقتی قابل قبول تا حد ﺯﻳﺎﺩﯼ ﮐﺎﻫﺶ ﭘﻴﺪﺍ میکند. نتایج آزمایشها نشان میدهد با بهکارگیری روش پیشنهادی، علیرغم اینکه تعداد داده آموزش به شدت کاهش مییابد اما دقت دستهبند از ۸۱٪ به ۸۳٪ افزایش مییابد.
Papers List
List of archived papers
Predicting Suicide Risk in Adolescents with Random Forest for Unbalanced Data Management
Fatemeh Rabbani - Dr Behrooz Masoumi - Dr Mohammad Reza Keyvanpour
Energy–Aware Clustering Routing Protocol to Improve the Multi-hop WSN Lifetime
Alireza Gholamrezaee - Hoda Gholamrezaee - Mahtab Hadiyan
طراحی و پیاده سازی بستر اجرای بازی جنگ سایبری
مریم نصراصفهانی - بهروز ترک لادانی - بهروز شاهقلی قهفرخی - حسین قجاوند بلتیجه - نوید شیرمحمدی - مهدی شمس - محمدامین آقاکبیری
Mamba-SAM: A Hybrid Architecture for Efficient Cardiac MRI Medical Image Segmentation
Mohammadreza Gholipour Shahraki - Mehdi Rezaeian - Mohammad Ghasemzadeh
A New Method Based on Deep Learning and Time Stabilization of the Propagation Path for Fake News Detection
Fatemeh Torgheh - Dr Mohammad Reza Keyvanpour - Dr Behrooz Masoumi
از داده تا تحول دیجیتال: توسعه داشبورد مدیریتی مبتنی بر دادهکاوی، علم داده و هوش تجاری برای ارتقای تصمیمگیری و بهبود عملکرد در ذوبآهن اصفهان
پدرام کیانی - یحیی غلامیان - پریناز واعظ
Attention-Enhanced Ensemble Learning for Automated Stenosis Detection in X-ray Coronary Angiography Videos
Marzieh Sadat Hosseini - Ahmad R. Naghsh-Nilchi - Mehran Safayani - Masoumeh Sadeghi
An LLM-Based Approach for Clarifying the Decisions of Vision Models in Autonomous Vehicles
Omid Mosalmani - Mohammad Javad Rashti - Seyed Enayat Alavi
A Neural-based Approach to Aid Early Parkinson's Disease Diagnosis
Dr Armin Salimi-badr - Mohammad Hashemi
شناسایی وبگاه های دامچینی به کمک شبکه عصبی گسستهساز بردار یادگیر (LVQ)
یگانه ستاری - غلامعلی منتظر
more
Samin Hamayesh - Version 42.5.2