0% Complete
English
صفحه اصلی
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
دستهبندی متون خبری فارسی با یادگیری فعال
نویسندگان :
مینا طباطبائی
1
سعیده ممتازی
2
1- دانشگاه صنعتی امیرکبیر
2- دانشگاه صنعتی امیرکبیر
کلمات کلیدی :
دستهبندی، بیزین ساده، یادگیری فعال، داده برچسبدار
چکیده :
به دست آوردن برچسب موضوعی متون از جمله موارد مهم و پرکاربرد در متنکاوی است که میتواند کاربردهای متنوعی داشته باشد. بهعنوان مثال در سایتهای خبری برچسبگذاری خودکار میتواند راهنمای کاربران در دستیابی به اطلاعات مورد علاقه خود باشد. در مقاله حاضر به طراحی و پیادهسازی یک سیستم تشخیص موضوع متون خبری با استفاده از یادگیری ماشین پرداختهایم. ﺩﺭ ﺑﺴﻴــﺎﺭﯼ ﺍﺯ ﻣﺴـــﺎﺋﻞ ﻳﺎﺩﮔﻴﺮﯼ ﻭﺍﻗﻌﯽ بهدﺳﺖ ﺁﻭﺭﺩﻥ ﻧﻤﻮﻧـﻪﻫـﺎﯼ ﺑﺮﭼﺴﺐﺩﺍﺭ فرایندی زمانبر و ﺑﺴﻴﺎﺭ ﭘﺮﻫﺰﻳﻨﻪ ﻣﻲباشد. ﺩﺭ ﺍﻳﻦ مقاله ﺭﻭﺷﻲ ﺑﺮﺍﻱ ﺩﺳﺘﻪﺑﻨﺪﯼ ﻣﺘﻮﻥ ارائه ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺩﺭ ﺁﻥ ﺍﺑﺘﺪﺍ ﻳﮏ ﺩﺳﺘﻪﺑﻨﺪ ﺑﻴﺰﻳﻦ ﺳﺎﺩﻩ ﺍﻭﻟﻴﻪ ﺑﺎ ﺗﻌﺪﺍﺩ ﮐﻤﯽ داده ﺑﺮﭼﺴﺐﺩﺍﺭ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﺩ، ﺳﭙﺲ ﺑـﺎ ﺍﺳـﺘﻔﺎﺩﻩ ﺍﺯ ﻳـﺎﺩﮔﻴﺮﯼ ﻓﻌﺎﻝ ﻭ ﺑﮑﺎﺭﮔﻴﺮﯼ ﺭﻭﺵ ﻧﻤﻮﻧﻪﮔﻴﺮﯼ ﺑﺮ ﺍﺳﺎﺱ ﻋﺪﻡ ﺍﻃﻤﻴﻨﺎﻥ ﺑﻪ ﺻﻮﺭﺕ هوشمندانه ﻧﻤﻮﻧﻪﻫﺎﯼ ﻣﻔﻴﺪ ﺭﺍ ﺑﺮﭼﺴﺐﮔﺬﺍﺭﯼ کرده و به داده آموزش دستهبند اضافه میکنیم. این کار به صورت چرخشی ادامه مییابد. ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺗﻌﺪﺍﺩ ﻧﻤﻮﻧﻪهای ﺑﺮﭼﺴﺐﺩﺍﺭ ﻣﻮﺭﺩ ﻧﻴﺎﺯ برای رسیدن به دقتی قابل قبول تا حد ﺯﻳﺎﺩﯼ ﮐﺎﻫﺶ ﭘﻴﺪﺍ میکند. نتایج آزمایشها نشان میدهد با بهکارگیری روش پیشنهادی، علیرغم اینکه تعداد داده آموزش به شدت کاهش مییابد اما دقت دستهبند از ۸۱٪ به ۸۳٪ افزایش مییابد.
لیست مقالات
لیست مقالات بایگانی شده
A Community-Based Method for Identifying Influential Nodes using Network Embedding
Nargess Vafaei - Dr Mohammad Reza Keyvanpour
Sparse Beamforming Design for Non-Coherent UD-CRAN with mm-Wave Fronthaul Links
Alireza M. Hosseini - Dr Abbas Mohammadi
Automatic Analysis of Inconsistencies in Inter-Enterprise Business Processes: Introducing a Formal Adaptation Patterns Catalog
Somayeh Ashourian - Shohreh َAjoudanian
Conceptual Intelligent Model for Visual Question Answering using Attention Mechanism and Relational Reasoning
ٍElham Alighardash - Dr Hassan Khotanlou - Vahid Pour Amin
نظرکاوی در سطح مفهوم با استفاده از رویکردی ترکیبی
سیدرضا قادریان خیرآبادی سیدرضا قادریان خیرآبادی -
Persian Language Understanding in Task-oriented Dialogue System for Online Shopping
Zeinab Borhanifard - Hossein Basafa - Seyedeh Zahra Razavi - Heshaam Faili
ML-based Optical Fibre Fault Detection in Smart Surveillance and Traffic Systems
Rushil Patel - Sana Narmawala - Nikunjkumar Mahida - Rajesh Gupta - Sudeep Tanwar - Hossein Shahinzadeh
UltraLearn: Next-Generation CyberSecurity Learning Platform
Saeed Raisi - Saeid Ghasemshirazi - Ghazaleh Shirvani
An Improved Image Classification Based In Feature Extraction From Convolutional Neural Network: Application To Flower Classification
Faeze Sadati - Dr Behrooz Rezaie
تشخیص خودکار اختلال عروقی ماکولا با عنوان عروق گسترش یافته در تصاویر آنژیوگرافی حاصل از تصویربرداری OCTA
راضیه گنجی - دکتر محسن ابراهیمی مقدم - دکتر رامین نوری نیا
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 42.5.2