0% Complete
فارسی
Home
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
دستهبندی متون خبری فارسی با یادگیری فعال
Authors :
مینا طباطبائی
1
سعیده ممتازی
2
1- دانشگاه صنعتی امیرکبیر
2- دانشگاه صنعتی امیرکبیر
Keywords :
دستهبندی، بیزین ساده، یادگیری فعال، داده برچسبدار
Abstract :
به دست آوردن برچسب موضوعی متون از جمله موارد مهم و پرکاربرد در متنکاوی است که میتواند کاربردهای متنوعی داشته باشد. بهعنوان مثال در سایتهای خبری برچسبگذاری خودکار میتواند راهنمای کاربران در دستیابی به اطلاعات مورد علاقه خود باشد. در مقاله حاضر به طراحی و پیادهسازی یک سیستم تشخیص موضوع متون خبری با استفاده از یادگیری ماشین پرداختهایم. ﺩﺭ ﺑﺴﻴــﺎﺭﯼ ﺍﺯ ﻣﺴـــﺎﺋﻞ ﻳﺎﺩﮔﻴﺮﯼ ﻭﺍﻗﻌﯽ بهدﺳﺖ ﺁﻭﺭﺩﻥ ﻧﻤﻮﻧـﻪﻫـﺎﯼ ﺑﺮﭼﺴﺐﺩﺍﺭ فرایندی زمانبر و ﺑﺴﻴﺎﺭ ﭘﺮﻫﺰﻳﻨﻪ ﻣﻲباشد. ﺩﺭ ﺍﻳﻦ مقاله ﺭﻭﺷﻲ ﺑﺮﺍﻱ ﺩﺳﺘﻪﺑﻨﺪﯼ ﻣﺘﻮﻥ ارائه ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺩﺭ ﺁﻥ ﺍﺑﺘﺪﺍ ﻳﮏ ﺩﺳﺘﻪﺑﻨﺪ ﺑﻴﺰﻳﻦ ﺳﺎﺩﻩ ﺍﻭﻟﻴﻪ ﺑﺎ ﺗﻌﺪﺍﺩ ﮐﻤﯽ داده ﺑﺮﭼﺴﺐﺩﺍﺭ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﺩ، ﺳﭙﺲ ﺑـﺎ ﺍﺳـﺘﻔﺎﺩﻩ ﺍﺯ ﻳـﺎﺩﮔﻴﺮﯼ ﻓﻌﺎﻝ ﻭ ﺑﮑﺎﺭﮔﻴﺮﯼ ﺭﻭﺵ ﻧﻤﻮﻧﻪﮔﻴﺮﯼ ﺑﺮ ﺍﺳﺎﺱ ﻋﺪﻡ ﺍﻃﻤﻴﻨﺎﻥ ﺑﻪ ﺻﻮﺭﺕ هوشمندانه ﻧﻤﻮﻧﻪﻫﺎﯼ ﻣﻔﻴﺪ ﺭﺍ ﺑﺮﭼﺴﺐﮔﺬﺍﺭﯼ کرده و به داده آموزش دستهبند اضافه میکنیم. این کار به صورت چرخشی ادامه مییابد. ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺗﻌﺪﺍﺩ ﻧﻤﻮﻧﻪهای ﺑﺮﭼﺴﺐﺩﺍﺭ ﻣﻮﺭﺩ ﻧﻴﺎﺯ برای رسیدن به دقتی قابل قبول تا حد ﺯﻳﺎﺩﯼ ﮐﺎﻫﺶ ﭘﻴﺪﺍ میکند. نتایج آزمایشها نشان میدهد با بهکارگیری روش پیشنهادی، علیرغم اینکه تعداد داده آموزش به شدت کاهش مییابد اما دقت دستهبند از ۸۱٪ به ۸۳٪ افزایش مییابد.
Papers List
List of archived papers
PersianRAG A Retrieval Augmented Generation System for Persian Language
Hossein Hosseini - Mohammad Sobhan Zare - Amir Hossein Mohammadi - Arefeh Kazemi - Zahra Zojaji - Mohammad Ali Nematbakhsh
Sentiment Analysis of the Amazon Customers Using the BiGRU Neural Network Enhanced by Attention Mechanism
Sara Sinan Salman al-Abedi - Keyvan Mohebbi
شناسایی حسابهای چندکاربره بر اساس ویژگیهای شخصیتی کاربران در پلتفرمهای پخش فیلم
مهسا رضائی - مرجان کائدی
Combinatorial Auction Based on Social Choice in the Internet of Things
Maede Esmaeili - Faria Nassiri-Mofakham - Fatemeh Hassanvand
Silicon photonic microring resonators: A Novel optical router based on Negative-First routing algorithm
Negin Bagheri Renani - Elham Yaghoubi
A Biased Random Key Genetic Algorithm for the Dial-a-Ride Problem
ُSomayeh Sohrabi - Koorush Ziarati - Morteza Keshtkaran
Wireless Virtual-Reality by considering Hybrid Beamforming in IEEE802.11ay standard
Nasim Alikhani - Abbas Mohammadi
A Topic Based Method to Classify the Question Clarity in CQA Networks
Alireza Khabbazan - Dr Ahmad Ali Abin
Mode Selection and Resource Allocation in D2D-Enabled MC-NOMA using Matching Theory
Alireza Gholamrezaee - Hamid Farrokhi - Javad Zeraatkar Moghaddam
مدیریت توأم منابع و خواب ایستگاه پایه مبتنی بر یادگیری تقویتی در شبکه های فوق متراکم با ارتباطات دو طرفه
طاهره رحمتی - بهروز شاهقلی قهفرخی
more
Samin Hamayesh - Version 42.5.2