0% Complete
English
صفحه اصلی
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
دستهبندی متون خبری فارسی با یادگیری فعال
نویسندگان :
مینا طباطبائی
1
سعیده ممتازی
2
1- دانشگاه صنعتی امیرکبیر
2- دانشگاه صنعتی امیرکبیر
کلمات کلیدی :
دستهبندی، بیزین ساده، یادگیری فعال، داده برچسبدار
چکیده :
به دست آوردن برچسب موضوعی متون از جمله موارد مهم و پرکاربرد در متنکاوی است که میتواند کاربردهای متنوعی داشته باشد. بهعنوان مثال در سایتهای خبری برچسبگذاری خودکار میتواند راهنمای کاربران در دستیابی به اطلاعات مورد علاقه خود باشد. در مقاله حاضر به طراحی و پیادهسازی یک سیستم تشخیص موضوع متون خبری با استفاده از یادگیری ماشین پرداختهایم. ﺩﺭ ﺑﺴﻴــﺎﺭﯼ ﺍﺯ ﻣﺴـــﺎﺋﻞ ﻳﺎﺩﮔﻴﺮﯼ ﻭﺍﻗﻌﯽ بهدﺳﺖ ﺁﻭﺭﺩﻥ ﻧﻤﻮﻧـﻪﻫـﺎﯼ ﺑﺮﭼﺴﺐﺩﺍﺭ فرایندی زمانبر و ﺑﺴﻴﺎﺭ ﭘﺮﻫﺰﻳﻨﻪ ﻣﻲباشد. ﺩﺭ ﺍﻳﻦ مقاله ﺭﻭﺷﻲ ﺑﺮﺍﻱ ﺩﺳﺘﻪﺑﻨﺪﯼ ﻣﺘﻮﻥ ارائه ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺩﺭ ﺁﻥ ﺍﺑﺘﺪﺍ ﻳﮏ ﺩﺳﺘﻪﺑﻨﺪ ﺑﻴﺰﻳﻦ ﺳﺎﺩﻩ ﺍﻭﻟﻴﻪ ﺑﺎ ﺗﻌﺪﺍﺩ ﮐﻤﯽ داده ﺑﺮﭼﺴﺐﺩﺍﺭ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﺩ، ﺳﭙﺲ ﺑـﺎ ﺍﺳـﺘﻔﺎﺩﻩ ﺍﺯ ﻳـﺎﺩﮔﻴﺮﯼ ﻓﻌﺎﻝ ﻭ ﺑﮑﺎﺭﮔﻴﺮﯼ ﺭﻭﺵ ﻧﻤﻮﻧﻪﮔﻴﺮﯼ ﺑﺮ ﺍﺳﺎﺱ ﻋﺪﻡ ﺍﻃﻤﻴﻨﺎﻥ ﺑﻪ ﺻﻮﺭﺕ هوشمندانه ﻧﻤﻮﻧﻪﻫﺎﯼ ﻣﻔﻴﺪ ﺭﺍ ﺑﺮﭼﺴﺐﮔﺬﺍﺭﯼ کرده و به داده آموزش دستهبند اضافه میکنیم. این کار به صورت چرخشی ادامه مییابد. ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺗﻌﺪﺍﺩ ﻧﻤﻮﻧﻪهای ﺑﺮﭼﺴﺐﺩﺍﺭ ﻣﻮﺭﺩ ﻧﻴﺎﺯ برای رسیدن به دقتی قابل قبول تا حد ﺯﻳﺎﺩﯼ ﮐﺎﻫﺶ ﭘﻴﺪﺍ میکند. نتایج آزمایشها نشان میدهد با بهکارگیری روش پیشنهادی، علیرغم اینکه تعداد داده آموزش به شدت کاهش مییابد اما دقت دستهبند از ۸۱٪ به ۸۳٪ افزایش مییابد.
لیست مقالات
لیست مقالات بایگانی شده
Dealing with Black-hole Attacks in Inter-vehicle Networks Using the Packet Delivery Rate Algorithm
Marzieh Sedighi - Mehdi Hamidkhani - Mostafa Sadeghi
Enhancing Mutation Testing through Grammar Fuzzing and Parse Tree-Driven Mutation Generation
Mohamad Khorsandi - Alireza Dastmalchi Saei - Mohammadreza Sharbaf
Inner and Outer Bearing Fault Diagnosis of electrical Motors Using a Proposed Algorithm and Vibration Signals
Vahid Safari Dehnavi - Masoud Shafiee
بررسی کارآمدی فناوری وب 0.2 در پشتیبانی از فرآیندهای انسان محور و دانش مبنا
سید احسان ملیحی - فاطمه مشایخی کردکلا
ارائۀ چارچوب هستانشناسی برای شهر هوشمند مبتنی بر سیستمهای سایبر-فیزیکی
علی اصغر قائمی - جعفر حبیبی - سید حسن میریان
A method for image steganography based on chaotic maps and advanced compression algorithms
Mohammad Yousefi Sorkhi
Face Recognition Based on Local Statistical Features and Artificial Neural Network
Mehdi Moghimi - Dr Hadi Grailu
A Potential Solutions-Based Parallelized GA for Application Graph Mapping in Reconfigurable Hardware
Seyed Mehdi Mohtavipour - Hadi Shahriar Shahhoseini
شبکههای نرمافزار محور در کلان داده: مطالعهی راهکارهای امنیتی و چالشها
احسان سلیمانی دهکردی - محمدرضا ملاخلیلی میبدی
COVID-19 Image Retrieval Using Siamese Deep Neural Network and Hashing Technique
Farsad Zamani Boroujeni - Doryaneh Hossein Afshari - Fatemeh Mahmoodi
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 41.3.1