0% Complete
English
صفحه اصلی
/
یازدهمین کنفرانس بین المللی فناوری اطلاعات و دانش
دستهبندی متون خبری فارسی با یادگیری فعال
نویسندگان :
مینا طباطبائی
1
سعیده ممتازی
2
1- دانشگاه صنعتی امیرکبیر
2- دانشگاه صنعتی امیرکبیر
کلمات کلیدی :
دستهبندی، بیزین ساده، یادگیری فعال، داده برچسبدار
چکیده :
به دست آوردن برچسب موضوعی متون از جمله موارد مهم و پرکاربرد در متنکاوی است که میتواند کاربردهای متنوعی داشته باشد. بهعنوان مثال در سایتهای خبری برچسبگذاری خودکار میتواند راهنمای کاربران در دستیابی به اطلاعات مورد علاقه خود باشد. در مقاله حاضر به طراحی و پیادهسازی یک سیستم تشخیص موضوع متون خبری با استفاده از یادگیری ماشین پرداختهایم. ﺩﺭ ﺑﺴﻴــﺎﺭﯼ ﺍﺯ ﻣﺴـــﺎﺋﻞ ﻳﺎﺩﮔﻴﺮﯼ ﻭﺍﻗﻌﯽ بهدﺳﺖ ﺁﻭﺭﺩﻥ ﻧﻤﻮﻧـﻪﻫـﺎﯼ ﺑﺮﭼﺴﺐﺩﺍﺭ فرایندی زمانبر و ﺑﺴﻴﺎﺭ ﭘﺮﻫﺰﻳﻨﻪ ﻣﻲباشد. ﺩﺭ ﺍﻳﻦ مقاله ﺭﻭﺷﻲ ﺑﺮﺍﻱ ﺩﺳﺘﻪﺑﻨﺪﯼ ﻣﺘﻮﻥ ارائه ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺩﺭ ﺁﻥ ﺍﺑﺘﺪﺍ ﻳﮏ ﺩﺳﺘﻪﺑﻨﺪ ﺑﻴﺰﻳﻦ ﺳﺎﺩﻩ ﺍﻭﻟﻴﻪ ﺑﺎ ﺗﻌﺪﺍﺩ ﮐﻤﯽ داده ﺑﺮﭼﺴﺐﺩﺍﺭ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﺩ، ﺳﭙﺲ ﺑـﺎ ﺍﺳـﺘﻔﺎﺩﻩ ﺍﺯ ﻳـﺎﺩﮔﻴﺮﯼ ﻓﻌﺎﻝ ﻭ ﺑﮑﺎﺭﮔﻴﺮﯼ ﺭﻭﺵ ﻧﻤﻮﻧﻪﮔﻴﺮﯼ ﺑﺮ ﺍﺳﺎﺱ ﻋﺪﻡ ﺍﻃﻤﻴﻨﺎﻥ ﺑﻪ ﺻﻮﺭﺕ هوشمندانه ﻧﻤﻮﻧﻪﻫﺎﯼ ﻣﻔﻴﺪ ﺭﺍ ﺑﺮﭼﺴﺐﮔﺬﺍﺭﯼ کرده و به داده آموزش دستهبند اضافه میکنیم. این کار به صورت چرخشی ادامه مییابد. ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺗﻌﺪﺍﺩ ﻧﻤﻮﻧﻪهای ﺑﺮﭼﺴﺐﺩﺍﺭ ﻣﻮﺭﺩ ﻧﻴﺎﺯ برای رسیدن به دقتی قابل قبول تا حد ﺯﻳﺎﺩﯼ ﮐﺎﻫﺶ ﭘﻴﺪﺍ میکند. نتایج آزمایشها نشان میدهد با بهکارگیری روش پیشنهادی، علیرغم اینکه تعداد داده آموزش به شدت کاهش مییابد اما دقت دستهبند از ۸۱٪ به ۸۳٪ افزایش مییابد.
لیست مقالات
لیست مقالات بایگانی شده
سیستم تشخیص نفوذ مبتنی برشبکه عصبی کانولوشن برای تشخیص حمله انکارسرویس در اینترنت وسایل نقلیه
زهرا جانفدا - سید امین حسینی سنو
Data Analysis to Reduce Electrical Power Plants
Amirali Sahraei - Jamshid Shanbehzadeh
Non-Linear Control of Cancer Model, Considering the Drug Resistance Using Feedback Based Chemotherapy Approach
Danial Kiaei - Hami Tourajizadeh
کشف برخط تقلب پیشنهاد ساختگی (Bid-Shielding) در مناقصه و مزایدههای الکترونیکی هلندی با رویکرد تحلیل شبکه اجتماعی
فاطمه الثلایا - دکتر سید علیرضا هاشمی گلپایگانی فاطمه الثلایا - سید علیرضا هاشمی گلپایگانی -
Securing the Internet of Things via Blockchain-Aided Smart Contracts
S. Mohammadali Zanjani - Hossein Shahinzadeh - Jalal Moradi - Zohreh Rezaei - Bahareh Kaviani-Baghbaderani - Sudeep Tanwar
کشف لبه در تصاویر پزشکی با استفاده از اتوماتای سلولی سلسله مراتبی
مریم علینقی زاده - علیرضا رضوانیان
استخراج موارد آزمون سطح برونمتد و درونکلاس از برنامههای شئگرا
محمد قرشی - حسن حقیقی
Sustainability analysis and improvement of model driven engineering and model transformation languages
Kevin Lano - Shekoufeh Kolahdouz Rahimi
جایگذاری مقادیر ازدست رفته در داده های سری زمانی چندمتغیره برای پیش بینی مرگ ومیر بیماران با رویکرد یادگیری عمیق مبتنی بر مکانیسم توجه
سید علی هاشمی - سعید جلیلی
شکلدهی سه بعدی پرتو و بهبود نرخ امن در شبکههای مخابراتی بیسیم-تواندادهشده مبتنی بر صفحات بازتابی هوشمند
کوثر انصاری - دکتر مهدی مجیدی
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 41.3.1