منو های اصلی
Skip to Content

کارگاه آموزشی- تخصصی روش های طبقه بندی مبتنی بر متن - زمان برگزاری 10 آبان96 توسط دکتر عبادتی برگزار می گردد

عنوان:                                                                         

کارگاه آموزشی- تخصصی روش های طبقه بندی مبتنی بر متن

هدف:

معرفی انواع روش های طبقه­ بندی با تمرکز بر روش­های مبتنی بر متن (MRF-CRF)

منابع:

  1. بررسی کارایی روشهای طبقه بندی SVM و KNN در استخراج عوارض شهری از ابر نقاط لیدار (عقیقی و همکاران، 1396)
  2. بررسی کارایی الگوریتم­های طبقه ­بندی D3 و ANN در استخراج عوارض شهری از ابر نقاط لیدار (عقیقی و همکاران، 1396)
  3. طبقه بندی ابر نقاط لیدار به کمک میدان تصادفی مارکوف و تکنیکهای یادگیری ماشین (عقیقی و همکاران، 1396)  
  4. CONDITIONAL RANDOM FIELDS FOR LIDAR POINT CLOUD CLASSIFICATION IN COMPLEX URBAN AREAS (Niemeyer et al., 2012)
  5. Classification of Urban LiDAR data using Conditional Random Field and Random Forests (Niemeyer et al., 2013)
  6. Efficient 3-D Scene Analysis from Streaming Data (Hanzhang, 2012)

سر فصل ها:

  1. تعریف طبقه ­بندی

طبقه ­بندی یکی از تکنیک‌های یادگیری ماشین است که به منظور پیش­بینی کلاس داده­ها به ­کار می­رود. پیش‌بینی یعنی، آنچه که انتظار می­رود در آینده بر اس اس دانش و تجربه اتفاق بیفتد، اما نه همیشه. به عبارت دیگر طبقه ­بندی به پیاده‌سازی ساختار شناخته­ شده بر داده ­های آزمایشی می­پردازد.

  1. انواع روش­های طبقه ­بندی (شبکه مبنا، نقطه مبنا و شئ مبنا)

در روش شبکه مبنا، ارزش عددی هر پیکسل نشان دهنده ویژگی­های محاسبه­ شده برای نقاط نزدیک به آن پیکسل خواهد بود. روش‌های طبقه‌بندی توضیح داده شده در بند فوق را می‌توان بر روی تک پیکسل‌ها و یا مجموعه‌ای از آنها اعمال کرد. از این روش می‌توان برای ادغام اطلاعات هر پالس لیدار با تصاویر چند طیفی استفاده کرد.

در روش‌ نقطه مبنا در مقایسه با روش‌های شبکه مبنا، هدف استخراج مجموعه ویژگی‌ها و تخمین یک کلاس شئ برای هر تک نقطه است. رسیدن به این هدف مستلزم بررسی کامل نقاط است تا کلاس اشیاء برچسب گزاری شوند.

در روش شئ مبنا، الگوریتم­های تقسیم‌بندی به دو دسته رشد ناحیه (منطقه­ ی در حال رشد) و خوشه­ بندی تقسیم می‌شوند. منطقه ­ی در حال رشد از یک نقطه مرکزی شروع می­شود و با توجه به یک معیار شباهت گسترش می­یابد. بر خلاف این روش که از یک نقطه مرکزی شروع و به همسایه­ های مشابه گسترش می­یابد، در خوشه­ بندی، یک خوشه با در نظر گرفتن مجاورت بین نقاطی که در یک فضای ویژگی قرار دارند، طراحی شده است.

  1. مقایسه روش­های طبقه­ بندی

در این قسمت به بررسی مزایا و معایب روش­های طبقه­ بندی ذکرشده و مقایسه روش­ها پرداخته می­شود.

  1. طبقه­ بندهای مبتنی بر متن

در این نوع طبقه ­بندی از اطلاعات متنی در کنار بردار ویژگی‌های هر نقطه استفاده می­شود، درحالی‌که سایر روش‌های مورد استفاده فقط از بردار ویژگی‌های هر نقطه برای طبقه ­بندی استفاده می­کنند. به همین علت این روش­ها دقت و سرعت بیش­تری دارند. همچنین این نوع طبقه­ بندها قدرت و انعطاف بیش­تری در یافتن روابط همسایگی اشیاء در یک فضای پیچیده دارد.

  1. نمونه کاربرد این طبقه ­بندها

از این نوع طبقه­ بندها برای طبقه ­بندی داده­های دو بعدی مثل تصویر و متن و همچنین برای طبقه­ بندی داده ­های سه ­بعدی مثل داده­ های لیدار استفاده می­شود. نتایج تحقیقات نشان می­دهد، قدرت این طبقه ­بندها در طبقه­ بندی داده­ های دو بعدی و سه­ بعدی بالاتر است.

  1. MRF

مدل MRF یک مدل گرافیکی مبتنی بر ساختار گراف­های بی­جهت است. MRF یک چارچوب مناسب و سازگار برای مدل­کردن مفهوم وابستگی متنی به کمک توصیف تأثیر متقابل همسایه‌ها و با استفاده از احتمالات شرطی محلی است.

  1. CRF

میدان تصادفی شرطی (CRF)، تعمیم‌یافته‌ی میدان تصادفی مارکوف و مدلی آماری است که در یادگیری ماشین کاربرد دارد و زمینه مدل­سازی مفهوم محلی را فراهم کرده است. کاربرد اصلی آن در یادگیری ساختاریافته[1است. CRF شبیه به MRF است و به خانواده­ ی گراف­های بدون جهت تعلق دارد.

  1. تشریح کامل الگوریتم­های MRF و CRF

در این قسمت ابتدا فلوچارت الگوریتم­ها تشریح و سپس به بررسی کدهای نوشته شده MRF و CRF در محیط برنامه نویسی متلب پرداخته می­شود. تا دانشجویان با بخش عملی و پیاده ­سازی این دو الگوریتم قدرتمند آشنا شوند.