عنوان:
کارگاه آموزشی- تخصصی روش های طبقه بندی مبتنی بر متن
هدف:
معرفی انواع روش های طبقه بندی با تمرکز بر روشهای مبتنی بر متن (MRF-CRF)
منابع:
سر فصل ها:
طبقه بندی یکی از تکنیکهای یادگیری ماشین است که به منظور پیشبینی کلاس دادهها به کار میرود. پیشبینی یعنی، آنچه که انتظار میرود در آینده بر اس اس دانش و تجربه اتفاق بیفتد، اما نه همیشه. به عبارت دیگر طبقه بندی به پیادهسازی ساختار شناخته شده بر داده های آزمایشی میپردازد.
در روش شبکه مبنا، ارزش عددی هر پیکسل نشان دهنده ویژگیهای محاسبه شده برای نقاط نزدیک به آن پیکسل خواهد بود. روشهای طبقهبندی توضیح داده شده در بند فوق را میتوان بر روی تک پیکسلها و یا مجموعهای از آنها اعمال کرد. از این روش میتوان برای ادغام اطلاعات هر پالس لیدار با تصاویر چند طیفی استفاده کرد.
در روش نقطه مبنا در مقایسه با روشهای شبکه مبنا، هدف استخراج مجموعه ویژگیها و تخمین یک کلاس شئ برای هر تک نقطه است. رسیدن به این هدف مستلزم بررسی کامل نقاط است تا کلاس اشیاء برچسب گزاری شوند.
در روش شئ مبنا، الگوریتمهای تقسیمبندی به دو دسته رشد ناحیه (منطقه ی در حال رشد) و خوشه بندی تقسیم میشوند. منطقه ی در حال رشد از یک نقطه مرکزی شروع میشود و با توجه به یک معیار شباهت گسترش مییابد. بر خلاف این روش که از یک نقطه مرکزی شروع و به همسایه های مشابه گسترش مییابد، در خوشه بندی، یک خوشه با در نظر گرفتن مجاورت بین نقاطی که در یک فضای ویژگی قرار دارند، طراحی شده است.
در این قسمت به بررسی مزایا و معایب روشهای طبقه بندی ذکرشده و مقایسه روشها پرداخته میشود.
در این نوع طبقه بندی از اطلاعات متنی در کنار بردار ویژگیهای هر نقطه استفاده میشود، درحالیکه سایر روشهای مورد استفاده فقط از بردار ویژگیهای هر نقطه برای طبقه بندی استفاده میکنند. به همین علت این روشها دقت و سرعت بیشتری دارند. همچنین این نوع طبقه بندها قدرت و انعطاف بیشتری در یافتن روابط همسایگی اشیاء در یک فضای پیچیده دارد.
از این نوع طبقه بندها برای طبقه بندی دادههای دو بعدی مثل تصویر و متن و همچنین برای طبقه بندی داده های سه بعدی مثل داده های لیدار استفاده میشود. نتایج تحقیقات نشان میدهد، قدرت این طبقه بندها در طبقه بندی داده های دو بعدی و سه بعدی بالاتر است.
مدل MRF یک مدل گرافیکی مبتنی بر ساختار گرافهای بیجهت است. MRF یک چارچوب مناسب و سازگار برای مدلکردن مفهوم وابستگی متنی به کمک توصیف تأثیر متقابل همسایهها و با استفاده از احتمالات شرطی محلی است.
میدان تصادفی شرطی (CRF)، تعمیمیافتهی میدان تصادفی مارکوف و مدلی آماری است که در یادگیری ماشین کاربرد دارد و زمینه مدلسازی مفهوم محلی را فراهم کرده است. کاربرد اصلی آن در یادگیری ساختاریافته[1است. CRF شبیه به MRF است و به خانواده ی گرافهای بدون جهت تعلق دارد.
در این قسمت ابتدا فلوچارت الگوریتمها تشریح و سپس به بررسی کدهای نوشته شده MRF و CRF در محیط برنامه نویسی متلب پرداخته میشود. تا دانشجویان با بخش عملی و پیاده سازی این دو الگوریتم قدرتمند آشنا شوند.