براي مينيمم کردن تابع فوق بايد مقاديربه صورت زير بروزرساني شوند:

2-6 الگوريتم FPCM
آقايان Krishnapuram وKeller به فازي سازي الگوريتم خوشه بندي Possibilistic C-Means يا PCM پرداخته اند و الگوريتم PCM فازي يا FPCM را ارائه کرده اند. در اين الگوريتم سعي بر مينيمم کردن تابع زير کرده اند:

که محدوديتهاي و وجود دارند. براي مينيمم کردن تابع فوق بايد متغيرهاي تابع به صورت زير بروزرساني شوند:

به طور تجربي مشخص شده که η بهتر است از بازه [3,5] انتخاب شود.
2-7 الگوریتم خوشه بندی c میانگین برای داده های نویزی:

همانطور که در بالا اشاره شد روش c میانگین حساسیت زیادی به نویز دارد. بهمین دلیل روش هایی ابداع شده که کمتر به نویز حساس باشند. یکی از روشهایی که در مورد داده های نویزی مطرح شده این است که یک خوشه برای داده های نویزی در نظر گرفته شود و نمونه هایی که نویز هستند با درجه تعلق زیاد به این خوشه نسبت داده شوند و نمونه هایی که نویز نیستند تعلق کمتری به این خوشه داشته باشند. میزان تعلق بردار ویژگی (نمونه) xk به خوشه نویز بر طبق رابطه زیر تعریف شود:
با این اگر نمونه k ام نویز نباشد سیگمای فرمول فوق باید مقدار بزرگی باشد (نزدیک به 1) و اگر نمونه نویز باشد باید مقدار سیگما نزدیک صفر باشد. بنابر تعریف فوق مجموع درجه تعلقات نمونه ها به c خوشه اولیه کمتر از 1 باید باشد، برخلاف روش c میانگین اولیه که این مجموع باید مساوی 1 شود:
تابع هدفی که برای این خوشه بندی تعریف شده بصورت زیر می باشد:
با مشتق گیری از تابع هدف و با در نظر گرفتن شرط مربوط به مجموع تعلقات نمونه ها به خوشه های اولیه، داریم:
در فرمول بالا δ عدد ثابتی است که برابر است با فاصله مرکز خوشه نویز با تمامی نمونه ها. اگر نمونه k ام نویز باشد جمله دوم فرمول فوق بزرگ می شود و میزان تعلق این نمونه به خوشه ها کم می شود و در نتیج میزان تعلق این نمونه به خوشه نویز افزایش می یابد.
از آنجا که جمله اضافه شده به تابع هدف این الگوریتم به vi بستگی ندارد برای محاسبه مقادیر vi می توان از فرمول ارائه شده برای ” الگوریتم C میانگین فازی” استفاده کرد. با پیدا کردن یک مقدار مناسب برای δ این الگوریتم نتایج بهتری نسبت به روش c میانگین اولیه خواهد داشت.
2-8 الگوریتم خوشه بندی c میانگین با بهره گرفتن از نمونه های برچسب گذاری شده:
در بعضی از کاربردها علاوه بر نمونه های بدون برچسب، تعداد کمی نمونه بر چسب دار نیز موجود می باشد. در چنین حالتی می توان از روی این نمونه های بر چسب دار حدس های اولیه بهتری برای مراکز خوشه ها بدست آورد. فرض کنید که تعداد نمونه n باشد و M نمونه از این تعداد برچسب دار باشد. در این کاربردها تابع هدف به صورت زیر تعریف می شود:
بردار b نیز بدین صورت تعریف می شود که اگر نمونه k ام برچسب داشته باشد bk =1 و در غیر اینصورت bk =0 است و lik مولفه های ماتریس L می باشند که درجه تعلق نمونه های برچسب دار را نشان می دهند. ضریب α برابر نسبت n به M در نظر گرفته می شود. مشابه قسمتهای قبل با مشتق گرفتن از تابع هدف می توان فرمول های بروز رسانی uik ها را محاسبه کرد و همچنین برای محاسبه مراکز خوشه ها از فرمول ارائه شده در الگوریتم c میانگین استاندارد استفاده می شود. مراحل الگوریتم نیز مشابه مراحل خوشه بندی c میانگین استاندارد می باشد. در این نوع خوشه بندی ها اگر M=n باشد الگوریتم خوشه بندی را با ناظر و اگر M<n باشد الگوریتم را با ناظر جزئی و اگر M=0 باشد الگوریتم خوشه بندی را بدون ناظر گویند.
2-9 توابع ارزیابی خوشه
یکی از مهمترین مسایل در خوشه بندی انتخاب تعداد خوشه های مناسب می باشد. تعداد خوشه ای مناسب می باشد که:

    • نمونه های موجود در یک خوشه تا حد امکان شبیه به یکدیگر باشند.
    • نمونه های متعلق به خوشه های متفاوت تا حد امکان با یکدیگر نامتشابه باشند.

عبارات فوق را بدین صورت نیز بیان می کنند که خوشه ها باید ماکزیمم فشردگی داشته باشند و تا حد امکان جدایی آنها نیز زیاد باشد. برای یک خوشه بندی مناسب هر دو معیار با هم باید ارضا شوند چرا که اگر تنها معیار فشردگی مورد استفاده قرار گیرد در آنصورت هر داده می تواند به صورت یک خوشه در نظر گرفته شود چرا که هیچ خوشه ای فشرده تر از خوشه ای با یک داده نمی باشد و اگر تنها معیار جدایی در نظر گرفته شود در آنصورت بهترین خوشه بندی این می باشد که کل داده ها را یک خوشه بگیریم با این توضیح که فاصله هر خوشه از خودش صفر است. بنابراین باید از ترکیب دو معیار فوق استفاده شود.
اگر چه در روش میانگین فازی و نسخه های مختلف آن تعداد خوشه ها از قبل مشخص شده است ولی در ابتدای کار تعداد خوشه ها برای طراح مشخص نیست و بیشتر با روش سعی و خطا تعداد مناسب خوشه ها تعیین می شود. برای مشخص کردن تعداد درست خوشه ها توابع ارزیابی مختلفی تعریف شده است که می توان با بهره گرفتن از آنها تعداد خوشه ها را برای مسائل مختلف مشخص کرد.
2-9-1 تابع ارزیابی ضریب افراز
انتخاب تعداد خوشه های مناسب با ماکزیمم کردن تابع فوق بدست می آید. یعنی برای تعداد خوشه های مختلف، خوشه بندی را اجرا می کنند و با بهره گرفتن از ماتریس تعلق بدست آمده مقدار تابع فوق را محاسبه می کنند. تعداد خوشه هایی که به ازای آن این تابع بیشترین مقدار را داشته است بعنوان تعداد خوشه های مناسب برای آن مساله مورد استفاده قرار می گیرد. مقدار تابع فوق بین 1/c و 1 می باشد که هر چه این مقدار به 1 نزدیکتر باشد خوشه بندی ما بهتر است.
2-9-2 تابع ارزیابی آنتروپی افراز
انتخاب تعداد خوشه های مناسب با می نیمم کردن تابع فوق بدست می آید. تعداد خوشه هایی که به ازای آن این تابع کمترین مقدار را داشته است بعنوان تعداد خوشه های مناسب برای مساله مورد استفاده قرار می گیرد. مقدار این تابع بین 0 تا log2c می باشد. یک حالت دیگر از این تابع نیز تعریف شده است که به تابع ارزیابی آنتروپی نرمال شده معروف است. در این تابع مقدار تابع ارزیابی فوق را بر لگاریتم تعداد خوشه ها © تقسیم می کنند.
نکته قابل توجه در مورد دو تابع معرفی شده در بالا این است که زمانی که PC برابر 1 باشد PE برابر 0 خواهد بود و در این حالت خوشه بندی معادل خوشه بندی کلاسیک است. اگر PC برابر 1/c باشد PE برابر log2c خواهد بود که در این حالت خوشه بندی در فازی ترین حالت خود خواهد بود. از طرف دیگر گفته شد که باید برای رسیدن به حالت خوشه بندی مطلوب PC ماکزیمم شود و PE می نیمم. بنابراین در خوشه بندی های فازی سعی می شود تا خوشه ها به خوشه های کلاسیک نزدیکتر باشند و نمونه ها با تعلق زیاد به خوشه ها نسبت داده شوند.
نقاط ضعف دو تابع فوق این است که از خود داده ها بطور مستقیم برای ارزیابی خوشه بندی استفاده نشده است. در توابعی که در ادامه معرفی می شوند خود نمونه ها نیز در تعریف تابع ارزیابی آمده اند.
2-9-3 تابع Fukuyama and Sugeno
در تابع فوق میانگین کل نمونه ها می باشد و انتخاب تعداد خوشه های مناسب با می نیمم کردن تابع فوق بدست می آید. تعداد خوشه هایی که به ازای آن این تابع کمترین مقدار را داشته است بعنوان تعداد خوشه های مناسب برای مساله مورد استفاده قرار می گیرد. جمله اول در تابع فوق معیاری برای فشردگی خوشه ها و جمله دوم معیاری برای جدایی خوشه ها از هم می باشد. هر چه خوشه ها فشرده تر باشند جمله اول کوچکتر خواهد بود و هر چه جمله دوم بزرگتر باشد جدایی خوشه ها بیشتر می باشد. بنابراین می نیمم کردن تابع فوق می تواند معیار مناسبی برای ارزیابی خوشه بندی و تعداد خوشه ها باشد.
2-9-4 تابع Beni Xie and
انتخاب تعداد خوشه های مناسب با می نیمم کردن تابع فوق بدست می آید و تعداد خوشه هایی که به ازای آن این تابع کمترین مقدار را داشته است بعنوان تعداد خوشه های مناسب برای مساله مورد استفاده قرار می گیرد. صورت تابع فوق معیاری برای فشردگی خوشه ها و مخرج کسر معیاری برای جدایی خوشه ها از هم می باشد. هر چه خوشه ها فشرده تر باشند صورت کسر کوچکتر خواهد بود و هر چه مخرج کسر بزرگتر باشد جدایی خوشه ها بیشتر می باشد. بنابراین می نیمم کردن تابع فوق می تواند معیار مناسبی برای ارزیابی خوشه بندی و تعداد خوشه ها باشد.
2-9-5 تابع N.Zahid
آقای N.Zahid و همکارانش تابع ارزیابی دیگری را معرفی کرده اند که مبتنی بر معیارهای فشردگی و جدایی خوشه می باشد. برای معرفی این تابع لازم است تا ابتدا یک عبارات تعریف شوند.
انحراف فازی نمونه k ام از مرکز خوشه Vi :
تغییرات خوشه فازی Ui :
کاردینالیتی فازی خوشه Ui :
با بهره گرفتن از تعاریف فوق میزان فشردگی خوشه فازی Ui را بصورت زیر تعریف کرده اند:
فشردگی کلی تمامی خوشه ها:
برای تعریف تابع ارزیابی لازم است تا معیار جدایی خوشه ها را نیز تعریف شود که آقای N.Zahid و همکارانش جدایی خوشه ها را بصورت زیر تعریف کرده اند:

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...