خوشهبندی تکپیوندی یکی از روشهای خوشهبندی سلسلهمراتبی است که با رویکرد از پایین به بالا یک سلسلهمراتب از خوشهها ایجاد میکند. خوشهبندی تجمعی که به نام تکنیک نزدیکترین همسایه نیز شناخته میشود برای اولین بار در سال ۱۹۵۱ توسط فلورک مطرح شد.[۱] مبنای کار این روش آن است که در هر مرحله از اجرا، دو خوشهای که کمترین فاصله از یکدیگر را دارند با هم ادغام میکند و فاصلهٔ یک خوشه از خوشهای دیگر برابر با کمترین فاصله از هر یک از اعضای آن خوشه با هر یک از اعضای خوشه دیگر تعریف میشود.
یکی از معایب این روش نسبت به خوشهبندی کامل پیوند آن است که خوشهبندی کامل پیوند خوشههای منسجمتری به وجود میآورد درحالی که در روش خوشه بندی تکپیوندی تعداد کمی داده که با فاصله اندک از یکدیگر که به شکل یک پل بین دو خوشه قرار داشته باشند موجب ادغام شدن آن دو خوشه میشوند و این خاصیت «اثر زنجیرهای» نامیده میشود. اما یکی از مزایای این روش تطبیقپذیری بیشتر آن و حفظ کارایی خود روی مجموعه دادههای مختلف است.[۲]
تعریف
خوشهبندیهای تجمعی احتمالاً یکی از پرمصرفترین روشهای خوشهبندی سلسلهمراتبی هستند. در این نوع از خوشهبندیها هر دادهای در ابتدا خود یک خوشه، سپس به صورت پیاپی در هر مرحله دو خوشه با یکدیگر ادغام شده و خوشهای بزرگتر تشکیل میدهند و این روند ادامه پیدا میکند تا تنها یک خوشه باقی بماند. نتیجهٔ چنین خوشهبندی ای معمولاً به صورت یک دندروگرام نمایش داده میشود و با برش دندروگرام در سطحی دلخواه از میزان شباهت یک خوشهبندی ایجاد میشود.[۲]
تفاوت روشهای مختلف خوشهبندی تجمعی در نحوه انتخاب شدن آن دو خوشهای است که در هر مرحله برای ادغام شدن انتخاب میشوند. در خوشهبندی تک پیوندی فاصلهٔ دو خوشه را نزدیکترین جفت داده (که هر کدام در یکی از خوشهها باشد) تعیین میکند.
به صورت ریاضی تابع فاصله خوشهها به شکل تعریف میشود که و خوشهها و فاصله دو داده و را نمایش میدهد.[۳]
در هر مرحله از این الگوریتم دو خوشهای که کمترین فاصله را با یکدیگر دارند با هم ترکیب میشوند و فاصله خوشه حاصل از ادغام شدن و و خوشه دیگر به صورت زیر محاسبه میشود: