Dasguptas мақсаты - Dasguptas objective - Wikipedia

Зерттеуінде иерархиялық кластерлеу, Дасгуптаның мақсаты а-дан анықталған кластерлеу сапасының өлшемі болып табылады ұқсастық шарасы кластерленетін элементтер туралы. Ол оны 2016 жылы тұжырымдаған Санжой Дасгуптаның есімімен аталады.[1] Оның басты қасиеті, егер ұқсастық ан-дан шыққан болса ультраметриялық кеңістік, осы сапа өлшемі үшін оңтайлы кластерлеу ультраметриялық кеңістіктің негізгі құрылымына сәйкес келеді. Осы мағынада осы мақсат үшін жақсы кластерлер шығаратын кластерлеу әдістері жуықтайды деп күтуге болады жердегі шындық берілген ұқсастық өлшемінің негізінде жатыр.[2]

Дасгуптаның тұжырымдауында элементтер арасындағы ұқсастықты ан береді бағытталмаған граф , оның шеттерінде теріс емес нақты салмақтар бар. Үлкен салмақтар бір-біріне ұқсас деп саналуы керек элементтерді, ал кішігірім салмақтар немесе жетіспейтін жиектер ұқсас емес элементтердің жұптарын көрсетеді, иерархиялық кластерлеуді жапырақтары элементтер болып табылатын ағаш (екілік ағаш емес) сипаттай алады. шоғырланған болу; кластерлер әр ағаш түйінінен түсетін элементтер тақырыбы және өлшемі болып табылады кез келген кластердің оның элементтер саны. Әр шеті үшін кіріс графигі, болсын жиектің салмағын білдіреді және рұқсат етіңіз екеуін де қамтитын берілген кластердің ең кіші кластерін белгілеңіз және . Содан кейін Дасгупта кластерлеу құнын анықтайды[1]

Осы мақсат үшін оңтайлы кластерлеу болып табылады NP-hard табу. Алайда, мақсаттың минималды мәніне жуықтайтын кластерді табуға болады көпмүшелік уақыт элементтерін бірнеше рет бөлетін бөлгіш (жоғарыдан төмен) кластерлеу алгоритмі бойынша жуықтау алгоритмі үшін ең сирек кесу проблемасы, кесілген жиектердің жалпы салмағының кесілген жұптардың жалпы санына қатынасын минимизациялайтын бөлімді табу мәселесі.[1]Сонымен, жуықтау мақсатында кесілген жиектердің жалпы салмағының кесудің кіші жағындағы элементтер санына қатынасын азайтуға болады. Ең сирек кесілген есеп үшін ең жақсы белгілі жуықтауды пайдаланып, жуықтау коэффициенті бұл тәсіл .[3]

Әдебиеттер тізімі

  1. ^ а б в Дасгупта, Санжой (2016), «Ұқсастыққа негізделген иерархиялық кластерлеу үшін шығындар функциясы», Есептеу теориясы бойынша 48-ші ACM SIGACT симпозиумының материалдары (STOC 2016), Нью-Йорк, Нью-Йорк: ACM, 118–127 б., arXiv:1510.05043, дои:10.1145/2897518.2897527, МЫРЗА  3536559
  2. ^ Коэн-Аддад, Винсент; Канаде, Варун; Маллман-Тренн, Фредерик; Матье, Клэр (2018), «Иерархиялық кластерлеу: мақсатты функциялар және алгоритмдер», Жиырма тоғызыншы ACM-SIAM жыл сайынғы дискретті алгоритмдер симпозиумының материалдары (SODA 2018), Филадельфия, Пенсильвания: Өнеркәсіптік және қолданбалы математика қоғамы, 378–397 б., arXiv:1704.02147, дои:10.1137/1.9781611975031.26, МЫРЗА  3775814
  3. ^ Арора, Санжеев; Рао, Сатиш; Вазирани, Умеш (2009), «Expander ағындары, геометриялық ендіру және графикалық бөлу», ACM журналы, 56 (2): A5: 1 – A5: 37, дои:10.1145/1502793.1502794, МЫРЗА  2535878