K-протояндардағы оңтайлы k қалай таңдауға болады?

Банктен деректер жиынтығын талдау үшін менде сандық және категориялы құндылықтар бар. Мен оларды k-прототиптерімен талдауға түрлендіремін.

Бастапқы деректер жиынтығы:

enter image description here

Өзгертілген деректер жиынтығы:

  • Мысалы: Job (1-ден 12-ге дейін '12 деңгей бар)

enter image description here

K-прототипін жасаудан бұрын деректер жиынтығын масштабтау керек пе?

Оңтайлы таңдауға қалай «k» таңдау (кодтау)?

Мен орындауға ойладым:

library(clustMixType)

lbd <- lambdaest(BPor)

kpres <- kproto(BPor, 5, lambda = lbd) #Change '5' for every possible value of k.

print(kpres)

Содан кейін, кластер қатесі ішіндегі соманы есептеңіз (кішкене таңдауды).

2
қосылды автор Brandon Haugen, көзі
@ Anony-Mousse Бірдей қолданушыдан емес, тіпті кросс-посттан да емес. Осылайша, осы себепті жабық болуы керек
қосылды автор Serge, көзі

Жауап жоқ

0