R-дегі бақыланбаған оқыту Матрицаны сыныптау - дұрыс пакет дегеніміз не?

Жақында мен Стэнфордтың көңілді Ашық аудиторияның бейне дәрістерін көрдім. Атап айтқанда, бақылаусыз машина жасау туралы бөлік назар аударды. Өкінішке орай, ол одан да қызықты болар еді.

Негізінен, дискреттік матрицаларды тексерілмеген алгоритм арқылы жіктеуге тырысамын. Бұл матрицаларда бірдей диапазонның дискреттік мәндері бар. Келіңіздер, мен 1000-дан бастап құндылықтарға ие 20x15 матрицасы бар дейік. Мен әдебиет арқылы оқып бастадым және сурет классификациясы - бұл күрделірек (түсті гистограмма) және менің ісім - бұл жерде жасалып жатқан жұмыстардың жеңілдетілуі.

Мен сондай-ақ Машина жасау және Кластері Кранның тапсырмалары Көріністер, бірақ тәжірибелік мысалмен қайда басталатындығын білмейміз.

Мәселен менің сұрағым: қандай пакет/алгоритм ойнай бастайды және R мәселесінде жұмыс істеу үшін жақсы таңдау болады?

EDIT: Мен түсінбеймін деп ойладым: Менің матрицада дискретті таңдау туралы мәліметтер бар, сондықтан кластерлеуді (!) Дұрыс деп санауға болмайды. Мен векторлар мен байқау туралы айтқандарыңызды түсінемін, бірақ матрицаны немесе деректерді қабылдайтын кейбір функцияларға үміттенемін, өйткені уақыт өте келе бірнеше байқау бар.

EDIT2: Мен категориялық деректердің құпиясыздандырылған жіктелуіне бағытталған пакет/функция кіріспе екенін түсінемін.

2
library (class) және hclust ішіндегі kmeans - бұл екі негізгі.
қосылды автор hatmatrix, көзі
бұл категориялық деректер үшін де жұмыс істейді ме?
қосылды автор Matt Bannert, көзі
@larsmans, thx! сіз жақсы түсіндірген нәрсені жақсы оқып/оқып шықтыңыз ба?
қосылды автор Matt Bannert, көзі
@ ran2: кез келген кластерлеу алгоритмі дұрыс параметрлермен категориялық деректер үшін жұмыс істейді. 1-ші кодты пайдалану жақсы идея болып табылады және егер кластерлеу пакеті бірнеше қашықтығы метрикасын ұсынса, Ewklidean орнына L1 қашықтығын көргіңіз келуі мүмкін.
қосылды автор Fred Foo, көзі
@ ran2: менің ML білімімнің көпшілігі тәжірибеден және әріптестерімен талқылаудан тұрады. Мен ESL сайтында көптеген ақпаратты таба аласыз деп ойлаймын.
қосылды автор Fred Foo, көзі

3 жауаптар

You might want to start from here : http://cran.r-project.org/web/views/MachineLearning.html

1
қосылды
Мұны кім берді? Мен құлдырап кетпеймін, себебі бұл жай ғана маған көмектесуге тырысады. Мен бұл сілтемімді бастапқы жазбамда жариялағанымды білдіремін. Егер бұл RTFM деп айтылса, бұл шынымен адал еді.
қосылды автор Matt Bannert, көзі
Сізді кінәлаған емеспін, жай кездейсоқтық деп ойладым. Дегенмен, мен біраз ақпарат алдым, бірақ бұл бастапқы нүктені табу қиын болғанымен, салыстырмалы түрде (басқа R мәселесімен салыстырғанда) болды. шын мәнінде өте көп нәрсе бар - әсіресе сіз іздеген нәрсені дәл білмесеңіз. Шындығында кейбір пакеттер табылды және кейінірек оны қорытындылауға жеткілікті түрде үйренетін болады.
қосылды автор Matt Bannert, көзі
CRAN ML сайтын сіздің түпнұсқаңыздағы сілтемеде көрсеткен .... байқамадым!
қосылды автор iinception, көзі

Деректердің бірнеше режимдерін өңдеу үшін Gower ұқсастығы коэффициенті сілтемесі бар «gower» дәлелін cluster пакетінен daisy деп таптым. Гауэр тек қана қашықтағы қашықтықты метрика сияқты, бірақ мен категориялық деректермен қолдануға таптым.

0
қосылды

... дискреттік матрицаны басқарылмаған алгоритм бойынша жіктеу

Сіз олардың кластерін білдіруіңіз керек. Жіктелу әдетте қадағаланған алгоритмдер арқылы жасалады.

Суреттің жіктелуі күрделі болып көрінеді (түсті гистограммалар) және менің ісім сол жерде жасалып жатқан әрекеттерді оңайлату болып табылады.

Сіздің матрицаларыңыздың қандай екенін білмей, сізге қандай алгоритм қажет екенін айту қиын. Бірақ бастапқы нүкте ұзындығы-300 векторды өндіру үшін 20 * 15 матрицасын түзетуі мүмкін; мұндай вектордың әрбір элементі кластерлеуді негіздеу үшін функциясы (немесе айнымалы ) бола алады. МЛ пакеттері, соның ішінде сілтеме жасайтын Cluster пакетін қоса, жұмыс істеу керек: «Матрица немесе деректер кадры болған жағдайда, әр жол бақылауларға сәйкес келеді және әр баған айнымалыға сәйкес келеді. «

0
қосылды
Қате болу үшін кешірім сұраймын. Қазір менің лауазымымды өзгертті.
қосылды автор Matt Bannert, көзі
Тарихи тұрғыдан алғанда, кластеризация деп аталатын қазіргі кезде жалпы жіктеу деп аталатын. Бұл атаумен тіпті өте жақсы танымал оқулық бар: Amazon. com/& hellip;
қосылды автор Hong Ooi, көзі