|
@@ -2,10 +2,10 @@ setwd("./data/clustering/") # Nastavení pracovního adresáře (relativní k ro
|
|
|
|
|
|
|
|
library(cluster)
|
|
library(cluster)
|
|
|
|
|
|
|
|
-input <- read.csv(file = 'input_modified.csv',header=TRUE,sep=",") # Načtení CSV souboru
|
|
|
|
|
|
|
+input <- read.csv(file = 'input_modified.csv') # Načtení CSV souboru
|
|
|
#head(input) # Výpis prvních šesti řádek CSV souboru
|
|
#head(input) # Výpis prvních šesti řádek CSV souboru
|
|
|
-mydata <- input[, -1] # Úprava dat, která funguje, ale nevím proč... (ale jen pro data s více než jedním číselným sloupcem)
|
|
|
|
|
-rownames(mydata) <- input[, 1]
|
|
|
|
|
|
|
+mydata <- input[, -1, drop=F] # Zahození prvního sloupce dat (NUTS_ID). Při 2-sloupcové tabulce nesmí redukovat dimenzi na vektor, proto drop=F
|
|
|
|
|
+rownames(mydata) <- input[, 1] # První sloupec dat jako název řádek
|
|
|
mydata <- scale(mydata) # Standardizace dat
|
|
mydata <- scale(mydata) # Standardizace dat
|
|
|
km25 <- kmeans(mydata, 12, nstart=25) # 12 cluster solution, nstart = počet náhodných počátečních přiřazení, optimální je hodnota 25-50
|
|
km25 <- kmeans(mydata, 12, nstart=25) # 12 cluster solution, nstart = počet náhodných počátečních přiřazení, optimální je hodnota 25-50
|
|
|
km50hw <- kmeans(mydata, 12, nstart=50) # 12 cluster solution, nstart = počet náhodných počátečních přiřazení, optimální je hodnota 25-50
|
|
km50hw <- kmeans(mydata, 12, nstart=50) # 12 cluster solution, nstart = počet náhodných počátečních přiřazení, optimální je hodnota 25-50
|