Selaa lähdekoodia

Fix error in R script

Fix undesired dimension reduction when only one data column is selected
jmacura 5 vuotta sitten
vanhempi
commit
6ea62ca9aa
1 muutettua tiedostoa jossa 3 lisäystä ja 3 poistoa
  1. 3 3
      r/selected_data.r

+ 3 - 3
r/selected_data.r

@@ -2,10 +2,10 @@ setwd("./data/clustering/") # Nastavení pracovního adresáře (relativní k ro
 
 library(cluster)
 
-input <- read.csv(file = 'input_modified.csv',header=TRUE,sep=",") # Načtení CSV souboru
+input <- read.csv(file = 'input_modified.csv') # Načtení CSV souboru
 #head(input) # Výpis prvních šesti řádek CSV souboru
-mydata <- input[, -1] # Úprava dat, která funguje, ale nevím proč... (ale jen pro data s více než jedním číselným sloupcem)
-rownames(mydata) <- input[, 1]
+mydata <- input[, -1, drop=F] # Zahození prvního sloupce dat (NUTS_ID). Při 2-sloupcové tabulce nesmí redukovat dimenzi na vektor, proto drop=F
+rownames(mydata) <- input[, 1] # První sloupec dat jako název řádek
 mydata <- scale(mydata) # Standardizace dat
 km25 <- kmeans(mydata, 12, nstart=25) # 12 cluster solution, nstart = počet náhodných počátečních přiřazení, optimální je hodnota 25-50
 km50hw <- kmeans(mydata, 12, nstart=50) # 12 cluster solution, nstart = počet náhodných počátečních přiřazení, optimální je hodnota 25-50