Ich schreibe eine Funktion, die prüfen muss, ob (und welche!) Spalte (Variable) alle fehlenden Werte enthält ( NA
, <NA>
). Es folgt ein Fragment der Funktion:
test1 <- data.frame (matrix(c(1,2,3,NA,2,3,NA,NA,2), 3,3))
test2 <- data.frame (matrix(c(1,2,3,NA,NA,NA,NA,NA,2), 3,3))
na.test <- function (data) {
if (colSums(!is.na(data) == 0)){
stop ("The some variable in the dataset has all missing value,
remove the column to proceed")
}
}
na.test (test1)
Warning message:
In if (colSums(!is.na(data) == 0)) { :
the condition has length > 1 and only the first element will be used
Q1: Warum tritt der obige Fehler auf und kann er behoben werden?
Q2: Gibt es eine Möglichkeit herauszufinden, welche der Spalten alle NA
zum Beispiel die Liste ausgeben (Name der Variablen oder Spaltennummer)?