Ich möchte eine Funktion schreiben, die ddply
die die zusammenfassende Statistik auf der Grundlage der Namen von zwei Spalten von data.frame
mat
.
-
mat
ist eine großedata.frame
mit den Namen der Spalten"metric", "length", "species", "tree", ...,"index"
-
index
ist ein Faktor mit 2 Stufen"Short", "Long"
-
"metric", "length", "species", "tree"
und andere sind alle kontinuierliche Variablen
Funktion:
summary1 <- function(arg1,arg2) {
...
ss <- ddply(mat, .(index), function(X) data.frame(
arg1 = as.list(summary(X$arg1)),
arg2 = as.list(summary(X$arg2)),
.parallel = FALSE)
ss
}
Ich erwarte, dass die Ausgabe nach dem Aufruf folgendermaßen aussieht summary1("metric","length")
Short metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Long metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Die Funktion erzeugt im Moment nicht die gewünschte Ausgabe? Welche Änderung sollte hier vorgenommen werden?
Vielen Dank für Ihre Hilfe.
Hier ist ein Beispiel für ein Spielzeug
mat <- data.frame(
metric = rpois(10,10), length = rpois(10,10), species = rpois(10,10),
tree = rpois(10,10), index = c(rep("Short",5),rep("Long",5))
)