8 Stimmen

Löschen von bestimmten Zeilen aus einem Datenrahmen

Ich arbeite mit einigen US-Regierungsdaten, die eine lange Liste von Städten und Postleitzahlen enthalten. Nach einiger Arbeit liegen die Daten im folgenden Format vor.

dat1 = data.frame(keyword=c("Bremen", "Brent", "Centreville, AL", "Chelsea, AL", "Bailytown, Alabama", "Calera, Alabama",
              "54023", "54024"), tag=c(rep("AlabamCity",2), rep("AlabamaCityST",2), rep("AlabamaCityState",2), rep("AlabamaZipCode",2)))
dat1

Es gibt jedoch bestimmte Schlüsselwörter, die nicht richtig funktionieren. So gibt es in dem folgenden Beispiel zwei "Postleitzahlen", die als 'AlabamaCity' und 'AlabamaCityState' bezeichnet werden. Aus irgendeinem Grund enthält der Originaldatensatz der Regierung mehrere Postleitzahlen die nicht richtig mit den anderen Postleitzahlen gruppiert sind.

dat2 = data.frame(keyword=c("Bremen", "Brent", "50143", "Chelsea, AL", "Bailytown, Alabama", "52348",
              "54023", "54024"), tag=c(rep("AlabamCity",2), rep("AlabamaCityST",2), rep("AlabamaCityState",2), rep("AlabamaZipCode",2)))
dat2

Ich wollte wissen, wie ich durch die gesamte Liste der Schlüsselwörter iterieren und löschen Sie alle Zeilen mit numerischen Werten (sie sind eigentlich als Zeichen gespeichert Werte gespeichert), die kein "AlabamaZipCode"-Tag haben. Die bisherigen Daten sollten also am Ende so aussehen.

dat3 = data.frame(keyword=c("Bremen", "Brent", "Chelsea, AL", "Bailytown, Alabama", "54023", "54024"), 
          tag=c(rep("AlabamCity",2), rep("AlabamaCityST",1), rep("AlabamaCityState",1), rep("AlabamaZipCode",2)))
dat3

Das Problem scheint zu sein, dass es bestimmte numerische Werte gibt, die ich beibehalten möchte, und andere, die ich löschen möchte. Kann mir jemand helfen?

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X