Gibt es eine Möglichkeit, beim Stemming mit NLP in R das Basiswort anstelle des Wurzelworts zu erhalten?
Code :
> #Loading libraries
> library(tm)
> library(slam)
>
> #Vector
> Vec=c("happyness happies happys","sky skies")
>
> #Creating Corpus
> Txt=Corpus(VectorSource(Vec))
>
> #Stemming
> Txt=tm_map(Txt, stemDocument)
>
> #Checking result
> inspect(Txt)
A corpus with 2 text documents
The metadata consists of 2 tag-value pairs and a data frame
Available tags are:
create_date creator
Available variables in the data frame are:
MetaID
[[1]]
happi happi happi
[[2]]
sky sky
>
Kann ich mit R das Basiswort "happy" (Basiswort) anstelle von "happi" (Wurzelwort) für "happyness happies happys" erhalten?