Probleme mit verschiedenen R Versionen
Created by: mhebing
Leider gibt es da gleich zu Beginn Probleme bei der Erstellung des balanced design und bei der Auswahl der Privathaushalte, da R $pop und $netto als Faktoren speichert und damit die Bedingungen nicht abgerufen werden können und somit am Ende ein Datensatz ohne Beobachtungen rauskommt. Ich dachte, das Problem schnell über as.numeric lösen zu können, es ist aber komplexer, da R andere values zu den einzelnen Ausprägungen vergeben hat, weshalb dann Quatsch dabei raus kommt. Ich schicke dir mal den Auszug aus dem Skript mit
### LOAD [H|P]PFAD ###
pfad <- read.dta(file.path(path_in, "ppfad.dta"))
pfad <- pfad[ , c("hhnr", "persnr", "sex", "gebjahr", "psample","yhhnr", "ynetto", "ypop")]
### [UN]BALANCED ###
pfad <- with(pfad, pfad[ (ynetto >= 10 & ynetto < 20) , ]) #funktioniert nicht, da als Faktoren abgelegt. as.numeric geht nicht, da andere values assigned wurden *levels(pfad$ynetto)
### PRIVATE HOUSEHOLDS ###
pfad <- with(pfad, pfad[ (ypop == 1 | ypop == 2), ]) #funktioniert nicht, da als Faktoren abgelegt. as.numeric geht nicht, da andere values assigned wurden *levels(pfad$ypop)