Ein Aufbereitungsprojekt ist in der Regel ein Projekt, in dem Erhebungsinstrumente erfasst, Datensätze erstelltund dokumentiert werden. Häufig wird dies die nächste Welle eines Panels sein.
Auf der oberen Ebene soll es folgende Ordner geben:
* einen Ordner für die Metadaten jedes Erhebungsinstruments
* einen Ordner für die Metadaten jedes Datensatzes
* einen Ordner "scripts" für die Aufbereitungsskripte
* einen Ordner "meta" für übergreifenden Matedaten
### Ordner für die Metadaten jedes Erhebungsinstruments
* Name: Identifikator des Instruments, z.B. "soep-is-2013-a"
* Inhalt:
** questions.csv und answers.csv
** logical_variables.csv und variabels.csv aller Rohdatensätze und des Pseudodatensatzes "notdirectlydelivered". In logical_variables.csv wird die Beziehung zu question und item hergestellt. Nachdem damit begonnen wird, sollte diese Datei nicht mehr durch Skripte überschrieben werden.)
** generations.csv für die Zuordnung der Rohdatensätze (inkl. notdirectlydelivered) zu den SUF-Datensätzen
### Ordner für die Metadaten jedes Datensatzes
* Name: Dateiname (ohne Suffix), z.B. "hgen"
* Inhalt:
** logical_variables.csv, variables.csv und variable_categories.csv des Datensatzes (Solange die Label-Informationen nicht von hier auf den Datensatz geschrieben werden, z.B. bi den englischen Labels, wird hier nichts manuell geändert.)
** XLIFF-Datei für den Datensatz, falls die Übersetzung des Datensatzes über Metadaten vorgenommen wird. Falls variables.csv und variable_categories.csv erfolgreich durch eine XLIFF-Datei ergänzt wurden, ist die xliff-Datei umzubenennen: z.B. von inno.xliff in inno_input_yyyy-mm-dd.xliff. Dann kan ein neuer xliff-Export erfolgen.
** generations.csv für die Zuordnung der Rohdatensätze (inkl. notdirectlydelivered) zu den SUF-Datensätzen