
Ich muss einen großen Datensatz aus Anonymitätsgründen codieren und weiß nicht, wie ich mehrere Variablen in einen Code (also nur 1 Vaiable) zusammenfassen kann.
Wenn mir irgendwer erklären kann, wie ich die verschiedenen Ausprägungen mehrerer Variablen in eine neucodierte Variable zusammenfassen kann, wäre ich sehr dankbar!

Tun wir als Beispiel so, als ginge es um Autos verschiedener Besitzer:
Jedes Auto hat die Variable Farbe (rot, blau, grün), Marke (Mercedes, BMW, Toyota) und Treibstoff(Diesel, Benzin).
Ziel ist es, jedem Auto einen eigenen individuallen Code aufgrund seiner Eigenschaften zuzuordnen. Also wenn wir zB zuordnen rot=1, BMW=2, Diesel=1 sollte einem roten BMW, der mit Diesel fährt, der Code 121 zugeordnet werden.
Problem:
1) "Recode into different variable" kann ja nicht die Informationen von verschiedenen Variablen in einer neuen vereinen
2) Mit dieser Herangehensweise hätte ich keine individuelle Unterscheidbarkeit, wenn zB zwei Autos die gleichen Eigenschaften hätten.
Gibt es irgendwie einen Weg, zusätzlich noch einen individuellen Code anzuhängen, um Unterschiedbarkeit zu gewährleisten?
Ich hoffe, jemand hier kann mir weiterhelfen

P.S.: Manuell einfügen ist keine Option, wir reden von vielen zehntausend Items.