Im letzten Beitrag habe ich darüber gesprochen, wie im Rahmen der Marktforschung ein Datenerhebungsinstrument gestaltet sein sollte. Nun möchte ich mit diesem Beitrag über die Editierung und Kodierung von Daten die Marktforschung abschließen.
Editierung und Kodierung von Daten
Die Editierung und Kodierung der gewonnenen Daten stellt die letzte Phase des Marktforschungsprozesses dar.
Editierung von Daten
Zunächst muss sichergestellt sein, dass die aus der Befragung gewonnenen Daten vorhanden, lesbar und fehlerfrei sind, all dies geschieht im Rahmen der Editierung.
Eine wichtige Frage, die bei der Editierung beantwortet werden muss, ist die, ob und wie nicht eindeutige oder unlesbare Antworten genutzt werden können. Hierbei bieten sich generell zwei Optionen an: die Daten werden nur teilweise genutzt oder diese Daten werden von der Analyse ausgeschlossen.
Zunächst muss also ein Fragebogen auf dessen Auswertbarkeit hin untersucht werden:
- Ist der Fragebogen vollständig?
- Wurden die Fragen richtig beantwortet?
- Sind Widersprüche im Antwortverhalten erkennbar?
- Wurde der Fragebogen vom Interviewer verfälscht?
Wenn ein Fragebogen nicht vollständig ausgefüllt worden ist (was ein sehr häufiges Problem darstellt), muss zunächst die Ursache, die zu einem Fehlen der Daten geführt hat, untersucht werden.
Dieser Ausfallmechanismus lässt sich grundsätzlich in zwei Typen unterscheiden:
- ignorierbare Ausfallmechanismen
- nicht-ignorierbare Ausfallmechanismen
Ein ignorierbarer Ausfallmechanismus ist zum Beispiel der, dass die Daten völlig zufällig fehlen. So kann es vorkommen, dass der Befragte die Frage ganz einfach übersehen hat. Zum anderer zählt als ignorierbarer Ausfallmechanismus, wenn das Fehlen der Daten nicht vom Wert der Variablen selbst abhängt, sondern vom Wert einer anderen Variablen.
Nicht-ignorierbar hingegen ist der Ausfallmechanismus zum Beispiel, wenn es vom Wert der Variablen selbst abhängt, warum die Frage nicht beantwortet wurde. Ein klassisches Beispiel hierfür ist die Frage nach dem Einkommen des Befragten. Besonders in Deutschland wird hierbei gerne die Angabe des Einkommens ausgelassen.
Wenn Werte aufgrund von nicht-ignorierbaren Ausfallmechanismen fehlen, ist es sehr schwer diese fehlenden Informationen zu ersetzen.
Bei ignorierbaren Ausfallmechanismen hingegen gibt es drei Verfahren diese Fragebögen dennoch zu nutzen:
- Verfahren der Elimination
- die fehlenden Variablen werden nicht berücksichtigen
- Verfahren der Imputation
- die fehlenden Werte werden durch eine möglichst gute Schätzung ersetzt
- Verfahren der simultanen Parameterschätzung
- bei der Parameterschätzung wird das Fehlen der Werte mitberücksichtigt
Das Verfahren der simultanen Parameterschätzung ist zwar in der Praxis durchaus überlegen, doch es ist leider auch sehr komplex, weshalb ich in diesem Beitrag nicht näher auf dieses Verfahren eingehen werde.
Bei nicht einigen fehlerhaften Fragebögen bietet sich das Verfahren der Eliminierung an: Die Fragebögen, die nicht vollständig und richtig ausgefüllt wurden, werden einfach nicht berücksichtigt.
Gerne wird auch das Verfahren der Imputation genutzt. Hierbei wird der fehlende Wert einfach durch den Mittelwert ersetzt.
Kodierung von Daten
Nun müssen die gewonnenen Daten noch in einer geeigneten Weise aufbereitet werden, um diese schließlich leichter auswerten zu können. Die Kodierung beschreibt hierbei den Prozess der Kategorisierung von Rohdaten. Die gewonnenen Rohdaten werden in Antwortkategorien eingeteilt und ggf. in Zahlen umgewandelt.
Bei einer quantitativen Erhebung, die häufig im bei geschlossenen Fragen der Fall ist, findet eine Kategorisierung der Daten bereits vor der Befragung statt. Bei der anschließenden Kodierung geht es dann nur noch darum, den möglichen Antworten entsprechende Zahlenwerte zuzuweisen. Häufig bietet es sich an, einer hohen Antwortoption (z.B. hohe Zustimmung) einen hohen Zahlenwert zuzuordnen.
Bei der qualitativen Erhebung, die besonders bei Tiefeninterviews oder offenen Fragen vorliegt, ist das Kodieren der gewonnenen Daten deutlich komplexer. Die Kodierung kann nicht, wie bei der quantitativen Erhebung quasi automatisch erfolgen, sondern erfordert die Interpretation durch die kodierende Person.
Im ersten Schritt sollten hier die Daten auf wiederholende Regelmäßigkeiten geprüft werden. Diese gefundenen Regelmäßigkeiten können dann die Basis für ein erstes Kategoriensystem bilden. Nun können die einzelnen Antworten den verschiedenen Kategorien zugeordnet werden.
Dabei ist besonders folgendes zu beachten:
- interne Homogenität
- die Daten innerhalb der Kategorie sollten sich möglichst stark ähneln
- externe Heterogenität
- die Kategorien untereinander sollten sich deutlich voneinander unterscheiden
Ein solches Kategoriensystem aufzustellen, kann sehr aufwändig sein, schließlich muss der Kodierer die folgenden Kriterien für die Kategorisierung beachten:
- Die Kategorien sollten in sich konsistent sein und gleichzeitig alle wichtigen Facetten des untersuchten Problems abdecken.
- Alle vorhandenen Daten sollte in das Kategoriensystem einzuordnen sein.
- Das Kategoriensystem sollte reproduziert werden können, wenn ein zweiter, unabhängiger Analyst dieselben Daten kategorisiert.
So nun haben wir für’s erste die Marktforschung abgeschlossen und werden uns nun mit einem sehr spannenden Bereich des Marketings beschäftigten: dem strategischen Marketing.
Im nächsten Beitrag schauen wir uns zunächst den Begriff der Marketingstrategie näher an.
Bildquelle: © kouchin – Fotolia.com
Dein Kommentar
An Diskussion beteiligen?Hinterlasse uns Deinen Kommentar!