Datenanalyse

Analyse von Daten ist im weitesten Sinn die spannende Kernaufgabe aller Tätigkeitsfelder von Statistiknet. Viele Anbieter von Statistik-Software preisen das leichte Handling ihrer Programmpakete, außerdem seien die nötigen Statistikkenntnisse in Schnellkursen rasch angeeignet. Erstklassige Statistikprogramme eröffnen zwar bisher ungeahnte Möglichkeiten, sie sinnvoll und ohne Schaden zu ergreifen, setzt in Wahrheit äußerst fundierte theoretische Fachkompetenz und langjährige Erfahrung des Analytikers voraus. Die sorgfältig durchgeführte Projektplanung bildet die Basis zum Erfolg. Damit sind wir bei den sechs wesentlichen Arbeitsschritten und Idealbedingungen eines gelungenen Projekts.

Tetraeder Datencluster

Statistiknet-Grundlagenforschung: Simplex-Mediane als neue Clusterzentren

Schritt 1 - Kontakt und Datengewinnung:

Wenn möglich, nehmen Sie frühzeitig Kontakt mit Statistiknet auf! Wir helfen Ihnen, prinzipielle Fehler zu vermeiden, die später vielleicht nur sehr schwierig, schlimmstenfalls gar nicht auszubügeln sind. Bei vielen Aufträgen ist es ohnehin erforderlich, manchmal sogar essenziell, dass schon die Datenerhebung durch ein externes Unternehmen erfolgt. Abgestimmt auf Ihre Ziele und Rahmenbedingungen erstellen wir ein optimiertes Strategiekonzept. Unser Leitgedanke: Maximale Qualität der Ergebnisse mit minimalstem Aufwand erzielen.

Ein entscheidender Faktor - und häufige Fehlerquelle vieler wertloser Studien - sind die Daten, ihre Herkunft und Beschaffenheit. Dazu nur einige Aspekte:
Vollerhebung scheidet bei der Erforschung und Beschreibung großer Grundgesamtheiten von vornherein aus. Jeder Ansatz in diese Richtung führt zu Datenmüll. Es kommt darauf an, mit Hilfe anerkannter statistischer Methoden repräsentative Daten ökonomisch zu beschaffen (representative nonbiased data), bzw. vorhandene Datensätze auf Verzerrungen zu prüfen.
Während Messdatenfehler bei entsprechenden Berechnungen prinzipiell berücksichtigt werden, gibt es für systematische Datenfehler kein Kalkül. Rasch summieren sich schon kleine Systemfehler zu fatalen Fehlschätzungen.
Daneben stellt jeder rechnerinterne Statistik-Algorithmus spezielle Anforderungen an die betreffenden Daten. Nur mit berechnungskonformen Erhebungsmethoden lassen sich verlässliche Aussagen ermitteln - schon deshalb sollten Sie von Anbeginn unsere Kompetenz und Dienstleistung nützen!

Messdaten mit Zeitachse Fouriertransformierte

Datenanalyse mit Fouriertransformation

Schritt 2 - Datentransfer:

Die von Statistiknet entwickelte Erfassungs-Software verknüpft automatisch die Dateneingabe mit der computergerechten Aufbereitung in einem Schritt. Der Input erfolgt auf einer unmittelbar verständlichen, anwenderorientierten Oberfläche. Plattformunabhängig werden alle Daten schon bei der Erfassung intern bzw. online in entsprechende Rohmatrizen oder Listen gepackt, Kosten gespart und eine große Fehlerquelle ausgeschalten. Weiterer Vorteil dieser Datenrohformen: Sie stehen verschiedenen Verarbeitungsprogrammen zur Verfügung.

Liegen die Daten bereits fertig in einem beliebigen, odbc-fähigen Dateiformat vor, erfolgt der Transfer ebenfalls automatisch per Datenbankzugriff. Odbc-fähig sind übrigens alle gängigen Dateiformate.

Speziell angefertigte Programmskripte lesen diese Rohstrukturen sofort in eine bearbeitungsfähige, programmspezifische Datenmatrix (Datentabelle) ein.

Zellhistogramme Q-Q-Plots

Varianzanalyse: Kontrolle notwendiger Zelleigenschaften

Schritt 3 - explorative Analyse:

Zuerst erfolgt hier die Daten-Endkontrolle durch Schätzungsberechnung wichtiger Lage-, Streuungs- und Gestaltparameter, durch Bestimmung aller Extremal- und typischer Erwartungswerte, durch Anforderung der Häufigkeitsverteilungen usw. Diese Plausibilitätskontrollen werden von graphischen Routineausgaben unterstützt.

Die ermittelten Kenngrößen und Diagramme liefern gleich einen guten Überblick in oft unüberschaubare Datenberge, bilden die Grundlage der deskriptiven Statistik und sind das Ziel einfacher Untersuchungen. Bei der Hypothesen- und Modellbildung werden den theoretischen Ansätzen konkrete Inhalte zugeordnet.

Gelegentlich ist es wünschenswert oder notwendig, Daten sinnvoll zu reduzieren. Mit statistischen Spezialverfahren lassen sich mehrere Variable oder Datensätze in passende Faktoren bzw. Cluster zusammenfassen, die sich besser und transparenter als die ursprüngliche Datenbreite in weitere Analyseverfahren einbinden lassen und für sich genommen oft interessante, unerwartete Strukturen offenbaren. Dabei kommt es besonders auf gute Teamarbeit zwischen professionellem Analytiker und sachkundigem Auftraggeber an.

Leverages Cook's Distanzen

Hebelmomente (li.) zur Identifizierung obskurer Daten und
Cook's Distanzen (re.) zur Bestimmung ungewöhnlicher Einflüsse

Schritt 4 - Inferenzverfahren:

Der erwartungsvolle Höhepunkt jeder anspruchsvollen Analyse ist das Aufdecken nützlicher Schlussfolgerungen. Das Fachrepertoire des Statistikers und seine Kreativität sind dabei viel wichtiger als die extensiven Möglichkeiten der eingesetzten Computer-Supersoftware. Lohnende Berechnungen bedingen die unverzichtbare Klärung einer Reihe grundlegender Fragen: Werden alle notwendigen Voraussetzungen zur Anwendung der angestrebten statistischen Tests von den vorliegenden Daten tatsächlich erfüllt? Mit welchen Transformationen können eventuelle Unzulässigkeiten behoben werden? Welche Test-Alternativen sind trennschärfer? Wie können verborgene Strukturen und Zusammenhänge effizient aufgespürt werden? Und so weiter.

Diesen entscheidenden Prozedurschritt bestehen nur versierte Statistiker erfolgreich, die über ein breites Spektrum klassischer Kenntnisse und erprobter Fertigkeiten verfügen und darüber hinaus bereit sind, ihr weitreichendes Orientierungswissen dem rasenden Fortschritt anzupassen. Überlassen Sie deshalb gleich uns die Lösung Ihrer Aufgabe!

Sind induktive Auswertungen Vorstudienteil eines großen Projekts, beginnt jetzt bei Schritt 1 die eigentliche Untersuchung unter Berücksichtigung erschlossener Korrekturen. Liegen hingegen sehr wenig Daten vor, startet unsere Arbeit im Wesentlichen hier mit der Durchführung geeigneter exakter Tests auf hochgerüsteten Rechenanlagen.

Betaverteilungen Laplace-Verteilungen

Zahllose Praxislösungen resultieren aus hilfreichen Modellen mit stetigen Verteilungen

Schritt 5 - Relevanzprüfung:

Schon aus statistisch-methodischen Erwägungen ist bei allem Eifer zweckmäßige Selbstbeschränkung auf wenige Projektziele unverzichtbar. Und wem sollten Ergebnisse nützen, die zwar statistisch signifikant, sonst aber nutzlos sind? Andererseits können statistisch nicht signifikante Befunde durchaus relevant sein.

Die Rangordnung nach Wichtigkeit der Erkenntnisse ist also mit ihrer praktischen Bedeutung und den vorgegebenen Auftragsfragen klar definiert. Wie angedeutet ist für eine wertvolle Auftragserfüllung etwas Vorarbeit unumgänglich. Zum Abschlussbericht wird wunschgemäß nur das Extrakt der gesamten Projektarbeit aufbereitet. Ohne Verzug verfügen Sie über alle entscheidenden Konsequenzen.

Selbstverständlich sind ordentliche Kontrolle und Plausibilitätsprüfung aller zugrundegelegten Berechnungen. Auftragsbezogen ist manchmal ein Vergleich mit anderen Studien sinnvoll.

Polar-Plot Zeitreihen

Datenanalyse: kreative Systematik zur universellen Erkenntnissuche

Schritt 6 - Präsentation:

Unser Abschlussbericht enthält ausführliche Beschreibungen und umfassende Interpretationen zu allen wesentlichen Ergebnissen, wichtige Details werden gesondert hervorgehoben. Neben der fachlich korrekten, publikationsreifen Formulierung bemühen wir uns dabei um eine besonders verständliche Übersetzung für den am wissenschaftlichen Hintergrund nicht interessierten Leser.

Suggestive Tabellen, anschauliche Graphiken und kurze Zusammenfassungen verschaffen unmittelbare Einsicht in komplexe Zusammenhänge, rasch ist alles Bedeutende erfasst.

Die präzise Abgrenzung des betreffenden Gültigkeitsbereichs der gesamten Analyse, die unverzichtbare Angabe berechneter Schätzbereiche (Konfidenzintervalle) oder die Darstellung eventuell zugrundeliegender Experimente zeichnen einen seriösen Bericht ebenso aus wie entsprechende Hinweise auf unkalkulierbare Unsicherheiten und Restrisiken.

Die persönliche Präsentation ist uns ein besonderes Anliegen. Mit modernster Technik führen wir Sie entspannt und leicht durch die gesamte Dokumentation, schnell und ohne Aufwand haben Sie sich alles zu eigen gemacht, auf Ihre Fragen sofort klare Antworten gefunden.

Balkendiagramm Kreisdiagramme

Mit einfachen Diagrammen wertvolle Informationen sofort sichtbar machen

© Statistiknet, 1998-2006
Webmaster
Irrtum und Änderung vorbehalten