B-123 Combinatorial Algorithms for computationally intensive econometric problems
Research Project
|
01.01.2010
- 31.12.2010
Zahlreiche praktische Fragestellungen bei der ökonometrischen Modellselektion sind zu komplex, um mit traditionellen Such- und Optimierungsverfahren in vernünftiger Zeit eine zuverlässige Lösung zu erhalten. Möchte man etwa aus 50 möglichen Indikatoren jene 5 auswählen, die für ein Erklärungsmodell am besten funktionieren, existieren ca. 2 Millionen Alternativen; möchte man die Auswahl auf die 7 besten erweitern, sind es bereits 100 Millionen Alternative. Falls die Modelle zudem zwischen der aktuellen Beobachtung und jener der Vorperiode wählen können, sieht man sich bereits über 16 Milliarden möglichen Lösungen gegenüber. Jede kleinste Erhöhung der Wahlmöglichkeiten (mehr ursprüngliche Indikatoren, ausgewählte Variable und / oder Vorperioden) führt rasch zu einer Explosion der resultierenden Alternativen. Zusätzlich verschärft wird dieses Problem, wenn die Modelle und deren Nebenbedingungen nichtlinear und somit die Bewertung einer jeden dieser Alternativen bereits für sich höchst rechenintensiv ist. Obwohl derartige Modelle in zahlreichen Fragestellungen immer noch als sehr einfach anzusehen sind, ist an Lösung durch Auswertung aller möglichen Alternativen selbst mit modernsten Computerclustern nicht zu denken. Dies erschwert die empirische Anwendung und Ueberprüfung von Modellen. In jüngster Zeit wird daher vermehrt nach Algorithmen gesucht, die rasch möglichst viele schlechte Alternativen ausschliessen können und so die Rechenzeit effizient nutzen und gleichzeitig die Wahrscheinlichkeit, gute Lösungen innert vernünftiger Zeit zu finden, erhöhen. Ziel dieses Projektes ist es, sowohl deterministische als auch stochastische Algorithmen für diese Problemstellung (neu- und weiter-) zu entwickeln und untersuchen. Aus ökonometri-scher Sicht stehen dabei seemingly unrelated regressions (SUR), vector autoregressive (VAR), simultaneous equations und regime switching (insbesondere smooth transition autor-egressive (STAR)) Modelle im Vordergrund. Diese Modelle sind hinsichtlich der genannten kombinatorischen Aspekte ähnlich genug, um sie in einer gemeinsame Suche nach geeigneten Algorithmen zu untersuchen. Als weiterer Aspekte sollen hier die genannten Subset-Regression behandelt werden (Auswahl einer Subgruppe aus den vorhandenen Indikatoren) und Robuste Regression (stabilere Lösungen gegenüber Ausreissern im Datensatz) einflies-sen. "Ausreisser" im Datensatz können die empirische Schätzungen verzerren, da sie traditionelle Gütemasse wie den Mittleren Quadratfehler stark beeinflussen. Werden stattdessen die Mediane der Quadratfehler oder deren getrimmte Verteilungen verwendet, so erzielten Ergebnisse wesentlich stabiler, allerdings können traditionelle Methoden mit dieses numerisch schwierige Schätzung nicht durchführen. Auch hierauf soll im Projekt eingegangen werden. Bei den Methoden wird vor allem Einsatz und Erweiterung von Pipeline Givens sequence und adding row algorithm (ARA, deterministisch) sowie evolutionärer Algorithmen (stochastisch) gedacht. Zum Einsatz der deterministischen Verfahren kann der Mitarbeiter auf erfolgreiche Publikationen in ähnlichen Anwendungsbereichen verweisen (der ARA wurde von ihm entwickelt), die evolutionären Verfahren wurden vom Antragsteller in verschiedensten Problemen (einschliesslich ökonometrischer Variablen- und Modellselektion) erfolgreich eingesetzt. Im vorliegenden Projekt sollen die bereits vorhandenen Verfahren systematisch verglichen und für die genannten Anwendungsbereiche operationalisiert werden. Es sollen aber auch Erweiterungen und Verbesserungen auf methodischem Gebiet erzielt werden.