Institutional Money, Ausgabe 3 | 2020

nicht mehr notwendig, gewaltige Daten- mengen zeit- und rechenaufwendig auszu- werten. Und zum Zweiten wären die Ergeb- nisse einer solchen Stichprobe möglicher- weise relevanter und mit höherer Prognose- kraft ausgestattet als die Auswertung des kompletten Datensets. Für die Forscher steht also die Relevanz der Datenmenge und nicht deren Umfang im Vordergrund. „Und genau diese ‚Rele- vanz‘ definieren wir auf mathematisch präzise Art als die Summe von multivariater Ähnlichkeit und Informationsgrad“, wie MIT-Forscher Kritzman erklärt. Exotischer Ansatz Errechnet wird die Relevanz unter An- wendung der Mahalanobis-Distanz, die per Definition „ein Maß für die Strecke zwi- schen zwei Punkten in einem Raum dar- stellt, der durch zwei korrelierte Variablen definiert wurde. Es ist eine multidimensio- nale Verallgemeinerung des Prinzips, die Distanz zwischen einem Punkt und dem Mittelwert einer Verteilung auszudrücken. Die Distanz ist hierbei die Anzahl der Stan- dardabweichungen, die der Punkt vom Mittelwert der Verteilung entfernt liegt. Die Distanz ist null, wenn der Punkt dem Mit- telwert entspricht“, wie in der vorliegenden Studie ausdefiniert wird. In unserem spe- ziellen Fall sieht die Anwendung der Maha- Will man das Phänomen „süß“ erfassen, muss man nicht alles kosten – Pommes frites tragen beispielsweise nicht unbedingt zum Erkenntnisgewinn bei. Eine Auswertung der kleineren, nur süßen Teilmenge an Lebensmitteln ist in diesem Fall also effizienter. Forscher haben diesen intuitiven Gedanken verfeinert – und kommen in puncto Prognose zu bemerkenswerten Thesen. Relevanzgewichtete Prognose Tabellarisch aufgeschlüsselte Funktionsweise des relevanzgewichteten Prognoseansatzes: Die Beobachtung zweier Variablen soll die Ertragsprognose (E) für eine dritte Variable ermöglichen. Beobachtungs- Distanz von t = 6 Ähnlichkeit (Ae) Informationsgrad (IG) Relevanz-Score (RS) Skal. Relevanz (SR) Relevanzgewichtetes zeitraum (i) ( x i – x t )Ω −1 ( x i – x t )′ -1 * (I) x i Ω −1 x i ′ (Ae)+(IG) (RS / (2*(n -1)) Y = (ST)*(Ertrag 1 ) 1 4,2 -4,2 2,0 -2,1 -0,21 -4,4 % 2 1,1 -1,1 2,9 1,8 0,18 -0,4 % 3 1,6 -1,6 0,6 -1,0 -0,10 1,0 % 4 2,4 -2,4 0,8 -1,6 -0,16 0,0 % 5 3,6 -3,6 3,2 -0,4 -0,04 -0,3 % 6 0,0 0,0 0,5 0,5 0,05 -0,8 % Summe gewichtetes Y Ertragsprognose (E) für Zielvariable bei t = 6: -4,9 % Modellmatrix einer relevanzgewichteten Prognose über sechs Zeitabschnitte. 1 Es handelt sich um die Erträge der Beobachtungspunkte in %: 20,6, -2,2, -9,9, -0,2, 7,4, -15,8. Quelle: Studie N o. 3/2020 | www.institutional-money.com 135 T H E O R I E & P R A X I S : PROGNOS T I S CHE I NNOVAT I ON

RkJQdWJsaXNoZXIy ODI5NTI=