Zusammenhänge - pos. EW?

Tiefseefischer · Juni 30, 2017

Liebe Community,

ich möchte gerne ein paar Forschungsergebnisse mit euch teilen – in der Hoffnung, dass Ihr vielleicht zu einer Schlussfolgerung kommt, die mir bisher noch nicht möglich war.

Worum geht es: Angehängt habe ich zwei Excel-Dateien mit Daten und einfachen Auswertungen.

Was sieht man dort: Jeweils in den ersten Tabellenblättern die „Rohdaten“, sprich Daten, die ich aus fortlaufenden Zufallsfolgen (binärer Art, es geht nur um 0/1) gewonnen habe. Wie diese Daten gewonnen wurden, soll nicht Gegenstand dieser Diskussion sein – es geht mir in erster Linie darum, ob sich eine Prognosemöglichkeit ergibt.

In den zweiten Tabellenblättern sieht man Auswertungen dieser Daten. Ich habe ein paar Erklärungen hinzugefügt, damit man´s auch lesen kann. Trotzdem fass´ ich nochmal kurz zusammen:

Datei1: Diese Datei enthält fortlaufende Datenspalten, von denen eine die tatsächlich erschienene Option (0 oder 1) darstellt, die andere die Alternativoption (deshalb die Bezeichnung der Spalten mit „richtig“ und „falsch“).

Im zweiten Tabellenblatt habe ich dann ein übliches statistisches Verfahren angewendet, um die Daten zu untersuchen. Ich habe jeweils die Differenz aus „t_n richtig“ und „t_n+1 richtig“ bzw. „t_n+1 falsch“ gebildet (um ein Beispiel zu nennen: Der Wert aus D8-D7 bildet eine neue Spalte und der Wert aus F8-D7 bildet eine neue Spalte.).

Das Interessante daran: Summiere ich diese Ergebnisspalten auf, dann erhalte ich das grafisch dargestellte Ergebnis – nämlich zwei komplett unterschiedliche Entwicklungen. Während Strang „richtig“ recht eng um die Nulllinie oszilliert, schwankt Strang „falsch“ deutlich stärker.

Die Schlussfolgerung: Verwendet man die Ergebnisse „richtig“ und „falsch“ (also letzten Endes die vorher noch nicht bekannten Ergebnisse 0 und 1) zufällig, dann ergibt sich die oben beschriebene Verteilung NICHT (das kann jeder in der Excel-Datei leicht selbst ausprobieren). Das bedeutet aber, dass die Ergebnisse (0 oder 1) NICHT rein zufällig sein können.

Datei2: Diese Datei ist in der Auswertung etwas komplizierter aufgebaut. Das erste Tabellenblatt enthält zunächst wieder die „Rohdaten“, die in diesem Fall aus drei Spalten bestehen:

Spalte1: Prognose trifft zu (1), Prognose trifft nicht zu (-1), keine Prognose möglich (0).

Spalte2: Ergebnis 0 (-1) oder 1 (1). Ich habe hier nicht 0/1 sondern 1/-1 aus Verarbeitungsgründen verwendet, aber das macht ja keinen Unterschied.

Spalte3: Prognose 0 (-1) oder 1 (1).

Spalte1 ergibt sich natürlich aus Spalte2 und 3.

Im zweiten Tabellenblatt ergibt sich dann folgende Auswertung:

Zunächst wird aus Spalte1 und Spalte2 ein gemeinsames Ergebnis gebildet (also 1 und 1 ergibt 1, 1 und -1 ergibt 2, -1 und 1 ergibt 3, -1 und -1 ergibt 4; 0 bleibt 0, da nicht relevant). Daraus ergibt sich wiederum eine fortlaufende Spalte mit den Ergebnissen von 0 bis 4. Die im Excel-Blatt nächsten Spalten sind Hilfsspalten und werfen eine Prognose von 1 bis 4 aus (0 wird ignoriert) und zwar in der Art, dass die letzte Folgeziffer bei der nächsten gleichen Ziffer erneut folgen soll.

Beispiel Abfolge:

1

0

2

4

2

Prognose wäre hier dann 4 (nach dem letzten 2er kam ein 4er).

Danach erfolgt der Abgleich mit der tatsächlichen Ziffer, was erstaunlicherweise eine deutlich höhere Trefferquote als erwartet (bei 4 Möglichkeiten müsste die Trefferquote eigentlich bei 25% liegen), nämlich >30% ergibt (ich hab das Ergebnis zusätzlich in Sigma-Abweichung ausgedrückt; die liegt bei diesem Testumfang irgendwo über 6,6; natürlich habe ich mit wesentlich mehr Daten getestet und das Ergebnis bleibt bei >30%, also einer deutlich höheren Abweichung).

Der Gegentest (wenn zur Erzeugung der Spalte3 „Prognose“ keine fortlaufenden Zahlen, sondern jeweils ein komplett neuer „Vorlauf“ verwendet wird) erfüllt genau die Erwartung, nämlich 25% Trefferquote bei der Prognose der Ziffern 1 bis 4.

Die Schlussfolgerung: Offensichtlich besteht ein Zusammenhang zwischen den Spalten 2 und 3 (nämlich zwischen tatsächlichem Ergebnis und der Prognose), und damit ein Zusammenhang zwischen Ergebnis und Vorlauf.

Es ist durchaus möglich, dass die dargestellten Entwicklungen systemimmanent sind, sich also kein weiterer Informationsgewinn (und somit keine Prognose) daraus ableiten lässt – vielleicht übersehe ich aber auch einfach etwas. Jetzt sind eure Ideen gefragt – eurer Phantasie in der Auswertung der Daten sind keine Grenzen gesetzt!

Sollte etwas unklar sein, bitte fragt einfach nach!

Beste Grüße

Tiefseefischer

RohdatenVerarbeitung.xlsx

RohdatenVerarbeitung_II.xlsx

elementaar · Juni 30, 2017

Hallo Tiefseefischer,

dies ist kein substantieller Beitrag, sondern die bloße Rückmeldung: ist angekommen und auf jeden Fall ist die Sache interessant.

Vielen Dank für die sehr klare Schilderung Deiner Vorgehensweise und das zur Verfügung stellen der Dateien.
Auch die Dateien selbst sind verständlich.

Auf das Phänomen selbst bin ich auch schon gestoßen, ich weiß noch, wie es mich einige Tage ins Grübeln brachte, leider habe ich die Herleitung zur Zeit nicht mehr präsent (man könnte es auch "vergessen" nennen).
Ich werde mal in meinen Dateien kramen und versuchen, es mir wieder ins Gedächtnis zu rufen (kann aber ein paar Tage dauern).

Vielleicht ist ja jemand schneller.

Gruß

elementaar

elementaar · Juli 2, 2017

Hallo Tiefseefischer,

wie angekündigt, habe ich mein aktuelles Archiv durchsucht, und muß leider berichten, daß ich die betreffenden Dateien scheinbar ausgelagert habe.
Ich weiß zwar zuverlässig, daß ich im Zusammenhang mit den EC-2er-Figuren auch schon einmal auf eine ca. 30%-Verteilung gestoßen bin, mich dieses Ungleichgewicht auch einige Tage beschäftigte, es sich dann mit irgendeiner Herleitung auflöste - nur wie das ging, will mir zur Zeit einfach nicht mehr einfallen.

Statt nun weitere Zeit mit Suchen zu verbringen, habe ich Deine Datei 2 "RohdatenVerarbeitung_II" nachgebaut.
Leider kann ich Deine Ergebnisse so nicht bestätigen.
Weiter unten gehe ich noch näher auf das Problem ein, zunächst die zusammengefassten Ergebnisse:

Damit die Güte der Prognose keinen Einfluß auf das Ergebnis hat, habe ich als Prognosemethode das einfache Nachspielen der letztgefallenen Farbe gewählt.
Jede Partie dauerte 1001 Cps.
Ansonsten das Figuren-Vorgänger-Nachfolger-Modell getreu Deiner Vorlage.

Zuerst habe ich mich allerdings ein wenig mit Deinen Daten beschäftigt.
Das Zusammenzählen der drei Datenspalten erbrachte dieses Ergebnis:

Tiefseefischer_02.png.bd4aee163ddca02d785d6bbf6c9128dd.png

Dabei fällt auf, daß die Spalten "Prognose richtig/falsch" und "Ergebnis" recht ausgeglichen sind, die Spalte "Prognose" jedoch nicht.
Es wird gute 7% häufiger "Prognose richtig" angenommen als "Prognose falsch".
Daß damit das Ergebnis dennoch ausgeglichen ist, erstaunt.

Ein möglichen Knackpunkt sehe ich allerdings in dem reduzierten Freiheitsgrad, der mit "Prognose richtig/falsch" vorgenommen wird.
Man könnte ja annehmen, daß, so lange alles binär bleibt, eine Bezeichnung so gut ist wie jede andere, Hauptsache man hat jeweils genau zwei sich ausschließende Möglichkeiten.
Real muß aber eine Prognose auf eine konkrete Farbe weisen, und diese kann jeweils "richtig" oder "falsch" sein (4 Fälle <=> 2 Fälle).
Setzt man nun in Deiner Spalte "Prognose" bspw. für "1" = "Rot" und für "-1" = "Schwarz" ein, verliert man die "Rate-"information, ob jeweils "richtig" oder "falsch" erwartet wird.
Will man hingegen die "Rate-"information "richtig" oder "falsch" behalten, geht dies nur mit einer Farbe und dann erhält man in der Spalte "Prognose richtig/falsch" nur zwei Figuren, nämlich 1 1 und -1 -1.

Tiefseefischer_03.png.1c562fc96c37fc5d74b0d50a3cc4c183.png

Gruß

elementaar

bearbeitet Juli 2, 2017 von elementaar
"a" eingefügt; "ß" zu "ss"; .png verbessert

Tiefseefischer · Juli 3, 2017

Hallo elementaar,

vielen Dank, dass du dir die Mühe machst und dich mit meinen Ausführungen auseinander setzt!

Um Missverständnisse zu vermeiden, erkläre ich aber besser die zweite Excel-Datei noch einmal:

Es gibt hier nämlich zwei „Prognosen“: Erstens die „Spalte Prognose“ (die müsst ihr als gegeben annehmen) und zweitens die „Prognose“, die sich aus der Verknüpfung der beiden Variablen „Spalte Prognose“ und „Spalte Ergebnis“ ergibt und Werte von 0 bis 4 annimmt.

Die „Spalte Prognose“ funktioniert ganz offensichtlich nicht (sonst hätten wir hier bereits einen pos. EW).

Was aber sehrwohl funktioniert (und die Schlussfolgerung ist dann das Interessante): Die Verknüpfung von „Spalte Prognose“ und „Spalte Ergebnis“ (nämlich die Werte 0 bis 4, wobei 0 ignoriert wird) lässt sich mit einer deutlich erhöhten Trefferquote prognostizieren (>30%). Daraus lässt sich schließen, dass es zwischen der „Spalte Prognose“ und der „Spalte Ergebnis“ einen Zusammenhang gibt. Und das wiederum bedeutet, dass der „Vorlauf“, aus dem sich die „Spalte Prognose“ letzten Endes ergibt, mit der „Spalte Ergebnis“ zusammenhängt.

Tatsächlich ergibt sich beim Gegentest, nämlich der Aneinanderreihung der Spalten „Prognose“ und „Ergebnis“ mit immer wieder komplett neuem Vorlauf (also NICHT fortlaufend), genau die zu erwartende Trefferquote (25%).

Ich kann wie gesagt noch keinen pos. EW produzieren, aber zumindest scheint mir damit nachgewiesen zu sein, was ich auch aus der ersten Excel-Datei schlussfolgere: Nämlich dass es einen (wie auch immer gearteten) Zusammenhang zwischen Vorlauf und Ergebnis gibt.

Ich kann mich aber auch täuschen und meine Schlussfolgerungen sind nicht korrekt oder zulässig – aber gerade deswegen hätte ich ja gerne weitere Meinungen dazu; oder (was noch besser wäre): Eine aus den vorhandenen Daten abgeleitete Prognosemöglichkeit!

Beste Grüße

Tiefseefischer

elementaar · Juli 5, 2017

Hallo Tiefseefischer,

vielen Dank für Deine Antwort, die mir zeigt, daß ich Dich wirklich gründlich mißverstanden haben muß.

Vielleicht stimmt es so:

- obwohl die Addition von Chance und Gegenchance in Datei I stets 35,13274045 ergibt, nennst Du das Ergebnis, leider falsch, "binär" ("binär" bedeutet, ein Ereignis kann nur zwei mögliche Werte und nicht deren 35,13274045 annehmen).
- Du führst dann, gut dokumentiert und erläutert, Rechenoperationen durch, die, saldiert, ganz richtig zu den beiden unterschiedlichen Graphen führen.
- verführt durch die falsche Benennung in (1), ziehst Du den, hier, falschen Schluß, es gebe einen "Zusammenhang zwischen Vorlauf und Ergebnis". Natürlich läßt sich daraus nichts Spielbares ableiten, denn zwei Graphen bilden 35,13274045 Möglichkeiten eben nicht vollständig ab.
- Dies soll aber nicht diskutiert, sondern hingenommen werden.
- in Datei II wiederum, erstellst Du in der dritten Spalte "Prognose" 4.815 mal die Prognose "1" und 4.484 mal die Prognose "-1" (Abweichung gute 7%), die aber doch zu einem (erstaunlich) ausgeglichenen Ergebnis führen.
- Trotz der diesmal halbwegs richtigen Bezeichnung binär (1, -1; 0 wird ignoriert), geht es real aber um 4 Fälle statt der falsch angenommenen 2 Fälle.
- Dies soll aber ebenfalls nicht diskutiert, sondern hingenommen werden.

Falls ich Dich jetzt richtig verstehe, fragst Du Folgendes:

Wenn man, mit einer Reihe falscher Voraussetzungen (die nicht diskutiert werden sollen), bei einem EC-4-Figurenspiel bei einer Figur den Erscheinenswert 30% erhält, wie sieht das dazugehörige Spiel mit pos. EW aus?

Hätte ich Dich gleich so verstanden, hätte ich Lebenszeit sparen können. Es empfiehlt sich halt immer, genau zu lesen.
Mein Fehler, ich bitte um Entschuldigung.

Gruß

elementaar

Tiefseefischer · Juli 5, 2017

Hallo elementaar,

ich habe zunächst überlegt, ob ich auf jeden deiner Punkte gesondert eingehe, aber ich versuche es besser noch einmal mit einer (hoffentlich verständlicheren) Erklärung:

Was stellt Datei1 dar?
Hier habe ich eine fortlaufende, binäre Reihe (die ist in der Datei nicht ersichtlich!) umgewandelt in zwei alternierende Reihen. Diese setzen sich so zusammen:
Spalte1 ("richtig") zeigt einen Wert, der sich aus der tatsächlichen Abfolge (einem definierten "Vorlauf") und dem richtigen letzten Ereignis (0 oder 1) ergibt, Spalte2 ("falsch") zeigt einen Wert, der sich ebenfalls aus der tatsächlichen Abfolge ("Vorlauf") und dem falschen letzten Ereignis (0 oder 1) ergibt.
Auf Deutsch heißt Spalte1: "So ist die binäre Reihe gelaufen", Spalte2: "So hätte die binäre Reihe mit 50%tiger Wahrscheinlichkeit (nur das letzte Bezugsergebnis ist anders) ebenfalls laufen können".

Die Werte selbst und deren Herleitung sind jetzt grundsätzlich einmal vollkommen egal (bzw. "sollen nicht Gegenstand dieser Diskussion sein und sollen als gegeben angenommen werden"). Das Interessante an diesen Werten ist jetzt eben, dass sie ganz offensichtlich nicht beliebig vertauscht werden können, was man von einer 50/50-Verteilung ja erwarten könnte. Die Werte beziehen sich lediglich auf das letzte Ereignis, das ja laut Wahrscheinlichkeitsrechnung mit 50%iger Wahrscheinlich 0 oder 1 sein hätte können - aber sie verhalten sich nicht so (was ich anhand eines statistischen Verfahrens und einem zugehörigen Graphen zu verdeutlichen versucht habe).

Ich hoffe, das ist nun soweit klar.
Meine Frage ist jetzt: Kann ich aus den Werten, deren Abfolge oder deren Verhältnis zueinander irgendwie im Vorhinein darauf schließen, welcher Wert der richtige und welcher der falsche sein wird (ich kann ja im Vorhinein beide berechnen)? Die Abfolge der Werte verhält sich zwar deutlich unterschiedlich und kann nicht beliebig vertauscht werden - aber mir ist es trotzdem bislang nicht gelungen, richtig und falsch im Vorhinein mit einer erhöhten Wahrscheinlichkeit zu prognostizieren. Mir drängt sich nur die Schlussfolgerung auf: Wenn die Abfolge der Werte nicht beliebig ist, dann sind die Werte zu gewissen Zeitpunkten nicht beliebig - und die Werte sind abhängig vom "Vorlauf", insofern beeinflusst der "Vorlauf" das Ergebnis!

Zur Datei2:

Hier gibt es (im Gegensatz zu Datei1) keine alternierenden Möglichkeiten, sondern zunächst einmal zwei Bezugswerte: Ergebnis und Prognose. Diese wurden ebenfalls aus einer binären Reihe gewonnen. Das heißt, "Ergebnis" bedeutet in diesem Fall 1 oder -1 (aus Auswertungsgründen habe ich hier nicht 0/1 verwendet). Wie sich leicht erkennen lässt, ist diese Spalte durchgängig, was logisch ist, weil ja immer eines der beiden Ereignisse eintritt. "Prognose" bedeutet in diesem Fall eine Prognose, die sich aus dem Verlauf ergibt ("diese Prognose soll nicht Gegenstand dieser Diskussion sein und soll als gegeben angenommen werden"). Diese Spalte ist nicht durchgängig, weil es zu Fällen kommen kann, in denen keine eindeutige Prognose erstellt werden kann.

Mein nächster Schritt ist jetzt, diese beiden Werte zu verknüpfen - davor erfolgt noch der Zwischenschritt, nämlich aus "Ergebnis" und "Prognose" eine dritte Spalte "Prognose trifft zu/trifft nicht zu" (in der Datei Spalte1) zu erzeugen. Dieser Zwischenschritt wäre nicht notwendig, er hat wiederum nur auswertungstechnische Gründe.

Kern der Sache ist: Grundsätzlich sollte man bei einer 50/50 Verteilung davon ausgehen, dass die Verknüpfung einer "Prognose"-Spalte mit einer "Ergebnis"-Spalte folgendes Ergebnis produziert:
Prognose=1 und Ergebnis=1 stellt den Wert 1 dar, der zu 25% eintritt
Prognose=1 und Ergebnis=-1 stellt den Wert 2 dar, der zu 25% eintritt
Prognose=-1 und Ergebnis=1 stellt den Wert 3 dar, der zu 25% eintritt
Prognose=-1 und Ergebnis=-1 stellt den Wert 4 dar, der zu 25% eintritt

Es gibt dann noch den Wert 0 - da sich dieser aber aus dem Ereignis "keine Prognose" ergibt, ist er nicht relevant (wenn keine Prognose gestellt wird, kann diese auch nicht "treffen" oder "nicht treffen") und wird für die weiteren Auswertungen ignoriert.

Versuche ich nun aus der Abfolge dieser 4 (bzw. 5) Werte eine (neue!) Prognose (meine Auswertung im Tabellenblatt2 in der Datei2) für den jeweils nächsten Wert von 1 bis 4 zu erstellen, dann sollte sich dabei wiederum nur eine 25%ige Trefferquote ergeben (eben einer der 4 möglichen Werte; 0 kann ich wieder ignorieren, da ich ja bereits weiß, ob ich eine Prognose stellen kann oder nicht). Das ist auch tatsächlich der Fall wenn ich:
a) für den Prognose-Wert zufällig 1 oder -1 wähle
b) für den Prognose-Wert zwar meine Herleitung verwende (die ich hier nicht zur Diskussion stellen möchte!), diese aber nicht fortlaufend buche, sondern jedes Mal einen komplett "neuen Vorlauf" verwende

Das Interessante ist in diesem Fall jetzt (wie hoffentlich aus meinen weiteren Verarbeitungen der Grunddaten ersichtlich ist): Eben diese erwartete 25%-Verteilung tritt nicht ein, sondern eine >30%ige Trefferquote für den nächsten Wert von 1 bis 4. Meine Schlussfolgerung: Da der einzige Unterschied zwischen der 25%-Verteilung und der 30%-Trefferquote der Prognose-Wert ist und dieser aus dem "Vorlauf" folgt, gibt es eine Abhängigkeit zwischen Ergebnis und "Vorlauf"!

Wie geschrieben: Möglicherweise sind diese Abhängigkeiten in Datei1 und Datei2 systemimmanent und können erklärt werden - dann sind auch meine Schlussfolgerungen nichts wert. Andernfalls ...

Beste Grüße
Tiefseefischer

elementaar · Juli 7, 2017

Hallo Tiefseefischer,

vielen Dank für Deine ausführliche Antwort.
(und, es gehört zwar woanders hin, aber dennoch, vielen Dank auch für Deinen Versuch öffentlich roemers Spiel zu entschlüsseln, welches dieser dann ja flugs von 15 Cps Vorlauf auf 25 Cps erweitert hat. Die von Dir angewandte Methode hatte ich exakt ein, zwei Jahre vorher selbst benutzt, mit ähnlichen Ergebnissen, und war dementsprechend erfreut zu sehen, wie ein Anderer öffentlich ein paar klare Gedanken in eine Prüfmethode fließen ließ, die Hand und Fuß hat.)

Aus mir nicht erfindlichen Gründen, scheint Dich die Sorge umzutreiben, Deine (schon im ersten Beitrag sehr gute und vollständige und von mir auch ausdrücklich gelobte) Beschreibung Deiner Methoden und deren Ergebnisse könnte nicht verstanden worden sein.
Laß Dir versichern, und meine Antworten sollten dies auch überdeutlich zeigen, zumindest bei mir gibt es kein Verständnisproblem. Im Gegenteil: in meiner zweiten Antwort zeige ich mindestens zwei Punkte auf, die Deine Schlußfolgerungen in Frage (oder als mindestens übereilt dar-) stellen.
In meiner dritten Antwort sage ich dasselbe aus anderer Perspektive und erweitere zum Problem mit Datei I.

In allen Deiner nunmehr drei Schilderungen (und eine ist so gut und verständlich und vollständig wie die andere, und sei hier nochmals ausdrücklich gelobt!) räumst Du zwar am Ende mögliche systemimmanente Abhängigkeiten ein, möchtest aber gerade darüber nicht sprechen.
Natürlich ist das Dein gutes Recht, ich muß mich dann aber aus der Diskussion verabschieden, einfach weil ich mich nicht an sinnlosen Ratespielen beteiligen möchte.

Eigentlich überflüssig, aber nochmals zur Verdeutlichung:

Nimmt man in Datei I als Summe von Chance/GegenChance statt der von Dir verwendeten 35,13274045 runde 36 (18/36=EC ohne Zéro), indem man in jedem Cp einfach die Permanenzzahl abliest, und in die Spalte der Gegenchance "36 - Permanenzzahl" jeweils einträgt, erhält man exakt dieselben unterschiedlichen zwei Graphen wie Du.
Man muß also gar nicht wissen, wie Du auf Deine konkreten Bruchteile von 35,13274045 kommst, sie müssen gar nicht diskutiert werden.
Und natürlich kann man das machen.
Leider kann man aus den Graphenwerten aber nicht mehr eindeutig auf eine EC zurückschließen, weil es sich bei der Bildung der beiden Spaltenwerte eben nicht um Binärwerte handelt (binär= (eindeutig und ausschließlich; die Menge enthält zwei Elemente:) wenn nicht 0, dann 1, wenn nicht 1, dann 0; hier aber (die Menge enthält 36 (oder 35,13274045) Elemente, so daß:) wenn nicht 1, dann 2 oder 3 oder 4 oder ...36).
Sorgfältigerweise müßte also erst einmal geklärt werden, ob der winzige Wissensvorsprung "Nicht 1" (17 Manque zu 18 Passe) so signifikante Auswirkungen hat, daß damit praktisch etwas anzufangen ist.

Hypothese: allein wahrscheinlich nicht.
Begründung: selbst bei einer starken Überzufälligkeit, mit der man 1/36 (vielleicht) ausschließen könnte, bliebe in der Differenz zum Hausvorteil 1/74 (bei EC mit Zéroteilung) zu wenig übrig.
Im Falle der Richtigkeit der Hypothese: man müßte über womöglich existierende Signalverstärkungsmethoden nachdenken.
Im Falle der Falschheit der Hypothese: fertig ist das Spiel mit pos. EW. ==> Wie komme ich an einen Setzroboter, der nicht auffällt?

Gruß

elementaar

bearbeitet Juli 7, 2017 von elementaar
"n" getilgt; "Ec" zu "EC" verbessert

Tiefseefischer · Februar 8, 2022

Nachdem doch einige Zeit seit der Thread-Erstellung vergangen ist, lasse ich das Thema jetzt aufleben – in der Hoffnung, dass schlaue Köpfe neue Erkenntnisse aus den Auswertungen ziehen können. Speziell möchte ich folgenden Umstand aufgreifen, der mir bei aktuellen Berechnungen aufgefallen ist:

Der konkrete Versuchsaufbau besteht aus jeweils 80 Coups, bei denen sich mittels eines Prognoseverfahrens eine Summe von richtigen und falschen Entscheidungen ergibt. Beispielsweise: Liegt die Prognose 24 mal richtig und 20 mal falsch, dann ergibt das Ergebnis „4“.

Was würde man nun erwarten bei einer großen Zahl solcher Auswertungen á 80 Coups?

Dass die Aufsummierung aller Ergebnisse um 0 schwankt: Das ist gegeben.
Dass sich die Ergebnisse auch untereinander ausgleichen, also genauso oft „4“ wie „-4“ eintritt (analog natürlich auch für „1“ und „-1“ usw.): Das ist nicht so. Tatsächlich gibt es wesentlich mehr negative Ergebnisse als positive – allerdings fallen die positiven höher aus. Sprich: Es kommt öfter „-4“ vor als „4“, aber dafür öfter „18“ als „-18“.

Das Interessante ist also: Obwohl sich die Ergebnisse in Summe aufheben, liegt eine Ungleichverteilung der Ausprägungen vor. Hier die Ergebnisse in Tabellenform über ca. 21.000 Coups:

"Länge"	"Anzahl +"	"Anzahl -"	Verteilung in Prozent	Sigma-Abweichung
30	2	0	100	1,4
29	5	0	100	2,2
28	10	0	100	3,2
27	14	0	100	3,7
26	16	0	100	4
25	10	0	100	3,2
24	24	0	100	4,9
23	29	0	100	5,4
22	41	0	100	6,4
21	46	0	100	6,8
20	62	4	94	7,1
19	76	8	90	7,4
18	92	16	85	7,3
17	116	31	79	7
16	163	54	75	7,4
15	157	97	62	3,8
14	180	151	54	1,6
13	257	235	52	1
12	290	314	48	-1
11	321	414	44	-3,4
10	425	549	44	-4
9	471	677	41	-6,1
8	569	803	41	-6,3
7	618	947	39	-8,3
6	756	1005	43	-5,9
5	765	1124	40	-8,3
4	919	1182	44	-5,7
3	950	1259	43	-6,6
2	1062	1217	47	-3,2
1	1114	1162	49	-1

Das bringt mich zur Frage: Fällt jemandem ein Weg ein, wie man diese Ungleichverteilung nützen könnte? Ich scheitere bislang …

Schöne Grüße

Tiefseefischer

Tiefseefischer · Februar 15, 2022

Zu abstrakt?

Anbei eine Datei mit den Basisdaten (der Auswertung).

Tabelle 1: Ungefiltert.

Tabelle 2: Ohne 0.

Tabelle 3: Auswertungsbeispiele für die Ungleichverteilung.

Wer kann aus Tabelle 1 oder Tabelle 2 mit höherer Wahrscheinlichkeit 1 oder -1, bzw. 2 oder -2 prognostizieren (0 ist irrelevant, kann aber möglicherweise in der Prognosefindung eine Rolle spielen)?

Schöne Grüße

Tiefseefischer

pos_EW.xls

bearbeitet Februar 15, 2022 von Tiefseefischer

Ropro · Februar 15, 2022

=WENN(AG8=0;0;WENN(AG8=1;WENN(AH8=1;1;2);WENN(AH8=1;3;WENN(AH8=-1;4;0))))

Formelfehler: 2mal das gleiche Argument.

Tiefseefischer · Februar 15, 2022

Hallo Ropro,

danke, dass du dich damit auseinander setzt. Die Formel ist allerdings so korrekt (Klassifizierung durch wenn/dann).

Du kannst natürlich gerne per Hand auswerten - das liefert das gleiche Ergebnis, dauert aber länger.

Schöne Grüße

Tiefseefischer

Ropro · Februar 15, 2022

Kann es sein, daß hier die Reihenfolge vertauscht ist:

müsste es nicht "Prognose - Ergebnis - Richtig/Falsch" sein?

und es tritt die Frage auf, wieso bei keiner Prognose (0) und keinem R/F (0) das Ergebnis 1 ist?


Prognose richtig/falsch	Ergebnis	Prognose


1	1	1
1	-1	-1
-1	-1	1
1	1	1
1	1	1
1	-1	-1
1	-1	-1
1	1	1
1	1	1
-1	1	-1
1	-1	-1
1	-1	-1
-1	-1	1
1	1	1
-1	-1	1
1	-1	-1
1	1	1
1	1	1
-1	1	-1
1	-1	-1
-1	1	-1
1	1	1
-1	1	-1
1	-1	-1
-1	1	-1
1	1	1
-1	-1	1
1	-1	-1
1	1	1
-1	-1	1
1	-1	-1
-1	-1	1
-1	-1	1
-1	-1	1
1	-1	-1
1	-1	-1
-1	1	-1
-1	1	-1
1	1	1
-1	1	-1
0	1	0
-1	-1	1
-1	-1	1

Tiefseefischer · Februar 15, 2022

Frage 1: Ja, aber völlig irrelevant. Es geht rein um die Verknüpfung Prognose zu Ergebnis.

Frage 2: Ein Ergebnis (1 oder 0, R oder N, ...) gibt es logischerweise immer. Eine Prognose nicht. Daher auch nicht immer eine Prognose richtig/falsch.

Schöne Grüße

Tiefseefischer

Ropro · Februar 15, 2022

Ich frage mal woran das liegen kann:

Du hast 10 000 Ergebnisse

Du hast 9 299 Prognosen abgegeben

und auch 9299 R/F-Wertungen

In Deiner Summenspalte BG BH BE hast du jedoch 9997 Treffer/Nichttreffer.

Tiefseefischer · Februar 16, 2022

Ich fürchte, ich kann dir nicht folgen.

Woher nimmst du die 9997?

Es finden doch nur 2998 Auswertungen statt, von denen 2394 als Treffer/Nichttreffer klassifiziert werden können. Man kann natürlich weiter auswerten, aber das Ergebnis ist mit über 6,6 Sigma Abweichung bereits signifikant.

Worum es bei der Auswertung geht und warum das Ergebnis signifikant ist, steht bereits recht ausführlich beschrieben in den bisherigen Postings...

Schöne Grüße

Tiefseefischer

Ropro · Februar 16, 2022

Ein signifikantes Ergebnis sagt nur aus, daß die Daten und Verknüpfungen überprüft werden müssen.

Also zurück zur Basis mit 2998 Auswertungen.

Ein ganz einfacher Test ist die Prognose immer gleichzusetzen.

Einmal alle Prognosen auf +1 und einmal alle Prognosen auf -1

Die Ergebnisse sollten sich unterscheiden, oder?

Probiers mal aus.

Und: bei iner Trefferquote von 50,68% ergibt sich eine Sigma von > +32. Das schreit doch!

bearbeitet Februar 16, 2022 von Ropro

Tiefseefischer · Februar 16, 2022

Tut mir Leid - ich hab keine Ahnung, wovon du sprichst.

Wir reden doch immer noch von der Datei "RohdatenVerarbeitung_II". Dabei geht es rein um die chronologische Abfolge von Vernüpfungen zwischen Prognose- und Ergebniscoups. Dabei entsteht nicht die zu erwartende Trefferquote von 25%, sondern 30%.

Ich denke aber, die zuletzt eingestellte Datei ("pos_EW") ist die interessanteste - ich wollte dafür aber keinen neuen Thread eröffnen. Meiner Meinung nach sollten wir uns darauf konzentrieren.

Schöne Grüße

Tiefseefischer

Anmelden

Zusammenhänge - pos. EW?

Recommended Posts

Tiefseefischer

elementaar

elementaar

Tiefseefischer

elementaar

Tiefseefischer

elementaar

Tiefseefischer

Tiefseefischer

Ropro

Tiefseefischer

Ropro

Tiefseefischer

Ropro

Tiefseefischer

Ropro

Tiefseefischer

Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren

Benutzerkonto erstellen

Anmelden

Umsehen

Aktivitäten