Seite 2 von 2

Re: Statistik und Prognosen für WA 1440 Runde

Verfasst: 16. Jul 2019, 13:36
von b_der_k_te
Sowas kenne ich ebenfalls nur zu gut. :( Habe vor ein paar Wochen ebenfalls eine Doppel-FITA geschossen und auf der letzten Distanz (30m) angefangen zu überlegen ob ich noch einen bestimmten Score erreichen kann. Vor allem weil die vorletzte Passe ganz gut war... Natürlich war die letzte ein Debakel. Und das obwohl es um absolut Nichts geht. Wenn dann beweist man nur sich selbst etwas. Hätte es besser wissen sollen. Die 30m waren an dem Wochenende überhaupt weit unter dem Schnitt im Vergleich zu den anderen Distanzen.

Das kann eben auch leicht passieren. Einzelne Durchgänge (oder auch nur Passen) die dermaßen weit weg von der (statistischen) Norm scoren. So wie ullr´s 301 Ringe auf 70m und das trotz einer 35er Passe. Der Rest muß dann auf einem Niveau gewesen sein mit dem man locker auf 1200 bei einer 1440er Runde kommen würde.

So eine 1440er Runde "verkehrt" kenne ich ebenfalls von früher. Da wurden für den zweiten Tag einer Doppel-FITA die Dämpfer auf die kurze Distanz stehen gelassen. Irgendwann gab es allerdings Interventionen von Schützen die zum Ende des Turniers hin nicht mehr die "schwierige" lange Distanz schießen wollten. Seitdem wird bei dieser einen Doppel-FITA in Österreich 2x "normal" geschossen. Am ersten Tag nicht "verkehrt" wegen - glaube ich - dem Einschießen und der Visiereinstellung auf die lange Distanz.

Kitty, das finde ich z.B. das elegante an diesem Archery Score Pad, bei dem man die verschiedenen Disziplinen miteinander vergleichen kann. Basierend auf die Größe der Trefferstreuung - die man mit dem Modell auf die unterschiedlichen Distanzen hochrechnen kann - kann man ein durchschnittliches Score-Ergebnis ausrechnen. Mit der Steuung mit der Du über 1200 in Deiner Disziplin kommst, würdest Du gut 1150 Ringe und mehr erreichen wenn Du die 90m schießen würdest. https://archeryscorepad.com/ratings.php ... it=Compare

Re: Statistik und Prognosen für WA 1440 Runde

Verfasst: 16. Jul 2019, 15:38
von b_der_k_te
Auf die Beiträge von mbf möchte ich noch näher eingehen, da bin ich noch Antworten schuldig. Jedenfalls Danke mbf für Deine Rückmeldungen dazu.

Die Frage ob ich die 50m und 7m zusammen genommen habe bezieht sich auf das bunte Diagramm in meinem Post davor?
Da habe ich diese Beiden zusammen dargestellt. Blau für 50m, Orange für 70m. (War hier die Farbwahl ungünstig?) Doch jede wurde einzeln für sich sich betrachtet. Hintergrund war die Frage ob das Modell von Park mit den Parametern auch noch bei niedrigeren Scores anwendbar ist oder ob es dort eine Anpassung bedarf. Da hat es sich angeboten die 50m und 70m gemeinsam zu zeigen.

Im Artikel wurden tatsächlich die Auflagen mit den Wertungszonen 10 bis 5 zur Berechung der Scores auf 50m und 30m herangezogen. Ich hatte hier mal einen Thread gestartet um herauszufinden welche Auflagen in Deutschland verwendet werden. Es gab Stimmen für beide Varianten, für die Ausarbeitung (Artikeln) wurde die "verschärfte" Variante ausgewählt. Stimmt, man bräuchte einen weiteren Artikel, oder zumindest ein Diagramm um noch einmal das gleiche für die volle Auflage zu klären.

Über die Sache mit den Konfidenzintervallen, niedrigeren Scores usw. lässt sich vortrefflich streiten. Und das obwohl alle Parteien eh das Gleiche meinen. Bei niedrigeren Scores passt sich das Konfidenzintervall mit an. Gerade weil es da größer wird braucht es einen eindeutigeren Abstand zwischen den Stichproben um sagen zu können der/die Schütz*inn hat sich z.B. verbessert. Verwendet man größere Stichproben (längerfristiger Trend) verkleinert sich der Wert des Konfidenzintervalls entsprechend automatisch. Es paßt sich also stets an.
Im Vorfeld muß die grundsätzliche Größe des Intervalls allerdings einmal festgelegt werden; im Artikel mit 1x Sigma. Derjenige der das festlegt kann dabei zwei Fehler machen: Es wird zu groß gewählt (z.B. 2x Sigma) dann werden tatsächliche Verbesserungen kaum oder gar nicht erkannt. Oder er wählt es zu klein dann werden die gezogenen Schlüsse aus den Rechenergebnissen aber unglaubwürdig. Diese Gradwanderung muß der "Analyst" gehen und darauf bezieht sich der verwendete Term "aller Voraussicht", um anzudeuten das jemand Anderer durchaus eine andere Vorstellung haben kann.
Sollten solche Details in der Arbeit angeführt werden, oder wünschen sich die Leser lieber eine deutliche An- und Aussage?

Zu der persönlichen Anmerkung; warum die 30m bei einer 1440er Runde nicht so viel Einfluß auf den Gesamtscore haben als die langen Distanzen. Das ist ein Punkt der zwischen mir und dem Autor der Artikeln auch einige Zeit lang für Verwirrung sorgte. Schaut man sich eben mehrere Ergebnisse an, so gibt es eine große Korrelation (also eine "Verbundenheit") zwischen den 30m Scores und dem Gesamtergebniss. Auf den ersten Blick erscheint es als ob der Score auf 30m entscheidender wäre als die anderern Distanzen. Das hat aber zwei Gründe. Zum Einen ist der Score auf 30m absolut gesehen der höchste der bei den vier Durchgängen erzielt wird. Damit hat er als Summand auch den größten Einfluß auf die Summe. Eine selbsterfüllende Prophezeiung also. Zum Anderen - und das ist die Erklärung auf mbf´s Feststellung - ist die natürliche Score-Schwankung der Schützen auf 30m viel kleiner als auf die anderen Distanzen. Ein guter Schütze erzielt dort vielleicht 330-336 Ringe. Es ist recht unwahrscheinlich das er auf diese Distanz 6 Ringe (also 324) hergibt Nach oben hin geht aber noch weniger. Auf den anderen Distanzen sind 6 Ringe aber schnell man weg. Wenn man nicht so gut ist hat man auf 30m trotzdem recht hohe Scores und kann den Anschluß an die besseren Schützen noch halten (Ergebnisfindung ist spannender). Bei den anderen Durchgängen trennt sich dann üblicherweise die Streu vom Weizen.

Zu den Hochrechnungen über Gold (und Miss):
Ich habe mir angewöhnt (in letzter Zeit wieder schleifen lassen) meine Ergebnisse auf einer Distanz (70m und 18m Halle) zu sammeln. Und zwar nicht nur das Ergebnis sondern den Score jeden einzelnen Pfeils des Durchgangs. Da sieht man dann schon wie erstaunlich stark die Ergebnisse unmittelbar hintereinander schwanken können. Als Stichprobe nehme ich dann stets 180 direkt hintereinander dokumentierte Schüsse. Aus diesem Durchschnitt kann man sich recht gut in den Archery Score Pad Tabellen orientieren und die oden diskutierten statistischen Rechnungen angstellen.
Darüber hinaus liste ich mir die Verteilung der Treffer auf - also wieviel Prozent der 180 Schuß sind Zehner, Neuner usw. Und dann sucht mir Excel (was etwas umständlicher ist) die Verteilung laut dem Modell heraus die am besten dazu paßt. So wie die Hochrechnung über Gold nur mit allen Wertungsringen berücksichtigt.
Ab und zu weicht diese Hochrechnung von der einfachen über den Durchschnittsscore ab. Oft erscheint ein besseres Skill-Level / Niveau. Besonders dann wenn Missen in den Stichproben auftauchen. Das läßt sich so erklären: Es gibt immer wieder einzelne Treffer die scoremäßig außer der Norm sind. Nach oben hin (Gold) stört das ja nicht, möchte man ja als "Verbesserung der Leistung" verstanden wissen. Und dann gibt es noch die Ausreißer zu den niedrigeren Ringen hin. Leider sind diese oft mehr und wirken sich kräftiger aus. Alle Ausreißer verändern den Durchschnitt stärker als sie die Verteilung ändern und da die negativen meist überwiegen...

Re: Statistik und Prognosen für WA 1440 Runde

Verfasst: 16. Jul 2019, 16:50
von ullr
Hallo b_der_k_te,
alles wunderbar, bis auf eines:
"Ausreißer" sind nur jene Schüsse, die du wirklich identifizieren kannst, also z.B. krummer Pfeil, extremer Schießfehler, all das. Ansonsten gibt es bei den Treffbildern keine Ausreißer. Jede "Ausreißerrechnung" ist letztendlich willkürlich, wenn man eine objektive Treffbildbeurteilung erwartet.
Gruß und klar doch,
"Gut Schuss!"
Christian
PS: das hat mir mein erster Chef bei der Bewertung von Munition beigebracht, und prompt habe ich mich bei Firmen ziemlich unbeliebt gemacht.

Re: Statistik und Prognosen für WA 1440 Runde

Verfasst: 17. Jul 2019, 08:39
von mbf
Hallo Bernd,

jo, das mit dem Konfidenzintervall ist so eine Sache. Du hast angesprochen, dass die Festlegung auf n Sigma hier relevant ist - und eine einfache, allgemeingültige Festlegung wird wahrscheinlich wenig Sinn machen. Es ist ja ein statistisches Hilfsmittel, mit dem man in der Bewertung später auf ein hartes "signifikant" oder eben nicht kommt. Da liegt dann der Knackpunkt in der Interpretation. Da muss schon jeder für sich im Vorfeld selbst entscheiden, was relevant ist. Nur muss man dazu grundlegende Einblicke in die statistischen Verfahren haben. Wenn man die Artikel überfliegt, stellt man dann beim Leistungsvergleich (bleiben wir bei Deinem Beispiel) eben fest: "Oh, ja eine Verbesserung!" Eigentlich heißt es: "Es wurde mit mindestens 68% Wahrscheinlichkeit eine Verbesserung erzielt." Das klingt schon mal ganz anders. Deshalb sollte solche Wertungsvergleiche nicht nur paarweise sondern in einer Trendanalyse langfristig aufgezeichnet werden. Sowas muss man eben im Hinterkopf behalten. Statistik ist kein Hexenwerk, aber falsch angewendet, zieht der Nutzer die falschen Schlüsse. Und das sollte in irgendeiner Form klar thematisiert werden, damit der Benutzer solcher Tabellen sensibilisiert wird. Bleiben wir beim o.g. Beispiel. Der Schütze, der eben noch eine Leistungssteigerung hatte, versemmelt den nächsten Durchgang. Die Auswertung ergibt, dass mit, sagen wir mal, 90% Wahrscheinlichkeit ein Leistungsabfall festgestellt wurde. In der langfristigen Auswertung ergibt sich aber, dass alle Werte im 95er Konfidenzintervall liegen. Und was nun? Schütze und Trainer sind verwirrt, da sich 2 Aussagen widersprechen. Da muss man sicherlich noch ein wenig feilen.

Nachtrag: wahrscheinlich wäre es am Besten, daraus einen "Ratgeber" zu machen, der zunächst die mathematischen Grundlagen kurz erläuert und dann auf die Tabellen kommt. So ist alles eine Einheit, konsistent und aus sich selbst heraus verstehbar.

Zu den 30 m noch eine Ergänzung, um es plakativ vor Augen zu führen: die guten Compounder (und die richtig guten Recurve'ler) schießen auf 30 m voll. Da kann man im schlimmsten Fall mit 359 einen Ring verlieren, aber rein gar nix mehr holen.


@Christian
Über Ausreißer kann man lang diskutieren. Es gibt ja diverse Tests, die prüfen, ob ein Wert mit einer gewissen Wahrscheinlichkeit der erwarteten Verteilung als zugehörig betrachtet werden kann - oder eben nicht. Ja, das ist eine gewisse Willkür dabei (siehe meine Ausführungen oben, da gilt analoges), aber es kommt immer drauf an, was man auswerten möchte. Schwieriges Thema.

Re: Statistik und Prognosen für WA 1440 Runde

Verfasst: 8. Aug 2019, 11:33
von mbf
b_der_k_te hat geschrieben:
16. Jul 2019, 15:38
Ab und zu weicht diese Hochrechnung von der einfachen über den Durchschnittsscore ab. Oft erscheint ein besseres Skill-Level / Niveau. Besonders dann wenn Missen in den Stichproben auftauchen. Das läßt sich so erklären: Es gibt immer wieder einzelne Treffer die scoremäßig außer der Norm sind. Nach oben hin (Gold) stört das ja nicht, möchte man ja als "Verbesserung der Leistung" verstanden wissen. Und dann gibt es noch die Ausreißer zu den niedrigeren Ringen hin. Leider sind diese oft mehr und wirken sich kräftiger aus. Alle Ausreißer verändern den Durchschnitt stärker als sie die Verteilung ändern und da die negativen meist überwiegen...
Ich bin gerade dabei, mir ein aktuelles Turnierergebnis anzuschauen, bei dem dieser Effekt reinspielt. Was sich abzeichnet -deswegen komme ich drauf-, ist, dass auch die Verteilung betroffen sein kann. Und dann kommt das Modell bezüglich der Anwendbarkeit an seine Grenzen, weil die Voraussetzungen nicht mehr erfüllt sind.

Sagen wir mal so: eine "20" kann man auf mehrere Varianten schießen: 10-10-M oder 7-7-6. Oder oder oder... die möglichen Kombinationen zu ermitteln, sei dem geneigten Leser als Übungsaufgabe überlassen (ein Klassiker aus Lehrbüchern... ich hasse sowas, egal). 10-10-M täuscht hier mit 2 Gold einen höheren Erwartungswert vor als es der tatsächlichen Ringzahl (20) entspricht. Das kann man auch auf Ergebnislisten sehen: spätestens ab dem Mittelfeld nach hinten hat man bei vergleichbaren Ringzahlen starke Schwankungen der Goldenen.

Hier kommt dann auch die Verteilung mit rein. Schießt der Schütze häufiger 10-10-M (oder meinetwegen auch 9-9-2) als 7-7-6 (oder 9-7-4, was wohl eher an das Modell ranreicht), dann kannste da keinen Rayleigh mehr drüberlegen. Im Extremfall hat man sogar eine zweigipflige Verteilung, wenn der Schütze zwar prinzipiell sauber schießt, aber recht viele "Ausreißer" produziert. Das ist dann der Punkt, wo das Modell eigentlich nicht mehr greift, da es von einer bestimmten Verteilung ausgeht, die nicht mehr erfüllt ist.

Insofern, ja es "stört" den Schützen nicht, wenn man mehr als erhofft ins Gold nagelt, man nimmt sowas ja gerne mit. Es stört aber die Betrachtungen, wenn man sich an so etwas orientiert, weil es zwar grundsätzlich noch den statistischen Modellen entspricht, aber ein Ereignis geringer Wahrscheinlichkeit ist, dass bei einer isolierten Betrachtung zu fehlerhaften Schlüssen führt. Nur: wie viele Pfeile braucht man, um eine valide Aussage mit hoher Wahrscheinlichkeit zu erhalten? Wahrscheinlich mehr, als man in einem Durchgang schießt...

Deswegen stehe ich der Hochrechnung mittels Goldenen auch skeptisch gegenüber, da man nur eine sehr grobe Abschätzung vornehmen kann. Da kann man sich auch am Score selbst orientieren, obwohl wir oben gesehen haben (und auch Deine Auswertung der Turniere zeigt es), dass man sehr wohl auf einzelnen Distanzen noch was gewinnen oder verlieren kann.

Re: Statistik und Prognosen für WA 1440 Runde

Verfasst: 8. Aug 2019, 15:38
von ullr
Ich denke mal "Hochrechnen" also eine Prognose für die Zukunft geben, kann man nur, wenn man tatsächlich die Standardabweichungen der einzelnen Treffbilder hast. Wir haben die früher mit einem Programm ermittelt, das zur Eingabe nur die Ringzahl und die Lage des Treffers nach Uhrzeit benötigte. Das war verblüffend genau. Genau und einfach genug, es reichte auf dem Schießzettel ein Punkt in der entsprechenden Richtung bei der Ringzahl.
Leider habe ich dieses Programm (das hat mein Sohn mit hmm..hhmmm..hmmm ;) 16 Jahren geschrieben) nicht mehr zum Laufen gebracht. Vielleicht mache ich mich doch mal selber dran, das neu zu schreiben.
Die Standardabweichung und die 50%ige Streuung sind meiner Meinung nach die einzigen Werte, um langfristig Prognosen abzugeben. Die Schützen müssen es sich abgewöhnen nach jedem Ergebnis, das nicht ihrer Erwartung entspricht, irgendwelche Erklärungen zu suchen. Die finden sie (da ist die Ausrede ja mit am einfachsten entweder beim Gerät oder bei den BWE (Besondere und WitterungsEinflüsse). Diese Ausreden muß man sein lassen. Bei BWE braucht man sich keine Gedanken zu machen. Und die "Besonderen"... naja... Der Schütze muß ehrlich zu sich selber sein.
Programme die die Standardabweichung rechnen gibt es wahrscheinlich zuhauf, keine Ahnung, aber man muß es wirklich langfristig tun.
Gruß und klar doch,
"Gut Schuss!"
Christian