Jump to content
Forum Shutdown 28/7/2023 Read more... ×
You need to play a total of 50 battles to post in this section.
Frighty1975

Matchmaking in der Kritik

22,256 comments in this topic

Recommended Posts

[FAME]
Players
4,352 posts
27,850 battles
Vor 2 Stunden, ColonelPete sagte:

Du warst dreimal im stärkeren Team. Daher kommt auch die 60% Siegrate

Wie kannst Du die Teams bei so geringer Datenbasis beurteilen?

Just_Testing_That erklärt Dir doch das man das nicht kann.

Share this post


Link to post
Share on other sites
[-SBG-]
Players
38,559 posts
19,178 battles
5 minutes ago, Re4cher said:

Wie kannst Du die Teams bei so geringer Datenbasis beurteilen?

Just_Testing_That erklärt Dir doch das man das nicht kann.

Auf Basis der Zahlen, die er geliefert hat.

 

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Gerade eben, ColonelPete sagte:

Auf Basis der Zahlen, die er geliefert hat.

 

Also Du sagst mit Verweis auf den Beitrag das man die Stats bei so geringer Datenlage nicht nutzen kann um einen Satz später eine eigene Teamanalyse aus genau den gleichen Daten abzugeben?

Strange!

 

Share this post


Link to post
Share on other sites
[-SBG-]
Players
38,559 posts
19,178 battles
3 minutes ago, Re4cher said:

Also Du sagst mit Verweis auf den Beitrag das man die Stats bei so geringer Datenlage nicht nutzen kann um einen Satz später eine eigene Teamanalyse aus genau den gleichen Daten abzugeben?

Strange!

Nein.

Er hat verschiedene Daten geliefert. Es benutzt nur den komplett unbrauchbaren Teil der Daten.

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Gerade eben, ColonelPete sagte:

Nein.

Er hat verschiedene Daten geliefert. Es benutzt nur den komplett unbrauchbaren Teil der Daten.

Welches ist denn der brauchbare Teil?

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 4 Minuten, ColonelPete sagte:

Die Account Siegraten.

Bei beispielsweise 7 Spielern unter 300 Gefechten?

Also ist für Dich im ersten Game 47.89% vs. 50.47% aussagekräftig?

12 Spieler haben da nichtmal 300 Games auf dem Tacho.

  • Cool 1

Share this post


Link to post
Share on other sites
[-SBG-]
Players
38,559 posts
19,178 battles
17 minutes ago, Re4cher said:

Bei beispielsweise 7 Spielern unter 300 Gefechten?

Also ist für Dich im ersten Game 47.89% vs. 50.47% aussagekräftig?

12 Spieler haben da nichtmal 300 Games auf dem Tacho.

Er hat die Werte erhoben. Wenn er die Siegraten von Spielern mit so wenig Gefechten nimmt, ist das auch nicht aussagekräftig.

Daher sage ich ja das man bei der Benutzung dieser Addons wissen muss was man macht.

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 2 Minuten, ColonelPete sagte:

Er hat die Werte erhoben. Wenn er die Siegraten von Spielern mit so wenig Gefechten nimmt, ist das auch nicht aussagekräftig.

Daher sage ich ja das man bei der Benutzung dieser Addons wissen muss was man macht.

Und Du weißt was man macht und welche Zahlen relevant sind?

Share this post


Link to post
Share on other sites
[COSA]
Players
4,332 posts
19,097 battles
Vor 2 Stunden, DTATank sagte:

Von Dir erklärt, dass die Werte nicht aussagen, sagt nichts aus.

Wenn du es ihm nicht glaubst, kann ich das auch nochmal übernehmen. 

 

Um empirisch signifikante Ergebnisse einer Stichprobe zu entnehmen, muss die Stichprobe groß genug sein,um aussagekräftig zu sein. Dafür müssen Singuläre Ergebnisse weitestgehend an Gewicht verlieren. Dieses ist stark in wenigen Gefechten und schwach in einer großen Menge. Je größer die Menge, desto wirksamer greift das Gesetz der großen Zahl. 

 

Und da wollen wir hin, wenn es um das erkennen von gesetzmäßigkeiten geht. 

 

Eine gängige mindestmenge für empirische Betrachtungen ist die Zahl 100. Mehr ist aber immer besser. Weniger bringt die Gefahr mit sich, verfälschende besonderheiten in der Betrachtung zu haben. 

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 1 Minute, ColonelPete sagte:

Ja.

Bleiben wir mal beim ersten Spiel.

Die Oklahoma auf der rechten Seite hat m.M. nach viel Einfluß auf die average Winrate / Account aber wird im Spiel wenig haben.

Für mich auf den ersten Blick ein Spieler der mit dem Schiff nicht oder noch nicht klarkommt - kann man vernachlässigen.

Avr-Account-Wr ist genau so ein schlechter Pauschalwert wie die anderen aufgeführten.

Man kan da schon Einschätzungen abgeben, die haben aber selten etwas mit dem Team-Average-Wert zu tun.

 

Stellt Euch einfach vor ihr müßt CV spielen und habt eine begrenzte Zahl an Devstrikes die ihr fliegen könnt.

Welche Schiffe müssen unbedingt raus - welche sind dann wichtig - welche sind egal.

Das ganze schätzt man Klasse für Klasse und klassenabhängig ein.

Schere Stein Papier.

Da sieht man Schiffe die relevant für die Einschätzung werden und welche Seite mehr Einfluß durch eben diese Schiffe haben wird.

 

Mit Durchschnitt hat das nichts zu tun.

Der Durchschnitt der Teams ist pauschal einfach nur schlecht, kompensiert durch eine Hand voll Spieler die besser sind.

 

Share this post


Link to post
Share on other sites
[-SBG-]
Players
38,559 posts
19,178 battles
2 minutes ago, Re4cher said:

Man kan da schon Einschätzungen abgeben, die haben aber selten etwas mit dem Team-Average-Wert zu tun.

Weshalb ich von dem Addon nicht viel halte.

2 minutes ago, Re4cher said:

Stellt Euch einfach vor ihr müßt CV spielen und habt eine begrenzte Zahl an Devstrikes die ihr fliegen könnt.

Welche Schiffe müssen unbedingt raus - welche sind dann wichtig - welche sind egal.

Das ganze schätzt man Klasse für Klasse und klassenabhängig ein.

Ich würde das an Hand des Spielgeschehens einschätzen.

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 12 Minuten, Aitvars sagte:

die Zahl 100

Sagt wer? Konrad Duden?

Wenn Mannschaft A gegen Mannschaft B in einem Spiel 0:100 verliert kommt zwar die Zahl 100 vor - gemessen an den Statistiken andere Mannschaften ist das aber ein empirisch signifikanter Wert.

Wen  wir es hier nur mit Winrate zu tun hätte wäre ich bei Dir

Share this post


Link to post
Share on other sites
Players
4,782 posts
14,744 battles
Vor 1 Stunde, ColonelPete sagte:

Die Account Siegraten.

ich pers. würde eher auf die Siegraten mit den jeweiligen Klassen schauen. Weil zwischen BB/CA, CV und DD irgendwie ein Unterschied ist. Wer Kreuzer kann, der versagt meistens mit einem BB nimmer ganz so wirklich. Umgekehrt ist das einfacher. DD ist IMHO genau wie CV ne eigene Liga. DD im Gegensatz zu CV eben nicht grad "deppensicher". Weil sonst biste nach 3 MInuten wieder im Hafen, passiert mit nem CV nicht.

Share this post


Link to post
Share on other sites
[-SBG-]
Players
38,559 posts
19,178 battles
20 minutes ago, Just_Testing_That said:

ich pers. würde eher auf die Siegraten mit den jeweiligen Klassen schauen. Weil zwischen BB/CA, CV und DD irgendwie ein Unterschied ist. Wer Kreuzer kann, der versagt meistens mit einem BB nimmer ganz so wirklich. Umgekehrt ist das einfacher. DD ist IMHO genau wie CV ne eigene Liga. DD im Gegensatz zu CV eben nicht grad "deppensicher". Weil sonst biste nach 3 MInuten wieder im Hafen, passiert mit nem CV nicht.

Die waren aber nicht aufgeführt.

Share this post


Link to post
Share on other sites
[COSA]
Players
4,332 posts
19,097 battles
Vor 1 Stunde, Re4cher sagte:

Sagt wer? Konrad Duden?

Wenn Mannschaft A gegen Mannschaft B in einem Spiel 0:100 verliert kommt zwar die Zahl 100 vor - gemessen an den Statistiken andere Mannschaften ist das aber ein empirisch signifikanter Wert.

Wen  wir es hier nur mit Winrate zu tun hätte wäre ich bei Dir

Wenn hier die Wissenschaft angezweifelt wird, dann sehe ich überhaupt keinen Sinn darin, mit dir irgendeine Art Diskussion zu führen

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 2 Stunden, Aitvars sagte:

Wenn hier die Wissenschaft angezweifelt wird, dann sehe ich überhaupt keinen Sinn darin, mit dir irgendeine Art Diskussion zu führen

Der Wissenschaftler in Dir müsste eigentlich verstehen das wir hier einen Bezug zwischen einem Datensatz (das ist der bisher gesammelte Datenbestand ) und der aus vielen Datensätzen bestehenden Statistik ( Durchschnittswert ) herstellen.

Die dafür relevanten Werte kann ich ab dem ersten Datensatz mit dem Durchschnitt vergleichen und eine Aussage dazu treffen.

Es geht hier um Werte die zu erwarten sind.

Wenn der empirisch signifikante  Durchschnittswert für eine Handlung 100 ist kann man einfach unterscheiden ob der erste Datensatz 10 oder 120 ist.

Da wir die umstände der zu erwartenden Werte kennen ist die Unterscheidung noch einfacher.

Bedeutet:

Wir können recht genau erwarten was eine goldene Yamato  im 3. Spiel erreicht wenn für die ersten beiden Spiele ein average Damage von 40k in der Statistik steht.

In untetren Tiers ist das sicher etwas komplizierter, allerdings kann man auch hier recht genau vorhersagen ob BB XYZ den großen Bogen hinter der Insel fährt oder Yolo ins Cap.

Leute die da in 3 Spielen überperformen werden ihr Schiff weder auf die eine noch auf die andere Art wegwerfen.

Natürlich gibt es auch da Ausnahmen - aber wir reden von dem was erwartbar ist und das kann man relativ gut bestimmen.

 

Deine Theorie würde uns Hoffnung geben das die schnell nach oben gestorbenen besser werden wenn sie signifikante Mengen an Datensätzen zusammengespielt haben.

50 Spiele T10 BB underperformed mit 50k  - da mußte lange für Stricken bis diese Werte in nen grünen Bereich wandern.

 

Aber Du hast natürlich recht - ein 100 Spiele 42% Account wird mit dem Erwerb eines T8 Premiumschiffes möglicherweise direkt Durchschnittswerte erspielen.

Wenn Du die Chancen dafür bei 50% siehst glaube ich Deiner Wissenschaft.

 

 

 

  • Cool 2

Share this post


Link to post
Share on other sites
[COSA]
Players
4,332 posts
19,097 battles

da wir hier offensichtlich und empirisch belegbar keine normalverteilung haben, ist der erwartungswert nicht bei 50% WR. und da hat dir @ColonelPete schon versucht zu vermitteln, daß bei 100 spielen auf dem account der ansatz der account-WR sinnvoller wäre als erwartungswert der performance auf einem neuen schiff. und auch da mit abstrichen, weil die empirische basis mit 100 accountspielen vor dem hintergrund eines gerade neu erworben schiffs auch sehr dünn ist, um aussagen treffen zu können. aber immer noch besser als zu sagen, wir nehmen die schiffs-WR, einen serverschnitt oder sonstiges.

 

und um ehrlich zu sein, ist es hohl, von "irgendjemandes wissenschaft" zu reden. auf dem niveau ist jede mühe zu viel.

Vor 11 Stunden, Re4cher sagte:

Wir können recht genau erwarten was eine goldene Yamato  im 3. Spiel erreicht wenn für die ersten beiden Spiele ein average Damage von 40k in der Statistik steht. 

und genau das kannst du nicht. du kannst orakeln, raten, kaffeesatz lesen ... aber statistisch belastbar kannst du nach 2 spielen nichts vorhersagen. da weißt du nicht mal ob stock/nicht stock. module ausgerüstet? nun irgendwas nachgerüstet? kapitän jetzt eingewiesen? lerneffekt nach 2 spielen? die immer wieder angeführten afk-leute im MM, die unicum-divi bei team rot,....

 

du weißt nach 2 spielen nichts!

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 55 Minuten, Aitvars sagte:

da wir hier offensichtlich und empirisch belegbar keine normalverteilung haben, ist der erwartungswert nicht bei 50% WR. und da hat dir @ColonelPete schon versucht zu vermitteln, daß bei 100 spielen auf dem account der ansatz der account-WR sinnvoller wäre als erwartungswert der performance auf einem neuen schiff. und auch da mit abstrichen, weil die empirische basis mit 100 accountspielen vor dem hintergrund eines gerade neu erworben schiffs auch sehr dünn ist, um aussagen treffen zu können. aber immer noch besser als zu sagen, wir nehmen die schiffs-WR, einen serverschnitt oder sonstiges.

 

und um ehrlich zu sein, ist es hohl, von "irgendjemandes wissenschaft" zu reden. auf dem niveau ist jede mühe zu viel.

und genau das kannst du nicht. du kannst orakeln, raten, kaffeesatz lesen ... aber statistisch belastbar kannst du nach 2 spielen nichts vorhersagen. da weißt du nicht mal ob stock/nicht stock. module ausgerüstet? nun irgendwas nachgerüstet? kapitän jetzt eingewiesen? lerneffekt nach 2 spielen? die immer wieder angeführten afk-leute im MM, die unicum-divi bei team rot,....

 

du weißt nach 2 spielen nichts!

Ich denke Du verstehst einfach nicht was ich sagen will.

Also hier nochmal ein letztes Beispiel:

 

Vergleichen wir mal Spieler mit einer sehr geringen Anzahl Games auf einem Schiff:

die Überperformer -> https://wows-numbers.com/de/ship/4185864144,Orion/?p=1

die Unterperformer ->https://wows-numbers.com/de/ship/4185864144,Orion/?p=295

 

Jetzt kannst Du Dich mal durch die je 50 Accounts mit sehr wenigen Spielen klicken und wirst einen DEUTLICHEN Unterschied in der Gesamtperformance der Spieler sehen.

Schau auch mal auf die Außreißer bei der Winrate (Aussagekraft kontra Glück/Pech)

Beide Seiten kann man in Richtung Durchschnitt Skalieren und andere Spieler anhand dieser Werte beurteilen oderr sich ein Bild von der Erwartung machen.

 

Sicher gibt es Ausnahmen und die Yamato die plötzlich 150k macht - aber das ist halt einfach gegen jede Wahrscheinlichkeit.

Es wird auch ehr passieren das ein zu erwartendes gutes Ergebnis nicht so gut wird als zu erwarten das ein Totalausfall Unicum-Stats hinlegt.

 

2, 20 oder 200 Spiele : die Stärke der Schwankungen bei der Winrate nimmt mit der Anzahl der Spiele ab - die Performance verläuft i.d.R. aber recht Linear.

Vllt. fehlen Dir da einfach 10k Spiele und 2 Jahre konstante nutzung des Monitors um das so deutlich zu erkennen.

 

Share this post


Link to post
Share on other sites
Players
4,782 posts
14,744 battles
Vor 5 Stunden, Re4cher sagte:

2, 20 oder 200 Spiele : die Stärke der Schwankungen bei der Winrate nimmt mit der Anzahl der Spiele ab  ....

"Wurzel" ists bei der Standardverteilung.

 

Hier nochmal die Verteilungsfunktionen für 250(!) zufällige Spiele mit einer wahren Winrate von "x".

image.png.de9a35990c9fc1b1ca93fb396ef71963.png

 

Aufgetragen: Wieviel Prozent aller Spieler BESSER sind als "x%" beobachtbare (Mindest-) Winrate. Lies: 90% aller statistisch echten 50% Spieler werden nach 250 gefechten mehr als 46% und immerin 10% besser als 54% liegen. Zufällig. Also 10-90% Konfidenzintervall bzw. 4 von 5 liegen in diesem Bereich. Simple Stochastik.

 

Und ja, wenn man zusätzlich noch den mittleren Schaden oder K/D zu Hilfe nehmen würde, man braucht auf einmal weit weniger Gefechte um belastbare Vorhersagen zu bekommen. Der Matchmakingmonitor lügt sehr selten. Das "ich spiele immer teamdientlich, sowas wird aber nicht belohnt und leider hab ich überwiegend Pech"  ist eine ausgenudelte Fassung von "ich bin für das Spiel eigentlich zu blöd und zudem nicht bereit was dazuzulernen".

 

  • Cool 2

Share this post


Link to post
Share on other sites
[FAME]
Players
4,352 posts
27,850 battles
Vor 2 Stunden, Just_Testing_That sagte:

"Wurzel" ists bei der Standardverteilung.

 

Hier nochmal die Verteilungsfunktionen für 250(!) zufällige Spiele mit einer wahren Winrate von "x".

image.png.de9a35990c9fc1b1ca93fb396ef71963.png

 

Aufgetragen: Wieviel Prozent aller Spieler BESSER sind als "x%" beobachtbare (Mindest-) Winrate. Lies: 90% aller statistisch echten 50% Spieler werden nach 250 gefechten mehr als 46% und immerin 10% besser als 54% liegen. Zufällig. Also 10-90% Konfidenzintervall bzw. 4 von 5 liegen in diesem Bereich. Simple Stochastik.

 

Und ja, wenn man zusätzlich noch den mittleren Schaden oder K/D zu Hilfe nehmen würde, man braucht auf einmal weit weniger Gefechte um belastbare Vorhersagen zu bekommen. Der Matchmakingmonitor lügt sehr selten. Das "ich spiele immer teamdientlich, sowas wird aber nicht belohnt und leider hab ich überwiegend Pech"  ist eine ausgenudelte Fassung von "ich bin für das Spiel eigentlich zu blöd und zudem nicht bereit was dazuzulernen".

 

Gut fangen wir mal an Deinen Mthos aufzulösen.

Die Datenquelle bitte.

Ich nehme nicht zusätzlich Damage , KD und PR sondern das sind die ersten Werte (in der Reihenfolge) auf die ich schaue.

WR KANN ein Kontrollwert sein, muß aber nicht.

Share this post


Link to post
Share on other sites
Players
4,782 posts
14,744 battles
Vor 22 Stunden, Re4cher sagte:

Gut fangen wir mal an Deinen Mthos aufzulösen.

Die Datenquelle bitte.

Ich nehme nicht zusätzlich Damage , KD und PR sondern das sind die ersten Werte (in der Reihenfolge) auf die ich schaue.

WR KANN ein Kontrollwert sein, muß aber nicht.

 

Das hat nichts mit Mythos zu tun. Das ist Stochastik, also "Würfeln für Fortgeschrittene". Es ist nunmal so, dass der statistische 50% Spieler (oder von mir aus auch 48% Spieler wenn viele Divis mit Winrates weit über 50% rumfahren um nicht im Frust zu ersaufen) von 100 Gefechten nur sehr unwahrscheinlich genau 50% gewinnen wird. Diese Verteilungsfunktionen stecken hinter meinem Graphen - nicht mehr und nicht weniger. Einige haben Pech mit den Teams, andere mit dem Gegner. Es endet in einer Normalverteilung. Vorteil dieser "Funktionen" ist, dass du die wahre Winrate setzt und die beobachtbare Winrate als Verteilungsfunktion ableiten kannst.

 

Wäre klasse wenn dir WOWS-NUMBERS zum Beispiel für den statistischen Fall 65 Gefechte, 30 davon Siege gleich 46% sagen würde:

 

Du hast 46% Winrate bei 65 Gefechten. mit 90%iger Sicherheit bist du zwischen x und y% bezogen auf die Spielstärke angesiegelt. Im genannten Beispiel ist weder ausgeschlossen, dass es ein Vollpfosten mit Glück ist ODER ein Unicum mit Pech. Winrate alleine betrachtet und das unter 300-500 Gefechten je Klasse? Nicht sinnlos, aber eben nicht wirklich aussagekräftig.

 

image.png.e02babe8aa421ccf1569887de179766c.png

 

Wenn Thunderer Spieler von der 1/10er Linie mit HE Snipen und Feuer legen - Schaden mag gut sein, die Winrate wird allerdings leiden. Genau wie der Yolo Dummfürst "die Sec muss ballern". Oder die "Best German DD" Derpitz. Aber "Scheiss Winrate", "wenig Schaden" und "K/D lausig" bzw. "der 3 Minuten DD" ... das sagt zusammen ne Menge aus. Bei Zerstörern gucke ich eher auf K/D, bei BBs eher auf "Damage". Weil ein Yolo Depp niemals über 1 kommt. 100% Chance wenigstens einen Gegner "rauszunehmen" ist nahe Null. Also ist das Ergebnis klar unter eins.

 

Deswegen bin ich auch sehr sicher, dass die Winrate in einer Schiffsklasse (ab Tier 5 um Robbenklatscher auszusieben) gefolgt je nach Klasse von Damage und/oder K/D bzw. Überlebensquote durchaus was über die Kompetenz eines Spielers aussagt.  Ich bin garantiert KEIN Gegner des Matchmaking-Monitors. Wenn dich alles rot anleuchtet, dann ist das leider "Pech". jedenfalls aus Sicht seines Teams.

 

 

  • Cool 1

Share this post


Link to post
Share on other sites
[COSA]
Players
4,332 posts
19,097 battles
Am 22.2.2021 um 12:52, Re4cher sagte:

Ich denke Du verstehst einfach nicht was ich sagen will.

Also hier nochmal ein letztes Beispiel:

 

Vergleichen wir mal Spieler mit einer sehr geringen Anzahl Games auf einem Schiff:

die Überperformer -> https://wows-numbers.com/de/ship/4185864144,Orion/?p=1

die Unterperformer ->https://wows-numbers.com/de/ship/4185864144,Orion/?p=295

 

Jetzt kannst Du Dich mal durch die je 50 Accounts mit sehr wenigen Spielen klicken und wirst einen DEUTLICHEN Unterschied in der Gesamtperformance der Spieler sehen.

Schau auch mal auf die Außreißer bei der Winrate (Aussagekraft kontra Glück/Pech)

Beide Seiten kann man in Richtung Durchschnitt Skalieren und andere Spieler anhand dieser Werte beurteilen oderr sich ein Bild von der Erwartung machen.

 

Sicher gibt es Ausnahmen und die Yamato die plötzlich 150k macht - aber das ist halt einfach gegen jede Wahrscheinlichkeit.

Es wird auch ehr passieren das ein zu erwartendes gutes Ergebnis nicht so gut wird als zu erwarten das ein Totalausfall Unicum-Stats hinlegt.

 

2, 20 oder 200 Spiele : die Stärke der Schwankungen bei der Winrate nimmt mit der Anzahl der Spiele ab - die Performance verläuft i.d.R. aber recht Linear.

Vllt. fehlen Dir da einfach 10k Spiele und 2 Jahre konstante nutzung des Monitors um das so deutlich zu erkennen.

 

Und genau das was du anführst sind Argumente gegen die Verwendung von Werten aus einem sehr kleinen stichprobenbereich aka "sehr wenige Spiele (auf einem Schiff). 

 

Kann es sein, dass wir hier grad in der Communityaufgabe stecken, bei dir Wahrscheinlichkeitrechnung und Statistik auf einem basiclevel nachzuholen? Du bezweifelst einerseits die Grundlagen dieser Bereiche und tituliert sie als "mythos". Aber andererseits schaffst du es nicht, die richtigen Konsequenzen aus deinen eigenen Überlegungen zu ziehen. Das auftreten von ausreißern hast du dir irgendwie als Problem verdeutlicht, aber die Lösung der Minderung deren Einfluß in statistischen Betrachtung über große stichprobenmengen scheinst du irgendwie ins lächerliche ziehen zu wollen. 

  • Funny 1

Share this post


Link to post
Share on other sites

×