1537 battle

« Older   Newer »
 
  Share  
.
  1.     +1   Top   Dislike
     
    .
    Avatar

    Gotta Knock A Little Harder

    Group
    Supporter
    Posts
    21,302
    e-penis
    +9,897
    Location
    glade of dreams

    Status
    Anonymous
    e così mi sono chiesto quanto avesse ragione y sulla questione ladder>tornei

    la generale tendenza è oggi quella di aumentare il più possibile il numero di battle (bo3 forzata, double elimination) per ridurre l'influenza dei fattori casuali. questo è ok, nel senso, quel 10% di chance di perdere una battle per frost vengono inquadrati al loro giusto posto ripetendo un gran numero di volte la partita. tutto bene fin qui

    resta ovvio che le battle che si fanno in torneo restano ugualmente POCHE in confronto a quelle che si ha occasione di fare in una ladder. ma la ladder comporta altri svantaggi, perché non tutti hanno occasione di fare lo stesso numero di battle in un giorno, e diversi tipi di team, con differenti velocità di esecuzione, possono sfavorire o favorire una scalata indipendentemente dall'effettiva bravura di un giocatore, obbligando così ad un solo tipo di playstyle / non retribuendo adeguatamente giocatore e team per la loro effettiva competitività

    ...e se quindi la virtù stesse nel mezzo? una ladder che obbliga un tetto massimo sostenibile di match al giorno, coi punteggi aggiornati solo nel fine settimana. questo limiterebbe ad un minimo l'influenza di fattori come la velocità e la nerdness.

    questo mi dà lo spunto per parlare di grandi numeri. penso che la maggior parte di voi non abbia minimamente idea di quale sia la probabilità di mandare a segno quattro dynamicpunch su otto, e mi darebbe risposte tipicamente senza senso se lo chiedessi...
    si risolve con un metodo che si chiama "binomiale", giusto perché chi è interessato può provare a cercare materiale al riguardo. alla binomiale corrisponde una distribuzione di probabilità, una che approssima un'altra distribuzione, che si chiama gaussiana, quando il numero di ripetizioni è grande. così, giocare a pokémon è un po' come giocare a scacchi + teoria delle probabilità. per dimenticarsi della parte sulla teoria delle probabilità, è necessario giocare parecchie partite, al limite delle partite infinite le probabilità assomigliano a costanti moltiplicative (es. con un numero tendente all'infinito di ice beam, il froze non è più culo, ma assomiglia sempre più alla costante moltiplicativa 0.1, un froze ogni dieci ice beam). tornando ai miei dynamicpunch, per vederli funzionare con probabilità 50% entro un intervallo sufficientemente piccolo (5%) con confidenza del 95% (che equivale a dire: voglio essere molto sicuro che la grandissima parte dei miei dynamicpunch funzioni una volta su due o poco più/poco meno), che numero n di battle devo fare? usando la formula per variabili dicotomiche (hit/miss)

    n= ceiling((2*1.96)2*p(1-p)/d2) = ceiling(4*1.962*.25/.052) = ceiling(1.96/.05)2

    si ottiene facilmente che il numero minimo di partite da giocare deve essere n= 1537. questo è un numero di partite un po' troppo grande anche per una "ladder" su base mensile.......................................................................................................

    se però ci si accontenta di una precisione del 10% attorno al valore del 50%, 385 partite sono sufficienti...
     
    Top
    .
  2.     Top   Dislike
     
    .
    Avatar

    Heisenberg mi fa un baffo.

    Group
    Member
    Posts
    2,437
    e-penis
    +594

    Status
    Offline
    è bello che tu ti sia interessato ad un problema così pratico, è evidente in questo senso che il numero di partite da fare è fin troppo elevato. l'unica cosa che si potrebbe fare è piuttosto valutare una ladder in tempi molto dilatati, come per esempio quella dell'nbf che tiene conto dei tornei. la domanda che ci si potrebbe porre è: esiste una scappatoia? la risposta più immediata che mi viene in mente è un simulatore con l'hax eliminato, ma in quel caso il gioco darebbe spazio alla supremazia di schifezze lamer che senza quel colpo di fortuna non potrebbero essere eliminate. forse a quel punto entrerebbe in gioco il criterio oggettivo per il ban, che richiederebbe tuttavia il calcolo della competitività di ogni singolo metagame... e qui la complessità computazionale raggiunge vette inconcepibili :\

    e allora mi viene in mente l'ultima parte del tuo post. di solito in statistica l'intervallo di confidenza è 5%, ma visto che la gaussiana è.. beh, gaussiana, sai che basta aumentare di poco le variazioni standard considerate per ottenere parecchie più probabilità di riuscita → minore n. ma allora quale intervallo di confidenza dovremmo cercare? dovremmo tarare il numero di battle in base all'intervallo, o il contrario?

    in realtà non mi sono mai davvero posto il problema visto che qui su nbf abbiamo sempre avuto una "ladder" su base indefinita (chissà da quanti anni va avanti lol), ma vista l'impazienza degli utenti con cui abbiamo a che fare, ed il loro immediato ed improvviso bisogno di valutare subito ed in modo definito la bravura dei giocatori... non sono sicuro che esista una risposta oggettiva, visto che eliminare la fortuna e giocare ad un gioco dove davvero chi è più bravo vince costituisce un ostacolo informatico che sembra non essere stato ancora superato :x

    tuttavia io sono sempre stato favorevole al chess mode. come ho già scritto andrebbe unito ad una banlist fatta con criterio. ecco magari è lì che potremmo applicare la statistica e parlare di un intervallo di confidenza quando si tratta di bannare qualcosa o no.
     
    Top
    .
  3.     Top   Dislike
     
    .
    Avatar

    DI TROIE CE NE SON TANTE, MA COME LE DONNE...

    Group
    NBF User
    Posts
    7,660
    e-penis
    +1,536

    Status
    Offline
    mah io credo che il problema più grave riguardo a Y non sia la sua posizione pro-ladder, alla fine credo sia una questione di opinioni, quanto il fatto che sembra che abbia eliminato totalmente la battle stessa nel determinare la forza di un giocatore, tant'è che lui era per una commissione senza alcun torneo

    poi magari sono un tantino fuori topic, neh?
     
    Top
    .
  4.     +7   Top   Dislike
     
    .
    Avatar


    Group
    Member
    Posts
    8,848
    e-penis
    +3,727
    Location
    La Bagnara

    Status
    Offline
    il problema più grave riguardo a y è che esiste, ma non intasiamo il topic con queste storie

    trovo comunque che 10% sia un margine di errore ai limiti dell'accettabile se si vogliono fare le cose con rigore, e 385 partite mensili comunque decisamente troppe... mi sembra onestamente un vicolo chiuso, anche se qualche idea interessante può uscire.

    CITAZIONE
    ...e se quindi la virtù stesse nel mezzo? una ladder che obbliga un tetto massimo sostenibile di match al giorno, coi punteggi aggiornati solo nel fine settimana. questo limiterebbe ad un minimo l'influenza di fattori come la velocità e la nerdness.

    è una buona idea... ma perché a questo punto non fissare direttamente il numero di battle totali da giocare, in modo che tutti giochino lo stesso numero di partite? il che conduce al round robin, in cui ognuno degli n partecipanti non deve giocare necessariamente n-1 partite, ma può essere trovato un numero (che può essere tanto maggiore quanto minore di n) che meglio si adatti alle circostanze. ad esempio, se 30 battle a testa in un mese sembra un numero ragionevole, ognuno potrebbe giocare le sue 30 partite, giocando al minimo m e al massimo m+1 partite contro ogni avversario, con m maggiore o uguale a 0. mi viene il dubbio che sia possibile attuare un format del genere per ogni coppia (numero di giocatori; numero di battle per giocatore) in modo che la condizione precedente sia rispettata per tutti i giocatori (nel senso cioè che ognuno deve sfidare ciascun altro lo stesso numero di volte, con un resto. è il resto che mi dà qualche dubbio e a pensarci un attimo credo che ciò non sia possibile)

    -> basta far sì che il numero di battle che ognuno deve giocare sia multiplo del numero degli altri giocatori (ognuno sfida ciascun altro lo stesso numero di volte) oppure sottomultiplo (più round robin separati). se i due numeri sono uguali si ha il classico round robin

    ad esempio, diciamo che il numero ragionevole di battle mensili si aggira attorno al 30. se ci sono 12 giocatori ognuno sfiderà ciascuno 3 volte per un totale di 33 battle; se ci sono 28 iscritti si fa un banale round robin; se ci sono 84 iscritti si fanno 2 oppure 4 gironi da 42 oppure 21 giocatori; se ci sono 83 iscritti siamo nella merda

    non so, sto giusto scrivendo quello che mi viene in mente ora... ma non mi pare sia male, qualunque sia il motivo di selezione. poi penso che se ci troviamo un numero primo di giocatori, come 83, si possa fare 27+28+28 e per ogni giocatore tener conto del rapporto vinte/giocate

    (capisco comunque che l'argomento del topic non fosse questo, ma mi sentivo di scrivere queste cose mentre lo pensavo. non avrei mai immaginato un numero grande come 1537 per rispettare le tue condizioni)
     
    Top
    .
  5.     Top   Dislike
     
    .
    Avatar

    Gotta Knock A Little Harder

    Group
    Supporter
    Posts
    21,302
    e-penis
    +9,897
    Location
    glade of dreams

    Status
    Anonymous
    sì anche io trovo il 10% una cattiva precisione. e non è che me ne freghi più di tanto del 5% come soglia di confidenza standard in statistica--più che altro è la mia bias di giocatore di pokemon ad impormelo: su razor leaf ci puoi fare affidamento, ma mi dà un formidabile senso di ansia pensare che per concludere a mio favore una partita la mossa da usare sia rock slide.

    il punto di fissare il numero di battle da giocare è correlato con il punto successivo da: "quale dovrebbe essere il tetto se vogliamo una ladder onesta?", ed i numeri per ottenere un comportamento sensato son troppo grandi. fissare un tetto come 25 battle resta cmq la migliore soluzione per equilibrare tornei importanti e a medio-lungo termine (come le selezioni). se però restringi così tanto il numero di trial e vuoi tenere alta la confidenza, stai parlando di una misura dell'accuracy di dynamicpunch che, al 95% di certezza, può essere tanto 26 quanto 74. c'è però da dire che, se le battle di cui stiamo parlando sono tutte delle bo3, la misura migliora sorprendentemente (a spanne, stai tra 43 e 57). quindi, se fai 25 battle in bo3, diciamo che puoi essere molto ragionevolmente sicuro che l'hax vada al suo posto da solo (condiziona "solo" il 14% delle battle).

    CITAZIONE
    Indeed, it has been said that democracy is the worst form of government except all those other forms that have been tried from time to time.

    Winston Churchill

    grazie per il post cmq
     
    Top
    .
  6.     Top   Dislike
     
    .
    Avatar


    Group
    Member
    Posts
    8,848
    e-penis
    +3,727
    Location
    La Bagnara

    Status
    Offline
    ma perché considerare 25 batte bo3 anziché 75 bo1?
     
    Top
    .
  7.     Top   Dislike
     
    .
    Avatar

    Grand Master

    Group
    NBF User
    Posts
    46,708
    e-penis
    +5,809
    Location
    Roma

    Status
    Offline
    CITAZIONE (Seymour @ 11/7/2012, 21:59) 
    [...]in realtà non mi sono mai davvero posto il problema visto che qui su nbf abbiamo sempre avuto una "ladder" su base indefinita (chissà da quanti anni va avanti lol)[...]

    Il primo PoryTrophy con i punteggi è stato il VI, del 23/08/09. Di lì c'è stato il PT mensile fino a quando non si è alternato con il RG per poi diventare bimestrale causa JC.
     
    Top
    .
  8.     Top   Dislike
     
    .
    Avatar

    Heisenberg mi fa un baffo.

    Group
    Member
    Posts
    2,437
    e-penis
    +594

    Status
    Offline
    perchè la modalità della bo3 è diversa, cioè 75 battle non vogliono necessariamente dire che vadano giocate in quel modo e soprattutto la bo3 non sempre ne include 3
     
    Top
    .
  9.     Top   Dislike
     
    .
    Avatar

    Gotta Knock A Little Harder

    Group
    Supporter
    Posts
    21,302
    e-penis
    +9,897
    Location
    glade of dreams

    Status
    Anonymous
    CITAZIONE (Suspopo @ 12/7/2012, 02:14) 
    condiziona "solo" il 14% delle battle

    non avrei potuto scegliere termini peggiori

    quel che avrei dovuto dire è che si può essere ragionevolmente sicuri che il rank finale alla fine del round robin non sia falsato oltre il 14%, cioè che nessun battler stia eccessivamente lontano da dove merita di stare/solo pochi sono lontani, e magari che una differenza nel rank del 14% decreta con sicurezza quale battler è più meritevole di un altro (differenze minori non sono statisticamente rilevanti per stabilire chi è "più forte").

    CITAZIONE (Carlo‚ Fantallen. @ 12/7/2012, 10:15) 
    ma perché considerare 25 batte bo3 anziché 75 bo1?

    una bo3 può anche contemplaare meno di tre battle!

    !
    omg credo di avere stimato male l'intervallo per il caso delle bo3 ma sono davvero troppo stanco per ricontrollare (l'idea cmq è che molte battle, tutte bo3=gud)

    omg

    Edited by Maud - 12/7/2012, 18:54
     
    Top
    .
  10.     +4   Top   Dislike
     
    .
    Avatar

    ¯\_(ツ)_/¯

    Group
    Member
    Posts
    15,581
    e-penis
    +3,922
    Location
    Milano

    Status
    Anonymous
    CITAZIONE (Carlo‚ Fantallen. @ 11/7/2012, 23:32) 
    il problema più grave riguardo a y è che esiste

    sarà ma per me bastava questo
     
    Top
    .
  11.     Top   Dislike
     
    .
    Avatar

    DI TROIE CE NE SON TANTE, MA COME LE DONNE...

    Group
    NBF User
    Posts
    7,660
    e-penis
    +1,536

    Status
    Offline
    QUOTE
    ...e se quindi la virtù stesse nel mezzo? una ladder che obbliga un tetto massimo sostenibile di match al giorno, coi punteggi aggiornati solo nel fine settimana. questo limiterebbe ad un minimo l'influenza di fattori come la velocità e la nerdness.

    Questa sarebbe una cosa fattibile su PO? Intendo dire inserire una ladder di questo tipo
     
    Top
    .
  12. AquilaUno
        Top   Dislike
     
    .

    User deleted


    Non ho niente da aggiungere a quanto detto finora, se non un consiglio riguardo il problema in caso di iscritti primi posto da Carlo un po' di tempo fa: in quanto giocatore di warhammer, gioco intrinsecamente a coppie dove in ogni turno di torneo tutti i giocatori devono sfidarsi, si è fottuti già in caso di giocatori dispari, non solo primi, allora esiste una regola: l'arbotro gioca in caso di giocatori dispari.

    Ecco appunto quello che volevo proporre è: in caso di giocatori primi basta avere pronto un "jolly"

    E ora scappo che ho la pasta sul fuoco.
     
    Top
    .
  13.     Top   Dislike
     
    .
    Avatar

    DI TROIE CE NE SON TANTE, MA COME LE DONNE...

    Group
    NBF User
    Posts
    7,660
    e-penis
    +1,536

    Status
    Offline
    ma devi venire a Geometria.....
     
    Top
    .
12 replies since 11/7/2012, 01:21   455 views
  Share  
.