WN8 is finished. I hope Seriych can explain it better to you guys, since Google translate is pretty bad.


Basically, a per-tank "expected" stat table is used. The stats for each tank are multiplied by the number of games played on that tank, and then added all together. Then the total stats for the player are compared with these total "expected" stats. Then we use a couple formulas to calculate the final value of WN8 like this:


The Steps of WN8 –


Step 1
rDAMAGE = avgDmg / expDmg
rSPOT = avgSpot / expSpot
rFRAG = avgFrag / expFrag
rDEF = avgDef / expDef
rWIN = avgWinRate / expWinRate


Step 1 takes the counts of tanks played on account, and multiplies them by the expected stats to get the account total expected values. Then the actual account totals (your total dmg, frags, spots, def, win-rate) are divided by the expected values to give the ratios.



Step 2
rWINc = max(0, (rWIN - 0.71) / (1- 0.71))
rDAMAGEc= max(0, (rDAMAGE-0.22) / (1-0.22))
rFRAGc = min(rDAMAGEc+0.2 , max(0, (rFRAG-0.12) / (1-0.12)))
rSPOTc = min (rDAMAGEc+0.1 ,  max(0, (rSPOT-0.38) / (1-0.38)))
rDEFc = min (rDAMAGEc+0.1 , max(0, (rDEF-0.10) / (1-0.10)))

Step 2 sets the zero point for the ratios. See the assumptions section for more info on why this happen. min  and max are functions to ensure the ratios stay within bounds. The constants are in the format of

(rSTAT – constant ) / (1 – constant)

To normalize that a player with all rSTATc of 1 would receive 1500 WN8.



Step 3
WN8 = 980*rDAMAGEc + 210*rDAMAGEc*rFRAGc + 155*rFRAGc*rSPOTc + 75*rDEFc*rFRAGc + 145*MIN(1.8,rWINc)

Step 3 takes the weighted (in Step 1) and normalized (in step 2) performance ratios and processes them through the coefficients determined for the final formula, reported above. This puts the scale on the more meaningful 0-5000, gives the relative weights of damage and reflects the interactions between frags*spots, def*frags and dmg*frags.



Here is a document explaining everything in detail, it is in English, but I hope Seryich can translate it into Russian soon:





WN8 has many advantages over WN7.

First of all, it can measure player skill regardless of what tanks he chooses to play. So WN8 cannot be "farmed" by playing a large number of games on OP tanks. Also, no more farming by playing tier 1 and 10 as was possible for WN7 (see document for more details).

Secondly, the fact that it is a ratio scale, allows people to directly compare scores. A player with 4000 WN8 contributes 4 times as much to winning a game as a player with 1000 WN8.

Thirdly, WN8 should be easy to translate into a 0-100 scale. Simply divide WN8 by 32. Approximately 99.99% of players have less than 3200 WN8. Those players above 3200 WN8 will have 100 on the 0-100 scale. An average player will have a score of around 25.



I would be happy to answer questions and concerns, and I would be thrilled if WN8 could be implemented into XVM. There is no doubt in my mind it is a much better metric than WN7.

Oh yeah, this is the updated per-tank expected stats table:



WN8 is finished.

sincerely  happy about that. Many thanks for the work You are doing  :thx:


I think the community will need some time to get acquainted with the new concept of efficiency estimation, see the analitics that, hopefully, will be done by local math experts.



this is the updated per-tank expected stats table

I have the question here. How often does this table need updates?

I think we'd better move here
Кстати, если есть кто хорошо английский знает, буду рад сложить с себя полномочия переводчика, а то у меня с этим не особо :-)

Кстати, если есть кто хорошо английский знает, буду рад сложить с себя полномочия переводчика, а то у меня с этим не особо :-)

как скоро нужен перевод? Если только этот пост, то выходных хватит, могу и завтра к вечеру. Если ещё тот ворд, что по ссылке - больше недели и не знаю что со временем получится.

If you guys feel it would be best, I could write a smaller summary.


My intention was to get the formula to the XVM developers so they could start thinking about implementation in XVM. The full text of the Word article is more for people who really want to know in depth how WN8 works. :)

I could write a smaller summary

Yes It would be great:) Thanks for the work.

Just I dont't understand about the 0-100 scale. Why an average player will have a score of around 25 but the average range of XVM scale is 34-52 being the constant value for all ratings? 

Чёт мало чего понял конечно. Почему-то средний показатель получается 25 по шкале XVM, чего там с эталонной таблицей и ее обновлением тоже не ясно. Вообщем надо русскую доку:) Может предложенный автором суммарик в переводе будет больше понятен юзеру, чем 14 страниц подробного разжевывания

WN8 закончен. Надеюсь, Seriych сможет лучше объяснить вам, парни, потому что переводчик гугла не фонтан.


По сути, используется таблица "ожидаемой" статистики по танку. Статистика для каждого танка умножается на число игр, сыгранных на танке, и потом все суммируется. Далее итоговая статистика игрока сравнивается с ожидаемой. Мы используем несколько формул для расчета финального значения WN8:


Шаг 1

rDAMAGE = avgDmg / expDmg

rSPOT = avgSpot / expSpot

rFRAG = avgFrag / expFrag

rDEF = avgDef / expDef

rWIN = avgWinRate / expWinRate


Шаг 1 берем число танков на аккаунте и умножает на ожидаемую статистику для получения результирующей ожидаемой величины для аккаунта. Далее реальные результаты по аккаунту (нанесенный урон, фраги, засвет, защита, винрейт) делятся на ожидаемые величины для получения соотношения.



Шаг 2.

rWINc = max(0, (rWIN - 0.71) / (1- 0.71))

rDAMAGEc= max(0, (rDAMAGE-0.22) / (1-0.22))

rFRAGc = min(rDAMAGEc+0.2 , max(0, (rFRAG-0.12) / (1-0.12)))

rSPOTc = min (rDAMAGEc+0.1 ,  max(0, (rSPOT-0.38) / (1-0.38)))

rDEFc = min (rDAMAGEc+0.1 , max(0, (rDEF-0.10) / (1-0.10)))


Шаг 2 устанавливаем нулевые точки для соотношений. Смотрите раздел Предложения для более подробной информации зачем это нужно. min и max это функции, обеспечивающие, чтобы соотношения оставались в нужных границах. Константы в формате


(rSTAT – константа ) / (1 – константа)

Для нормализации, чтобы игрок со всеми rSTATc равными 1 имел WN8 = 1500.


Шаг 3

WN8 = 980*rDAMAGEc + 210*rDAMAGEc*rFRAGc + 155*rFRAGc*rSPOTc + 75*rDEFc*rFRAGc + 145*MIN(1.8,rWINc)


Шаг 3 берем взвешенные (шаг 1) и нормализованные (шаг 2) соотношения эффиктивности и обрабатывает их через коэффициенты, определенные для финальной формулы, приведенной выше. Это приводит шкалу к более понятной шкале 0-5000, дает относительные значения урона и отражает взаимодействия между фраги*засвет, защита*фраги и урон*фраги.



Вот документ, объясняющий все более подробно, он на английском, но я надеюсь Seryich сможет вскоре перевести на русский.





WN8 имеет много преимуществ перед WN7.


Прежде всего, он может измерять скилл игрока независимо от того, на каких танках он играет. Так что WN8 нельзя "фармить", много играя на имбалансных танках. Также, нельзя фармить на танках 1 и 10 уровня, как это было возможно для WN7 (смотрите документ для подробностей).


Во-вторых, тот факт, что это шкала соотношений, позволяет сравнивать рейтинги напрямую. Игрок с рейтингом 4000 WN8 способствует победе в 4 раза больше игрока с рейтингом 1000.


В-третьих, WN8 легко будет привести к шкале 0-100. Просто разделите WN8 на 32. Приблизительно 99.99% игроков имеют рейтинг WN8 ниже 3200. Игроки с рейтингом выше 3200 будут иметь 100 на шкале 0-100. Средний игрок будет иметь рейтинг порядка 25.


Буду рад ответить на вопросы и предложения, и меня очень волнует возможность встраивания WN8 в XVM. У меня нет никаких сомнений в том, что это гораздо лучшая система измерения, чем WN7.


Да, вот обновленная таблица ожидаемой статистики по танкам:




Вольный перевод мой, прошу строго не судить.

Edited by Caryon
Вольный перевод мой, прошу строго не судить.

Спасибо. Но яснее не стало. Откель эта предполагаемая таблица? Кто на каком основании ее предполагает? Откуда берутся коэффициэнты формулы (всё грозились, что не из пальца, а как-то хитро высчитываются)? По кой по 100 бальной шкале середнячок имеет 25 если средний дипазон у шкалы 34-52? Каким образом и как часто обновляется эталонная таблица? И так далее и тому подобное, короче- одни вопросы пока. Ждем разжевывания политики партии от тех, кто в этом обычно копается и разбирается

Edited by demon2597
Откель эта предполагаемая таблица?


Там реально долгий процесс :)

В двух словах, использовалась база данных по всем игрокам по каждому танку.

С помощью WN7 выбирались адекватные комбинации игрок/танк, и на основе этих данных подсчитывались значения.

Отдельно настраивались танки, на которых мало игр в целом, или которые были перебалансены.

to Praetor77:

Where do the coefficients for step3 come from?

There's no info on it in detailed document.

Почему-то средний показатель получается 25 по шкале XVM

Где ты там нашел про шкалу XVM?


Меня больше интересует, откуда взялось, что рейтинг прямо пропорционален некоему способствованию победе (A player with 4000 WN8 contributes 4 times as much to winning a game as a player with 1000 WN8). Кстати, тоже самое в свое время писалось про WN6, распределение называлось идеальным, и это было одним из аргументов, почему автор отказался делать единую шкалу на базе всем понятных реперных точек 600-900-1200-1500-1800 (до сих пор жалко, что так не сделали).

Где ты там нашел про шкалу XVM?
а че не её имели в виду по 100 бальной? Типа просто так? Ну тогда вопрос снят



A player with 4000 WN8 contributes 4 times as much to winning a game as a player with 1000 WN8
я вообще честно говоря эту фразу понять и переварить не могу. Я понял так, что игрок с 4000 в носит в 4 раза больший вклад в победу, чем игрок с 1000- белиберда какая-то
  • Upvote 1
  • Downvote 2
The reason for using a ratio scale is that it decompresses the distribution from the middle. What is the sense of a scale if every single player you meet in game has 900-1100 rating? It loses usefulness in being able to predict how well that player normally plays.




Ratio scale

The ratio type takes its name from the fact that measurement is the estimation of the ratio between a magnitude of a continuous quantity and a unit magnitude of the same kind (Michell, 1997, 1999). A ratio scale possesses a meaningful (unique and non-arbitrary) zero value. Most measurement in the physical sciences and engineering is done on ratio scales. Examples include mass, length, duration, plane angle, energy and electric charge. Ratios are allowed because having a non-arbitrary zero point makes it meaningful to say, for example, that one object has "twice the length" of another. Very informally, many ratio scales can be described as specifying "how much" of something (i.e. an amount or magnitude) or "how many" (a count). The Kelvin temperature scale is a ratio scale because it has a unique, non-arbitrary zero point called absolute zero. The zero point of the Celsius scale is at 273.15 kelvins, so Celsius is not a ratio scale.




The reason for changing to a ratio scale is that, once again, it decompresses the values from the middle, making a wider bell curve, which makes WN8 more effective and useful at predicting player competence/skill. 


With interval scale (WN7), 0 rating meant 0 stats, 0 kills, 0 damage, 0 spots. The problem is that even a bot gets some spots, and even some kills and damage if it is a more complicated one.

With ratio scale, 0 rating means 0 contribution to winning. You will notice no players had WN7 scores below 300 (unless they had tier penalty applied to them). In WN8 the worst players in the game get 0-100 rating, regardless of the fact that they do not have 0 stats, they do contribute nothing to wins, for example a 38% win player.





And I don´t know why you find it hard to believe that a player can contribute 4 times more to victory than an average player. This is true. This is why an average player "wins" 7% of matches (49% winrate, 7% above the winrate for doing absolutely nothing), while the best players in game can get winrates of around 70% while playing solo (no platoon), which is 28% above the winrate for doing nothing. So yes these players do 4 times more than the average player to help his team win. Of course, this is not linear for each stat, they don´t do 4 times more damage and kills than an average player, which is what makes the ratio scale in WN8 clever and useful.



Again, the interval scale used in WN7/Efficiency/etc. is not really good at comparing one player to another. There is a HUGE difference in skill between a 500 WN7 player and a 900 WN7 player, which will now be better represented in WN8, as maybe they would have 200 and 1000 WN8. The same goes for the unicum players, with a huge difference in skill between a 1750 WN7 player and a 2000 WN7 player, which will now be better represented in the WN8 ratings, with maybe 2200 and 3000 WN8.



About the 1-100 scale, I was simply suggesting something which I feel would be more useful for me than the standard 1-100, 50 median scale. Doing what I suggested, dividing WN8 by 32 for the 1-100 scale (with all players above 3200 WN8 having 100), maintains the ratio scale properties of WN8. If, however, of course you are more than free to use the same process of bringing the rating to a 0-100 scale that has been used before, this removes the interval scale properties of WN8, and turns it back into an interval scale, which is less useful to me, IMHO.




PS:Oh yeah, about the per-tank values they would need to be updated every patch.


PS2: The coefficients in step three were determined using Eureqa, a program which uses iterative genetic algorithms to find mathematical relationships between sets of data.


Eureqa determined that these coefficients are the best way in which we can approximate/estimate how much a player should win, given his stats.

It is explained better and in more detail in the Word document.


PS3: Another big change from WN7 to WN8, is that we now have per-tank normalized damage. So now we can fairly compare the average damage of two players who played absolutely different tanks. Using tier-based damage normalization in WN7 made average damage less useful, since we all know that if one player played a lot of games in AMX40 and another in T40, their average damages will not be comparable. 

In WN8, using per-tank damage comparisons allows this stat to be much more useful, even more useful than average kills. Therefore, WN8 is more heavily weighed on damage than on kills, which prevents WN8 farming, as some people did with WN7, farming kills in low tier games, and damage in high tier games.

Edited by Praetor77
Praetor77, i noticed that expected stats in per-tank8 file were corresponding to a 1200 WN8 player. Now, in per-tank12, slightly corrected numbers would make a player have 1500 WN8. Was it a typo? or you decided to bump everyone's rating?



ps. the value for exp frags in E-25 is missing in the latest file.

got the latest version. thank you, guys.

are you keeping in touch with rating site admins? i mean to make sure everyone is using the same tables. otherwise, me thinks, it'll be a slight mess with sites calculating wn8 using different snapshots, and now based on different expected values.




господа разработчики, правильно понимаю, что первая итерация расчета wn8 еще не завершилась? т.к. у некоторых игроков он, рейтинг, совсем не отображается.

