Jump to content
Korean Random

Обсуждаем рейтинги эффективности, придумываем свой


seriych

Recommended Posts

Входит. В том то и дело, что нормировать хотелось бы автоматом, а не субъективными коэффициентами.

А я и предлагал строго по данным "объективной экспертной таблицы" (той, которую Вы выложили). Но теперь и я данные этой таблицы ничем кроме "субъективной липы" назвать не могу, увы...

Это плохо тем, что наши поправки будут субъективны и взяты с потолка. Хотелось бы опоры на реальную статистику.

Предлагал брать из этой "таблицы", но теперь и сам вижу что это даже хуже чем "с потолка", увы...

Не было. Просто ответ такой же, как и на низких: средний скилл игроков, играющих на этой технике выше среднего скила вообще по всем танкам.

Т.е. Вы серьезно уверены что на высоколевельной технике играет игроков со скиллом выше среднего намного больше чем на средних уровнях?

А то что 80% игроков играет вообще без доната, а потому вынуждены играть 4 боя на КВ чтобы сыграть один бой на Ис-7 Вам известно?

А то, что многие скиллованные игроки вообще стараются сейчас не играть в рандоме соло на топовой технике(из-за засилия арты и откровенного нубства команд) знаете?

А то, что из-за мании ВГ на ввод веток новой техники люди гораздо больше вынуждены "фармить" (опыт и креды) чем играть "для удовольствия" Вы знаете?

Я лично "матерюсь" на команду в высоколевельных боях куда чаще, чем в "среднелевельных" (90% боев на топах крысо-олене-стадных), для справки я сейчас "качаю" три танка 9-го левла (ПТ9 франц и СССР и Конкуерор)... Это "нечто" (матерное), это не игра (очень напоминает "сидение за бараками + слив по центру поля на малиновке" на 1-м левле, какой там еще "скилл" лишь бы не нубили по черному)...

 

SageSer: А как тогда "похожесть" определять будете?

seriych: Да не надо нам ее определять вообще.

SageSer: Вы же сочли возможным сделать заявление, что "научившись играть на одном танке, на всех похожих игрок будет иметь высокие результаты"? На чем тогда основана такая уверенность, если "похожесть" мы определять не умеем? На пустом "мнении"?

seriych: Видимо, да. Мне это кажется очевидным. (seriych: Это плохо тем, что наши поправки будут субъективны и взяты с потолка. Хотелось бы опоры на реальную статистику.)

Не могу понять "мысли скачут как у женщины" у меня или у Вас? Но у кого то из нас точно "хотелка" превуалирует над разумом...

Тогда я не совсем понял претензий к данным по этим танкам.

Да нет и не может быть у меня "претензий к данным по танкам" (они такие какими их "сделал ВГ" это факт и на этом точка). Есть лишь сомнения в "очевидности" некоторых "выводов" из этих данных (т.е. мыслей по поводу этих данных, типа "что это означает").

 

Не совсем. Мы вроде уже выяснили, что голда далеко не всегда приводит к лучшим результатам. Хороший игрок может вполне хорошо серебро фармить и тоже стрелять голдой. Да, конечно, донатер будет иметь выше результаты по сравнению с игроком с тем же скилом на том же танке, но определить ведь никак нельзя, кто донат, а кто нет.

Не совсем. Голда как раз ВСЕГДА "приводит к лучшим результатам", только в большинстве случаев "выигрыш" всего 10-15%, а вот в некоторых, особых, "в разы" (и это уже существенно). И определить как раз только и можно по "экстремальным" результатам (недостижимым практически без голды), иначе никак, Вы правы. Если же игрок от пользования голдой не умеет эти "экстремальные" результаты иметь даже на "особых танках", ну и хрен с ним, тогда и "корректировать" смысла нет (он уже сам себя "наказал").

Незачем к этому постоянно возвращаться. Почти все хотят видеть умение играть.

Тогда держите пожалуйста "цель" перед собой, если не будете (в своих словах) от нее "отклоняться", то я не буду и "возвращаться".

В данном предложении я говорил о столбике среднего дамага в таблице. То есть среднее значение среди всех средних дамагов всех игроков на отдельно выбранном танке.

Если так, то чем такие данные не "объективны", не понимаю...

 

Писал выше: набить этот средний дамаг гораздо проще на низких уровнях, а на высоких сложнее.

Это верно и с этим я не спорю.

Я не понимаю почему "средний игрок" должен иметь средний дамаг ниже "этого среднего" (из таблицы) на высоколевельной технике. А раз не понимаю, то и спрашиваю, почему Вы так думаете?

Речь идет как раз о пресловутом "веере". На популярных танках(они же задротские) топ 100- это веер.

НЕ... Это точно неверно...

"Популярные" - это те, на которых "любят играть" сотни тысяч "Алешек" (на них число боев в разы превосходит любую технику, еженедельная статистика ВоТ Ньюс Вам в помощь).

"Задротские" - это те, играя намеренно "стато-задротно" на которых можно создать очень большое преимущество над "среднестатистическими Алешками" (как правилдо играющими на "популярных" танках). Такие танки неизбежно должны "показывать" аномально большую разницу между "топовыми" и "средними" показателями (по дамагу в том числе). Должны, но... судя по приведенной Вами таблице НЕ КАЖУТ, хоть тресни...

И только в ряде случаев эти танки могут временно и случайно "совпасть" (например сейчас Квас и популярный и задротный танк одновременно).

Предлагается резать стату просто потому что игроку нравится играть на этих танка? Не вариант. Только если как в TWR сначала сравнивать с похожими.

Нет, не так. "Резать" только в случае когда и винрейт и число боев одновременно на таких танках аномально высоки для аккаунта игрока + если по разнице "топового и среднего" танк "вычисляется" как "задротный". Если хоть одно из условий не выполняется, то и "резаться" ничего не должно.

Например, на "основном" Вашем акке "порезки" по ходу вообще не будет (существенной по крайней мере), а на твинке (seriy_ch) точно нужно "порезать" Су-26, на учитывая очень высокий дамаг на ней (реальный) вряд ли и эта "порезка" сильно изменит оценку Вашего "скилла" (можете посчитать по предложенной методике и убедиться сами).

Неужели Вы сами серьезно полагаете, что когда Вы заходите в игру под твинком (seriy_ch), то у Вас вдруг внезапно и резко вырастает "скилл"?

Идет.

"Регион" в личку пожалуйста...
Link to comment
Short link
Share on other sites

Вы серьезно уверены что на высоколевельной технике играет игроков со скиллом выше среднего намного больше чем на средних уровнях?
Я "намного" не говорил. Просто больше, а не намного больше.
А то что 80% игроков играет вообще без доната, а потому вынуждены играть 4 боя на КВ чтобы сыграть один бой на Ис-7 Вам известно? А то, что многие скиллованные игроки вообще стараются сейчас не играть в рандоме соло на топовой технике(из-за засилия арты и откровенного нубства команд) знаете? А то, что из-за мании ВГ на ввод веток новой техники люди гораздо больше вынуждены "фармить" (опыт и креды) чем играть "для удовольствия" Вы знаете? Я лично "матерюсь" на команду в высоколевельных боях куда чаще, чем в "среднелевельных" (90% боев на топах крысо-олене-стадных), для справки я сейчас "качаю" три танка 9-го левла (ПТ9 франц и СССР и Конкуерор)... Это "нечто" (матерное), это не игра (очень напоминает "сидение за бараками + слив по центру поля на малиновке" на 1-м левле, какой там еще "скилл" лишь бы не нубили по черному)...
Мне действительно много чего неизвестно про игру, ибо я недавно начал играть, а на высоких уровнях вообще не играл. Но тут как бы "закон сохранения". Если на низких средний игрок вообще дамажит выше среднего конкретно по этим низким, то где-то у этого среднего игрока должно и убыть, иначе он уже не средний, а выше среднего. Это сюда же:
Я не понимаю почему "средний игрок" должен иметь средний дамаг ниже "этого среднего" (из таблицы) на высоколевельной технике. А раз не понимаю, то и спрашиваю, почему Вы так думаете?

 

Не могу понять "мысли скачут как у женщины" у меня или у Вас? Но у кого то из нас точно "хотелка" превуалирует над разумом...
Я думаю мы всего лишь немного не понимаем друг друга. Просто есть куча разных "средних" с разным смыслом и не всегда ясно о чем речь.
Тогда держите пожалуйста "цель" перед собой, если не будете (в своих словах) от нее "отклоняться", то я не буду и "возвращаться".
Если кажется, что я от этого отклоняюсь, то это лишь кажется.
Неужели Вы сами серьезно полагаете, что когда Вы заходите в игру под твинком (seriy_ch), то у Вас вдруг внезапно и резко вырастает "скилл"?
Нет, конечно. Я в том числе и на примерах из этой темы высказывался, что неплохо бы порезать "этого меня". Но на самом деле скилл-то тот же, но оценка при этом иной должна быть иной, по крайней мере при нынешнем понимании принципов этой самой оценки. О чем это я... Мы сейчас полагаем, что вся техника равноправна и если ты играешь хорошо на свете- получи хороший рейтинг, играешь так же хорошо на арте- получи такой же хороший рейтинг на арте и т.д. А вот если игрок хорошо играет на одном типе техники и плохо на другом типе, как считать? Сейчас это все примерно пропорционально количеству боев на каждом типе. Сыграл ты 1000 боев на арте и 50 на остальном- тебя в основном по арте и оценит. Собственно если не учитывать показатели на отдельных танках, то по иному нельзя. Только если будут показатели на каждом танке, можно применить иной подход- считать, что игрок должен уметь играть на всем. И считать независимо скилл на каждом типе(как вариант каждом танке или каждом типе+уровне) а потом усреднять значение этих рейтингов, независимо от того, сколько на чем боев. Существующий подход обязан дать моему твинку оценку выше, ибо на арте я играю лучше других типов техники(хотя 33% на су-14 заставляют усомниться :-) ), а на твинке процент боев на арте гораздо выше. А вот второй подход в идеале даст равный рейтинг.
"Регион" в личку пожалуйста...
Я вроде давно отправил сообщение в личку.
Link to comment
Short link
Share on other sites

По новым данные некорректные, на них можно не смотреть.

Да хрен с ними с "новыми"...

А по "старым"?

Потом на топовой технике в большинстве случаев "средний дамаг" явно завышен, поэтому и разница с топовым столь смехотворна (неужели Вы поверите в то, что тот же "jage" набивает на топовой технике дамаг лишь чуть выше чем "среднестатистический Алешка"?).

Не смешите меня, на любом ТТ10 "среднестатистический Алешка" набивает где-то 1200-1300 дамага (я за последний год тысячи стат таких "Алешек" пресмотрел). Да и в "итоговой таблице боя" наблюдаю каждый день этот "средний дамаг" средних игроков на топах... Ну он реально другой (случаются "выхлесты", не спорю, но это один "выхлест" за 3000 дамага на 10 игроков на топах, он "погоды" в стате не делает, у меня тоже раз в десять боев и на 9-м левле бывают бои за 5к дамага, только "средний" от этого даже 2к не становится)!

А топовый на топовой технике? Я бы легко поверил, если бы этот "топ100 дамаг" был на уровне (мож и чуть меньше) того же Страйка (HeXecutor), а Вы посмотрите разницу в реалии, она ОГРОМНА!

 

Короче... я в трансе (выпить что ли с горя?)...

 

...

Существующий подход обязан дать моему твинку оценку выше, ибо на арте я играю лучше других типов техники(хотя 33% на су-14 заставляют усомниться :-) ), а на твинке процент боев на арте гораздо выше. А вот второй подход в идеале даст равный рейтинг.

По моему это и есть "главная цель" = давать "равный рейтинг" при одинаковом скилле? Или не так (я ошибаюсь)?
Link to comment
Short link
Share on other sites

выложил базу игроков в CSV: https://docs.google.com/file/d/0BzFz8iaChO72YWFKOVhUOFFIejQ/edit?usp=sharing (3GB)

Тут все игроки, которые есть в базе на текущий момент, без фильтрации. Завтра попробую очистить данные от мусора и оставить только игроков с количеством боев >= 1000 и танки с количеством боев >= level * 10. Если еще надо отфильтровать по времени (последняя неделя, последние 10 дней и т.д.), пишите, добавлю в фильтр.

 

З.Ы. В QlikView нормально загружается, 8ГБ памяти в принципе хватает для более-менее серьезной аналитики с этой базой. Главное не ошибаться в выборках, иначе система быстро входит в ступор по нехватке памяти.

 

З.Ы.Ы. Расшарил так же QlikView, чтобы не регаться на их сайте. https://docs.google.com/file/d/0BzFz8iaChO72cTRianRZdU14czQ/edit?usp=sharing Тут есть особенность - бесплатная версия позволяет открывать только свои же файлы. Файлы, созданные другой копией программы можно открыть только 4 раза.

Edited by sirmax
Link to comment
Short link
Share on other sites

согласно

...

Мда скромность ваша черта, примите поздравления.

Боюсь таки что Вы сильно преувеличиваете мои "заслуги" (в части скромности). Просто "среднестатистический Алешка" (который и должен, по идее давать нам "статистически средние" показатели ни разу не "средний игрок", это чисто "по опыту игры").

Реально "средний" должен играть существенно лучше, чем эти уважаемые "Алексы". Но это чисто мое мнение, а как и всякое мнение... грош ему цена... По этой "шкале" я игрок действительно "чуть выше среднего", это факт а не "скромность".

А по поводу рейтов это не ко мне, это к их создателям (которые не смогли "составить формулы" бол/мен отражающие реальный "скилл" игрока).

Вот я средний игрок.

На Кошке да, и по моей "шкале" это так, а вот на других танках (где у Вас больше 100 боев), не уверен. Как Вы сами то думаете, можно ли назвать игрока добившегося "среднего уровня игры" на одном танке просто "средним" (средним среди всех игроков сервера)?

Впрочем, не исключаю, что я "придираюсь" (не парьтесь зря). Ибо личные оценки хороши только для личного же применения ("оценивать" других на их основе дело глупое и неблагодарное). Так что оценка Вашей статы дело Ваше и только Ваше (т.е. Вам точно виднее).

 

выложил базу игроков в CSV: https://docs.google.com/file/d/0BzFz8iaChO72YWFKOVhUOFFIejQ/edit?usp=sharing (3GB)

Тут все игроки, которые есть в базе на текущий момент, без фильтрации. Завтра попробую очистить данные от мусора и оставить только игроков с количеством боев >= 1000 и танки с количеством боев >= level * 10. Если еще надо отфильтровать по времени (последняя неделя, последние 10 дней и т.д.), пишите, добавлю в фильтр.

...

Полагаю этого будет более чем достаточно (таблица должна "резко похудеть" вроде бы и стать более "адекватной").

Спасибо! Аналогично спасибо и за ссыль на КвикВью (уверен что пригодиться не раз). Попробую "поколдовать" на досуге, мож что путное и "выколдуется"...

Пока все очень трагично увы (увидел таблицу по ссылке seriych-а и ... впал в транс), оптимизм почти пропал совсем...

Link to comment
Short link
Share on other sites

Если еще надо отфильтровать по времени (последняя неделя, последние 10 дней и т.д.), пишите, добавлю в фильтр.
Обязательно. Появление в игре хотя бы раз за последний месяц можно отфильтровать?
Потом на топовой технике в большинстве случаев "средний дамаг" явно завышен, поэтому и разница с топовым столь смехотворна (неужели Вы поверите в то, что тот же "jage" набивает на топовой технике дамаг лишь чуть выше чем "среднестатистический Алешка"?). Не смешите меня, на любом ТТ10 "среднестатистический Алешка" набивает где-то 1200-1300 дамага (я за последний год тысячи стат таких "Алешек" пресмотрел). Да и в "итоговой таблице боя" наблюдаю каждый день этот "средний дамаг" средних игроков на топах... Ну он реально другой
Конкретно по jage- я так полагаю он в ротах очень много играет, а в сильной роте у сильного игрока дамаг будет значительно меньше, чем у него же в рандоме. В роте его сильные товарищи "отбирают" у него дамаг. Насколько сильно это влияет, не могу сказать, но причина может быть в этом. На не ротных тт10 у jage ситуация аналогичная? Просто я в этих танках разбираюсь чуть более, чем никак.

А глобально причина может быть в следующем: средний дамаг подсчитан по такой формуле (это предположение):

(d1+d2+...+dn)/(b1+b2+...+bn) , где di и bi - дамаг и количество боев i-того игрока.

то есть сумма всех дамагов на танке деленная на сумму всех боев на танке.

А надо по такой формуле (опять же, может по ней и считалось, я не в курсе):

(d1/b1 + d2/b2 + ... + dn/bn)/n

то есть среднее арифметическое дамагов всех игроков на этом танке.

@sirmax, ты по какой из формул считал в табличке?

 

По моему это и есть "главная цель" = давать "равный рейтинг" при одинаковом скилле? Или не так (я ошибаюсь)?
Ну я вроде обрисовал обе точки зрения и они обе имеют право на жизнь. Мне вторая тоже больше нравится, но во всех рейтингах применяется первая(хотя это автоматически следует из того, что разделения по танкам в существующих формулах нет).

танки с количеством боев >= level * 10
Думаю это тоже надо пересмотреть. В оценке конкретного игрока это может быть достаточно, но в табличку совать игрока с 10 боями на первом уровне мне кажется неправильно. Лучше для таблички сделать боев что-то вроде >= (50 + level * 5)
Link to comment
Short link
Share on other sites

Обязательно. Появление в игре хотя бы раз за последний месяц можно отфильтровать?

Ок, отфильтрую за месяц.

220k из 4.4 млн отсеялось

 

А глобально причина может быть в следующем: средний дамаг подсчитан по такой формуле (это предположение):

(d1+d2+...+dn)/(b1+b2+...+bn) , где di и bi - дамаг и количество боев i-того игрока.

то есть сумма всех дамагов на танке деленная на сумму всех боев на танке.

А надо по такой формуле (опять же, может по ней и считалось, я не в курсе):

(d1/b1 + d2/b2 + ... + dn/bn)/n

то есть среднее арифметическое дамагов всех игроков на этом танке.

@sirmax, ты по какой из формул считал в табличке?

По первой, так как по второй не было возможности. Сейчас через QlikView смогу пересчитать как угодно.

 

Думаю это тоже надо пересмотреть. В оценке конкретного игрока это может быть достаточно, но в табличку совать игрока с 10 боями на первом уровне мне кажется неправильно. Лучше для таблички сделать боев что-то вроде >= (50 + level * 5)

Давай сначала базу подготовлю с level*10, а там уже посмотрим, может и отфильтруем еще больше.

Вот количество отсеянных танков:

 

sqlite> select count(*) from v;

292745333

sqlite> select count(*) from v where vbattles < 10 * vlevel;

144193022

sqlite> select count(*) from v where vbattles < (50 + 5 * vlevel);

199746241

 

P.S. SQLite не хватает памяти на удаление. :) Эх, придется все-таки на сервак заливать.

Link to comment
Short link
Share on other sites

Тут (находясь в трансе) долго думал о том, какой примерно должен быть "средний дамаг" на топовой технике (в боях 10+ левла):

Мысль была такая - Не "ворую" ли я (как игрок "чуть выше среднего") дамаг у "среднестатистических алешек"?

Ну суть в том, что когда они играют PvP без меня, то они пусть и дольше и с большими потерями в команде но так или иначе должны же примерно в 50% боев "перепукать" всех противников, а я вмешиваюсь в это "единоборство Алешек" и... отбираю у них их "возможный дамаг" (как у своих, так и у танков противника), поэтому в боях с моим участием у них он ниже, чем когда они "месят" друг друга без моего участия.  Поэтому я и вижу такой низкий "средний дамаг" (т.е. мой "взгляд" не объективен получается)...

Хотя с другой стороны, активно уничтожая противников и "запугивая" их своим дамагом я тем самым сберегаю ХП союзников и позволяю им сделать 1-2 лишних результативных выстрела, что по идее должно наоборот помогать им "набивать" больший дамаг, чем без меня. Но тем еще сильнее падает средний дамаг в команде противника. Так что опять получается что я могу "воровать дамаг", только теперь уже у команды противника. Т.е. "средний" в моем присутствии тоже как бы должен казаться мне "заниженным"...

 

Решил пойти другим путем (в раздумьях) и... вовсе исключить "себя любимого" из рассуждений (ибо путь тупиковый, я не смог бы все равно "вычислить" даже примерную величину "уворованного дамага").

 

Бой заканчивается либо "уничтожением всех" либо "захватом" либо "ничьей".

1. При "уничтожении всех" и победе средний дамаг равен сумме ХП танков противника / 15 (это "теоретический максимум" среднего дамага).

2. При победном захвате он меньше п.1 (в среднем он 2/3 примерно, это "по опыту"). При ничьей примерно также (но ничьих примерно 2%, они "погоды не делают").

3. При поражении "уничтоженим всех союзников" средний дамаг в проигравшей команде еще меньше (в среднем он 3/5 примерно, это "по опыту").

4. При поражении захватом базы ситуация примерно такая же (в среднем), как и в п.3.

 

Получается что при победе средний дамаг должен быть где-то в районе 4/5 от "теоретического" (см. п1 и п2).

При поражении он где-то 3/5 от "теоретического".  В среднем будем считать что число побед и поражений равно (отбросим ничьи которых всего 2% и они погоды не делают). Тогда средний дамаг получается примерно 70% от "теоретического" (сумма ХП всей команды противника деленная на 15).

 

Какова же величина "теоретического"?

Сейчас в боях высоких левлов в рандоме аномально много арты и света (в среднем это три арты, светляк, четыре СТ, пара ПТ и пять тяжей, обычно это Т100Е5 и Ис-7, т.е. "популярные").

Получается примерно столько в среднем ХП на команду: 3*520+600+4*1950+2*2100+5*2300 (я здесь взял даже ХП чуть больше, чем реально). Итого = 25660 ХП.

Поделим его на 14 (будем считать что светляк дамагу не нанес вовсе) ~ 1850 ХП это "теоретический средний".  В ротах и на ГК ХП команд и "теоретический средний" меньше вроде бы быть не должны (там не такие уродливые сетапы). Но число этих боев не более 5% от общего (так что они тоже погоды не делают).

Учтите также то, что топы в рандоме попадают в бои и 10-11 левлов, где ХП в команде еще меньше (значит полученная нами "оценка" будет априори завышенной!)

 

Какой же выходит из этих рассуждений ожидаемый "средний дамаг на топах"?

Тут все уже просто = 0,7*"теоретический" = 0,7*1850 = 1295 ХП.

Что, кстати, совпадает полностью с моими "собственными наблюдениями" (по факту и опыту как игры, так и анализа тысяч стат за последний год).

 

У нас есть в таблице хоть один топовый танк с таким "средним дамагом"???  -  НЕТ!  У всех выше и намного!

Ужос...

Вывод: явно в таблице средний дамаг на топах завышен и сильно.  Почему?  Я не знаю пока (надо думать и анализировать)...

Edited by SageSer
Link to comment
Short link
Share on other sites

Почему? Я не знаю пока (надо думать и анализировать)...

Дак вот жеж ответ:

 

глобально причина может быть в следующем: средний дамаг подсчитан по такой формуле (это предположение):

(d1+d2+...+dn)/(b1+b2+...+bn) , где di и bi - дамаг и количество боев i-того игрока.

то есть сумма всех дамагов на танке деленная на сумму всех боев на танке.

А надо по такой формуле (опять же, может по ней и считалось, я не в курсе):

(d1/b1 + d2/b2 + ... + dn/bn)/n

то есть среднее арифметическое дамагов всех игроков на этом танке.

sirmax, ты по какой из формул считал в табличке?

По первой

Пусть у нас всего два игрока имеют бои на маусе. Один провел 1000 боев на нем со средним дамагом 2000, другой 100 боев со средним дамагом 1000. Первая формула(по которой оказывается делалась табличка) даст дамаг (2000*1000+1000*100)/(1000+100) = 1909. Вторая (по которой надо считать) даст (2000+1000)/2=1500.

Edited by seriych
Link to comment
Short link
Share on other sites

Ок, отфильтрую за месяц.

220k из 4.4 млн отсеялось

 

По первой, так как по второй не было возможности. Сейчас через QlikView смогу пересчитать как угодно.

 

Давай сначала базу подготовлю с level*10, а там уже посмотрим, может и отфильтруем еще больше.

Вот количество отсеянных танков:

 

sqlite> select count(*) from v;

292745333

sqlite> select count(*) from v where vbattles < 10 * vlevel;

144193022

sqlite> select count(*) from v where vbattles < (50 + 5 * vlevel);

199746241

 

P.S. SQLite не хватает памяти на удаление. :) Эх, придется все-таки на сервак заливать.

Sirmax выложи пожалуйста "отсеянную" базу куда нибудь. Хочу тоже попробовать поколдовать с ней (увы, пока чем больше анализирую и размышляю тем больше прихожу в "ужос")...

 

Дак вот жеж ответ:

 

Пусть у нас всего два игрока имеют бои на маусе. Один провел 1000 боев на нем со средним дамагом 2000, другой 100 боев со средним дамагом 1000. Первая формула(по которой оказывается делалась табличка) даст дамаг (2000*1000+1000*100)/(1000+100) = 1909. Вторая (по которой надо считать) даст (2000+1000)/2=1500.

Если так, то вполне возможно, хотя "правильный средний" как раз и будет 1909 в описанном Вами случае (это так, для справки)... В реалии (рандома) "средний дамаг" набивают как раз "Алешки", а не "папки" (их число боев несоизмеримо больше, чем у "папок", т.е. Ваш пример надо приводить "наоборот" 1000 боев с 1000 дамага у одного и 100 боев с 2000 дамага у другого, это ближе к реалиям, но тогда и "средний" получится по первой формуле не 1909, а всего 1090).

Но боюсь что считали все же "правильно" и дело в неверной выборке или условиях расчета или еще в чем-то, что я не учитываю...

С "максимальным" тоже не все "гладко" по ходу, это тоже наводит на нехорошие мысли...

 

Так для справки, как я думаю правильно надо считать средний и топовый дамаги для "экспертной таблицы":

1. Средний как сумму всего нанесенного игроками дамага на данном танке по серверу (никого не "отбрасывая") деленная на общее число боев на этом танке на сервере. Это будет 100% релевантная цифирь.

2. Топовый (так называемый топ-100). Брать тупо дамаг 100-го по дамагу нехорошо (он может быть совсем не показательным, случайным).

Сначала выбираем игроков с максимальным дамагом (он средний дамаг на акке этих "чемпионов" по танку) на каждом танке и сортируем их по убыванию дамага (первых 200 по дамагу, далее "отсекаем").

Можно было бы тупо просуммировать дамаги по этим 200 игроков и поделить затем на 200 (получили бы среднестатистический топ-100). НО! Если мало игроков играло на этих танках или есть большие перекосы в числе боев среди "чемпионов", то "цифирь" получится существенно липовой (у популярных топовый дамаг будет завышен, а у не популярных - занижен и сильно), увы...

Как это исправить?

Методика (мысли) такая примерно (суть в том, чтобы "топовый" расчитывался исходя из равного % "чемпионов" для каждого танка, для "популярных" это будет средний дамаг первых 200 по дамагу, а для не популярных средний дамаг из меньшей выборки, пропорциональной этой самой "не популярности"):

 

Далее считаем общее число боев на танке по серверу и число игроков на этом танке. Отбираем самый "популярный" (для каждого левла и типа техники отдельно!). Например, получилось 10 млн боев и 50000 игроков на самом популярном танке (обозначим его Pt). Далее по каждому танку считаем его "коэффициент не популярности" (Kp), как среднее между отношением числа боев на текущем (обозначим его Tt) к "популярному" (Pt) = Tt/Pt и отношением числа игроков на этих танках = Ti/Pi. Получится так Kp = (Tt/Pt + Ti/Pi)/2. Далее умножаем этот Kp на 200 (число выбоки игроков-чемпионов по самому популярному танку) и получаем количество игроков-чемпионов (Ni) по текущему танку, но если получилась цифра меньше 20 игроков, то принудительно ставим 20 (иначе по некоторым танкам мы будем получать еще более некорректные данные, чем ранее). По этой выборке и считаем "топ-100" как сумму дамагов первых Ni из выборки топовых деленную на Ni.

Edited by SageSer
Link to comment
Short link
Share on other sites

Sirmax выложи пожалуйста "отсеянную" базу куда нибудь. Хочу тоже попробовать поколдовать с ней (увы, пока чем больше анализирую и размышляю тем больше прихожу в "ужос")...

Конечно выложу, она как раз и будет основной, от которой мы все остальное считать будем.

Link to comment
Short link
Share on other sites

Конечно выложу, она как раз и будет основной, от которой мы все остальное считать будем.

Боюсь что после "отсева" мы можем получить неверные данные в "экспертной таблице"... Поэтому сейчас качаю полную, во избежание таких ошибок...

Попробую "залить" ее как нибудь в 1С или же Акцес (чтобы привычными мне методами сделать репрезентативные выборки для экспертной таблицы).

Link to comment
Short link
Share on other sites

Боюсь что после "отсева" мы можем получить неверные данные в "экспертной таблице"... Поэтому сейчас качаю полную, во избежание таких ошибок...

Попробую "залить" ее как нибудь в 1С или же Акцес (чтобы привычными мне методами сделать репрезентативные выборки для экспертной таблицы).

Access умирает, проверено. :)

SQLite справляется.

Link to comment
Short link
Share on other sites

Выложил очищенные данные (как зальется, дам ссылки).

 

1. players.tar.bz2 - данные в CSV по состоянию на 22.03.2013, за период 30 дней.

Данные содержат игроков с общим кол-вом боев >= 1000, и технику с боями >= 10 * уровень танка

В архиве папка data с 4 файлами:

_vinfo.csv - данные по технике (уровень, хп и т.д.) - просто справочник

_vtop.csv - данные по топовой технике. Подробней распишу позже, тут есть с чем поиграться.

_global.csv - общие данные по игрокам

_vehicle.csv - данные по технике (ключ - playerId, vehicleName)

 

Так же выложил пару полезных архивов:

 

2. soft.zip - софт для анализа:

  • QlikViewDesktop_x64Setup.exe - инсталлятор QlikView
  • Spravochnoe_rukovodstvo_po_QlikView.pdf - дока по QlikView на русском.

3. scripts.zip - вспомогательные скрипты и шаблоны:

  • players.qvw - шаблон для QlikView (пока еще не полный, но для начала сойдет)
  • qv-load.qvs - скрипт загрузки данных в QlikView

 

 

P.S. QlikView - мощная штука. Практически любая аналитика на лету. Графики, таблицы, все что хочешь, в любом измерении, с любыми выборками. Начинаю понимать что знаний по математике не хватает, долго приходится въезжать в некоторые функции.

Edited by sirmax
Link to comment
Short link
Share on other sites

Выложил очищенные данные (как зальется, дам ссылки).

...

У меня дела куда хуже...

Дома не вышло ничего, комп слабоват.

Вышел сегодня после болезни на работу, залил базу (полную) на сервак. Начал делать конфу в 1С для заливки базы. Большего не удалось, работы накопилось по уши...

Думаю дня два уйдет пока получу базу для анализа в 1С. Даже на работе Эксель ее не берет с сервака, "посылает", придется грузить напрямую как из текстового файла...

Дальше будет проще (как только загружу).

Link to comment
Short link
Share on other sites

Выложу отдельно файл c топовыми данными. Думаю, интересно будет его проанализировать.

В нем собраны данные по топ-200 показателям в разрезе игровых серверов.

Колонки:

region - игровой регион. G (общий по всем), RU, EU, US, SEA.

vn - название танка

topR - топовый процент побед

topD- топовый дамаг

topE- топовый удельный дамаг

topF- топовые фраги

topS- топовый засвет

topU- топовая выживаемость.

 

Интересно проверить, разумно ли выбрано значение 100-го игрока для определения максимума.

Так же в архив включен файл с данными по танку (vn;level;class;hp;premium;nation;vname), можно проанализировать в разрезе уровня, класса танка и т.д.



В общем, проанализировав топов, могу сказать, что 100-й с конца вполне оправдан. Аномалии встречаются только в последних 10-20 значений, а дальше идет равномерное снижение.

_vtop.csv.7z

Link to comment
Short link
Share on other sites

На основе:

http://code.google.com/p/wot-xvm/source/browse/trunk/src/xvm/src/wot/utils/VehicleInfoDataAvg.as

и http://code.google.com/p/wot-xvm/source/browse/trunk/src/xvm/src/wot/utils/VehicleInfoDataTop.as

Сделал новую табличку:

https://docs.google.com/spreadsheet/ccc?key=0AmxWwjNALiQkdHA4R3EwRENjVXE4VnRfQUNyd0RhOHc&usp=sharing

Что-то мне некоторые данные опять не нравятся. T34- топовый дамаг 4400, второй в игре после T30? О_о

 

@sirmax, Может всеже стоит брать не фиксированное число 100, а фиксированный процент игроков? 0,1% или что-то типа того.

Edited by seriych
Link to comment
Short link
Share on other sites

Сделал новую табличку

Сортировки запили, неудобно.

 

фиксированный процент игроков

Будет точнее, ага. Только название не будет ТОП100.

Link to comment
Short link
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.
Note: Your post will require moderator approval before it will be visible.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...