Jump to content
Korean Random

antey007

User
  • Posts

    10
  • Joined

  • Last visited

Reputation

1 Noob

Contacts

  • Nick
    antey007
  1. Да, влияние этого урезания будет всего 9% (440 вместо 480). Зато если в команде 5 игроков с 50 и 1 игрок с 230, то влияние урезания будет значительно выше - 31% (365 вместо 480).
  2. А что, если при вычислении суммарной эффективности команды учитывать самого сильного игрока с коэффициентом 0,5. Назвать это "один в поле не воин". Влияние сильных взводов практически полностью сохранится . Навела меня на эту мысль система подсчета баллов в фигурном катании и других видах спорта, где максимальные и минимальные оценки отбрасываются. В нашем случае отбрасывать нельзя, но вот понизить влияние можно.
  3. Хороший вопрос. Известно, что коэффициент корреляции не зависит от масштаба сравниваемых случайных величин. Например, можно ввести обозначение {победа, ничья, поражение} как {1,0,-1}, а можно и {1, 0.5, 0}. Коэффициент корреляции не изменится. Аналогично и прогноз можно масштабировать, например в виде Y = 50% + K*(X-50%). Но я в своих расчетах масштабировал не прогноз, а истинную вероятность победы. Меняются, можно сказать, условия проведения эксперимента. Так, при разбросе 0-100 результат части битв "предопределён". В первом из 100 боёв почти наверняка (99%) победит команда 1, а в последнем - команда 2. При разбросе 25-75 такой несправедливости нет. Минимальный шанс победы - 25%. Можно сказать, что влияние случайности в процессе боя выше, чем влияние состава команд. А раз состав команд влияет меньше, то и корреляция меньше. А поскольку функцию прогноза я считаю идеальной, точно отражающей истинную вероятность победы, то и прогноз сжимается в 2 раза вместе с истинной вероятностью.
  4. Напиши, что непонятно. Попробую объяснить. Мне нужно уметь объяснять, для начала хотя бы в форумной переписке. Как я уже писал, растяжение не влияет на коэффициент корреляции. Так в том-то и дело, что никто не имеет. Этот вопрос я бы сформулировал иначе. В таком, философском смысле: Что сильнее влияет на исход боя: состав команд (скилл игроков, вид и комплектация техники, экипаж), или случайности в процессе боя (не только ВБР в виде рикошетов, непробитий, критов, но и непредсказуемые решения игроков "буду дефить" или "поеду светить" - ведь даже самые сильные игроки иногда совершают глупые ошибки, плюс падения ФПС, рост пинга, отвлекающие телефонные звонки и т.п.)??? Не конкретно "в этом бою мне (не) повезло", а глобально. На этот вопрос вряд ли получится ответить строго, например "влияние случайностей в 2,5 раза выше влияния состава команд", но вот оценить можно. Вот и пытаюсь я сравнить величину корреляции с некоторыми эталонными значениями, полученными на "далекой от реальности модели".
  5. Корреляция отлично работает с нормальными распределениями. Я думаю об значениях. Например, величина корреляции 0,442 - это много или мало? Можно ли придумать формулу, дающую бОльшую корреляцию? Или же коллеги вплотную приблизились к тому значению, которое зависит от балансера? А остальная вероятность победы зависит уже исключительно от рандома во время боя? Для этого я и считаю корреляцию результатов с "идеальной" формулой. Даже, правильнее сказать, с истинной вероятностью победы. Считаю аналитически, карандашом на бумаге. С равномерным распределением получилось. А с нормальным распределением не получается. Придется использовать метод Монте-Карло. Смоделировать тысячу раз выборку из 180 битв, посчитать тысячу значений корреляции, определить среднее значение корреляции, её дисперсию, доверительный интервал.... Сделаю - отпишусь. Я сделал проверку гипотез о нормальном распределении с помощью критерия Пирсона. 4 формулы - 4 распределения - 4 гипотезы. Результат проверки: распределения с высокой степенью достоверности можно считать нормальными.
  6. Согласен на 110%. Просто этот вариант наиболее прост и понятен, хоть и не похож на действительность. Можно рассмотреть другую идеальную функцию. Идеальную в том смысле, что вероятность победы в каждой битве независима и равна прогнозу. А прогнозы равномерно распределены во вдвое меньшем диапазоне: 25 - 75%. Такое сужение диапазона означает примерно: "рандом в процессе боя (рикошеты, непробития) влияет сильнее на победу, чем рандом балансера (состав команд)". Корреляция в этом случае имеет значение в 2 раза меньше: 1/sqrt(12) = 0.289. Посчитать аналитически корреляцию для неравномерного, например, нормального, распределения - пока не могу.
  7. (тихо ворчит) Ну вот, пришлось версию экселя обновлять ради этого файла. У тебя там зависимость от дисперсии прогнозов стоит... Неплохо... Может ты и прав... В статистике, как в философии, у каждого исследователя свои методы и свои результаты, и каждый по-своему прав. Могу посоветовать попробовать использовать не весовую, а интегральную функцию нормального распределения. Либо целиком - тогда она будет симметрична относительно 50%, а сумма постоянна, либо половину - тогда сумма будет выгнута вниз. Сам я считаю, что наилучший способ проверить работу формулы - это определить корреляцию прогнозов с итогами боёв. Корреляция широко известна, хорошо описана, много где реализована (в т.ч. в любимом нами экселе). Она не зависит от смещения и масштабирования, то есть на неё не влияют средний процент побед и коэффициент растяжения формул. По результатам 180 битв получаются следующие значения корреляции: Ф1: 0,230; Ф2: 0,442; Ф3: 0,279; Ф4: 0,368. Вторая формула неплохо опережает все остальные. UPD. Для сравнения: рассмотрим идеальную функцию. Прогнозы равномерно распределены в диапазоне 0 - 100%. Вероятность победы в каждой битве независима и равна прогнозу. Корреляция имеет значение 1/sqrt(3) = 0.577.
  8. seriych, я проанализировал твой метод раздачи баллов. Он, мягко говоря, несовершенен. Я могу придумать такую функцию прогноза результата боя, которая, если использовать только твои баллы, как Тузик грелку рвёт все 4 остальные известные функции. И эта функция - "100%". Просто, тупо, всегда выдавать прогноз "вы победите". Посчитаем баллы по твоему методу. За каждую победу, а их 102, эта функция получит по 1 баллу, да еще по чуть-чуть за каждую ничью и поражение. Всего функция "100%" получит более 102 баллов, а это больше, чем 4 известные функции (55,9 - 66,6 или 76,8 - 85,5 в зависимости от параметров). Причина - это форма черной кривой на твоих графиках. Она имеет максимумы в 0 и 100%, поэтому любая функция прогнозов, выдающая всегда граничные значения будет зарабатывать больше баллов, чем функция, выдающая промежуточные значения. Чтобы избавить твой метод раздачи баллов от этой ошибки, нужно использовать такие функции, которые будут давать постоянную сумму на всем диапазоне 0-100. Частный случай - линейная зависимость баллов от прогноза.
  9. Среднее значение прогнозов должно быть равно 50% в среднем по всем игрокам. У людей, использующих xvm и читающих этот форум, среднее значение прогнозов, как и средний процент побед, будет больше и составит порядка 51%-55% без растяжения. С растяжением - еще больше, от 55% до 60%. Насчет нормального распределения я, наверное, был неправ. Это совсем не обязательно. Формула прогнозов может выдавать и равномерное распределение. Придумал простой и изящный способ оценки формул. Надо сравнить среднее значение прогнозов, выданных формулой перед победами, со средним значением прогнозов, выданных перед поражениями. Идеальная формула перед победами будет выдавать числа, в среднем порядка 60-70%. А перед поражениями - 30-40%. Можно показать, что в случае равномерного распределения прогнозов в диапазоне от 0 до 100% среднее значение победных прогнозов составит 66,6%, а прогнозов перед поражениями - 33,3%. Разница между средними - 33,3%. А гипотетическая формула, выдающая абсолютно рандомный, не зависящий от участников боя, прогноз, будет иметь среднее значение прогнозов 50% и для побед, и для поражений. Применил этот метод к данным из вложения к посту #157. Результаты удивили. Формула Ф1 - среднее прогнозов по всем боям - 58,24%. Среднее по всем победным боям - 58,75%. Среднее по всем проигранным боям - 57,70%. Средние почти одинаковые, в пределах статистической погрешности! Формула совершенно не работает. Аналогично и формулы 2 и 3. Ф2: Среднее по всем победным боям - 57,76%. Среднее по всем проигранным боям - 58,92%. Ф3: Среднее по всем победным боям - 51,35%. Среднее по всем проигранным боям - 50,99%. А вот формула 4 приятно порадовала. Среднее по всем победным боям - 58,97%. Среднее по всем проигранным боям - 48,78%. Разница между средними - 10%, что в 3 раза меньше аналогичной разницы у идеальной функции, но это все равно очень хороший результат. При этом среднее по всем боям равно 54,04%, что близко к общему проценту побед товарища nemoW. ЗЫ. Надеюсь, я не перепутал значения результатов боя. 1 - это "победа", а 2 - это "поражение".
  10. Коллеги, разрешите влить свежую порцию соображений. Попробую понять постановку задачи: Есть несколько (пока 4) различных формул. Надо 1) выбрать из них самую правильную, 2) разработать методику оценки правильности формул. Если вторая задача решена, то решить первую - элементарное дело: просто сравнить 4 числа. Поэтому в дальнейшем решаю только вторую задачу. Как мне кажется, формула должна удовлетворять нескольким базовым условиям: 1) Её среднее значение (M) должно равняться 50%. Это, наверное, все подразумевают, но никто не проверял. Предлагаю проверить все 4 формулы и убедиться, что это так. Иначе это будет означать, что формула постоянно завышает/занижает шансы. Строгое равенство 50% невозможно и не обязательно, среднее должно попадать в некий диапазон, о котором позже (вероятно, завтра). 2) Её СКО (среднеквадратическое отклонение, S) должно равняться какой-то константе, например, 20%. Для этого нужна нормализация со значениями, указанными в посте #152. 3) Формула должна давать результаты, близкие к нормальному распределению. То есть на 100 боев она должна выдать: 19 прогнозов в диапазоне от M до M+0.5S (50% - 60%) 15 прогнозов в диапазоне от M+0.5S до M+S (60% - 70%) 9 прогнозов в диапазоне от M+S до M+1.5S (70% - 80%) 5 прогнозов в диапазоне от M+1.5S до M+2S (80% - 90%) 2 прогноза свыше 90% И симметрично от 0% до 50% Извините, рабочий день закончился, пора домой, продолжу излагать мысли завтра - а мыслей еще очень много.
×
×
  • Create New...