AI Arena é um game sofisticado que integra técnicas avançadas de machine learning para treinar e otimizar modelos de lutadores. Os players podem escolher entre diferentes tipos de modelos, cada um oferecendo vantagens e desafios únicos. O game foca na coleta e processamento estratégico de dados para melhorar a performance do lutador, sendo essencial que os players entendam e utilizem as várias configurações e modos disponíveis.
Tivemos a oportunidade de bater um papo com o vencedor do All-Star Invitational e representante da G3, Ixtlanian, para um guia completo de AI Arena sobre como se tornar um pro player e quais são os fundamentos que você precisa dominar antes de subir o nível do seu game. Este é o primeiro guia da nossa série, e vamos focar em apresentar o modelo Avançado para novos players.
Modelos de Lutadores
No AI Arena, existem três tipos de modelos de lutadores disponíveis:
- Simples - Ideal para iniciantes e bem popular, mas tem limitações que impedem a competição de alto nível.
- Original - Utiliza machine learning e ferramentas sofisticadas para ajustes finos, mas a gameplay pode ser bem desafiadora. Por exemplo, demonstrar uma ação em uma parte do mapa pode afetar o comportamento em outro lugar de forma imprevisível. Este modelo é o menos popular.
- Avançado - Combina as melhores features dos dois primeiros modelos, permitindo edições isoladas de zonas sem afetar o resto, e oferece configurações avançadas para converter dados subótimos em material de treino útil. Este modelo é o preferido dos top players e será o foco aqui.
Escolhendo o Modelo Avançado
Selecione o modelo "Avançado" antes de começar seu treino para usar este guia. Ative a caixa "Exponential Memory Updating" para sessões de treino recentes mais eficazes, o que é ideal para mudanças significativas no comportamento do seu lutador.
Processo de Coleta de Dados
O canal oficial do game no YouTube oferece vídeos extensos sobre coleta de dados. Aqui estão algumas dicas diretamente do Ixtlanian:
- Minimize Slots de Informação Vazios: Diminua a pausa entre apertar o botão de coleta de dados e realizar uma ação para aumentar a eficiência do treino.
- Evite Ações Desnecessárias: Garanta que as ações sejam claras e isoladas em cada situação durante a coleta de dados.

Processamento de Dados
Vamos focar nas configurações avançadas em vez das simples. Consulte o tutorial no canto superior esquerdo para explicações detalhadas de configurações como “Epochs”, “Batch Size”, “Learning Rate” e “Direction and Action Lambda”.
Dicas para quem já está familiarizado com o tutorial:
- Configurações de Mudança Máxima: Use valores máximos para “Epochs” e “Learning Rate” combinados com valores mínimos para “Batch Size” e “Direction and Action Lambda” para as sessões de treino iniciais, a fim de estabelecer um comportamento básico.
- Proteja Dados Existentes: Use valores máximos de “Direction and Action Lambda” para proteger dados existentes, reduzindo os valores de “Epochs” e “Learning Rate” para as mudanças desejadas, mantendo o progresso atual.
- Remover Esparsidade: Ativar a caixa “Remove Sparsity” remove a maioria das células de informação vazias, tornando o treino mais eficaz. Isso é usado 95% do tempo.
- Oversampling: Ajuda os lutadores a distinguir e memorizar diferentes posições e direções, reagindo com mais precisão às ações inimigas. Este modo é frequentemente usado no treino inicial para estabelecer as bases.
- Multi-Stream: Aumenta proporcionalmente a chance de aplicar ações e direções existentes se confirmadas no treino atual. No entanto, pode afetar negativamente outras ações se um treino intensivo para novas ações for aplicado.
Buckets
Os Buckets são divididos em duas categorias: “On Ground” (No Chão) e “In Air” (No Ar). As ações mostradas em uma categoria não afetam as da outra, a menos que selecionadas. Esse isolamento é uma vantagem significativa do modelo avançado, preferido pelos top players.
Buckets No Chão
- Projectile Active: Ativado apenas quando habilidades especiais são usadas e somente enquanto seu lutador está no chão.
- Opponent Stunned e Opponent Knockback: Acionados quando o oponente está atordoado ou derrubado, respectivamente.
- Opponent Active: Usado em todos os outros casos quando seu lutador está no chão, incluindo todas as opções até que o oponente seja atordoado ou derrubado.
Buckets No Ar
- Near Blast Zone, Safe Zone, Under Stage, Side Of Stage: Dividem o espaço aéreo em zonas onde seu lutador está localizado. Essas zonas são treinadas isoladamente umas das outras.
Configurações de Foco no AI Arena
Depois de selecionar os BUCKETS nos quais fazer as mudanças, passamos para o que nosso lutador deve enfatizar. A maioria deles também é descrita no Tutorial dentro do game, mas vamos focar nos mais usados e dar dicas de como eles funcionam em diferentes combinações.
- Your Actions - Essa configuração memoriza as ações anteriores do seu lutador e permite construir uma sequência de ações. Por exemplo, você pode treinar seu lutador para executar um chute na cabeça após um uppercut. É raramente usada, principalmente nas sessões de treino finais.
- Opponent Actions - Essa configuração permite que seu lutador vincule suas ações às ações do oponente. Por exemplo, seu lutador pode levantar um escudo quando o inimigo ataca ou agarrar o inimigo quando ele está com o escudo. É quase sempre usada no treino de chão desde o início.
- Your Positioning - Isso ajuda seu lutador a entender sua localização no espaço para usar as direções ou ações corretas. É sempre usado para retornar à plataforma de "Side Of Stage" e "Near Blast Zone" e raramente é usado no chão.
- Opponent Positioning - Isso permite que seu lutador entenda a localização do oponente no espaço. É raramente usado no meta atual, mas pode ser experimentado.
- Your Direction - Isso considera para onde seu lutador está olhando em relação ao inimigo. É quase sempre usado no chão e na “Safe Zone” para perseguir o inimigo e determinar se o lutador está de frente para o inimigo ou de costas para ele. É frequentemente usado em conjunto com "Angle to Opponent" e não é usado para retornar à plataforma de "Side Of Stage" e "Near Blast Zone". Dica: Use isso para agarrar um inimigo apenas quando você estiver de frente para ele ou para fazer um uppercut.
- Opponent Direction - Isso considera para onde o inimigo está olhando, como para bloquear apenas quando ele ataca na sua direção. É usado em combinação com "Angle to Opponent".
- Angle to Opponent - Isso determina a posição do seu lutador em relação ao inimigo e é usado sempre que as ações são orientadas para o inimigo, na maioria das vezes em conjunto com "Your Direction".
- Recoveries Remaining - Essa configuração é usada apenas para retornar de "Side Of Stage" e "Near Blast Zone". Ajuda seu lutador a entender quais técnicas ele já usou para retornar, aumentando a probabilidade de usar outras técnicas para um retorno bem-sucedido.
- Discrete Distance - Isso ajuda seu lutador a entender se está perto ou longe do inimigo, crucial para o combate vertical no ar e todo o combate no chão. É sempre usado no treino.
- Proximity to Edge - Isso ajuda seu lutador a entender se está na beira da plataforma ou no meio, introduzindo variedade no comportamento. É muito importante dominar e é usado apenas enquanto está no chão, frequentemente em combinação com "Discrete Distance", "Angle to Opponent" e "Your Direction".
- Opponent Off Stage - Isso permite que seu lutador perceba quando o inimigo está fora da plataforma para defender eficazmente a borda e impedir o retorno do inimigo. É muito importante dominar e é usado apenas enquanto seu lutador está no chão, frequentemente em combinação com "Discrete Distance", "Angle to Opponent" e "Your Direction".

Dicas Pro do Ixtlanian
Para criar um lutador adaptável e imprevisível, use várias combinações de foco para ensinar comportamentos específicos em resposta a diferentes ações do oponente. Essa abordagem garante que seu lutador possa reagir de forma rápida e precisa aos movimentos do oponente, evitando a previsibilidade e se tornando mais versátil em situações de combate.
Planeje cuidadosamente suas sessões de treino, determinando as habilidades específicas que você quer que seu lutador aprenda. Demonstre essas ações durante o treino e processe os dados com configurações que otimizarão sua eficácia. Por exemplo, se você quer ensinar seu lutador a fazer um uppercut ou flipkick no ar a curta distância e a pular para perto para um soco a longa distância, você deve selecionar "Your Direction", "Angle to Opponent" e "Discrete Distance". Essas configurações ajudam seu lutador a entender a direção do seu olhar, seu ângulo em relação ao inimigo e a distância entre eles.
Finalmente, sempre experimente e itere. Se os resultados de uma sessão de treino não forem satisfatórios, não salve os dados. Em vez disso, identifique o que deu errado, faça os ajustes necessários no treino ou no processamento de dados e tente novamente. Esse processo iterativo vai melhorar suas sessões de treino ao longo do tempo, resultando em um lutador com tempo de reação e relevância superiores.

