AI Arena是一款复杂的游戏,它集成了先进的机器学习技术来训练和优化斗士模型。玩家可以在不同的模型类型之间进行选择,每种类型都提供独特的优势和挑战。游戏强调战略性数据收集和处理以提升斗士性能,因此玩家理解和利用各种可用设置和模式至关重要。
我们有幸采访了全明星邀请赛冠军和G3代表Ixtlanian,他为我们提供了完整的AI Arena攻略,讲述了如何成为一名职业玩家以及在提升游戏水平之前需要掌握哪些要点。这是我们系列攻略的第一部分,我们将重点向新玩家介绍高级模型。
斗士模型
在AI Arena中,有三种斗士模型可供选择:
- 简单模型 - 适合新手玩家,非常受欢迎,但存在限制,无法进行高水平竞技。
- 原始模型 - 利用机器学习和复杂工具进行微调,但游戏玩法可能非常具有挑战性。例如,在地图的一个区域演示一个动作可能会不可预测地影响其他区域的行为。这种模型最不受欢迎。
- 高级模型 - 结合了前两种模型的最佳特性,允许进行隔离区域编辑而不影响其他部分,并提供高级设置将次优数据转换为有用的训练材料。这种模型受到顶尖玩家的青睐,将是本文的重点。
选择高级模型
在开始训练之前选择“高级”模型以利用本攻略。勾选“指数记忆更新”复选框,以实现更有效的近期训练会话,这适用于对斗士行为进行重大更改。
数据收集过程
游戏的官方YouTube频道提供了大量关于数据收集的视频。以下是Ixtlanian直接提供的提示:
- 最小化空信息槽:缩短按下数据收集按钮和执行动作之间的暂停时间,以提高训练效率。
- 避免不必要的动作:确保在数据收集过程中,每个情境下的动作都清晰且独立。

数据处理
我们将重点关注高级设置而非简单设置。有关“Epochs”、“Batch Size”、“Learning Rate”以及“Direction and Action Lambda”等设置的详细解释,请参阅左上角的教程。
熟悉教程的玩家提示:
- 最大更改设置:在初始训练会话中,使用“Epochs”和“Learning Rate”的最大值,结合“Batch Size”和“Direction and Action Lambda”的最小值,以建立基本行为。
- 保护现有数据:使用最大“Direction and Action Lambda”值来保护现有数据,同时减少“Epochs”和“Learning Rate”值以实现所需更改,并保持当前进度。
- 移除稀疏性:启用“移除稀疏性”复选框可以移除大部分空信息单元格,使训练更有效。这在95%的情况下都会使用。
- 过采样:帮助斗士区分和记忆不同的位置和方向,更精确地响应敌人的动作。此模式通常用于初始训练以奠定基础。
- 多流:如果当前训练中确认,按比例增加应用现有动作和方向的机会。但是,如果对新动作进行密集训练,可能会对其他动作产生负面影响。
桶(Buckets)
桶分为两类:“地面上”和“空中”。在一个类别中显示的动作不会影响另一个类别中的动作,除非被选中。这种隔离是高级模型的一个显著优势,受到顶尖玩家的青睐。
地面桶
- 投射物激活:仅在特殊能力使用时激活,且仅当你的斗士在地面上时。
- 对手眩晕和对手击退:分别在对手眩晕或被击退时触发。
- 对手激活:在你的斗士在地面上的所有其他情况下使用,包括直到对手眩晕或被击退的所有选项。
空中桶
- 近爆炸区、安全区、舞台下方、舞台侧边:将空域划分为你的斗士所在区域。这些区域相互独立训练。
AI Arena中的焦点设置
在选择要更改的“桶”之后,我们进入斗士应该强调什么。其中大部分在游戏内的教程中也有描述,但我们将重点介绍最常用的,并提供它们在不同组合中如何运作的提示。
- 你的动作 - 此设置会记住你的斗士之前的动作,并允许你构建一系列动作。例如,你可以训练你的斗士在一次上勾拳后执行一次高踢腿。它很少使用,主要用于最终训练会话。
- 对手动作 - 此设置允许你的斗士将其动作与对手的动作关联起来。例如,当敌人攻击时,你的斗士可以举起盾牌,或者当敌人被盾牌格挡时,抓住敌人。这几乎总是从一开始就在地面训练中使用。
- 你的位置 - 这有助于你的斗士理解其在空间中的位置,以便使用正确的方向或动作。它总是用于从“舞台侧边”和“近爆炸区”返回平台,很少在地面上使用。
- 对手位置 - 这允许你的斗士理解对手在空间中的位置。在当前版本中很少使用,但可以进行实验。
- 你的方向 - 这考虑了你的斗士相对于敌人的朝向。它几乎总是在地面和“安全区”中使用,以追击敌人并确定斗士是面向敌人还是背对敌人。它经常与“与对手的角度”结合使用,不用于从“舞台侧边”和“近爆炸区”返回平台。提示:使用此设置仅在你面向敌人时抓住敌人或进行上勾拳。
- 对手方向 - 这考虑了敌人的朝向,例如仅当他们朝你的方向攻击时才进行格挡。它与“与对手的角度”结合使用。
- 与对手的角度 - 这决定了你的斗士相对于敌人的位置,并且在动作面向敌人时使用,最常与“你的方向”结合使用。
- 剩余恢复次数 - 此设置仅用于从“舞台侧边”和“近爆炸区”返回。它帮助你的斗士理解他们已经使用了哪些技术来返回,增加了使用其他技术成功返回的可能性。
- 离散距离 - 这有助于你的斗士理解他们是靠近还是远离敌人,这对于空中的垂直战斗和所有地面战斗都至关重要。它总是用于训练。
- 边缘距离 - 这有助于你的斗士理解他们是在平台边缘还是在中间,从而引入行为的多样性。掌握它非常重要,并且仅在地面上使用,通常与“离散距离”、“与对手的角度”和“你的方向”结合使用。
- 对手脱离平台 - 这允许你的斗士在敌人脱离平台时意识到,从而有效地防守边缘并阻止敌人返回。掌握它非常重要,并且仅在你的斗士在地面上时使用,通常与“离散距离”、“与对手的角度”和“你的方向”结合使用。

Ixtlanian的专业技巧
要创建一个适应性强且不可预测的斗士,请使用各种焦点组合来教授针对不同对手动作的特定行为。这种方法确保你的斗士能够快速准确地响应对手的动作,避免可预测性,并在战斗情境中变得更加多才多艺。
仔细规划你的训练会话,确定你希望你的斗士学习的特定技能。在训练期间演示这些动作,并使用能够优化其有效性的设置处理数据。例如,如果你旨在训练你的斗士在近距离空中执行上勾拳或翻踢,并在远距离跳得更近进行拳击,你应该选择“你的方向”、“与对手的角度”和“离散距离”。这些设置有助于你的斗士理解其视线方向、相对于敌人的角度以及它们之间的距离。
最后,始终进行实验和迭代。如果训练会话的结果不令人满意,请不要保存数据。相反,找出问题所在,对训练或数据处理进行必要的调整,然后重试。这种迭代过程将随着时间的推移增强你的训练会话,从而产生一个具有卓越反应时间和相关性的斗士。

