2025-0824 - 如何进行好的 Playtest


WHY

|723x408

最近以“如何进行好的 Playtest”为主题进行了一次 [[design discussion]],这里将内容进行一下汇总。

WHAT

这次的的内容是从不同地方学习到的,在最后一页中也标注了 References:

CONTENT

PDF

目录

会涵盖以下方面:

  • [[Playtest]] 的过程
  • [[Playtest]] 的原则
  • 一些过往总结的经验
  • 以及总结

PLAYTEST 的过程

如 [[Valve]] 所提的,PLAYTEST 可以作为一种工程学方法来对游戏进行不断迭代优化,所以过程就和做实验一样:

  • 发现问题(Goal)
  • 提出假设(Design)
  • 进行实验(Playtest)
  • 根据结果进行迭代(Iterate)

PLAYTEST 的一些原则

Goal

  • 应该设立明确且可量化的目标
    • 在早期的 PLAYTEST 中应该关注的是 understanding - 即玩家是否理解设计者的意图
    • 而在后期的 PLAYTEST 中应该关注的是 engaging - 玩家是否玩的开心;以及 Debug - 即找到可能存在的漏洞

Design

需要根据设计的目标来创建合适的测试环境,避免无关因素的干扰

Playtest

  • 需要找到合适的测试玩家
    • 最好能找到目标受众
      • 即那些本可能在发售后进行购买游玩的玩家,他们最能反映“玩家之声”
      • 比如 [[Valve]] 觉得网吧中那些在玩射击游戏的玩家就是潜在的目标玩家
    • 需要不同水平的玩家
      • 需要明确你的游戏到底为谁而做,难度的平衡是一个难题,所以最好能让不同水平的玩家都进行测试,确保难度的合理性
    • 一次性测试
      • 除非一些特殊的需要长线进行的测试,应该尽可能只让测试者参与一次测试

  • 尽早测试
    • valve 在游戏达到可玩状态后就会开始测试,即使当时还都是白盒
    • 这当然和游戏类型有关,如此早期开始测试也有很高的成本,但依然可供参考

  • 频繁测试
    • Vavle 基本会每一到两周进行测试——可以说他们的开发也是一种基于测试反馈而进行的迭代开发
    • 排除异常值
      • 只有达到的一定的样本量之后,才能真实反映最终的数据情况
      • 没有记错的话,他们每次测试的人数大概也会在 5 人左右

  • 非偏测试
    • 尽可能接近真实的游玩环境
      • 如果能尽量模拟玩家最终游玩的条件是最好不过了,但这很难实现,所以就是作为某种参考
    • 让玩家有机会练习
      • 特别是如果测试内容是偏游戏中后期的内容,那么就一定需要给玩家一些时间提前对 3C 以及可能用上的 ingredients 进行试玩和熟悉,否则玩家很可能因为不熟悉而导致没能发挥真实水平,导致结果失真
    • 闭嘴观看
      • 在玩家测试过程中,开发者们除了进行必要的帮助(比如提前告知一些已知的严重 BUG,以及当玩家完全卡住寻求帮助)之外,应该尽可能地只进行观看而不发表任何观点
        • 这样才能够反映最真实的游玩情况
        • 而且如果在此期间你看得越难受,说明此次测试确实有一些独到的价值(既帮助你发现了一些问题,又刺激了你努力进行迭代修改)

  • 让负责人们一起来实施 PLAYTEST
    • 大家可以一起进行观看
    • 并且分头得出自己的结论
    • 最终可以讨论来得出最终的迭代方案
    • 好处多多
      • 既可以简化评估流程
      • 帮助确定优先级
      • 也能够激励大家继续迭代修改

Iterate

|723x407

  • 质疑你的预期
    • 要确保玩家是真的理解而不是“撞大运”

  • 相信趋势而不是极端情况
    • 迭代的目标应该是玩家们共有的困惑
    • 或者是开发者们达成的共识

  • 迭代时的一些要点
    • 根据优先级来进行迭代
      • 这样能最快解决最棘手的痛点
      • 有一些优先级较低的部分很可能在前面的问题修好之后也不再需要关注了
    • 尝试便宜而快速的捷径(30 分花费 60 分效果)而不是贵但完善(80 分花费 90 分效果)的方法
      • 这一点在早期尤为重要,因为在这时很多东西还未定型,所以如果存在便宜且快速的“补丁”,那么就应该优先这么做,避免大量投入之后最后被验证出这部分内容有可能是不需要的,导致资源的浪费
      • 但这一点也要辩证的看待,如果已经是比较成型的阶段,便宜且快速的方案已经不足以满足要求,那也需要考虑是否需要考虑更好的方案进行迭代
    • 大刀阔斧的修改
      • 这一点针对的是某些参数的修改,当趋势表明有一些参数需要修改时,那么尽可能以“加倍”的方式来对数值进行修改,这样能够确保改动是可被感知的,否则很有可能“改了和没改一样”,浪费下一次测试的结果
    • 验收标准 - 直到不再痛苦
      • 当开发者们能够在观看玩家测试时不再感到痛苦,那么可能就达到了验收标准,可以推进到下一模块的迭代
    • 如有必要,短痛重开
      • 很多时候如果方向错误了,再迭代可能也是无用的,那么长痛不如短痛,fail fast, learn fast

一些过往经验

  • 玩家们在危急关头很难学会东西
    • 这一点好像是在看命运的某期 GDC 看到的哈哈…
  • 玩家们从不抬头看
    • 这一看起来是笑话的点其实对于很多玩家来说都适用,玩家们更多只会关注水平范围的内容,而不会抬头查看
    • 这一点当然也可以被反过来利用,比如把需要藏起来的东西或是 jump scare 放在上方
    • 对于不同游戏类型的玩家当然有不一样的玩家行为模式,比如熟悉魂类游戏的玩家总是习惯查看门的背后和上方,以及会去路径的边缘部分向下看,这些都是玩家们在不同游戏中练就的行为模式,需要有针对性地应对
  • 感受都是真的,但是反馈未必是真的
    • 这一点其实在很多不同的场景被很多不同领域的大师们反复提及
    • [[Neil Gaiman]] 也曾分享过类似的观点“当人们说哪里感觉不对时,他们通常是对的;但当他们告诉你怎么更改时,他们通常是错的”
    • 亨利福特名言“用户只知道他们想要更快的马,但他们不知道他们想要的其实是汽车”也是一个道理
    • 这里我们当时也进行了一些延伸讨论
      • expertise as playtester
        • 他们对其中可能潜藏的问题更加敏锐,并且有机会更准确地指出问题的核心
        • 但他们很有可能不能代表广泛的玩家群体的意见
      • customer as playtester
        • 玩家作为测试者很有可能由于种种原因(对开发者的尊敬、不能准确表述感受等)无法真实反映内心感受
        • 所以很重要的一点就是仔细观看他们游玩时的反应,并以此作为最重要的依据

Summary

这是一份总结的思维导图,涵盖了前面所提到的所有内容

小结

总结不同的开发者们的共同经验总是有益处的,但最终如何落地,还是要结合具体情况具体分析。

持续学习,继续前进!


Author:
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint policy. If reproduced, please indicate source !
  TOC