问题来源
language model checkpoints with multihead attention (MHA) can be uptrained (Komatsuzaki et al., 2022) to use MQA with a small fraction of original training compute
而翻译词典无法翻译
解释:
“uptrained” 这个词没有直接的中文翻译,因为它不是一个标准的英文单词。但是,根据上下文的不同,我们可以尝试进行翻译。
如果 “uptrained” 出现在与机器学习或人工智能相关的上下文中,它可能是指 “进一步训练”、“增量训练” 或 “继续训练”。在这种情况下,它描述的可能是在一个已经训练好的模型基础上,使用新数据或额外的数据来继续训练以提高性能或适应新的任务。
例如:
如果一个模型已经在一个数据集上训练过了,然后你使用额外的数据继续训练它,这个过程可能被称为 “uptraining”,相应的中文可以翻译为 “进一步训练” 或 “继续训练”。
如果一个模型被设计为能够在不断接收新信息的情况下更新其参数,这个过程也可能被称为 “uptraining”,中文可以翻译为 “增量训练”。