请问,如何让llm产出翻译后的词,并且和测试集ground truth进行比较呢?
请问,如何让llm产出翻译后的词,并且和测试集ground truth进行比较呢?