【LLM教程】为什么做大语言模型fine tuning时,要将 drop_last_batch设置为True?
目录 1. drop_last_batch 是什么? 2. drop_last_batch有什么用? 这是我们做tokenizer时,经常会遇到的代码,那这里的drop_last_batch 为什么要设置: finetuning_dataset_loaded datasets.load_dataset("json&q…
2025-11-13