disable deepspeed when setting up fake trainer (#38101)

* disable deepspeed when setting up fake trainer * Apply style fixes --------- Co-authored-by: Marc Sun <57196510+SunMarc@users.noreply.github.com> Co-authored-by: github-actions[bot] <github-actions[bot]@users.noreply.github.com>
2025-07-05 05:40:05 +06:00 · 2025-05-15 09:34:04 -04:00 · 2025-05-15 09:34:04 -04:00 · fe9426f12d
commit fe9426f12d
parent 7caa57e85e
1 changed files with 8 additions and 3 deletions
--- a/src/transformers/integrations/integration_utils.py
+++ b/src/transformers/integrations/integration_utils.py
@ -15,6 +15,7 @@
 Integrations with other Python libraries.
 """
 import copy
 import functools
 import importlib.metadata
 import importlib.util
@ -33,7 +34,7 @@ from typing import TYPE_CHECKING, Any, Dict, Literal, Optional, Union
 import numpy as np
 import packaging.version
-from .. import PreTrainedModel, TFPreTrainedModel
+from .. import PreTrainedModel, TFPreTrainedModel, TrainingArguments
 from .. import __version__ as version
 from ..utils import (
    PushToHubMixin,
@ -929,13 +930,17 @@ class WandbCallback(TrainerCallback):
        if not self._initialized:
            self.setup(args, state, model, **kwargs)
-    def on_train_end(self, args, state, control, model=None, processing_class=None, **kwargs):
+    def on_train_end(self, args: TrainingArguments, state, control, model=None, processing_class=None, **kwargs):
        if self._wandb is None:
            return
        if self._log_model.is_enabled and self._initialized and state.is_world_process_zero:
            from ..trainer import Trainer
-            fake_trainer = Trainer(args=args, model=model, processing_class=processing_class, eval_dataset=["fake"])
+            args_for_fake = copy.deepcopy(args)
            args_for_fake.deepspeed = None
            fake_trainer = Trainer(
                args=args_for_fake, model=model, processing_class=processing_class, eval_dataset=["fake"]
            )
            with tempfile.TemporaryDirectory() as temp_dir:
                fake_trainer.save_model(temp_dir)
                metadata = (