[Modeling] Reduce runtime when loading missing keys (#36312)

* hoist keys Signed-off-by: Kyle Sayers <kylesayrs@gmail.com> * remove hoist Signed-off-by: Kyle Sayers <kylesayrs@gmail.com> --------- Signed-off-by: Kyle Sayers <kylesayrs@gmail.com>
2025-07-03 12:50:06 +06:00 · 2025-02-24 11:10:28 -05:00 · 2025-02-24 11:10:28 -05:00 · 05dfed06d7
commit 05dfed06d7
parent 18276b03f7
1 changed files with 3 additions and 3 deletions
--- a/src/transformers/modeling_utils.py
+++ b/src/transformers/modeling_utils.py
@ -4679,11 +4679,11 @@ class PreTrainedModel(nn.Module, ModuleUtilsMixin, GenerationMixin, PushToHubMix
        # This is not ideal in terms of memory, but if we don't do that not, we can't initialize them in the next step
        if low_cpu_mem_usage:
            for key in missing_keys:
-                if key in list(model_state_dict.keys()):
+                if key in model_state_dict:
                    key = key
-                elif f"{prefix}.{key}" in list(model_state_dict.keys()):
+                elif f"{prefix}.{key}" in model_state_dict:
                    key = f"{prefix}.{key}"
-                elif key.startswith(prefix) and ".".join(key.split(".")[1:]) in list(model_state_dict.keys()):
+                elif key.startswith(prefix) and ".".join(key.split(".")[1:]) in model_state_dict:
                    key = ".".join(key.split(".")[1:])
                param = model_state_dict[key]