Cloned tensors after indexing in _compute_attn_output_with_global_indices (#13613)

Co-authored-by: Alessandro Suglia <asuglia@fb.com>
2025-08-01 02:31:11 +06:00 · 2021-09-17 16:05:49 +01:00 · 2021-09-17 16:05:49 +01:00 · 19b7acdd61
commit 19b7acdd61
parent ce32c69c0b
2 changed files with 2 additions and 2 deletions
--- a/src/transformers/models/led/modeling_led.py
+++ b/src/transformers/models/led/modeling_led.py
@ -586,7 +586,7 @@ class LEDEncoderSelfAttention(nn.Module):
        # attn = torch.einsum('blhs,bshd->blhd', (selected_attn_probs, selected_v))
        # compute attn output only global
        attn_output_only_global = torch.matmul(
-            attn_probs_only_global.transpose(1, 2), value_vectors_only_global.transpose(1, 2)
+            attn_probs_only_global.transpose(1, 2).clone(), value_vectors_only_global.transpose(1, 2).clone()
        ).transpose(1, 2)
        # reshape attn probs
--- a/src/transformers/models/longformer/modeling_longformer.py
+++ b/src/transformers/models/longformer/modeling_longformer.py
@ -976,7 +976,7 @@ class LongformerSelfAttention(nn.Module):
        # attn = torch.einsum('blhs,bshd->blhd', (selected_attn_probs, selected_v))
        # compute attn output only global
        attn_output_only_global = torch.matmul(
-            attn_probs_only_global.transpose(1, 2), value_vectors_only_global.transpose(1, 2)
+            attn_probs_only_global.transpose(1, 2).clone(), value_vectors_only_global.transpose(1, 2).clone()
        ).transpose(1, 2)
        # reshape attn probs