Merge pull request #2303 from patrickvonplaten/fix_error_with_repetition_penalty

fix repetition penalty error in modeling_utils.py
2025-07-31 10:12:23 +06:00 · 2019-12-25 22:39:20 +01:00 · 2019-12-25 22:39:20 +01:00 · aeef4823ab
commit aeef4823ab
parent 0412f3d929 18e5bdbec5
1 changed files with 10 additions and 2 deletions
--- a/src/transformers/modeling_utils.py
+++ b/src/transformers/modeling_utils.py
@ -728,7 +728,11 @@ class PreTrainedModel(nn.Module):
            if repetition_penalty != 1.0:
                for i in range(batch_size):
                    for previous_tokens in set(input_ids[i].tolist()):
-                        next_token_logits[i, previous_tokens] /= repetition_penalty
+                        # if score < 0 then repetition penalty has to multiplied to reduce the previous token probability
+                        if next_token_logits[i, previous_tokens] < 0:
+                            next_token_logits[i, previous_tokens] *= repetition_penalty
+                        else:
+                            next_token_logits[i, previous_tokens] /= repetition_penalty

            if do_sample:
                # Temperature (higher temperature => more likely to sample low probability tokens)
@ -807,7 +811,11 @@ class PreTrainedModel(nn.Module):
            if repetition_penalty != 1.0:
                for i in range(batch_size * num_beams):
                    for previous_tokens in set(input_ids[i].tolist()):
-                        scores[i, previous_tokens] /= repetition_penalty
+                        # if score < 0 then repetition penalty has to multiplied to reduce the previous token probability
+                        if scores[i, previous_tokens] < 0:
+                            scores[i, previous_tokens] *= repetition_penalty
+                        else:
+                            scores[i, previous_tokens] /= repetition_penalty

            if do_sample:
                # Temperature (higher temperature => more likely to sample low probability tokens)