feat: add TP plan for granite (#35573)

Signed-off-by: Mehant Kammakomati <mehant.kammakomati2@ibm.com>
2025-07-31 02:02:21 +06:00 · 2025-01-09 19:55:55 +05:30 · 2025-01-09 19:55:55 +05:30 · 320512df46
commit 320512df46
parent 633da1b10e
1 changed files with 10 additions and 0 deletions
--- a/src/transformers/models/granite/configuration_granite.py
+++ b/src/transformers/models/granite/configuration_granite.py
@ -112,6 +112,16 @@ class GraniteConfig(PretrainedConfig):

    model_type = "granite"
    keys_to_ignore_at_inference = ["past_key_values"]
+    # Default tensor parallel plan for base model `GraniteModel`
+    base_model_tp_plan = {
+        "layers.*.self_attn.q_proj": "colwise",
+        "layers.*.self_attn.k_proj": "colwise",
+        "layers.*.self_attn.v_proj": "colwise",
+        "layers.*.self_attn.o_proj": "rowwise",
+        "layers.*.mlp.gate_proj": "colwise",
+        "layers.*.mlp.up_proj": "colwise",
+        "layers.*.mlp.down_proj": "rowwise",
+    }

    def __init__(
        self,