[Wav2Vec2ProcessorWithLM] improve multi processing (#15247)

* [Wav2Vec2ProcessorWithLM] improve multi processing * close pool
2025-08-02 03:01:07 +06:00 · 2022-01-21 18:30:10 +01:00 · 2022-01-21 18:30:10 +01:00 · 80af1048cf
commit 80af1048cf
parent 4cff3fae11
1 changed files with 5 additions and 2 deletions
--- a/src/transformers/models/wav2vec2_with_lm/processing_wav2vec2_with_lm.py
+++ b/src/transformers/models/wav2vec2_with_lm/processing_wav2vec2_with_lm.py
@ -18,7 +18,7 @@ Speech processor class for Wav2Vec2
 import os
 from contextlib import contextmanager
 from dataclasses import dataclass
-from multiprocessing import Pool
+from multiprocessing import get_context
 from typing import TYPE_CHECKING, Iterable, List, Optional, Union
 import numpy as np
@ -300,7 +300,7 @@ class Wav2Vec2ProcessorWithLM:
        # create multiprocessing pool and list numpy arrays
        logits_list = [array for array in logits]
-        pool = Pool(num_processes)
+        pool = get_context("fork").Pool(num_processes)
        # pyctcdecode
        decoded_beams = self.decoder.decode_beams_batch(
@ -313,6 +313,9 @@ class Wav2Vec2ProcessorWithLM:
            hotword_weight=hotword_weight,
        )
        # clone multi-processing pool
        pool.close()
        # extract text
        batch_texts = [d[0][0] for d in decoded_beams]