Spaces:

k2-fsa
/

automatic-speech-recognition-3

Build error

App Files Files Community

csukuangfj commited on 9 days ago

Commit

55c6d0d

1 Parent(s): 35dce23

add giga am v2

Browse files

Files changed (1) hide show

model.py +12 -2

model.py CHANGED Viewed

@@ -440,6 +440,7 @@ def _get_russian_pre_trained_model_ctc(
 ) -> sherpa_onnx.OfflineRecognizer:
     assert repo_id in (
         "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24",
     ), repo_id
     model = _get_nn_model_filename(
@@ -467,6 +468,7 @@ def _get_russian_pre_trained_model(
         "alphacep/vosk-model-ru",
         "alphacep/vosk-model-small-ru",
         "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24",
     ), repo_id
     if repo_id == "alphacep/vosk-model-ru":
@@ -477,7 +479,10 @@ def _get_russian_pre_trained_model(
         model_dir = "am"
         encoder = "encoder.onnx"
         model_type = "transducer"
-    elif repo_id == "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24":
         model_dir = "."
         encoder = "encoder.int8.onnx"
         model_type = "nemo_transducer"
@@ -500,7 +505,10 @@ def _get_russian_pre_trained_model(
         subfolder=model_dir,
     )
-    if repo_id == "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24":
         tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
     else:
         tokens = _get_token_filename(repo_id=repo_id, subfolder="lang")
@@ -1861,6 +1869,8 @@ japanese_models = {
 }
 russian_models = {
     "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24": _get_russian_pre_trained_model,
     "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24": _get_russian_pre_trained_model_ctc,
     "alphacep/vosk-model-ru": _get_russian_pre_trained_model,

 ) -> sherpa_onnx.OfflineRecognizer:
     assert repo_id in (
         "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24",
+        "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-v2-russian-2025-04-19",
     ), repo_id
     model = _get_nn_model_filename(
         "alphacep/vosk-model-ru",
         "alphacep/vosk-model-small-ru",
         "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24",
+        "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-v2-russian-2025-04-19",
     ), repo_id
     if repo_id == "alphacep/vosk-model-ru":
         model_dir = "am"
         encoder = "encoder.onnx"
         model_type = "transducer"
+    elif repo_id in (
+        "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24",
+        "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-v2-russian-2025-04-19",
+    ):
         model_dir = "."
         encoder = "encoder.int8.onnx"
         model_type = "nemo_transducer"
         subfolder=model_dir,
     )
+    if repo_id in (
+        "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24",
+        "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-v2-russian-2025-04-19",
+    ):
         tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
     else:
         tokens = _get_token_filename(repo_id=repo_id, subfolder="lang")
 }
 russian_models = {
+    "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-v2-russian-2025-04-19": _get_russian_pre_trained_model,
+    "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-v2-russian-2025-04-19": _get_russian_pre_trained_model_ctc,
     "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24": _get_russian_pre_trained_model,
     "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24": _get_russian_pre_trained_model_ctc,
     "alphacep/vosk-model-ru": _get_russian_pre_trained_model,