Lint scripts and tests

2026-01-04 14:15:00 +01:00 · 2026-01-04 14:15:00 +01:00 · 74c4dc791d
commit 74c4dc791d
parent cf6c49f502
5 changed files with 17 additions and 17 deletions
--- a/audio_tests/generate_transcripts.py
+++ b/audio_tests/generate_transcripts.py
@ -6,6 +6,7 @@ Produces one JSON file per audio with: [{word, start, end}, ...]

 import json
 import os
+
 from faster_whisper import WhisperModel

 AUDIO_DIR = os.path.dirname(os.path.abspath(__file__))
--- a/run_benchmark.py
+++ b/run_benchmark.py
@ -33,7 +33,6 @@ sys.path.insert(0, str(Path(__file__).parent))
 from test_backend_offline import (
    AUDIO_TESTS_DIR,
    SAMPLE_RATE,
-    TestResult,
    create_engine,
    discover_audio_files,
    download_sample_audio,
--- a/scripts/determine_alignment_heads.py
+++ b/scripts/determine_alignment_heads.py
@ -8,7 +8,7 @@ import io
 import math
 import pathlib
 import sys
-from typing import List, Optional, Sequence, Tuple, Union
+from typing import Sequence, Tuple, Union

 import matplotlib.pyplot as plt
 import numpy as np
@ -24,7 +24,7 @@ sys.path.insert(0, str(REPO_ROOT))
 sys.path.insert(0, str(WHISPER_ROOT))

 from whisper import load_model
-from whisper.audio import load_audio, log_mel_spectrogram, pad_or_trim
+from whisper.audio import log_mel_spectrogram, pad_or_trim
 from whisper.tokenizer import get_tokenizer

 AudioInput = Union[str, pathlib.Path, np.ndarray, torch.Tensor]
@ -85,7 +85,7 @@ def _parse_args():
    parser.add_argument(
        "--dataset-config",
        type=str,
-        default="clean" 
+        default="clean"
    )
    parser.add_argument(
        "--dataset-split",
--- a/scripts/sync_extension.py
+++ b/scripts/sync_extension.py
@ -1,40 +1,39 @@
 """Copy core files from web directory to Chrome extension directory."""

-import os
 import shutil
 from pathlib import Path


 def sync_extension_files():
-    
+
    web_dir = Path("whisperlivekit/web")
    extension_dir = Path("chrome-extension")
-    
+
    files_to_sync = [
        "live_transcription.html", "live_transcription.js", "live_transcription.css"
    ]

    svg_files = [
        "system_mode.svg",
-        "light_mode.svg", 
+        "light_mode.svg",
        "dark_mode.svg",
        "settings.svg"
    ]
-        
+
    for file in files_to_sync:
        src_path = web_dir / file
        dest_path = extension_dir / file
-        
+
        dest_path.parent.mkdir(parents=True, exist_ok=True)
        shutil.copy2(src_path, dest_path)
-    
+
    for svg_file in svg_files:
        src_path = web_dir / "src" / svg_file
        dest_path = extension_dir / "web" / "src" / svg_file
        dest_path.parent.mkdir(parents=True, exist_ok=True)
        shutil.copy2(src_path, dest_path)
-    
+

 if __name__ == "__main__":

-    sync_extension_files()
+    sync_extension_files()
--- a/test_backend_offline.py
+++ b/test_backend_offline.py
@ -36,8 +36,8 @@ import logging
 import sys
 import time
 import urllib.request
+from dataclasses import asdict, dataclass, field
 from pathlib import Path
-from dataclasses import dataclass, asdict, field
 from typing import List, Optional

 import numpy as np
@ -157,6 +157,7 @@ def create_engine(
 ):
    """Create a TranscriptionEngine with the given backend config."""
    import gc
+
    from whisperlivekit.core import TranscriptionEngine

    # Reset singleton so we get a fresh instance
@ -320,7 +321,7 @@ async def run_test(
        transcription = _extract_text_from_response(last)

    # --- Compute WER and timestamp accuracy against ground truth ---
-    from whisperlivekit.metrics import compute_wer, compute_timestamp_accuracy
+    from whisperlivekit.metrics import compute_timestamp_accuracy, compute_wer

    wer_val = None
    wer_details = None
@ -434,7 +435,7 @@ async def run_all_tests(
        file_lan = lan
        if "french" in audio_path.name.lower() and lan == "en":
            file_lan = "fr"
-            logger.info(f"Auto-detected language 'fr' from filename")
+            logger.info("Auto-detected language 'fr' from filename")

        audio = load_audio(str(audio_path))

@ -495,7 +496,7 @@ def print_benchmark_summary(results: List[TestResult]):
    print(f"{'=' * 110}")

    # Print transcription excerpts
-    print(f"\nTRANSCRIPTIONS:")
+    print("\nTRANSCRIPTIONS:")
    print(f"{'-' * 110}")
    for r in results:
        excerpt = r.transcription[:120] + "..." if len(r.transcription) > 120 else r.transcription