openapi-python/scripts/benchmark_generate.py at main · Minibrams/openapi-python

244 lines (198 loc) · 7.7 KB
from __future__ import annotations
import argparse
import gzip
import json
import shutil
import statistics
import tempfile
import time
from pathlib import Path
from typing import Any
def _load_spec(path: Path) -> str:
    if path.suffix == ".gz":
        return gzip.decompress(path.read_bytes()).decode("utf-8")
    return path.read_text(encoding="utf-8")
def _load_generator(package_path: Path) -> tuple[Any, Any]:
    sys.path.insert(0, str(package_path.resolve()))
    from openapi_python.generator import GenerationRequest, generate_client
    return GenerationRequest, generate_client
def _run_once(
    generate_client: Any,
    generation_request: Any,
    spec_json: str,
    package_name: str,
) -> tuple[float, Any]:
    output_dir = Path(tempfile.mkdtemp(prefix="openapi-python-benchmark-"))
        start = time.perf_counter()
        result = generate_client(
            generation_request(
                output_dir=output_dir,
                spec_json=spec_json,
                package_name=package_name,
                overwrite=True,
        elapsed = time.perf_counter() - start
        return elapsed, result
    finally:
        shutil.rmtree(output_dir, ignore_errors=True)
def _run_size_once(
    generate_client: Any,
    generation_request: Any,
    spec_json: str,
    package_name: str,
) -> tuple[dict[str, int], Any]:
    output_dir = Path(tempfile.mkdtemp(prefix="openapi-python-size-"))
        result = generate_client(
            generation_request(
                output_dir=output_dir,
                spec_json=spec_json,
                package_name=package_name,
                overwrite=True,
        file_sizes = {
            path.relative_to(output_dir).as_posix(): path.stat().st_size
            for path in result.written_files
        return file_sizes, result
    finally:
        shutil.rmtree(output_dir, ignore_errors=True)
def run_benchmark(args: argparse.Namespace) -> int:
    spec_json = _load_spec(args.spec)
    generation_request, generate_client = _load_generator(args.package_path)
    result = None
    for _ in range(args.warmup):
        _, result = _run_once(
            generate_client=generate_client,
            generation_request=generation_request,
            spec_json=spec_json,
            package_name=args.package,
    samples = []
    for _ in range(args.repeat):
        elapsed, result = _run_once(
            generate_client=generate_client,
            generation_request=generation_request,
            spec_json=spec_json,
            package_name=args.package,
        samples.append(elapsed)
    if result is None:
        raise RuntimeError("benchmark did not run")
    payload = {
        "best_seconds": min(samples),
        "median_seconds": statistics.median(samples),
        "samples_seconds": samples,
        "operations": result.operations,
        "type_definitions": result.type_definitions,
        "repeat": args.repeat,
        "warmup": args.warmup,
    encoded = json.dumps(payload, indent=2, sort_keys=True)
    if args.output:
        args.output.write_text(encoded + "\n", encoding="utf-8")
    print(encoded)
    return 0
def run_size_benchmark(args: argparse.Namespace) -> int:
    spec_json = _load_spec(args.spec)
    generation_request, generate_client = _load_generator(args.package_path)
    file_sizes, result = _run_size_once(
        generate_client=generate_client,
        generation_request=generation_request,
        spec_json=spec_json,
        package_name=args.package,
    payload = {
        "files_bytes": file_sizes,
        "operations": result.operations,
        "total_bytes": sum(file_sizes.values()),
        "type_definitions": result.type_definitions,
    encoded = json.dumps(payload, indent=2, sort_keys=True)
    if args.output:
        args.output.write_text(encoded + "\n", encoding="utf-8")
    print(encoded)
    return 0
def _format_bytes(value: float) -> str:
    return f"{value:,.0f} bytes"
def compare_benchmarks(args: argparse.Namespace) -> int:
    baseline = json.loads(args.baseline.read_text(encoding="utf-8"))
    candidate = json.loads(args.candidate.read_text(encoding="utf-8"))
    baseline_seconds = float(baseline["best_seconds"])
    candidate_seconds = float(candidate["best_seconds"])
    allowed_seconds = baseline_seconds * (1 + args.max_regression)
    change = (candidate_seconds - baseline_seconds) / baseline_seconds
    print(f"baseline best:  {baseline_seconds:.6f}s")
    print(f"candidate best: {candidate_seconds:.6f}s")
    print(f"change:         {change:+.2%}")
    print(f"limit:          +{args.max_regression:.2%}")
    if candidate_seconds > allowed_seconds:
        print(
            "generation benchmark regressed beyond the configured limit",
            file=sys.stderr,
        return 1
    return 0
def compare_size_benchmarks(args: argparse.Namespace) -> int:
    baseline = json.loads(args.baseline.read_text(encoding="utf-8"))
    candidate = json.loads(args.candidate.read_text(encoding="utf-8"))
    baseline_bytes = float(baseline["total_bytes"])
    candidate_bytes = float(candidate["total_bytes"])
    allowed_bytes = baseline_bytes * (1 + args.max_regression)
    change = (candidate_bytes - baseline_bytes) / baseline_bytes
    print(f"baseline total:  {_format_bytes(baseline_bytes)}")
    print(f"candidate total: {_format_bytes(candidate_bytes)}")
    print(f"change:          {change:+.2%}")
    print(f"limit:           +{args.max_regression:.2%}")
    if candidate_bytes > allowed_bytes:
        print(
            "generated file size regressed beyond the configured limit",
            file=sys.stderr,
        return 1
    return 0
def _build_parser() -> argparse.ArgumentParser:
    parser = argparse.ArgumentParser(
        prog="benchmark_generate.py",
        description="Benchmark OpenAPI client generation for a large spec.",
    subcommands = parser.add_subparsers(dest="command", required=True)
    run = subcommands.add_parser("run", help="Run the generation benchmark")
    run.add_argument("--spec", type=Path, required=True)
    run.add_argument("--package-path", type=Path, default=Path.cwd())
    run.add_argument("--package", default="my_client")
    run.add_argument("--repeat", type=int, default=5)
    run.add_argument("--warmup", type=int, default=1)
    run.add_argument("--output", type=Path)
    run.set_defaults(func=run_benchmark)
    size = subcommands.add_parser("size", help="Measure generated file sizes")
    size.add_argument("--spec", type=Path, required=True)
    size.add_argument("--package-path", type=Path, default=Path.cwd())
    size.add_argument("--package", default="my_client")
    size.add_argument("--output", type=Path)
    size.set_defaults(func=run_size_benchmark)
    compare = subcommands.add_parser("compare", help="Compare two benchmark results")
    compare.add_argument("--baseline", type=Path, required=True)
    compare.add_argument("--candidate", type=Path, required=True)
    compare.add_argument("--max-regression", type=float, default=0.02)
    compare.set_defaults(func=compare_benchmarks)
    compare_size = subcommands.add_parser(
        "compare-size", help="Compare two generated file size results"
    compare_size.add_argument("--baseline", type=Path, required=True)
    compare_size.add_argument("--candidate", type=Path, required=True)
    compare_size.add_argument("--max-regression", type=float, default=0.02)
    compare_size.set_defaults(func=compare_size_benchmarks)
    return parser
def main(argv: list[str] | None = None) -> int:
    parser = _build_parser()
    args = parser.parse_args(argv)
    return args.func(args)
if __name__ == "__main__":
    raise SystemExit(main())
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

benchmark_generate.py

Latest commit

History

benchmark_generate.py

File metadata and controls