SearchEngine-rs/python/metrics/map.py at master · JDScript/SearchEngine-rs

80 lines (59 loc) · 2.33 KB

Mean Average Precision (MAP) metric
import numpy as np
from typing import Dict, List, Tuple
def compute_average_precision(
    qrels_for_query: Dict[str, int], results_for_query: List[Tuple[str, int, float]]
) -> float:
    Compute Average Precision for a single query.
    Average Precision (AP) is the average of precision values computed at
    each position where a relevant document is retrieved.
        qrels_for_query: Dictionary mapping passage_id to relevance for one query
        results_for_query: List of (passage_id, rank, score) for one query
    Returns:
        float: Average Precision (0.0 to 1.0)
    Formula:
        AP = (sum of P@k for each relevant doc) / (total # relevant docs)
        where P@k is precision at position k
    relevant_docs = set(pid for pid, rel in qrels_for_query.items() if rel > 0)
    total_relevant = len(relevant_docs)
    if total_relevant == 0:
        return 0.0
    num_relevant_seen = 0
    sum_precisions = 0.0
    for i, (passage_id, _, _) in enumerate(results_for_query, start=1):
        if passage_id in relevant_docs:
            num_relevant_seen += 1
            precision_at_i = num_relevant_seen / i
            sum_precisions += precision_at_i
    return sum_precisions / total_relevant
def compute_map(
    qrels: Dict[str, Dict[str, int]], results: Dict[str, List[Tuple[str, int, float]]]
) -> float:
    Compute Mean Average Precision.
    MAP is the mean of Average Precision scores across all queries.
    It's particularly useful for binary relevance judgments.
        qrels: Dictionary mapping query_id to {passage_id: relevance}
        results: Dictionary mapping query_id to [(passage_id, rank, score), ...]
    Returns:
        float: MAP score (0.0 to 1.0)
    Formula:
        MAP = average of AP across all queries
        MAP is preferred over NDCG when relevance judgments are binary (0 or 1)
        as it gives equal weight to all relevant documents.
    average_precisions = []
    for query_id, query_qrels in qrels.items():
        if query_id not in results:
            average_precisions.append(0.0)
            continue
        ap = compute_average_precision(query_qrels, results[query_id])
        average_precisions.append(ap)
    return np.mean(average_precisions) if average_precisions else 0.0

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

map.py

Latest commit

History

map.py

File metadata and controls