imap_processing/imap_processing/codice/decompress.py at dev · tmplummer/imap_processing

168 lines (133 loc) · 5.11 KB
Will decompress CoDICE science data.
For CoDICE, there are 4 forms of compression:
    | 1. Table-based lossy compression A (32-bit -> 8-bit)
    | 2. Table-based lossy compression B (32-bit -> 8 bit)
    | 3. LZMA lossless compression
    | 4. Pack 24 bit compression (24-bit integers)
Only one lossy option can be selected in cases of lossy + lossless compression.
Thus, there are 7 possible compression algorithms:
    | 0. No compression
    | 1. Lossy A only
    | 2. Lossy B only
    | 3. Lossless only
    | 4. Lossy A + lossless
    | 5. Lossy B + lossless
    | 6. Pack 24 bit
In the case of (4) and (5), the data is first run through lossy compression, and
then the result is run through lossless compression. Thus, to decompress, one
must apply lossless decompression first, then lossy decompression
    This information was provided via email from Greg Dunn on Oct 23, 2023.
    The "Pack 24 bit" compression algorithm was added in Feb 2024.
import lzma
from enum import IntEnum
import numpy as np
from numpy.typing import NDArray
from imap_processing.codice.constants import LOSSY_A_TABLE, LOSSY_B_TABLE
from imap_processing.codice.utils import CoDICECompression
def _apply_lossy_a(compressed_bytes: bytes) -> list[int]:
    Apply 8-bit to 32-bit Lossy A decompression algorithm.
    The Lossy A algorithm uses a lookup table imported into this module.
    Parameters
    ----------
    compressed_bytes : bytes
        The compressed byte stream.
    Returns
    -------
    decompressed_values : list[int]
        The 32-bit decompressed values.
    compressed_values = list(compressed_bytes)
    decompressed_values = [LOSSY_A_TABLE[item] for item in compressed_values]
    return decompressed_values
def _apply_lossy_b(compressed_bytes: bytes) -> list[int]:
    Apply 8-bit to 32-bit Lossy B decompression algorithm.
    The Lossy B algorithm uses a lookup table imported into this module.
    Parameters
    ----------
    compressed_bytes : bytes
        The compressed byte stream.
    Returns
    -------
    decompressed_values : list[int]
        The 32-bit decompressed values.
    compressed_values = list(compressed_bytes)
    decompressed_values = [LOSSY_B_TABLE[item] for item in compressed_values]
    return decompressed_values
def _apply_lzma_lossless(compressed_bytes: bytes) -> bytes:
    Apply LZMA lossless decompression algorithm.
    Parameters
    ----------
    compressed_bytes : bytes
        The compressed byte stream.
    Returns
    -------
    lzma_decompressed_values : bytes
        The 32-bit lzma decompressed values.
    lzma_decompressed_values = lzma.decompress(compressed_bytes)
    return lzma_decompressed_values
def _apply_pack_24_bit(compressed_bytes: bytes) -> NDArray[int]:
    Apply the pack 24 bit decompression algorithm.
    Parameters
    ----------
    compressed_bytes : bytes
        The compressed byte stream.
    Returns
    -------
    decompressed_values : NDArray[int]
        The 24-bit decompressed values.
    decompressed_values = np.frombuffer(compressed_bytes, dtype=np.uint8).reshape(-1, 3)
    decompressed_values = np.array(
        [int.from_bytes(value, byteorder="big") for value in decompressed_values],
        dtype=np.uint32,
    return decompressed_values
def decompress(compressed_bytes: bytes, algorithm: IntEnum) -> list[int]:
    Perform decompression on a byte stream into a list of integers.
    Apply the appropriate decompression algorithm(s) based on the value
    of the ``algorithm`` attribute. One or more individual algorithms may be
    applied to a given compressed value.
    Parameters
    ----------
    compressed_bytes : bytes
        The compressed byte stream.
    algorithm : int
        The algorithm to apply. Supported algorithms are provided in the
        ``codice_utils.CoDICECompression`` class.
    Returns
    -------
    decompressed_values : list[int]
        The 24- or 32-bit decompressed values.
    # Apply the appropriate decompression algorithm
    if algorithm == CoDICECompression.NO_COMPRESSION:
        decompressed_values = list(compressed_bytes)
    elif algorithm == CoDICECompression.LOSSY_A:
        decompressed_values = _apply_lossy_a(compressed_bytes)
    elif algorithm == CoDICECompression.LOSSY_B:
        decompressed_values = _apply_lossy_b(compressed_bytes)
    elif algorithm == CoDICECompression.LOSSLESS:
        decompressed_bytes = _apply_lzma_lossless(compressed_bytes)
        decompressed_values = list(decompressed_bytes)
    elif algorithm == CoDICECompression.LOSSY_A_LOSSLESS:
        decompressed_bytes = _apply_lzma_lossless(compressed_bytes)
        decompressed_values = _apply_lossy_a(decompressed_bytes)
    elif algorithm == CoDICECompression.LOSSY_B_LOSSLESS:
        decompressed_bytes = _apply_lzma_lossless(compressed_bytes)
        decompressed_values = _apply_lossy_b(decompressed_bytes)
    elif algorithm == CoDICECompression.PACK_24_BIT:
        decompressed_values = _apply_pack_24_bit(compressed_bytes)
        raise ValueError(f"{algorithm} is not supported")
    return decompressed_values
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

decompress.py

Latest commit

History

decompress.py

File metadata and controls