llmcompressor.pipelines.basic

`BasicPipeline`

Bases: CalibrationPipeline

Source code in llmcompressor/pipelines/basic/pipeline.py

@CalibrationPipeline.register("basic")
class BasicPipeline(CalibrationPipeline):
    @staticmethod
    def __call__(
        model: torch.nn.Module,
        dataloader: DataLoader,
        dataset_args: Union["DatasetArguments", None],
    ):
        """
        Run a basic data pipeline.

        Batches are fetched from the data loader and are used to perform forward passes
        through the model. This pipeline is typically used for basic model calibration
        and, unlike the sequential pipelines, does not propagate compression error when
        used to calibrate model compression

        :param model: model being calibrated
        :param dataloader: loads data for calibration
        :param dataset_args: dataset arguments relevant to pipelines
        """
        dispatch_for_generation(model)  # basic dispatch is identical to generation
        model_device = get_execution_device(model)

        LifecycleCallbacks.calibration_epoch_start()

        with contextlib.ExitStack() as stack:
            stack.enter_context(calibration_forward_context(model))

            if dataset_args is not None and dataset_args.calibrate_moe_context:
                moe_calibration_context(model, stack)

            for batch in tqdm.tqdm(dataloader, desc="Calibrating"):
                batch = apply_pad_mask_to_batch(batch)
                batch = tensors_to_device(batch, model_device)
                model(**batch)

        LifecycleCallbacks.calibration_epoch_end()

`call(model, dataloader, dataset_args)` `staticmethod`

Run a basic data pipeline.

Batches are fetched from the data loader and are used to perform forward passes through the model. This pipeline is typically used for basic model calibration and, unlike the sequential pipelines, does not propagate compression error when used to calibrate model compression

Parameters:

Name	Type	Description	Default
`model`	`Module`	model being calibrated	required
`dataloader`	`DataLoader`	loads data for calibration	required
`dataset_args`	`Union[DatasetArguments, None]`	dataset arguments relevant to pipelines	required

Source code in llmcompressor/pipelines/basic/pipeline.py

@staticmethod
def __call__(
    model: torch.nn.Module,
    dataloader: DataLoader,
    dataset_args: Union["DatasetArguments", None],
):
    """
    Run a basic data pipeline.

    Batches are fetched from the data loader and are used to perform forward passes
    through the model. This pipeline is typically used for basic model calibration
    and, unlike the sequential pipelines, does not propagate compression error when
    used to calibrate model compression

    :param model: model being calibrated
    :param dataloader: loads data for calibration
    :param dataset_args: dataset arguments relevant to pipelines
    """
    dispatch_for_generation(model)  # basic dispatch is identical to generation
    model_device = get_execution_device(model)

    LifecycleCallbacks.calibration_epoch_start()

    with contextlib.ExitStack() as stack:
        stack.enter_context(calibration_forward_context(model))

        if dataset_args is not None and dataset_args.calibrate_moe_context:
            moe_calibration_context(model, stack)

        for batch in tqdm.tqdm(dataloader, desc="Calibrating"):
            batch = apply_pad_mask_to_batch(batch)
            batch = tensors_to_device(batch, model_device)
            model(**batch)

    LifecycleCallbacks.calibration_epoch_end()

llmcompressor.pipelines.basic

BasicPipeline

__call__(model, dataloader, dataset_args) staticmethod

`BasicPipeline`

`call(model, dataloader, dataset_args)` `staticmethod`