Source code for gpytorchwrapper.src.config.config_classes

from dataclasses import dataclass, field
from typing import Optional



[docs]
@dataclass
class DataConf:
    num_inputs: int
    num_outputs: int
    output_index: Optional[int | list[int]] = None




[docs]
@dataclass
class TransformerConf:
    transform_data: bool = False
    transformer_class: str = "DefaultTransformer"
    transformer_options: Optional[dict] = field(default_factory=dict)
    columns: Optional[list[int]] = None




[docs]
@dataclass
class TransformConf:
    transform_input: TransformerConf = field(default_factory=TransformerConf)
    transform_output: TransformerConf = field(default_factory=TransformerConf)




[docs]
@dataclass
class OptimizerConf:
    optimizer_class: str = "Adam"
    optimizer_options: Optional[dict] = field(default_factory=lambda: {"lr": 0.1})




[docs]
@dataclass
class LikelihoodConf:
    likelihood_class: str = "GaussianLikelihood"
    likelihood_options: Optional[dict] = field(default_factory=dict)




[docs]
@dataclass
class ModelConf:
    model_class: str
    model_options: Optional[dict] = field(default_factory=dict)




[docs]
@dataclass
class TrainingConf:
    model: ModelConf = field(default_factory=ModelConf)
    likelihood: LikelihoodConf = field(default_factory=LikelihoodConf)
    learning_iterations: int = 100
    botorch: Optional[bool] = False
    debug: Optional[bool] = True
    optimizer: OptimizerConf = field(default_factory=OptimizerConf)




[docs]
@dataclass
class TestingConf:
    test: bool = False
    test_size: float = 0.2
    strat_shuffle_split: bool = False
    kfold: bool = False
    kfold_bins: Optional[int] = None




[docs]
@dataclass
class Config:
    data_conf: DataConf
    transform_conf: TransformConf
    training_conf: TrainingConf
    testing_conf: TestingConf



# Function to create a Config object from a dictionary with defaults

[docs]
def create_config(config_dict: dict) -> Config:
    """
    Create a Config object from a nested configuration dictionary.

    This function initializes a `Config` dataclass using values from the provided
    `config_dict`. Optional fields not specified in the dictionary are populated
    with default values.

    Parameters
    ----------
    config_dict : dict
        A nested dictionary with the following structure:
            - data_conf :
                - num_inputs : int
                    Number of input features.
                - num_outputs : int
                    Number of output targets.
                - output_index : int or list of int, optional
                    Index or indices of outputs to use.
            - transform_conf : dict, optional
                - transform_input : dict
                    - transform_data : bool, default False
                    - transformer_class : str, default "DefaultTransformer"
                    - transformer_options : dict, default {}
                    - columns : list of int, optional
                - transform_output : dict
                    Same structure as `transform_input`.

            - training_conf : dict
                - model : dict
                    - model_class : str
                    - model_options : dict, default {}
                - likelihood : dict, optional
                    - likelihood_class : str, default "GaussianLikelihood"
                    - likelihood_options : dict, default {}
                - learning_iterations : int, default 100
                - botorch : bool, default False
                - debug : bool, default True
                - optimizer : dict, optional
                    - optimizer_class : str, default "Adam"
                    - optimizer_options : dict, default {"lr": 0.1}
            - testing_conf : dict, optional
                - test : bool, default False
                - test_size : float, default 0.2
                - strat_shuffle_split : bool, default False
                - kfold : bool, default False
                - kfold_bins : int, optional

    Returns
    -------
    Config
        A fully populated `Config` dataclass instance, with missing optional values
        filled in using defaults.
    """
    if config_dict.get("transform_conf", None) is None:
        transform_conf = TransformConf(TransformerConf(), TransformerConf())
    else:
        transform_conf = TransformConf(
            transform_input=TransformerConf(
                transform_data=config_dict["transform_conf"]["transform_input"].get(
                    "transform_data", False
                ),
                transformer_class=config_dict["transform_conf"]["transform_input"].get(
                    "transformer_class", "DefaultTransformer"
                ),
                transformer_options=config_dict["transform_conf"][
                    "transform_input"
                ].get("transformer_options", {}),
                columns=config_dict["transform_conf"]["transform_input"].get(
                    "columns", None
                ),
            )
            if config_dict["transform_conf"].get("transform_input", False)
            else TransformerConf(),
            transform_output=TransformerConf(
                transform_data=config_dict["transform_conf"]["transform_output"].get(
                    "transform_data", False
                ),
                transformer_class=config_dict["transform_conf"]["transform_output"].get(
                    "transformer_class", "DefaultTransformer"
                ),
                transformer_options=config_dict["transform_conf"][
                    "transform_output"
                ].get("transformer_options", {}),
                columns=config_dict["transform_conf"]["transform_output"].get(
                    "columns", []
                ),
            )
            if config_dict["transform_conf"].get("transform_output", False)
            else TransformerConf(),
        )

    if config_dict.get("testing_conf", None) is None:
        testing_conf = TestingConf()
    else:
        testing_conf = TestingConf(
            test=config_dict["testing_conf"].get("test", False),
            test_size=config_dict["testing_conf"].get("test_size", 0.2),
            strat_shuffle_split=config_dict["testing_conf"].get(
                "strat_shuffle_split", False
            ),
            kfold=config_dict["testing_conf"].get("kfold", False),
            kfold_bins=config_dict["testing_conf"].get("kfold_bins", None),
        )

    config = Config(
        data_conf=DataConf(
            num_inputs=config_dict["data_conf"]["num_inputs"],
            num_outputs=config_dict["data_conf"]["num_outputs"],
            output_index=config_dict["data_conf"].get("output_index"),
        ),
        transform_conf=transform_conf,
        training_conf=TrainingConf(
            model=ModelConf(
                model_class=config_dict["training_conf"]["model"]["model_class"],
                model_options=config_dict["training_conf"]["model"].get(
                    "model_options", {}
                ),
            ),
            likelihood=LikelihoodConf(
                likelihood_class=config_dict["training_conf"]["likelihood"].get(
                    "likelihood_class", "GaussianLikelihood"
                ),
                likelihood_options=config_dict["training_conf"]["likelihood"].get(
                    "likelihood_options", {}
                )
                if config_dict["training_conf"].get("likelihood", False)
                else LikelihoodConf(),
            ),
            learning_iterations=config_dict["training_conf"].get(
                "learning_iterations", 100
            ),
            botorch=config_dict["training_conf"].get("botorch", False),
            debug=config_dict["training_conf"].get("debug", True),
            optimizer=OptimizerConf(
                optimizer_class=config_dict["training_conf"]["optimizer"].get(
                    "optimizer_class", "Adam"
                ),
                optimizer_options=config_dict["training_conf"]["optimizer"].get(
                    "optimizer_options", {"lr": 0.1}
                ),
            )
            if config_dict["training_conf"].get("optimizer", False)
            else OptimizerConf(),
        ),
        testing_conf=testing_conf,
    )

    return config