Source code for backprop.models.auto_model

from typing import Dict
from backprop.models import HFNLIModel, STModel, HFSeq2SeqTGModel, T5QASummaryEmotion, \
    T5, HFCausalLMTGModel, HFSeqTCModel, EfficientNet, CLIP
from backprop import load
import torch

[docs]class AutoModel:
[docs]    @staticmethod
    def from_pretrained(model_name: str, aliases: Dict = None, device: str = None):
        """
        Loads a model by name

        Args:
            model_name: unique name of the model
            aliases: dictionary that maps aliases to model_name
            device: device to use model on. Defaults to "cuda" if available

        Returns:
            Initialised model object

        Example::

            import backprop

            model = backprop.models.AutoModel.from_pretrained("t5_small")
        """
        if device == None:
            device = "cuda" if torch.cuda.is_available() else "cpu"

        model = None

        models = AutoModel.list_models(return_dict=True)
        model_config = models.get(model_name)

        # Try to find by alias
        if model_config == None and aliases:
            name_from_alias = aliases.get(model_name)

            if name_from_alias:
                model_config = models.get(name_from_alias)
                if model_config:
                    model_name = name_from_alias

        # Try to load from local saved model
        if model_config == None:
            try:
                model = load(model_name)
                model.to(device)
            except ValueError:
                raise ValueError(f"Model '{model_name}' not found")
    
        if model == None:
            model_class = model_config["class"]
            init_kwargs = model_config["init_kwargs"]

            model = model_config["class"](**init_kwargs,
                    description=model_config["description"],
                    tasks=model_config["tasks"],
                    name=model_name,
                    details=model_config.get("details"),
                    device=device)

        return model

[docs]    @staticmethod
    def list_models(task=None, return_dict=False, display=False, limit=None,
                    aliases: Dict = None):
        """
        Lists available models

        Args:
            task: filter by task identifier
            return_dict: whether to return dictionary instead of a list
            display: print instead of returning
            limit: maximum number of models to include
            aliases: dict that maps aliases to model_name

        Example::

            import backprop
            backprop.models.AutoModel.list_models(task="text-vectorisation", display=True)
            
            > Name         clip
              Description  Model by OpenAI
              ...
        """

        models_classes = [HFNLIModel, STModel, HFSeq2SeqTGModel, T5QASummaryEmotion,
                          T5, HFCausalLMTGModel, HFSeqTCModel, EfficientNet, CLIP]

        if display:
            return_dict = False

        reverse_aliases = None
        if aliases:
            reverse_aliases = {v: k for k, v in aliases.items()}

        models_dict = {}
        models_list = []
        output = None

        num_models = 0

        for model_class in models_classes:
            models = model_class.list_models()
            
            for model_name, model_config in models.items():
                if not task or task in model_config.get("tasks"):
                    
                    if limit and num_models >= limit:
                        break

                    if reverse_aliases:
                        alias = reverse_aliases.get(model_name)
                        if alias:
                            model_config["alias"] = alias

                    # Get tasks that are finetunable
                    finetunable_tasks = []

                    details = model_config.get("details")
                    if details:
                        for k, v in details.items():
                            if isinstance(details.get(k), dict) and details.get(k).get("finetunable"):
                                finetunable_tasks.append(k)
                    
                    model_config["finetunable_tasks"] = finetunable_tasks

                    if return_dict:
                        model_config["class"] = model_class
                        models_dict[model_name] = model_config
                        output = models_dict
                    else:
                        model_config["name"] = model_name
                        models_list.append(model_config)
                        output = models_list
                    
                    num_models += 1

        if display:
            for model in models_list:

                print(f"{'Name' :25s}{model['name']}")

                if model.get("alias"):
                    print(f"{'Alias' :25s}{model['alias']}")

                print(f"{'Description' :25s}{model['description']}")
                print(f"{'Supported tasks' :25s}{model['tasks']}")
                print(f"{'Finetunable tasks' :25s}{model['finetunable_tasks']}")
                print("----------")
        else:
            return output