Source code for zounds.learn.pytorch_model

import warnings
import featureflow as ff
from .preprocess import Preprocessor, PreprocessResult, Op
from zounds.persistence.util import extract_init_args
import torch


class PyTorchPreprocessResult(PreprocessResult):
    def __init__(self, data, op, inversion_data=None, inverse=None, name=None):
        super(PyTorchPreprocessResult, self).__init__(
            data, op, inversion_data, inverse, name)

    def __getstate__(self):
        """
        Extract serializable state from an instance
        """
        forward_func = self.op._func
        inv_data_func = self.inversion_data._func
        backward_func = self.inverse._func
        network_params = self.op.network.state_dict()
        weights = dict(
            ((k, v.cpu().numpy()) for k, v in network_params.items()))
        cls = self.op.network.__class__
        name = self.name
        init_args = extract_init_args(self.op.network)

        kwargs = dict(self.op.kwargs)
        del kwargs['network']

        return dict(
            forward_func=forward_func,
            op_kwargs=kwargs,
            inv_data_func=inv_data_func,
            backward_func=backward_func,
            weights=weights,
            name=name,
            cls=cls,
            init_args=init_args)

    def __setstate__(self, state):
        """
        Re-hydrate an instance from serialized state
        """

        restored_weights = dict(
            ((k, torch.from_numpy(v))
             for k, v in state['weights'].items()))
        init_args = state['init_args']
        network = state['cls'](*init_args)
        network.load_state_dict(restored_weights)

        # KLUDGE: Should we *ever* implicitly move things to the GPU?  If not,
        # this would need to be done explicitly by the user when re-hydrating
        # the learning pipeline
        if torch.cuda.is_available():
            network = network.cuda()

        network.eval()

        self.op = Op(
            state['forward_func'],
            network=network,
            **state['op_kwargs'])

        self.inversion_data = Op(state['inv_data_func'], network=network)
        self.inverse = Op(state['backward_func'])
        self.name = state['name']

    def for_storage(self):
        return PyTorchPreprocessResult(
            None,
            self.op,
            self.inversion_data,
            self.inverse,
            self.name)


[docs]class PyTorchNetwork(Preprocessor):
    def __init__(
            self,
            trainer=None,
            post_training_func=None,
            needs=None,
            training_set_prep=None,
            chunksize=None):

        super(PyTorchNetwork, self).__init__(needs=needs)
        self.trainer = trainer
        self.post_training_func = post_training_func or (lambda x: x)
        self._cache = dict()
        self.training_set_prep = training_set_prep
        self.chunksize = chunksize

    def _forward_func(self):

        def x(d, network=None, chunk_size=None):
            from zounds.core import ArrayWithUnits, IdentityDimension
            from zounds.learn import apply_network

            result = apply_network(network, d, chunksize=chunk_size)
            try:
                return ArrayWithUnits(
                    result, [d.dimensions[0], IdentityDimension()])
            except (AttributeError, ValueError):
                return result

        return x

    def _backward_func(self):
        def x(_):
            raise NotImplementedError()

        return x

    def _enqueue(self, data, pusher):
        if self._cache is None:
            self._cache = dict()
        k = self._dependency_name(pusher)
        self._cache[k] = data

    def _dequeue(self):

        if self._cache is None:
            raise ff.NotEnoughData()

        if isinstance(self._cache, dict) \
                and len(self._cache) != len(self.needs):
            raise ff.NotEnoughData()

        data = self._cache
        self._cache = None
        return data

    def _train(self, data):
        trained_network = self.trainer.train(data)
        trained_network.zero_grad()
        trained_network.eval()
        return trained_network

    def _process(self, data):
        data = self._extract_data(data)
        if self.training_set_prep:
            data = self.training_set_prep(data)

        trained_network = self._train(data)

        chunksize = self.chunksize or self.trainer.batch_size

        try:
            forward_func = self._forward_func()
            x = self.post_training_func(data['data'])
            processed_data = forward_func(
                x, network=trained_network, chunk_size=chunksize)
        except RuntimeError as e:
            processed_data = None
            # the dataset may be too large to fit onto the GPU all at once
            warnings.warn(e.message)

        op = self.transform(
            network=trained_network, chunk_size=self.trainer.batch_size)
        inv_data = self.inversion_data()
        inv = self.inverse_transform()

        yield PyTorchPreprocessResult(
            processed_data,
            op,
            inversion_data=inv_data,
            inverse=inv,
            name='PyTorchNetwork')


[docs]class PyTorchGan(PyTorchNetwork):
    def __init__(self, apply_network='generator', trainer=None, needs=None):
        super(PyTorchGan, self).__init__(trainer=trainer, needs=needs)

        if apply_network not in ('generator', 'discriminator'):
            raise ValueError(
                'apply_network must be one of (generator, discriminator)')

        self.apply_network = apply_network
        self._cache = None

    def _forward_func(self):
        def x(d, network=None, apply_network=None):
            from zounds.core import ArrayWithUnits, IdentityDimension
            from zounds.learn import apply_network as apply
            import numpy as np

            if apply_network == 'generator':
                n = network.generator
            else:
                n = network.discriminator

            result = apply(n, d.astype(np.float32), chunksize=128)

            try:
                return ArrayWithUnits(
                    result, d.dimensions[:-1] + (IdentityDimension(),))
            except AttributeError:
                return result
            except ValueError:
                # the number of dimensions has likely changed
                return result

        return x

    def _backward_func(self):
        def x(_):
            raise NotImplementedError()

        return x

    def _enqueue(self, data, pusher):
        self._cache = data

    def _process(self, data):
        data = self._extract_data(data)

        network = self._train(data)

        try:
            # note that the processed data passed on to the next step in the
            # training pipeline will be the labels output by the discriminator
            forward_func = self._forward_func()
            processed_data = forward_func(
                data, network=network, apply_network='discriminator')
        except RuntimeError as e:
            processed_data = None
            # the dataset may be too large to fit onto the GPU all at once
            warnings.warn(e.message)

        op = self.transform(network=network, apply_network=self.apply_network)
        inv_data = self.inversion_data()
        inv = self.inverse_transform()

        yield PyTorchPreprocessResult(
            processed_data,
            op,
            inversion_data=inv_data,
            inverse=inv,
            name='PyTorchGan')


[docs]class PyTorchAutoEncoder(PyTorchNetwork):
    def __init__(self, trainer=None, needs=None):
        super(PyTorchAutoEncoder, self).__init__(trainer=trainer, needs=needs)
        self._cache = None

    def _forward_func(self):
        def x(d, network=None):
            from zounds.core import ArrayWithUnits, IdentityDimension
            from zounds.learn import apply_network
            import numpy as np

            encoded = apply_network(
                network.encoder, d.astype(np.float32), chunksize=128)

            try:
                extra_dims = (IdentityDimension(),) * (encoded.ndim - 1)
                return ArrayWithUnits(
                    encoded, d.dimensions[:1] + extra_dims)
            except AttributeError:
                return encoded

        return x

    def _backward_func(self):
        def x(d, network=None):
            from zounds.learn import apply_network
            import numpy as np
            return apply_network(
                network.decoder, d.astype(np.float32), chunksize=128)

        return x

    def _enqueue(self, data, pusher):
        self._cache = data

    def _process(self, data):
        data = self._extract_data(data)

        data = dict(data=data, labels=data)

        trained_network = self._train(data)

        processed_data = None
        inp = data['data']

        while processed_data is None:
            try:
                forward_func = self._forward_func()
                processed_data = forward_func(inp, network=trained_network)
            except RuntimeError as e:
                processed_data = None
                warnings.warn(e.message)
                # we've just experienced an out of memory exception.  Cut the
                # size of the input data in half, so that downstream nodes that
                # need some data to initialize themselves can do so
                inp = inp[:len(inp) // 64]
            except ValueError:
                break

        op = self.transform(network=trained_network)
        inv_data = self.inversion_data(network=trained_network)
        inv = self.inverse_transform()

        yield PyTorchPreprocessResult(
            processed_data,
            op,
            inversion_data=inv_data,
            inverse=inv,
            name='PyTorchAutoEncoder')