Wyrm

A reverse mode, define-by-run, low-overhead autodifferentiation library.

Features

Performs backpropagation through arbitrary, define-by-run computation graphs, emphasizing low overhead estimation of sparse, small models on the CPU.

Highlights:

Low overhead.
Built-in support for sparse gradients.
Define-by-run.
Trivial Hogwild-style parallelisation, scaling linearly with the number of CPU cores available.

Requires the nightly compiler due to use of SIMD intrinsics.

Quickstart

The following defines a univariate linear regression model, then backpropagates through it.

```rust let slope = ParameterNode::new(randommatrix(1, 1)); let intercept = ParameterNode::new(randommatrix(1, 1));

let x = InputNode::new(randommatrix(1, 1)); let y = InputNode::new(randommatrix(1, 1));

let yhat = slope.clone() * x.clone() + intercept.clone(); let mut loss = (y.clone() - yhat).square(); ```

To optimize the parameters, create an optimizer object and go through several epochs of learning:

```rust let mut optimizer = SGD::new(0.1, vec![slope.clone(), intercept.clone()]);

for _ in 0..numepochs { let xvalue: f32 = rand::random(); let yvalue = 3.0 * xvalue + 5.0;

// You can re-use the computation graph
// by giving the input nodes new values.
x.set_value(x_value);
y.set_value(y_value);

loss.forward();
loss.backward(1.0);

optimizer.step();
loss.zero_gradient();

} ```

You can use rayon to fit your model in parallel, by first creating a set of shared parameters, then building a per-thread copy of the model:

```rust let slopeparam = Arc::new(HogwildParameter::new(randommatrix(1, 1))); let interceptparam = Arc::new(HogwildParameter::new(randommatrix(1, 1))); let num_epochs = 10;

(0..rayon::currentnumthreads()) .intopariter() .foreach(|| { let slope = ParameterNode::shared(slopeparam.clone()); let intercept = ParameterNode::shared(interceptparam.clone()); let x = InputNode::new(randommatrix(1, 1)); let y = InputNode::new(randommatrix(1, 1)); let yhat = slope.clone() * x.clone() + intercept.clone(); let mut loss = (y.clone() - yhat).square();

       let mut optimizer = SGD::new(0.1, vec![slope.clone(), intercept.clone()]);

       for _ in 0..num_epochs {
           let x_value: f32 = rand::random();
           let y_value = 3.0 * x_value + 5.0;

           x.set_value(x_value);
           y.set_value(y_value);

           loss.forward();
           loss.backward(1.0);

           optimizer.step();
           loss.zero_gradient();
       }
   });

```

BLAS support

You should enable BLAS support to get (much) better performance out of matrix-multiplication-heavy workloads. To do so, add the following to your Cargo.toml:

text ndarray = { version = "0.11.0", features = ["blas", "serde-1"] } blas-src = { version = "0.1.2", default-features = false, features = ["openblas"] } openblas-src = { version = "0.5.6", default-features = false, features = ["cblas"] }