Achieving Over 4000x Speedups and Meta-Evolving Discoveries with PureJaxRL

We can leverage recent advancements in JAX to train parallelised RL agents over 4000x faster entirely on GPUs. Unlike past RL implementations, ours is written end-to-end in Jax.