Nano Diffusion Speedrun

A minimal implementation for tokenizing ImageNet and training GPT/Diffusion models, optimized for performance and simplicity. This codebase provides an efficient path from initialization to image generation.

Features

NVIDIA's Cosmos tokenizer for image tokenization
Implementation of both GPT and Diffusion architectures
Multi-GPU training optimization

Installation

# Clone the repository
git clone https://github.com/fal-ai/diffusion-speedrun
cd diffusion-speedrun

# Execute setup script
bash oneclick_setup.sh

Training Pipeline

1. Data Preparation

The repository utilizes pre-tokenized ImageNet data for optimal performance. For custom tokenization:

cd tokenize_dataset
python download.py download-models     # Acquire Cosmos tokenizer
python download.py download-preprocessed  # Acquire preprocessed ImageNet

2. Model Training

# Single GPU Configuration
python train_gpt.py

# Multi-GPU Configuration (Recommended)
torchrun --nproc_per_node=8 train_gpt.py \
    --run_name="experiment_1" \
    --global_batch_size=128 \
    --per_gpu_batch_size=16 \
    --num_iterations=51000 \
    --learning_rate=3e-3

3. Image Generation

python generate_gpt.py \
    --checkpoint="path/to/checkpoint.pt" \
    --num_samples=5 \
    --temperature=1.0 \
    --top_k=100 \
    --class_ids="1,130" \
    --output_dir="generated_images"

Acknowledgments

NVIDIA's Cosmos Tokenizer
@karpathy for foundational GPT implementation
@kellerjordan for nano-gpt speedrun efforts, which I took many ideas from

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
ema		ema
generated_images		generated_images
tokenize_dataset		tokenize_dataset
.gitignore		.gitignore
README.md		README.md
generate_gpt.py		generate_gpt.py
nccl_test.py		nccl_test.py
oneclick_setup.sh		oneclick_setup.sh
sweep.sh		sweep.sh
train_gpt.py		train_gpt.py
train_gpt_or_diffusion.py		train_gpt_or_diffusion.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Nano Diffusion Speedrun

Features

Installation

Training Pipeline

1. Data Preparation

2. Model Training

3. Image Generation

Acknowledgments

License

About

Releases

Packages

Contributors 2

Languages

fal-ai/diffusion-speedrun

Folders and files

Latest commit

History

Repository files navigation

Nano Diffusion Speedrun

Features

Installation

Training Pipeline

1. Data Preparation

2. Model Training

3. Image Generation

Acknowledgments

License

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages