qcbm

Skill for understanding, using, and implementing the Quantum Circuit Born Machine (QCBM) for learning discrete probability distributions (Bars-and-Stripes) via the QCBMAlgorithm class.

unitarylab 25 2 Updated 2mo ago

Resources

GitHub

Install

npx skillscat add unitarylab/quantum-skills/qcbm

Install via the SkillsCat registry.

SKILL.md

Quantum Circuit Born Machine (QCBM)

Purpose

QCBM is an unsupervised generative model that uses the Born rule to map a parameterized quantum circuit's measurement outcomes to a probability distribution. It learns to match an arbitrary target distribution by minimizing KL divergence.

Use this skill when you need to:

Learn and generate samples from a discrete probability distribution using a quantum circuit.
Demonstrate generative quantum machine learning with Born-rule probabilities.

One-Step Run Example Command

python ./scripts/algorithm.py

Overview

Target: 2×2 Bars-and-Stripes (BAS) distribution over 4 bits (6 valid patterns out of 16).
Initialize variational parameters $\theta \in \mathbb{R}^{n_layers \times n_qubits}$.
For each epoch: compute Born-rule probabilities $p_\theta(x)$, compute KL divergence, compute Parameter Shift gradients.
Update $\theta$ with Adam optimizer.

Prerequisites

Born rule: measurement probabilities $p_\theta(x) = |\langle x|\psi(\theta)\rangle|^2$.
KL divergence; Parameter Shift Rule.
Adam optimizer.
torch, numpy, Circuit.

Using the Provided Implementation

from unitarylab.algorithms import QCBMAlgorithm

algo = QCBMAlgorithm(seed=42)
result = algo.run(
    n_qubits=4,
    n_layers=4,
    epochs=40,
    lr=0.1,
    backend='torch'
)

print(f"Final KL divergence: {result['loss_history'][-1]:.4f}")
print(result['plot'])

Core Parameters Explained

Constructor

Parameter	Type	Default	Description
`seed`	`int`	`42`	Random seed for reproducibility.

`run()` Parameters

Parameter	Type	Default	Description
`n_qubits`	`int`	`4`	Number of qubits. BAS requires exactly 4.
`n_layers`	`int`	`4`	Number of variational layers.
`epochs`	`int`	`40`	Training epochs.
`lr`	`float`	`0.1`	Adam optimizer learning rate.
`backend`	`str`	`'torch'`	Simulation backend.
`algo_dir`	`str\|None`	`None`	Output directory for plots and circuit.

Return Fields

Key	Type	Description
`status`	`str`	`'success'`.
`loss_history`	`List[float]`	KL divergence at each epoch.
`circuit`	`Circuit`	Example ansatz circuit.
`circuit_path`	`str`	Path to circuit SVG.
`plot_path`	`str`	Path to training curve PNG.
`plot`	`str`	ASCII art result panel.

Implementation Architecture

QCBMAlgorithm in algorithm.py trains a variational quantum circuit to learn a discrete probability distribution (2×2 Bars and Stripes) using KL divergence minimization and the Parameter Shift Rule.

run(n_qubits, n_layers, epochs, lr, backend, algo_dir) — Five Stages:

Stage	Code Action	Algorithmic Role
1 — Initialization	`_get_bas_dist(n_qubits)` → `target_probs`; `theta = nn.Parameter(torch.rand((n_layers, n_qubits))*2π)`; Adam optimizer	BAS target distribution and random parameter init
2 — Circuit Preview	`_build_circuit(theta.detach(), n_qubits, backend)`	Visualization only — not used for training
3 — Training Loop	Per epoch: `curr_probs = _get_probs(theta, ...)`; manual KL loss; parameter shift per `(l,q)`: `_get_probs(th_p/th_m, ...)`; `grad = 0.5*(p_p - p_m)`; `optimizer.step()`	Full quantum gradient-based KL minimization
4 — Evaluation	`_get_probs(theta, ...)` with final params → `final_probs`	Final distribution capture
5 — Export	`_generate_all_outputs(target, final, history, ...)`	Saves 3 plots: KL loss curve, distribution comparison bar chart, BAS sample grid

Helper Methods:

_get_bas_dist(n_qubits) — Hardcoded BAS distribution: valid = [0, 3, 5, 10, 12, 15]; returns a tensor with uniform probability 1/6 over these 6 states and 0 elsewhere.
_build_circuit(theta, n_qubits, backend) — Circuit(n_qubits, backend=backend); per layer $l$: ry(theta[l,q], q) for all qubits (RY gates); then ring cx(q, (q+1)%n_qubits) for all qubits (skipped in last layer).
_get_probs(theta, n_qubits, backend) — Calls _build_circuit, executes with initial_state=|0⟩, converts |ψ|² to a torch tensor of length 2^n_qubits.

Data flow: _get_bas_dist() → target_probs → training loop → _get_probs() (current + shift±) → KL gradient per (l,q) → Adam step → final_probs → _generate_all_outputs() → result dict.

Understanding the Key Quantum Components

1. Born Rule Probability

The probability of measuring basis state $|x\rangle$:
$$p_\theta(x) = |\langle x|U(\theta)|0^{\otimes n}\rangle|^2$$
This is the squared amplitude — the uniquely quantum mechanism. All $2^n$ probabilities sum to 1 by unitarity.

2. Variational Circuit Ansatz

Each layer applies:

Per-qubit: Rz(θ[l,q])
Entanglement: CNOT(q, q+1 mod n_qubits)  [ring topology]

The ring entanglement generates long-range correlations needed to represent BAS patterns.

3. 2×2 Bars-and-Stripes Target Distribution

The BAS dataset encodes 2×2 binary images where columns or rows are uniformly ON or OFF:

All-rows: 0000, 1111 (all off / all on)
Row patterns: 0011, 1100
Column patterns: 0101, 1010

The target is uniform over these 6 patterns: $p_{\text{target}}(x) = 1/6$ for valid patterns, 0 otherwise.

4. KL Divergence Loss

$$\mathcal{L} = D_{\text{KL}}(p_{\text{target}} | p_\theta) = \sum_x p_{\text{target}}(x) \log\frac{p_{\text{target}}(x)}{p_\theta(x) + \epsilon}$$

5. Parameter Shift Gradient

$$\frac{\partial \mathcal{L}}{\partial \theta_{l,q}} = \frac{1}{2}\left[\mathcal{L}(\theta_{l,q}+\pi/2) - \mathcal{L}(\theta_{l,q}-\pi/2)\right]$$

Theory-to-Code Mapping

README / Theory Concept	Code Object or Location
Target distribution $\pi$ (BAS)	`_get_bas_dist()` — states `[0,3,5,10,12,15]`, each prob `1/6`
Variational circuit $U(\theta)$	`_build_circuit(theta, n_qubits, backend)` — RY layers + ring CNOT entanglement
Born rule probabilities $p_k =	\langle k
KL divergence $D_{\text{KL}}(\pi \| p_\theta)$	`sum(target * log((target+ε)/(curr+ε)))` in training loop
Parameter shift rule $\partial_\theta \mathcal{L}$	`grad = 0.5*(p_plus - p_minus)` for each `(l,q)` index
KL gradient wrt $\theta_{l,q}$	`grad_theta[l,q] = sum(-(target/(curr+ε)) * grad_p)`
Adam optimizer update	`torch.optim.Adam([theta], lr=lr)`
BAS valid states	`[0(0000), 3(0011), 5(0101), 10(1010), 12(1100), 15(1111)]`
Note — gate type	Circuit uses `ry(theta[l,q], q)` (RY gates); the "Rz" reference in Key Quantum Components is a discrepancy — actual gate is RY

Mathematical Deep Dive

State: $|\psi(\theta)\rangle = U(\theta)|0^n\rangle = \prod_{l=1}^{L}[\text{CX-ring} \cdot \bigotimes_q R_z(\theta_{l,q})]|0^n\rangle$.

Probabilities: $\mathbf{p}\theta = (p\theta(0), \ldots, p_\theta(2^n-1))$ where $\sum_x p_\theta(x) = 1$.

Information-theoretic convergence: As $\mathcal{L} \to 0$, $p_\theta \to p_{\text{target}}$ in total variation distance.

Hands-On Example

from unitarylab.algorithms import QCBMAlgorithm
import numpy as np

for seed in [42, 123, 7]:
    algo = QCBMAlgorithm(seed=seed)
    result = algo.run(n_qubits=4, n_layers=6, epochs=60, lr=0.08)
    final_loss = result['loss_history'][-1]
    print(f"seed={seed}: final KL = {final_loss:.4f}")

Implementing Your Own Version

The following skeleton reconstructs the QCBM circuit builder, Born-rule probability extraction, and Parameter Shift gradient loop.

# Simplified reconstruction — mirrors QCBMAlgorithm._build_circuit(), _get_probs(), training loop
import numpy as np
import torch
from unitarylab.core import Circuit

def build_circuit(theta: torch.Tensor, n_qubits: int,
                  backend: str = 'torch') -> Circuit:
    """Ry-layer + CNOT-ring architecture, n_layers = theta.shape[0]."""
    gs = Circuit(n_qubits, backend=backend)
    for l in range(theta.shape[0]):
        for q in range(n_qubits):
            gs.ry(float(theta[l, q]), q)
        if l < theta.shape[0] - 1:
            for q in range(n_qubits):
                gs.cx(q, (q + 1) % n_qubits)  # ring entanglement
    return gs

def get_probs(theta: torch.Tensor, n_qubits: int,
              backend: str = 'torch') -> torch.Tensor:
    """Execute circuit and return Born-rule probability vector (length 2^n_qubits)."""
    qc = build_circuit(theta, n_qubits, backend)
    psi0 = np.zeros((2**n_qubits, 1), dtype=np.complex128)
    psi0[0, 0] = 1.0
    final_sv = qc.execute(initial_state=psi0)
    amplitudes = np.asarray(final_sv).flatten()
    return torch.as_tensor(np.abs(amplitudes)**2)

def train_qcbm(target_probs: torch.Tensor, n_qubits: int = 4,
               n_layers: int = 4, epochs: int = 40, lr: float = 0.1,
               backend: str = 'torch') -> torch.Tensor:
    """Full KL-divergence training loop with Parameter Shift gradients."""
    theta = torch.nn.Parameter(torch.rand((n_layers, n_qubits)) * 2 * np.pi)
    optimizer = torch.optim.Adam([theta], lr=lr)
    shift = np.pi / 2
    eps = 1e-12

    for ep in range(1, epochs + 1):
        curr_probs = get_probs(theta.detach(), n_qubits, backend)
        kl_loss = torch.sum(target_probs * torch.log((target_probs + eps) / (curr_probs + eps)))

        # Parameter Shift gradients
        grad = torch.zeros_like(theta)
        for l in range(n_layers):
            for q in range(n_qubits):
                th_p = theta.detach().clone(); th_p[l, q] += shift
                th_m = theta.detach().clone(); th_m[l, q] -= shift
                p_p = get_probs(th_p, n_qubits, backend)
                p_m = get_probs(th_m, n_qubits, backend)
                dp  = 0.5 * (p_p - p_m)  # gradient of prob w.r.t. theta[l,q]
                grad[l, q] = torch.sum(-(target_probs / (curr_probs + eps)) * dp)

        optimizer.zero_grad(); theta.grad = grad; optimizer.step()
    return theta.detach()

Component roles:

build_circuit — faithfully mirrors _build_circuit(): per-layer Ry rotations on all qubits, followed by a CNOT ring (except on the last layer).
get_probs — mirrors _get_probs(): executes from $|0\rangle^{\otimes n}$ and returns $|\langle x|\psi(\theta)\rangle|^2$ for all $x$.
train_qcbm — mirrors the training loop: KL divergence as the loss, Parameter Shift Rule for exact analytical gradients, Adam optimizer.

Debugging Tips

KL divergence not decreasing: Increase n_layers (6+) or epochs (80+). For BAS with 4 qubits, at least 4 layers are needed.
n_qubits != 4: The BAS target distribution is hard-coded for 4 qubits. Changing n_qubits changes the circuit but the target distribution remains 4-qubit BAS.
Slow training: Parameter Shift requires $2 \times n_layers \times n_qubits$ circuit evaluations per epoch. For n_layers=4, n_qubits=4, this is 32 circuits per epoch.
lr too large: May cause KL to oscillate or diverge. Use lr=0.05–0.15.
Numerical stability: The KL divergence adds eps=1e-12 to avoid log(0). If probabilities collapse to 0 for some states, consider entropy regularization.

qcbm

Resources

Install

Quantum Circuit Born Machine (QCBM)

Purpose

One-Step Run Example Command

Overview

Prerequisites

Using the Provided Implementation

Core Parameters Explained

Constructor

run() Parameters

Return Fields

Implementation Architecture

Understanding the Key Quantum Components

1. Born Rule Probability

2. Variational Circuit Ansatz

3. 2×2 Bars-and-Stripes Target Distribution

4. KL Divergence Loss

5. Parameter Shift Gradient

Theory-to-Code Mapping

Mathematical Deep Dive

Hands-On Example

Implementing Your Own Version

Debugging Tips

Categories

Install

Recommended Skills

`run()` Parameters