incerto.llm.ContrastiveDecoding#

class incerto.llm.ContrastiveDecoding[source]#

Uncertainty from contrastive decoding (comparing expert vs amateur models).

Uses the difference in predictions between a strong and weak model to identify regions of high uncertainty.

Methods

`__init__`()
`compute_contrastive_score`(expert_logits, ...)	Compute contrastive decoding score in log-space.
`disagreement_score`(expert_logits, amateur_logits)	Measure disagreement between expert and amateur.

static compute_contrastive_score(expert_logits, amateur_logits, alpha=0.5)[source]#

Compute contrastive decoding score in log-space.

Score = log(expert_prob) - alpha * log(amateur_prob)

Parameters:

Return type:

Tensor

Returns:

Contrastive scores (log-space)

static disagreement_score(expert_logits, amateur_logits)[source]#

Measure disagreement between expert and amateur.

Parameters:

Return type:

Tensor

Returns:

Disagreement score (KL divergence)

incerto.llm.ContrastiveDecoding