Optimizer - PraisonAI

Optimize agent outputs using the evaluation system to measure, compare, and improve results.

Quick Start

Evaluate Agent Output

use praisonai::{Agent, AccuracyEvaluator};

// Create agent
let agent = Agent::new()
    .name("Writer")
    .instructions("Write concise summaries")
    .build()?;

// Get output
let output = agent.start("Summarize quantum computing").await?;

// Evaluate accuracy
let evaluator = AccuracyEvaluator::new()
    .input("Summarize quantum computing")
    .expected("Quantum computing uses qubits for parallel processing")
    .threshold(0.7)
    .build();

let result = evaluator.evaluate_simple(&output);
println!("Score: {} | Passed: {}", result.score.value, result.passed);

Criteria-Based Evaluation

use praisonai::{CriteriaEvaluator, CriteriaScore};
use std::collections::HashMap;

let evaluator = CriteriaEvaluator::new()
    .criterion("accuracy")
    .criterion("clarity")
    .criterion("completeness")
    .threshold(0.7)
    .build();

// Score each criterion
let mut scores = HashMap::new();
scores.insert("accuracy".to_string(), 0.9);
scores.insert("clarity".to_string(), 0.8);
scores.insert("completeness".to_string(), 0.75);

let result = evaluator.evaluate(&scores);
println!("Overall: {} | Passed: {}", result.score.value, result.passed);

User Interaction Flow

AccuracyEvaluator

Compare output against expected results.

pub struct AccuracyEvaluator {
    input: String,
    expected: String,
    config: EvaluatorConfig,
}

Builder Methods

Method	Signature	Description
`new()`	`fn new() -> AccuracyEvaluatorBuilder`	Create builder
`input(text)`	`fn input(impl Into<String>) -> Self`	Set input
`expected(text)`	`fn expected(impl Into<String>) -> Self`	Set expected output
`threshold(n)`	`fn threshold(f64) -> Self`	Pass threshold (0.0-1.0)
`build()`	`fn build(self) -> AccuracyEvaluator`	Build evaluator

Evaluation

let result = evaluator.evaluate_simple(&actual_output);
// result.score.value = 0.0-1.0
// result.passed = true/false

CriteriaEvaluator

Evaluate against custom criteria with weighted scores.

pub struct CriteriaEvaluator {
    criteria: Vec<String>,
    config: EvaluatorConfig,
}

Builder Methods

Method	Signature	Description
`new()`	`fn new() -> CriteriaEvaluatorBuilder`	Create builder
`criterion(name)`	`fn criterion(impl Into<String>) -> Self`	Add criterion
`threshold(n)`	`fn threshold(f64) -> Self`	Pass threshold
`build()`	`fn build(self) -> CriteriaEvaluator`	Build evaluator

Example

use praisonai::CriteriaEvaluator;
use std::collections::HashMap;

let evaluator = CriteriaEvaluator::new()
    .criterion("relevance")
    .criterion("coherence")
    .threshold(0.75)
    .build();

let mut scores = HashMap::new();
scores.insert("relevance".to_string(), 0.9);
scores.insert("coherence".to_string(), 0.8);

let result = evaluator.evaluate(&scores);

PerformanceEvaluator

Measure execution performance.

pub struct PerformanceEvaluator {
    max_duration: Duration,
    max_ttft: Option<Duration>,
    config: EvaluatorConfig,
}

Configuration

Option	Type	Default	Description
`max_duration`	`Duration`	30s	Maximum allowed time
`max_ttft`	`Option<Duration>`	None	Max time-to-first-token
`threshold`	`f64`	0.7	Pass threshold

Example

use praisonai::{PerformanceEvaluator, PerformanceMetrics};
use std::time::Duration;

let evaluator = PerformanceEvaluator::new()
    .max_duration(Duration::from_secs(10))
    .threshold(0.8)
    .build();

let metrics = PerformanceMetrics::new(Duration::from_secs(5));
let result = evaluator.evaluate(&metrics);

Judge

LLM-based evaluation for complex judgments.

pub struct Judge {
    pub name: String,
    pub config: JudgeConfig,
    pub threshold: f64,
}

Configuration

Option	Type	Default	Description
`model`	`String`	`"gpt-4o-mini"`	Model for judging
`temperature`	`f64`	`0.0`	LLM temperature
`system_prompt`	`Option<String>`	None	Custom system prompt

Example

use praisonai::Judge;

let judge = Judge::new("quality-judge")
    .with_threshold(0.8);

let result = judge.judge(
    "Explain quantum computing",
    &agent_output,
    Some("Expected explanation of qubits and superposition")
);

println!("Score: {} | Reason: {}", result.score, result.reasoning);

Optimization Loop Pattern

use praisonai::{Agent, AccuracyEvaluator};

let agent = Agent::new()
    .name("Writer")
    .build()?;

let evaluator = AccuracyEvaluator::new()
    .expected("Clear, concise explanation")
    .threshold(0.8)
    .build();

let mut output = agent.start("Explain AI").await?;
let mut result = evaluator.evaluate_simple(&output);

// Iterate until passing
while !result.passed {
    let feedback = format!(
        "Previous score: {}. Improve clarity and accuracy.",
        result.score.value
    );
    output = agent.start(&feedback).await?;
    result = evaluator.evaluate_simple(&output);
}

println!("Final output (score {}): {}", result.score.value, output);

Best Practices

Define clear evaluation criteria

Use specific, measurable criteria for consistent evaluation.

Set appropriate thresholds

Start with 0.7-0.8 threshold and adjust based on use case.

Combine evaluators for comprehensive assessment

Use AccuracyEvaluator + PerformanceEvaluator for complete picture.

Log iteration history

Track scores across iterations to identify improvement patterns.

Evaluation

Evaluation system

Agent

Agent API

Rust

​Quick Start

​User Interaction Flow

​AccuracyEvaluator

​Builder Methods

​Evaluation

​CriteriaEvaluator

​Builder Methods

​Example

​PerformanceEvaluator

​Configuration

​Example

​Judge

​Configuration

​Example

​Optimization Loop Pattern

​Best Practices

​Related

Evaluation

Agent

Quick Start

User Interaction Flow

AccuracyEvaluator

Builder Methods

Evaluation

CriteriaEvaluator

Builder Methods

Example

PerformanceEvaluator

Configuration

Example

Judge

Configuration

Example

Optimization Loop Pattern

Best Practices

Related