Model Failover

Model Failover automatically switches between LLM providers when one fails, ensuring your agents remain operational even during API outages or rate limits.

Quick Start

Configure Auth Profiles

from praisonaiagents import AuthProfile, FailoverManager

# Create profiles for different providers
openai = AuthProfile(
    name="openai",
    provider="openai",
    api_key="sk-...",
    priority=1
)

anthropic = AuthProfile(
    name="anthropic", 
    provider="anthropic",
    api_key="sk-ant-...",
    priority=2
)

Setup Failover Manager

from praisonaiagents import FailoverConfig, FailoverManager

config = FailoverConfig(
    max_retries=3,
    retry_delay=1.0,
    exponential_backoff=True
)

manager = FailoverManager(config)
manager.add_profile(openai)
manager.add_profile(anthropic)

Use with Agent

from praisonaiagents import Agent

agent = Agent(
    name="assistant",
    failover=manager
)

# Automatically fails over on errors
response = agent.start("Hello!")

How It Works

Component	Role
AuthProfile	Credentials for a single provider
FailoverManager	Orchestrates failover logic
FailoverConfig	Retry and backoff settings
ProviderStatus	Tracks provider health

Configuration Options

from praisonaiagents import FailoverConfig

config = FailoverConfig(
    max_retries=3,              # Max retry attempts
    retry_delay=1.0,            # Initial delay (seconds)
    exponential_backoff=True,   # Enable exponential backoff
    max_retry_delay=60.0,       # Max delay between retries
    failover_on_rate_limit=True,# Failover on 429 errors
    failover_on_timeout=True,   # Failover on timeouts
    failover_on_error=True,     # Failover on other errors
)

Option	Type	Default	Description
`max_retries`	`int`	`3`	Maximum retry attempts
`retry_delay`	`float`	`1.0`	Initial retry delay
`exponential_backoff`	`bool`	`True`	Use exponential backoff
`max_retry_delay`	`float`	`60.0`	Maximum retry delay
`failover_on_rate_limit`	`bool`	`True`	Failover on 429
`failover_on_timeout`	`bool`	`True`	Failover on timeout

Auth Profiles

Configure credentials for each provider:

from praisonaiagents import AuthProfile

profile = AuthProfile(
    name="openai-primary",
    provider="openai",
    api_key="sk-...",
    base_url=None,           # Custom endpoint (optional)
    priority=1,              # Lower = higher priority
    weight=1.0,              # For load balancing
    rate_limit=100,          # Requests per minute
    metadata={}              # Custom metadata
)

Field	Type	Description
`name`	`str`	Unique profile identifier
`provider`	`str`	Provider: openai, anthropic, etc.
`api_key`	`str`	API key (masked in logs)
`base_url`	`str`	Custom API endpoint
`priority`	`int`	Failover priority (1 = highest)
`weight`	`float`	Load balancing weight
`rate_limit`	`int`	Rate limit (requests/min)

Common Patterns

Multi-Provider
Cost Optimization
Regional Failover

from praisonaiagents import AuthProfile, FailoverManager

manager = FailoverManager()

# Add multiple providers
manager.add_profile(AuthProfile(
    name="openai",
    provider="openai",
    api_key="sk-...",
    priority=1
))

manager.add_profile(AuthProfile(
    name="anthropic",
    provider="anthropic", 
    api_key="sk-ant-...",
    priority=2
))

manager.add_profile(AuthProfile(
    name="groq",
    provider="groq",
    api_key="gsk-...",
    priority=3
))

from praisonaiagents import AuthProfile, FailoverManager

manager = FailoverManager()

# Cheaper model first
manager.add_profile(AuthProfile(
    name="gpt-4o-mini",
    provider="openai",
    api_key="sk-...",
    priority=1,
    metadata={"model": "gpt-4o-mini"}
))

# Premium model as fallback
manager.add_profile(AuthProfile(
    name="gpt-4o",
    provider="openai",
    api_key="sk-...",
    priority=2,
    metadata={"model": "gpt-4o"}
))

from praisonaiagents import AuthProfile, FailoverManager

manager = FailoverManager()

# US region
manager.add_profile(AuthProfile(
    name="openai-us",
    provider="openai",
    api_key="sk-...",
    base_url="https://api.openai.com/v1",
    priority=1
))

# EU region
manager.add_profile(AuthProfile(
    name="azure-eu",
    provider="azure",
    api_key="...",
    base_url="https://eu.api.azure.com",
    priority=2
))

Failover Callbacks

React to failover events:

from praisonaiagents import FailoverManager, FailoverConfig

def on_failover(from_profile, to_profile, error):
    print(f"Failing over from {from_profile} to {to_profile}")
    print(f"Reason: {error}")
    # Log to monitoring system
    
config = FailoverConfig(
    on_failover=on_failover
)

manager = FailoverManager(config)

Provider Status

Monitor provider health:

from praisonaiagents import FailoverManager

manager = FailoverManager()

# Get status of all providers
status = manager.status()
for name, info in status.items():
    print(f"{name}: {info['status']}")
    print(f"  Failures: {info['failure_count']}")
    print(f"  Last success: {info['last_success']}")

# Reset a provider after recovery
manager.mark_success("openai")

# Reset all providers
manager.reset_all()

Best Practices

Configure multiple providers

Always have at least 2-3 providers configured. This ensures availability even during major outages.

Use exponential backoff

Enable exponential_backoff=True to avoid hammering providers during issues. This helps you stay within rate limits.

Set appropriate priorities

Order providers by cost and reliability. Put cheaper/faster providers first, with premium providers as fallback.

Monitor failover events

Use the on_failover callback to track when failovers occur. This helps identify provider issues early.

Models

Supported LLM providers

Rate Limiting

Control API usage

Getting Started

Core Concepts

Guides

Features

Models

Databases

Observability

Memory

Knowledge

RAG

Persistence

Tools

Other Features

Developers

Configuration

Best Practices

Getting Started (No Code)

Quick Start

How It Works

Configuration Options

Auth Profiles

Common Patterns

Failover Callbacks

Provider Status

Best Practices

Models

Rate Limiting

Getting Started

Core Concepts

Guides

Features

Models

Databases

Observability

Memory

Knowledge

RAG

Persistence

Tools

Other Features

Developers

Configuration

Best Practices

Getting Started (No Code)

​Quick Start

​How It Works

​Configuration Options

​Auth Profiles

​Common Patterns

​Failover Callbacks

​Provider Status

​Best Practices

​Related

Models

Rate Limiting

Quick Start

How It Works

Configuration Options

Auth Profiles

Common Patterns

Failover Callbacks

Provider Status

Best Practices

Related