DuckDB Agent - PraisonAI Documentation

Prerequisites

Python 3.10 or higher
PraisonAI Agents package installed
duckdb package installed
Basic understanding of SQL and databases

DuckDB Tools

Use DuckDB Tools to manage and query databases with AI agents.

Install Dependencies

First, install the required packages:

pip install praisonaiagents duckdb

Import Components

Import the necessary components:

from praisonaiagents import Agent, Task, PraisonAIAgents
from praisonaiagents.tools import execute_query, load_csv, export_csv

Create Agent

Create a DuckDB database agent:

db_agent = Agent(
    name="DBProcessor",
    role="Database Management Specialist",
    goal="Manage and query databases efficiently.",
    backstory="Expert in database operations and SQL.",
    tools=[execute_query, load_csv, export_csv],
    self_reflect=False
)

Define Task

Define the database task:

db_task = Task(
    description="Query and analyze database data.",
    expected_output="Query results and analysis.",
    agent=db_agent,
    name="db_analysis"
)

Run Agent

Initialize and run the agent:

agents = PraisonAIAgents(
    agents=[db_agent],
    tasks=[db_task],
    process="sequential"
)
agents.start()

Available Functions

from praisonaiagents.tools import execute_query
from praisonaiagents.tools import load_csv
from praisonaiagents.tools import export_csv

Function Details

execute_query(query: str, params: Optional[Union[tuple, dict]] = None, return_df: bool = True)

Executes SQL queries with advanced features:

Supports parameterized queries
Returns results as DataFrame records or raw tuples
Full SQL query support (SELECT, INSERT, UPDATE, DELETE, etc.)
Automatic connection management

# Basic SELECT query
results = execute_query("SELECT * FROM employees")

# Parameterized query
results = execute_query(
    "SELECT * FROM employees WHERE department = ? AND salary > ?",
    params=('Engineering', 75000)
)

# Named parameters
results = execute_query(
    "SELECT * FROM employees WHERE department = :dept",
    params={'dept': 'Engineering'}
)
# Returns: List[Dict[str, Any]]
# Example: [{"id": 1, "name": "Alice", "department": "Engineering"}, ...]

load_csv(table_name: str, filepath: str, schema: Optional[Dict[str, str]] = None, if_exists: str = ‘replace’)

Loads CSV files into DuckDB tables:

Optional schema definition
Flexible table existence handling
Automatic type inference
Support for large files

# Basic usage - auto schema inference
success = load_csv("employees", "employees.csv")

# With custom schema
schema = {
    "id": "INTEGER PRIMARY KEY",
    "name": "VARCHAR",
    "salary": "DECIMAL(10,2)",
    "hire_date": "DATE"
}
success = load_csv(
    "employees",
    "employees.csv",
    schema=schema,
    if_exists='replace'
)
# Returns: bool (True if successful)

export_csv(query: str, filepath: str, params: Optional[Union[tuple, dict]] = None)

Exports query results to CSV files:

Supports parameterized queries
Automatic header generation
Configurable output formatting
Large result set handling

# Export simple query results
success = export_csv(
    "SELECT * FROM employees",
    "exported_employees.csv"
)

# Export filtered data with parameters
success = export_csv(
    "SELECT * FROM employees WHERE department = ? AND year = ?",
    "eng_2023.csv",
    params=('Engineering', 2023)
)
# Returns: bool (True if successful)

Understanding DuckDB Tools

What are DuckDB Tools?

DuckDB Tools provide database capabilities for AI agents:

SQL query execution
Data import/export
Schema management
Data analysis
Performance optimization

Key Components

DB Agent

Create specialized database agents:

Agent(tools=[execute_query, load_csv, export_csv])

DB Task

Define database tasks:

Task(description="db_operation")

Process Types

Sequential or parallel processing:

process="sequential"

DB Options

Customize database parameters:

read_only=True, memory=True

Examples

Basic Database Agent

from praisonaiagents import Agent, Task, PraisonAIAgents
from praisonaiagents.tools import execute_query, load_csv, export_csv

# Create database agent
db_agent = Agent(
    name="DBExpert",
    role="Database Specialist",
    goal="Query and analyze data efficiently.",
    backstory="Expert in database management and SQL.",
    tools=[execute_query, load_csv, export_csv],
    self_reflect=False
)

# Define database task
db_task = Task(
    description="Analyze sales performance data.",
    expected_output="Sales analysis report.",
    agent=db_agent,
    name="sales_analysis"
)

# Run agent
agents = PraisonAIAgents(
    agents=[db_agent],
    tasks=[db_task],
    process="sequential"
)
agents.start()

Advanced Database Operations with Multiple Agents

# Create query agent
query_agent = Agent(
    name="QueryProcessor",
    role="SQL Query Specialist",
    goal="Execute SQL queries efficiently.",
    tools=[execute_query],
    self_reflect=False
)

# Create data import/export agent
data_agent = Agent(
    name="DataProcessor",
    role="Data Import/Export Specialist",
    goal="Handle data import and export operations efficiently.",
    tools=[load_csv, export_csv],
    self_reflect=False
)

Dependencies

The DuckDB tools require the following Python packages:

duckdb: For database operations
pandas: For data manipulation and CSV handling

These will be automatically installed when needed.

Example Agent Configuration

from praisonaiagents import Agent
from praisonaiagents.tools import execute_query, load_csv, export_csv

agent = Agent(
    name="DBProcessor",
    description="An agent that works with DuckDB databases",
    tools=[execute_query, load_csv, export_csv]
)

Error Handling

All functions include comprehensive error handling:

Database connection errors
Query syntax errors
File I/O errors
Schema validation errors
Missing dependency errors

Errors are logged and returned in a consistent format:

Success cases return the expected data type
Error cases return a dict with an “error” key containing the error message

Common Use Cases

Data Analysis:

# Load data
load_csv("sales", "sales_data.csv")

# Analyze with SQL
results = execute_query("""
    SELECT 
        department,
        COUNT(*) as count,
        AVG(salary) as avg_salary
    FROM employees
    GROUP BY department
    HAVING count > 5
    ORDER BY avg_salary DESC
""")

Data Export:

# Export filtered and aggregated data
export_csv("""
    SELECT 
        date_trunc('month', date) as month,
        SUM(amount) as total_sales
    FROM sales
    GROUP BY 1
    ORDER BY 1
""", "monthly_sales.csv")

Data Transformation:

# Load and transform data
load_csv("raw_data", "input.csv")
execute_query("""
    CREATE TABLE transformed AS
    SELECT 
        id,
        UPPER(name) as name,
        ROUND(amount, 2) as amount,
        DATE_TRUNC('day', timestamp) as date
    FROM raw_data
""")
export_csv("SELECT * FROM transformed", "transformed.csv")

Best Practices

Agent Configuration

Configure agents with clear database focus:

Agent(
    name="DBProcessor",
    role="Database Specialist",
    goal="Process queries accurately and efficiently",
    tools=[execute_query, load_csv, export_csv]
)

Task Definition

Common Patterns

Database Operation Pipeline

# Query agent
querier = Agent(
    name="Querier",
    role="SQL Specialist",
    tools=[execute_query]
)

# Analysis agent
analyzer = Agent(
    name="Analyzer",
    role="Data Analyst"
)

# Define tasks
query_task = Task(
    description="Execute SQL queries",
    agent=querier
)

analyze_task = Task(
    description="Analyze query results",
    agent=analyzer
)

# Run workflow
agents = PraisonAIAgents(
    agents=[querier, analyzer],
    tasks=[query_task, analyze_task]
)

Tools

​DuckDB Tools

​Available Functions

​Function Details

​execute_query(query: str, params: Optional[Union[tuple, dict]] = None, return_df: bool = True)

​load_csv(table_name: str, filepath: str, schema: Optional[Dict[str, str]] = None, if_exists: str = ‘replace’)

​export_csv(query: str, filepath: str, params: Optional[Union[tuple, dict]] = None)

​Understanding DuckDB Tools

What are DuckDB Tools?

​Key Components

DB Agent

DB Task

Process Types

DB Options

​Examples

​Basic Database Agent

​Advanced Database Operations with Multiple Agents

​Dependencies

​Example Agent Configuration

​Error Handling

​Common Use Cases

​Best Practices

​Common Patterns

​Database Operation Pipeline

DuckDB Tools

Available Functions

Function Details

execute_query(query: str, params: Optional[Union[tuple, dict]] = None, return_df: bool = True)

load_csv(table_name: str, filepath: str, schema: Optional[Dict[str, str]] = None, if_exists: str = ‘replace’)

export_csv(query: str, filepath: str, params: Optional[Union[tuple, dict]] = None)

Understanding DuckDB Tools

Key Components

Examples

Basic Database Agent

Advanced Database Operations with Multiple Agents

Dependencies

Example Agent Configuration

Error Handling

Common Use Cases

Best Practices

Common Patterns

Database Operation Pipeline