Multi-Modal Agent CLI

Work with images, PDFs, and files from the command line.

Commands

Analyze Image

# Analyze image from URL
praisonai-ts image analyze https://example.com/image.jpg \
  --prompt "What do you see?"

# Analyze local image
praisonai-ts image analyze ./photo.png \
  --prompt "Describe this image in detail"

# With specific model
praisonai-ts image analyze ./image.jpg \
  --model gpt-4o \
  --prompt "What objects are in this image?"

Generate Image

# Generate image with DALL-E
praisonai-ts image generate "A sunset over mountains" \
  --model dall-e-3 \
  --size 1024x1024 \
  --output ./sunset.png

# With quality setting
praisonai-ts image generate "Futuristic city" \
  --quality hd \
  --style vivid

Process PDF

# Summarize PDF
praisonai-ts pdf summarize ./document.pdf

# Extract text
praisonai-ts pdf extract ./document.pdf --output text.txt

# Ask questions about PDF
praisonai-ts pdf query ./document.pdf \
  --prompt "What are the main findings?"

Options

Option	Type	Default	Description
`--model`	string	`gpt-4o`	Model to use
`--prompt`	string	-	Analysis prompt
`--output`	string	-	Output file path
`--size`	string	`1024x1024`	Image size
`--quality`	string	`standard`	Image quality
`--json`	boolean	`false`	JSON output

Examples

Batch Image Analysis

# Analyze multiple images
praisonai-ts image analyze ./images/*.jpg \
  --prompt "Categorize this image" \
  --output results.json \
  --json

Compare Images

# Compare two images
praisonai-ts image compare ./image1.jpg ./image2.jpg \
  --prompt "What are the differences?"

Interactive Vision Chat

# Start vision chat session
praisonai-ts chat --vision \
  --model gpt-4o \
  --instructions "You are a helpful image analyst"

Environment Variables

Variable	Required	Description
`OPENAI_API_KEY`	Yes	For GPT-4o and DALL-E
`ANTHROPIC_API_KEY`	For Claude	Claude vision

praisonai-ts image list-models - List vision models
praisonai-ts image history - View generation history

JavaScript

​Multi-Modal Agent CLI

​Commands

​Analyze Image

​Generate Image

​Process PDF

​Options

​Examples

​Batch Image Analysis

​Compare Images

​Interactive Vision Chat

​Environment Variables

​Related Commands

Multi-Modal Agent CLI

Commands

Analyze Image

Generate Image

Process PDF

Options

Examples

Batch Image Analysis

Compare Images

Interactive Vision Chat

Environment Variables

Related Commands