Multi-Modal (Images)

Multi-Modal (Images)
Next Steps

const agent = new Agent({
  name: 'Vision Agent',
  instructions: 'You can analyze images.',
  model: openai('gpt-4o'),
});

await agent.process({
  message: 'What is in this image?',
  messages: [
    {
      role: 'user',
      content: [
        { type: 'text', text: 'What is in this image?' },
        {
          type: 'image_url',
          image_url: { url: 'https://example.com/image.jpg' },
        },
      ],
    },
  ],
});

Next Steps

Streaming

Learn about streaming

Media Processing

Learn about media processing

Multi-Agent System (Supervisor Pattern)Streaming with Memory

⌘I

Getting Started

CLI

Core Concepts

Real-World Examples

Advanced

Configuration

Extending Runflow

Help & Support

Multi-Modal (Images)

Next Steps

Streaming

Media Processing

Getting Started

CLI

Core Concepts

Real-World Examples

Advanced

Configuration

Extending Runflow

Help & Support

​Multi-Modal (Images)

​Next Steps

Streaming

Media Processing

Multi-Modal (Images)

Next Steps