Audio Chunks

Basic Usage

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  // audioChunk.arrayBuffer contains the raw audio data
  const buffer = audioChunk.arrayBuffer;
  const sampleRate = audioChunk.sampleRate || 16000;
  
  session.logger.info('Received audio chunk:', buffer.byteLength, 'bytes at', sampleRate, 'Hz');
});

Audio Chunk Interface

interface AudioChunk {
  type: StreamType.AUDIO_CHUNK;
  arrayBuffer: ArrayBufferLike;  // Raw audio data buffer
  sampleRate?: number;            // Sample rate (e.g., 16000 Hz)
  timestamp: Date;                // When chunk was received
}

When to Use Audio Chunks

Custom Speech Recognition

Use your own speech-to-text model:

session.events.onAudioChunk(async (audioChunk: AudioChunk) => {
  const result = await customSTT.process(audioChunk.arrayBuffer);
  session.logger.info('Transcription:', result);
});

Voice Analysis

Analyze voice characteristics:

Voice activity detection (VAD)
Pitch detection
Emotion recognition
Speaker identification

Audio Effects

Apply real-time audio processing:

Noise reduction
Echo cancellation
Voice enhancement
Audio filtering

Recording

Save audio for later processing:

const audioChunks: AudioChunk[] = [];

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  audioChunks.push(audioChunk);
});

Audio chunks are advanced functionality. For most apps, use session.events.onTranscription() instead.

Working with Audio Data

Convert to Float32Array

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  // Convert to typed array for processing
  const samples = new Float32Array(audioChunk.arrayBuffer);
  
  // Process samples (values typically between -1.0 and 1.0)
  for (let i = 0; i < samples.length; i++) {
    const sample = samples[i];
    // Process each sample...
  }
});

Calculate Audio Level

function calculateRMS(audioChunk: AudioChunk): number {
  const samples = new Float32Array(audioChunk.arrayBuffer);
  let sum = 0;
  
  for (let i = 0; i < samples.length; i++) {
    sum += samples[i] * samples[i];
  }
  
  return Math.sqrt(sum / samples.length);
}

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  const level = calculateRMS(audioChunk);
  
  if (level > 0.1) {
    session.logger.info('Voice detected, RMS level:', level.toFixed(3));
  }
});

Common Patterns

Recording Audio

class AudioRecorder {
  private chunks: ArrayBuffer[] = [];
  private isRecording = false;

  start(session: AppSession) {
    this.chunks = [];
    this.isRecording = true;
    
    session.events.onAudioChunk((chunk) => {
      if (this.isRecording) {
        // Store the arrayBuffer
        this.chunks.push(chunk.arrayBuffer);
      }
    });
  }

  stop(): ArrayBuffer[] {
    this.isRecording = false;
    return this.chunks;
  }

  getRecording(): ArrayBuffer[] {
    return this.chunks;
  }
}

// Usage
const recorder = new AudioRecorder();

session.events.onButtonPress((data) => {
  if (data.button === 'select') {
    recorder.start(session);
    session.layouts.showTextWall('Recording...');
  }
});

// Stop after 5 seconds
setTimeout(() => {
  const recording = recorder.stop();
  session.layouts.showTextWall(`Recorded ${recording.length} chunks`);
}, 5000);

Audio Level Monitoring

let lastUpdate = 0;

session.events.onAudioChunk((chunk) => {
  const now = Date.now();
  
  // Update display every 200ms
  if (now - lastUpdate > 200) {
    const sampleRate = chunk.sampleRate || 16000;
    session.dashboard.content.writeToMain(`🎤 Recording at ${sampleRate}Hz`);
    lastUpdate = now;
  }
});

Performance Considerations

Audio Chunks Are Frequent

Audio chunks arrive many times per second:

// ❌ Avoid - expensive operation every chunk
session.events.onAudioChunk(async (audioChunk: AudioChunk) => {
  await expensiveProcessing(audioChunk); // Too slow
});

// ✅ Good - queue for batch processing
const queue: AudioChunk[] = [];
session.events.onAudioChunk((audioChunk: AudioChunk) => {
  queue.push(audioChunk);
});

Memory Management

Audio data accumulates quickly:

// ✅ Good - limit stored chunks
const maxChunks = 100;
const chunks: AudioChunk[] = [];

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  chunks.push(audioChunk);

  if (chunks.length > maxChunks) {
    chunks.shift();
  }
});

Processing Time

Keep processing fast:

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  // Keep processing fast - audio chunks arrive frequently
  const buffer = audioChunk.arrayBuffer;
  // Process synchronously
});

Best Practices

Use Transcription API When Possible

Built-in transcription is optimized and easier:

// ✅ Better for most cases
session.events.onTranscription((data) => {
  if (data.isFinal) {
    processCommand(data.text);
  }
});

// Only use audio chunks if you need:
// - Custom speech recognition
// - Voice analysis
// - Audio effects
// - Recording

Clone Buffers

ArrayBuffers may be reused:

// ✅ Good - store the arrayBuffer
session.events.onAudioChunk((chunk) => {
  storedChunks.push(chunk.arrayBuffer);
});

Handle Errors

Audio processing can fail:

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  try {
    processAudio(audioChunk.arrayBuffer);
  } catch (error) {
    session.logger.error('Audio processing error:', error);
  }
});

Clean Up Resources

Stop processing when done:

const unsubscribe = session.events.onAudioChunk((audioChunk: AudioChunk) => {
  // Process audio
});

// Later, stop receiving chunks
unsubscribe();

Permissions Required

Audio chunks require the MICROPHONE permission. Set this in the Developer Console.

AudioChunk Properties

Property	Type	Description
`arrayBuffer`	`ArrayBufferLike`	Raw audio data buffer
`sampleRate`	`number` (optional)	Sample rate in Hz (typically 16000)
`timestamp`	`Date`	When chunk was received
`type`	`StreamType.AUDIO_CHUNK`	Stream type identifier

Audio Format:

Raw PCM audio data
Mono (1 channel)
Convert to Float32Array for processing

Troubleshooting

No Audio Chunks

Check permission:

Ensure MICROPHONE permission is set
User must approve permission
Check for permission errors in logs

Delayed Processing

Processing too slow:

Keep processing under 20ms per chunk
Use async processing with queues
Optimize audio algorithms

Memory Issues

Too much buffering:

Limit stored chunks
Process and discard quickly
Don’t store entire recording in memory

Example: Simple Recording

const recordedChunks: AudioChunk[] = [];
let isRecording = false;

session.events.onButtonPress((data) => {
  if (data.button === 'select') {
    isRecording = !isRecording;
    if (isRecording) {
      recordedChunks.length = 0;
      session.logger.info('Recording started');
    } else {
      session.logger.info('Recorded', recordedChunks.length, 'chunks');
      
      // Process recorded audio
      recordedChunks.forEach((chunk) => {
        const samples = new Float32Array(chunk.arrayBuffer);
        session.logger.info('Chunk:', samples.length, 'samples at', chunk.sampleRate, 'Hz');
      });
    }
  }
});

session.events.onAudioChunk((audioChunk: AudioChunk) => {
  if (isRecording) {
    recordedChunks.push(audioChunk);
  }
});

Next Steps

Speech-to-Text

Use built-in transcription

Text-to-Speech

Generate voice output

Event Manager

Complete event API reference

Permissions

Learn about permissions

Getting Started

Core Concepts

SDK Reference

Basic Usage

Audio Chunk Interface

When to Use Audio Chunks

Working with Audio Data

Convert to Float32Array

Calculate Audio Level

Common Patterns

Recording Audio

Audio Level Monitoring

Performance Considerations

Best Practices

Permissions Required

AudioChunk Properties

Troubleshooting

Example: Simple Recording

Next Steps

Speech-to-Text

Text-to-Speech

Event Manager

Permissions

Getting Started

Core Concepts

SDK Reference

​Basic Usage

​Audio Chunk Interface

​When to Use Audio Chunks

​Working with Audio Data

​Convert to Float32Array

​Calculate Audio Level

​Common Patterns

​Recording Audio

​Audio Level Monitoring

​Performance Considerations

​Best Practices

​Permissions Required

​AudioChunk Properties

​Troubleshooting

​Example: Simple Recording

​Next Steps

Speech-to-Text

Text-to-Speech

Event Manager

Permissions

Basic Usage

Audio Chunk Interface

When to Use Audio Chunks

Working with Audio Data

Convert to Float32Array

Calculate Audio Level

Common Patterns

Recording Audio

Audio Level Monitoring

Performance Considerations

Best Practices

Permissions Required

AudioChunk Properties

Troubleshooting

Example: Simple Recording

Next Steps