Mode ng Talk¶
Ang Talk mode ay isang tuloy-tuloy na loop ng pag-uusap na boses:
- Makinig sa pananalita
- Ipadala ang transcript sa model (pangunahing session, chat.send)
- Hintayin ang tugon
- Bigkasin ito gamit ang ElevenLabs (streaming playback)
Asal (macOS)¶
- Palaging naka-on na overlay habang naka-enable ang Talk mode.
- Mga paglipat ng yugto: Listening → Thinking → Speaking.
- Sa maikling paghinto (window ng katahimikan), ipinapadala ang kasalukuyang transcript.
- Ang mga sagot ay isinusulat sa WebChat (kapareho ng pagta-type).
- Interrupt sa pananalita (default na naka-on): kapag nagsimulang magsalita ang user habang nagsasalita ang assistant, itinitigil ang playback at itinatala ang timestamp ng pag-interrupt para sa susunod na prompt.
Mga direktiba ng boses sa mga sagot¶
Maaaring unahan ng assistant ang sagot nito ng iisang linya ng JSON para kontrolin ang boses:
{ "voice": "<voice-id>", "once": true }
Mga panuntunan:
- Unang hindi bakanteng linya lamang.
- Ang mga hindi kilalang key ay binabalewala.
- Ang
once: trueay nalalapat lamang sa kasalukuyang sagot. - Kapag walang
once, ang boses ay nagiging bagong default para sa Talk mode. - Inaalis ang JSON line bago ang TTS playback.
Mga suportadong key:
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
Konpigurasyon (~/.openclaw/openclaw.json)¶
{
talk: {
voiceId: "elevenlabs_voice_id",
modelId: "eleven_v3",
outputFormat: "mp3_44100_128",
apiKey: "elevenlabs_api_key",
interruptOnSpeech: true,
},
}
Mga default:
interruptOnSpeech: truevoiceId: bumabalik saELEVENLABS_VOICE_ID/SAG_VOICE_ID(o sa unang ElevenLabs voice kapag may available na API key)modelId: default saeleven_v3kapag hindi nakatakdaapiKey: bumabalik saELEVENLABS_API_KEY(o sa gateway shell profile kung available)outputFormat: default sapcm_44100sa macOS/iOS atpcm_24000sa Android (itakda angmp3_*para pilitin ang MP3 streaming)
UI sa macOS¶
- Toggle sa menu bar: Talk
- Tab ng config: pangkat na Talk Mode (voice id + interrupt toggle)
- Patong:
- Listening: pumipintig na ulap na may antas ng mic
- Thinking: lumulubog na animation
- Speaking: mga naglalabasang singsing
- I-click ang ulap: itigil ang pagsasalita
- I-click ang X: lumabas sa Talk mode
Mga tala¶
- Nangangailangan ng pahintulot sa Speech + Microphone.
- Gumagamit ng
chat.sendlaban sa session key namain. - Gumagamit ang TTS ng ElevenLabs streaming API na may
ELEVENLABS_API_KEYat incremental playback sa macOS/iOS/Android para sa mas mababang latency. - Ang
stabilitypara saeleven_v3ay bina-validate sa0.0,0.5, o1.0; tumatanggap ang ibang model ng0..1. - Ang
latency_tieray bina-validate sa0..4kapag itinakda. - Sinusuportahan ng Android ang mga output format na
pcm_16000,pcm_22050,pcm_24000, atpcm_44100para sa low-latency AudioTrack streaming.