Talk မုဒ်¶
Talk မုဒ်သည် ဆက်တိုက် အသံဖြင့် စကားပြောဆိုနိုင်သော လုပ်ဆောင်ချက် လှည့်ပတ်မှုတစ်ခု ဖြစ်သည်—
- စကားပြောအသံကို နားထောင်သည်
- ပြန်ရေးသားထားသော စာသားကို မော်ဒယ်သို့ ပို့သည် (main session, chat.send)
- တုံ့ပြန်ချက်ကို စောင့်သည်
- ElevenLabs မှတစ်ဆင့် (streaming playback) အသံထုတ်ပြောသည်
ပြုမူပုံ (macOS)¶
- Talk မုဒ် ဖွင့်ထားစဉ် အမြဲတမ်း ပေါ်နေသော overlay။
- Listening → Thinking → Speaking အဆင့်အလိုက် ပြောင်းလဲမှုများ။
- ခဏတာ ရပ်နားမှု (တိတ်ဆိတ်ချိန်ကာလ) ဖြစ်သည့်အခါ လက်ရှိ transcript ကို ပို့သည်။
- တုံ့ပြန်ချက်များကို WebChat သို့ ရေးထည့်သည် (စာရိုက်သည့်အတိုင်းတူ)။
- စကားပြောနေစဉ် အနှောင့်အယှက် ပြုလုပ်နိုင်ခြင်း (မူလအတိုင်း ဖွင့်ထား): အကူအညီပေးသူက ပြောနေစဉ် အသုံးပြုသူ စကားပြောစတင်ပါက playback ကို ရပ်ပြီး နောက်တစ်ကြိမ် prompt အတွက် အနှောင့်အယှက် ဖြစ်သည့် အချိန်တံဆိပ်ကို မှတ်သားထားသည်။
တုံ့ပြန်ချက်များအတွင်း အသံညွှန်ကြားချက်များ¶
အကူအညီပေးသူသည် အသံကို ထိန်းချုပ်ရန် JSON တစ်ကြောင်းတည်း ကို မိမိတုံ့ပြန်ချက်၏ အစတွင် ထည့်နိုင်သည်—
{ "voice": "<voice-id>", "once": true }
စည်းကမ်းများ—
- ပထမဆုံး မလွတ်လပ်သော စာကြောင်းတစ်ကြောင်းသာ။
- မသိသော ကီးများကို လျစ်လျူရှုမည်။
once: trueသည် လက်ရှိ တုံ့ပြန်ချက်အတွက်သာ သက်ရောက်သည်။onceမပါရှိပါက အသံသည် Talk မုဒ်အတွက် မူလအတိုင်း အသစ်ဖြစ်သွားမည်။- TTS playback မပြုလုပ်မီ JSON စာကြောင်းကို ဖယ်ရှားမည်။
ပံ့ပိုးထားသော ကီးများ—
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
ဖွဲ့စည်းမှု (~/.openclaw/openclaw.json)¶
{
talk: {
voiceId: "elevenlabs_voice_id",
modelId: "eleven_v3",
outputFormat: "mp3_44100_128",
apiKey: "elevenlabs_api_key",
interruptOnSpeech: true,
},
}
မူလတန်ဖိုးများ—
interruptOnSpeech: truevoiceId:ELEVENLABS_VOICE_ID/SAG_VOICE_IDသို့ ပြန်လည် ချိတ်ဆက်မည် (API key ရရှိပါက ElevenLabs အသံ ပထမဆုံးတစ်ခုကို အသုံးပြုမည်)modelId: မသတ်မှတ်ထားပါကeleven_v3သို့ မူလအတိုင်း သတ်မှတ်မည်apiKey:ELEVENLABS_API_KEYသို့ ပြန်လည် ချိတ်ဆက်မည် (ရရှိပါက gateway shell profile ကို အသုံးပြုမည်)outputFormat: macOS/iOS တွင်pcm_44100နှင့် Android တွင်pcm_24000သို့ မူလအတိုင်း သတ်မှတ်မည် (MP3 streaming ကို အတင်းအကျပ် သုံးရန်mp3_*ကို သတ်မှတ်နိုင်သည်)
macOS အသုံးပြုသူ မျက်နှာပြင်¶
- မီနူးဘား ခလုတ်: Talk
- Config တဘ်: Talk Mode အုပ်စု (voice id + အနှောင့်အယှက် ခလုတ်)
- အပေါ်ထပ် ပြသမှု:
- Listening: မိုက်အဆင့်အလိုက် တိမ်ပုံ လှုပ်ရှားမှု
- Thinking: အောက်သို့ စိမ့်ဝင်သည့် အန်နီမေးရှင်း
- Speaking: လှိုင်းဝိုင်းများ ဖြန့်ထွက်လာခြင်း
- တိမ်ပုံကို နှိပ်ပါက: စကားပြောခြင်းကို ရပ်မည်
- X ကို နှိပ်ပါက: Talk မုဒ်မှ ထွက်မည်
မှတ်ချက်များ¶
- Speech + Microphone ခွင့်ပြုချက်များ လိုအပ်သည်။
- session key
mainကို အသုံးပြုပြီးchat.sendကို အသုံးချသည်။ - TTS သည် ElevenLabs streaming API ကို
ELEVENLABS_API_KEYဖြင့် အသုံးပြုပြီး macOS/iOS/Android တွင် latency လျော့ချရန် incremental playback ကို အသုံးပြုသည်။ eleven_v3အတွက်stabilityကို0.0,0.5, သို့မဟုတ်1.0ဟုတ်မဟုတ် စစ်ဆေးအတည်ပြုသည်; အခြား မော်ဒယ်များသည်0..1ကို လက်ခံသည်။latency_tierကို သတ်မှတ်ထားပါက0..4ဖြစ်ရမည်ဟု အတည်ပြုသည်။- Android သည် latency နည်းသော AudioTrack streaming အတွက်
pcm_16000,pcm_22050,pcm_24000, နှင့်pcm_44100output ဖော်မတ်များကို ပံ့ပိုးသည်။