ٹاک موڈ¶
ٹاک موڈ ایک مسلسل صوتی گفتگو کا لوپ ہے:
- تقریر سنیں
- نقلِ تحریر ماڈل کو بھیجیں (مرکزی سیشن، chat.send)
- جواب کا انتظار کریں
- ElevenLabs کے ذریعے اسے بول کر سنائیں (اسٹریمنگ پلے بیک)
رویّہ (macOS)¶
- ٹاک موڈ فعال ہونے پر ہمیشہ آن اوورلے۔
- سننا → سوچنا → بولنا کے مراحل میں منتقلی۔
- مختصر وقفے (خاموشی ونڈو) پر موجودہ نقلِ تحریر بھیج دی جاتی ہے۔
- جوابات WebChat میں لکھے جاتے ہیں (بالکل ٹائپ کرنے جیسے)۔
- تقریر پر انٹرپٹ (بطورِ طے شدہ آن): اگر اسسٹنٹ کے بولتے وقت صارف بات شروع کرے تو پلے بیک روک دیا جاتا ہے اور اگلے پرامپٹ کے لیے انٹرپشن کا ٹائم اسٹیمپ نوٹ کیا جاتا ہے۔
جوابات میں صوتی ہدایات¶
اسسٹنٹ اپنی جواب کی ابتدا ایک واحد JSON لائن سے کر سکتا ہے تاکہ آواز کو کنٹرول کیا جا سکے:
{ "voice": "<voice-id>", "once": true }
قواعد:
- صرف پہلی غیر خالی لائن۔
- نامعلوم کلیدیں نظرانداز کر دی جاتی ہیں۔
once: trueصرف موجودہ جواب پر لاگو ہوتا ہے۔onceکے بغیر، آواز ٹاک موڈ کے لیے نئی بطورِ طے شدہ بن جاتی ہے۔- TTS پلے بیک سے پہلے JSON لائن ہٹا دی جاتی ہے۔
معاون کلیدیں:
voice/voice_id/voiceIdmodel/model_id/modelIdspeed,rate(WPM),stability,similarity,style,speakerBoostseed,normalize,lang,output_format,latency_tieronce
کنفیگ (~/.openclaw/openclaw.json)¶
{
talk: {
voiceId: "elevenlabs_voice_id",
modelId: "eleven_v3",
outputFormat: "mp3_44100_128",
apiKey: "elevenlabs_api_key",
interruptOnSpeech: true,
},
}
بطورِ طے شدہ:
interruptOnSpeech: truevoiceId:ELEVENLABS_VOICE_ID/SAG_VOICE_IDپر واپس جاتا ہے (یا جب API کلید دستیاب ہو تو پہلی ElevenLabs آواز)modelId: غیر متعین ہونے پرeleven_v3بطورِ طے شدہapiKey:ELEVENLABS_API_KEYپر واپس جاتا ہے (یا اگر دستیاب ہو تو گیٹ وے شیل پروفائل)outputFormat: macOS/iOS پرpcm_44100اور Android پرpcm_24000بطورِ طے شدہ (MP3 اسٹریمنگ کو مجبور کرنے کے لیےmp3_*سیٹ کریں)
macOS یوزر انٹرفیس¶
- مینو بار ٹوگل: Talk
- کنفیگ ٹیب: Talk Mode گروپ (آواز کی آئی ڈی + انٹرپٹ ٹوگل)
- اوورلے:
- سننا: مائیک لیول کے ساتھ بادل کی دھڑکنیں
- سوچنا: نیچے ڈوبتی اینیمیشن
- بولنا: پھیلتے ہوئے حلقے
- بادل پر کلک: بولنا بند کریں
- X پر کلک: ٹاک موڈ سے باہر نکلیں
نوٹس¶
- اسپیچ + مائیکروفون کی اجازتیں درکار ہیں۔
- سیشن کی
mainکلید کے خلافchat.sendاستعمال کرتا ہے۔ - TTS کم لیٹنسی کے لیے macOS/iOS/Android پر
ELEVENLABS_API_KEYاور بتدریج پلے بیک کے ساتھ ElevenLabs اسٹریمنگ API استعمال کرتا ہے۔ eleven_v3کے لیےstabilityکی توثیق0.0،0.5، یا1.0تک کی جاتی ہے؛ دیگر ماڈلز0..1قبول کرتے ہیں۔latency_tierسیٹ ہونے پر0..4تک توثیق کی جاتی ہے۔- Android کم لیٹنسی AudioTrack اسٹریمنگ کے لیے
pcm_16000،pcm_22050،pcm_24000، اورpcm_44100آؤٹ پٹ فارمیٹس کی حمایت کرتا ہے۔