Community translations by veiseule.ai — Help improve them on Crowdin
Skip to main content

ٹاک موڈ

ٹاک موڈ ایک مسلسل صوتی گفتگو کا لوپ ہے:

  1. تقریر سنیں
  2. نقلِ تحریر ماڈل کو بھیجیں (مرکزی سیشن، chat.send)
  3. جواب کا انتظار کریں
  4. ElevenLabs کے ذریعے اسے بول کر سنائیں (اسٹریمنگ پلے بیک)

رویّہ (macOS)

  • ٹاک موڈ فعال ہونے پر ہمیشہ آن اوورلے۔
  • سننا → سوچنا → بولنا کے مراحل میں منتقلی۔
  • مختصر وقفے (خاموشی ونڈو) پر موجودہ نقلِ تحریر بھیج دی جاتی ہے۔
  • جوابات WebChat میں لکھے جاتے ہیں (بالکل ٹائپ کرنے جیسے)۔
  • تقریر پر انٹرپٹ (بطورِ طے شدہ آن): اگر اسسٹنٹ کے بولتے وقت صارف بات شروع کرے تو پلے بیک روک دیا جاتا ہے اور اگلے پرامپٹ کے لیے انٹرپشن کا ٹائم اسٹیمپ نوٹ کیا جاتا ہے۔

جوابات میں صوتی ہدایات

اسسٹنٹ اپنی جواب کی ابتدا ایک واحد JSON لائن سے کر سکتا ہے تاکہ آواز کو کنٹرول کیا جا سکے:

{ "voice": "<voice-id>", "once": true }

قواعد:

  • صرف پہلی غیر خالی لائن۔
  • نامعلوم کلیدیں نظرانداز کر دی جاتی ہیں۔
  • once: true صرف موجودہ جواب پر لاگو ہوتا ہے۔
  • once کے بغیر، آواز ٹاک موڈ کے لیے نئی بطورِ طے شدہ بن جاتی ہے۔
  • TTS پلے بیک سے پہلے JSON لائن ہٹا دی جاتی ہے۔

معاون کلیدیں:

  • voice / voice_id / voiceId
  • model / model_id / modelId
  • speed, rate (WPM), stability, similarity, style, speakerBoost
  • seed, normalize, lang, output_format, latency_tier
  • once

کنفیگ (~/.openclaw/openclaw.json)

{
  talk: {
    voiceId: "elevenlabs_voice_id",
    modelId: "eleven_v3",
    outputFormat: "mp3_44100_128",
    apiKey: "elevenlabs_api_key",
    interruptOnSpeech: true,
  },
}

بطورِ طے شدہ:

  • interruptOnSpeech: true
  • voiceId: ELEVENLABS_VOICE_ID / SAG_VOICE_ID پر واپس جاتا ہے (یا جب API کلید دستیاب ہو تو پہلی ElevenLabs آواز)
  • modelId: غیر متعین ہونے پر eleven_v3 بطورِ طے شدہ
  • apiKey: ELEVENLABS_API_KEY پر واپس جاتا ہے (یا اگر دستیاب ہو تو گیٹ وے شیل پروفائل)
  • outputFormat: macOS/iOS پر pcm_44100 اور Android پر pcm_24000 بطورِ طے شدہ (MP3 اسٹریمنگ کو مجبور کرنے کے لیے mp3_* سیٹ کریں)

macOS یوزر انٹرفیس

  • مینو بار ٹوگل: Talk
  • کنفیگ ٹیب: Talk Mode گروپ (آواز کی آئی ڈی + انٹرپٹ ٹوگل)
  • اوورلے:
  • سننا: مائیک لیول کے ساتھ بادل کی دھڑکنیں
  • سوچنا: نیچے ڈوبتی اینیمیشن
  • بولنا: پھیلتے ہوئے حلقے
  • بادل پر کلک: بولنا بند کریں
  • X پر کلک: ٹاک موڈ سے باہر نکلیں

نوٹس

  • اسپیچ + مائیکروفون کی اجازتیں درکار ہیں۔
  • سیشن کی main کلید کے خلاف chat.send استعمال کرتا ہے۔
  • TTS کم لیٹنسی کے لیے macOS/iOS/Android پر ELEVENLABS_API_KEY اور بتدریج پلے بیک کے ساتھ ElevenLabs اسٹریمنگ API استعمال کرتا ہے۔
  • eleven_v3 کے لیے stability کی توثیق 0.0، 0.5، یا 1.0 تک کی جاتی ہے؛ دیگر ماڈلز 0..1 قبول کرتے ہیں۔
  • latency_tier سیٹ ہونے پر 0..4 تک توثیق کی جاتی ہے۔
  • Android کم لیٹنسی AudioTrack اسٹریمنگ کے لیے pcm_16000، pcm_22050، pcm_24000، اور pcm_44100 آؤٹ پٹ فارمیٹس کی حمایت کرتا ہے۔