Community translations by veiseule.ai — Help improve them on Crowdin
Skip to main content

5. Talk Rejimi

  1. Talk rejimi — uzluksiz ovozli suhbat aylanasidir:

    1. Nutqni tinglash
    1. Transkriptni modelga yuborish (asosiy sessiya, chat.send)
    1. Javobni kutish
    1. Uni ElevenLabs orqali aytish (oqimli ijro)

11) Xatti-harakat (macOS)

    1. Talk rejimi yoqilgan paytda har doim ko‘rinadigan overlay.
    1. Tinglash → O‘ylash → Gapirish bosqichlari o‘tishlari.
    1. Qisqa pauza (sukut oynasi) bo‘lganda, joriy transkript yuboriladi.
    1. Javoblar WebChat’ga yoziladi (matn terish bilan bir xil).
    1. Nutqda to‘xtatish (standart yoqilgan): foydalanuvchi assistent gapirayotganda gapira boshlasa, ijro to‘xtatiladi va keyingi prompt uchun to‘xtatish vaqti qayd etiladi.

17. Javoblardagi ovoz ko‘rsatmalari

  1. Assistent javobini ovozni boshqarish uchun bitta JSON qatori bilan boshlashi mumkin:
19. { "voice": "<voice-id>", "once": true }
  1. Qoidalar:
    1. Faqat birinchi bo‘sh bo‘lmagan qatordan foydalaniladi.
    1. Noma’lum kalitlar e’tiborsiz qoldiriladi.
    1. once: true faqat joriy javobga qo‘llanadi.
    1. once bo‘lmasa, ovoz Talk rejimi uchun yangi standartga aylanadi.
    1. JSON qatori TTS ijrosidan oldin olib tashlanadi.
  1. Qo‘llab-quvvatlanadigan kalitlar:
    1. voice / voice_id / voiceId
    1. model / model_id / modelId
    1. speed, rate (WPM), stability, similarity, style, speakerBoost
    1. seed, normalize, lang, output_format, latency_tier
    1. once

32. Sozlamalar (~/.openclaw/openclaw.json)

33. {
  talk: {
    voiceId: "elevenlabs_voice_id",
    modelId: "eleven_v3",
    outputFormat: "mp3_44100_128",
    apiKey: "elevenlabs_api_key",
    interruptOnSpeech: true,
  },
}
  1. Standartlar:
    1. interruptOnSpeech: true
    1. voiceId: ELEVENLABS_VOICE_ID / SAG_VOICE_ID ga qaytadi (yoki API kaliti mavjud bo‘lsa, birinchi ElevenLabs ovozi)
    1. modelId: o‘rnatilmagan bo‘lsa, eleven_v3 ga standartlanadi
    1. apiKey: ELEVENLABS_API_KEY ga qaytadi (yoki mavjud bo‘lsa, gateway shell profili)
    1. outputFormat: macOS/iOS’da pcm_44100, Android’da pcm_24000 (MP3 oqimini majburlash uchun mp3_* ni o‘rnating)

40. macOS UI

    1. Menyu paneli tugmasi: Talk
    1. Sozlamalar yorlig‘i: Talk Mode guruhi (voice id + to‘xtatish tumchog‘i)
    1. Overlay:
    1. Tinglash: mikrofon darajasi bilan bulut pulsatsiyalari
    1. O‘ylash: cho‘kib boruvchi animatsiya
    1. Gapirish: tarqaluvchi halqalar
    1. Bulutni bosish: gapirishni to‘xtatish
    1. X ni bosish: Talk rejimidan chiqish

49. Eslatmalar

    1. Nutq + Mikrofon ruxsatlari talab etiladi.
  • main sessiya kaliti bilan chat.send dan foydalanadi.
  • TTS ElevenLabs streaming API dan ELEVENLABS_API_KEY bilan foydalanadi va kechikishni kamaytirish uchun macOS/iOS/Android’da bosqichma-bosqich ijroni qo‘llab-quvvatlaydi.
  • eleven_v3 uchun stability qiymati 0.0, 0.5 yoki 1.0 ga tekshiriladi; boshqa modellar 0..1 oralig‘ini qabul qiladi.
  • Agar o‘rnatilgan bo‘lsa, latency_tier 0..4 oralig‘ida tekshiriladi.
  • Android past kechikishli AudioTrack streaming uchun pcm_16000, pcm_22050, pcm_24000 va pcm_44100 chiqish formatlarini qo‘llab-quvvatlaydi.