카메라 캡처(에이전트)¶
OpenClaw 는 에이전트 워크플로를 위한 카메라 캡처를 지원합니다:
- iOS 노드(Gateway(게이트웨이) 를 통해 페어링):
node.invoke를 통해 사진(jpg) 또는 짧은 동영상 클립(mp4, 선택적 오디오 포함)을 캡처합니다. - Android 노드(Gateway(게이트웨이) 를 통해 페어링):
node.invoke를 통해 사진(jpg) 또는 짧은 동영상 클립(mp4, 선택적 오디오 포함)을 캡처합니다. - macOS 앱(Gateway(게이트웨이) 를 통한 노드):
node.invoke을 통해 사진(jpg) 또는 짧은 동영상 클립(mp4, 선택적 오디오 포함)을 캡처합니다.
모든 카메라 접근은 사용자 제어 설정 뒤에서 제한됩니다.
iOS 노드¶
사용자 설정(기본값 켜짐)¶
- iOS 설정 탭 → Camera → Allow Camera (
camera.enabled) - 기본값: 켜짐(키가 없으면 활성화된 것으로 처리).
- 꺼짐일 때:
camera.*명령은CAMERA_DISABLED를 반환합니다.
명령(Gateway(게이트웨이) 경유 node.invoke)¶
camera.list-
응답 페이로드:
devices:{ id, name, position, deviceType }의 배열
-
camera.snap - 파라미터:
facing:front|back(기본값:front)maxWidth: number (선택 사항; iOS 노드에서 기본값1600)quality:0..1(선택 사항; 기본값0.9)format: 현재jpgdelayMs: number (선택 사항; 기본값0)deviceId: string (선택 사항;camera.list에서 가져옴)
- 응답 페이로드:
format: "jpg"base64: "<...>"width,height
-
페이로드 가드: 사진은 base64 페이로드를 5 MB 미만으로 유지하기 위해 재압축됩니다.
-
camera.clip - 파라미터:
facing:front|back(기본값:front)durationMs: number (기본값3000, 최대60000로 제한)includeAudio: boolean (기본값true)format: 현재mp4deviceId: string (선택 사항;camera.list에서 가져옴)
- 응답 페이로드:
format: "mp4"base64: "<...>"durationMshasAudio
포그라운드 요구 사항¶
canvas.* 와 마찬가지로, iOS 노드는 포그라운드에서만 camera.* 명령을 허용합니다. 백그라운드 호출은 NODE_BACKGROUND_UNAVAILABLE 를 반환합니다.
CLI 헬퍼(임시 파일 + MEDIA)¶
첨부 파일을 얻는 가장 쉬운 방법은 CLI 헬퍼를 사용하는 것으로, 디코딩된 미디어를 임시 파일에 기록하고 MEDIA:<path> 를 출력합니다.
예시:
openclaw nodes camera snap --node <id> # default: both front + back (2 MEDIA lines)
openclaw nodes camera snap --node <id> --facing front
openclaw nodes camera clip --node <id> --duration 3000
openclaw nodes camera clip --node <id> --no-audio
참고:
nodes camera snap는 에이전트에게 두 가지 뷰를 모두 제공하기 위해 기본적으로 양쪽 페이싱을 사용합니다.- 출력 파일은 자체 래퍼를 빌드하지 않는 한 OS 임시 디렉토리에 있는 임시 파일입니다.
Android 노드¶
Android 사용자 설정(기본값 켜짐)¶
- Android 설정 시트 → Camera → Allow Camera (
camera.enabled) - 기본값: 켜짐(키가 없으면 활성화된 것으로 처리).
- 꺼짐일 때:
camera.*명령은CAMERA_DISABLED를 반환합니다.
권한¶
- Android 는 런타임 권한이 필요합니다:
CAMERA:camera.snap및camera.clip모두에 필요.RECORD_AUDIO:includeAudio=true일 때camera.clip에 필요.
권한이 없는 경우 앱은 가능한 경우 프롬프트를 표시합니다. 거부되면 camera.* 요청은
*_PERMISSION_REQUIRED 오류로 실패합니다.
Android 포그라운드 요구 사항¶
canvas.* 와 마찬가지로, Android 노드는 포그라운드에서만 camera.* 명령을 허용합니다. 백그라운드 호출은 NODE_BACKGROUND_UNAVAILABLE 를 반환합니다.
10. 페이로드 가드¶
사진은 base64 페이로드를 5 MB 미만으로 유지하기 위해 재압축됩니다.
macOS 앱¶
사용자 설정(기본값 꺼짐)¶
macOS 컴패니언 앱은 체크박스를 제공합니다:
- 설정 → 일반 → 카메라 허용 (
openclaw.cameraEnabled) - 기본값: 꺼짐
- 꺼짐일 때: 카메라 요청은 “Camera disabled by user” 를 반환합니다.
CLI 헬퍼(노드 호출)¶
주요 openclaw CLI 를 사용하여 macOS 노드에서 카메라 명령을 호출합니다.
예시:
openclaw nodes camera list --node <id> # list camera ids
openclaw nodes camera snap --node <id> # prints MEDIA:<path>
openclaw nodes camera snap --node <id> --max-width 1280
openclaw nodes camera snap --node <id> --delay-ms 2000
openclaw nodes camera snap --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --duration 10s # prints MEDIA:<path>
openclaw nodes camera clip --node <id> --duration-ms 3000 # prints MEDIA:<path> (legacy flag)
openclaw nodes camera clip --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --no-audio
참고:
openclaw nodes camera snap는 재정의되지 않는 한 기본값이maxWidth=1600입니다.- macOS 에서
camera.snap는 워밍업/노출 안정화 이후 캡처 전에delayMs(기본값 2000ms) 를 대기합니다. - 사진 페이로드는 base64 를 5 MB 미만으로 유지하기 위해 재압축됩니다.
안전성 + 실용적 한계¶
- 카메라 및 마이크 접근은 일반적인 OS 권한 프롬프트를 트리거하며 Info.plist 에 사용 문자열이 필요합니다.
- 동영상 클립은 과도한 노드 페이로드(base64 오버헤드 + 메시지 제한)를 피하기 위해(현재
<= 60s)로 제한됩니다.
macOS 화면 동영상(OS 수준)¶
화면 동영상(카메라 아님)의 경우 macOS 컴패니언을 사용하십시오:
openclaw nodes screen record --node <id> --duration 10s --fps 15 # prints MEDIA:<path>
참고:
- macOS Screen Recording 권한(TCC)이 필요합니다.