Chụp camera (tác tử)¶
OpenClaw hỗ trợ chụp camera cho các quy trình làm việc của tác tử:
- Node iOS (ghép cặp qua Gateway): chụp ảnh (
jpg) hoặc clip video ngắn (mp4, có thể kèm âm thanh) quanode.invoke. - Node Android (ghép cặp qua Gateway): chụp ảnh (
jpg) hoặc clip video ngắn (mp4, có thể kèm âm thanh) quanode.invoke. - Ứng dụng macOS (node qua Gateway): chụp ảnh (
jpg) hoặc clip video ngắn (mp4, có thể kèm âm thanh) quanode.invoke.
Mọi quyền truy cập camera đều được kiểm soát bởi các cài đặt do người dùng quản lý.
Node iOS¶
Cài đặt người dùng (mặc định bật)¶
- Tab Cài đặt iOS → Camera → Allow Camera (
camera.enabled) - Mặc định: bật (thiếu khóa được xem là đã bật).
- Khi tắt: các lệnh
camera.*trả vềCAMERA_DISABLED.
Lệnh (qua Gateway node.invoke)¶
camera.list-
Payload phản hồi:
devices: mảng{ id, name, position, deviceType }
-
camera.snap - Tham số:
facing:front|back(mặc định:front)maxWidth: number (tùy chọn; mặc định1600trên node iOS)quality:0..1(tùy chọn; mặc định0.9)format: hiện tạijpgdelayMs: number (tùy chọn; mặc định0)deviceId: string (tùy chọn; từcamera.list)
- Payload phản hồi:
format: "jpg"base64: "<...>"width,height
-
Bảo vệ payload: ảnh được nén lại để giữ payload base64 dưới 5 MB.
-
camera.clip - Tham số:
facing:front|back(mặc định:front)durationMs: number (mặc định3000, giới hạn tối đa60000)includeAudio: boolean (mặc địnhtrue)format: hiện tạimp4deviceId: string (tùy chọn; từcamera.list)
- Payload phản hồi:
format: "mp4"base64: "<...>"durationMshasAudio
Yêu cầu chạy tiền cảnh¶
Tương tự canvas.*, node iOS chỉ cho phép các lệnh camera.* trong tiền cảnh. Các lệnh gọi ở chế độ nền sẽ trả về NODE_BACKGROUND_UNAVAILABLE.
Trợ giúp CLI (tệp tạm + MEDIA)¶
Cách dễ nhất để lấy tệp đính kèm là qua trợ giúp CLI, công cụ này ghi media đã giải mã vào một tệp tạm và in ra MEDIA:<path>.
Ví dụ:
openclaw nodes camera snap --node <id> # default: both front + back (2 MEDIA lines)
openclaw nodes camera snap --node <id> --facing front
openclaw nodes camera clip --node <id> --duration 3000
openclaw nodes camera clip --node <id> --no-audio
Ghi chú:
nodes camera snapmặc định là cả hai hướng camera để tác tử có đủ hai góc nhìn.- Các tệp đầu ra là tạm thời (trong thư mục temp của hệ điều hành) trừ khi bạn tự xây dựng wrapper riêng.
Node Android¶
Cài đặt người dùng Android (mặc định bật)¶
- Trang Cài đặt Android → Camera → Allow Camera (
camera.enabled) - Mặc định: bật (thiếu khóa được xem là đã bật).
- Khi tắt: các lệnh
camera.*trả vềCAMERA_DISABLED.
Quyền¶
- Android yêu cầu quyền runtime:
CAMERAcho cảcamera.snapvàcamera.clip.RECORD_AUDIOchocamera.clipkhiincludeAudio=true.
Nếu thiếu quyền, ứng dụng sẽ nhắc khi có thể; nếu bị từ chối, các yêu cầu camera.* sẽ thất bại với lỗi
*_PERMISSION_REQUIRED.
Yêu cầu chạy tiền cảnh trên Android¶
Tương tự canvas.*, node Android chỉ cho phép các lệnh camera.* trong tiền cảnh. Các lệnh gọi ở chế độ nền sẽ trả về NODE_BACKGROUND_UNAVAILABLE.
Bảo vệ payload¶
Ảnh được nén lại để giữ payload base64 dưới 5 MB.
Ứng dụng macOS¶
Cài đặt người dùng (mặc định tắt)¶
Ứng dụng đồng hành macOS cung cấp một ô chọn:
- Cài đặt → Cài đặt chung → Cho phép Camera (
openclaw.cameraEnabled) - Mặc định: tắt
- Khi tắt: các yêu cầu camera trả về “Camera disabled by user”.
Trợ giúp CLI (gọi node)¶
Sử dụng CLI chính openclaw để gọi các lệnh camera trên node macOS.
Ví dụ:
openclaw nodes camera list --node <id> # list camera ids
openclaw nodes camera snap --node <id> # prints MEDIA:<path>
openclaw nodes camera snap --node <id> --max-width 1280
openclaw nodes camera snap --node <id> --delay-ms 2000
openclaw nodes camera snap --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --duration 10s # prints MEDIA:<path>
openclaw nodes camera clip --node <id> --duration-ms 3000 # prints MEDIA:<path> (legacy flag)
openclaw nodes camera clip --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --no-audio
Ghi chú:
openclaw nodes camera snapmặc định làmaxWidth=1600trừ khi được ghi đè.- Trên macOS,
camera.snapchờdelayMs(mặc định 2000ms) sau khi làm ấm/ổn định phơi sáng trước khi chụp. - Payload ảnh được nén lại để giữ base64 dưới 5 MB.
An toàn + giới hạn thực tế¶
- Quyền truy cập camera và micro sẽ kích hoạt các hộp thoại xin quyền tiêu chuẩn của hệ điều hành (và yêu cầu chuỗi mô tả sử dụng trong Info.plist).
- Clip video bị giới hạn (hiện tại
<= 60s) để tránh payload node quá lớn (độ dư base64 + giới hạn thông điệp).
Video màn hình macOS (cấp hệ điều hành)¶
Đối với video màn hình (không phải camera), hãy dùng ứng dụng đồng hành macOS:
openclaw nodes screen record --node <id> --duration 10s --fps 15 # prints MEDIA:<path>
Ghi chú:
- Yêu cầu quyền Screen Recording của macOS (TCC).