1269 lines
43 KiB
Markdown
1269 lines
43 KiB
Markdown
|
||
# RK3588 智能视频分析系统 PRD(v1.2)
|
||
|
||
---
|
||
|
||
## 一、文档综述
|
||
|
||
### 1.1 项目背景
|
||
|
||
为了充分利用瑞芯微 RK3588 芯片提供的:
|
||
|
||
- **NPU:约 6 TOPS**(RKNN,INT8 推理能力)
|
||
- **VPU:多路 1080p 硬件解码/编码**
|
||
- **RGA:硬件图像处理(缩放/颜色转换/OSD 等)**
|
||
|
||
构建一套**纯 C++ 实现、高性能、低延迟、模块化**的边缘计算视频分析平台。平台主要部署在园区、仓库、工厂等场景,实现就地智能分析与处理,减少带宽与中心算力压力。
|
||
|
||
### 1.2 核心目标
|
||
|
||
- **高性能**
|
||
- 单 RK3588 支持 8–16 路 1080p 实时分析
|
||
- 单路端到端(拉流→推理→输出)延迟 < 500ms
|
||
- **低耦合**
|
||
- 基于插件 + DAG 流水线架构
|
||
- 算法、业务逻辑与底层框架完全解耦
|
||
- **易运维**
|
||
- JSON 配置驱动
|
||
- 支持热更新,无需重启进程即可变更流程/参数
|
||
- **多场景覆盖**
|
||
- 同一套框架通过不同配置图覆盖:
|
||
- 安防报警
|
||
- 录像存储
|
||
- 转码网关(RTSP/HLS)
|
||
- 混合场景(报警 + 存储 + 推流)
|
||
|
||
---
|
||
|
||
## 二、总体架构设计
|
||
|
||
### 2.1 系统逻辑架构
|
||
|
||
```text
|
||
[ media-server 主进程 ]
|
||
|
|
||
+-- Graph Manager (图管理:加载配置、构建DAG、热更新/回滚)
|
||
|
|
||
+-- Plugin Loader (插件加载:dlopen .so,检查 ABI 版本)
|
||
|
|
||
+-- AiScheduler (统一调度 NPU 推理请求)
|
||
|
|
||
+-- Metrics & Logger (监控指标、日志)
|
||
|
|
||
+-- HTTP Server (REST API + Web 控制台 + 状态查询)
|
||
```
|
||
|
||
- **media-server**:主入口,负责初始化配置、图构建、主事件循环。
|
||
- **Graph Manager(GraphMgr)**:
|
||
- 对应多个 graph(每个 graph 一路/一组业务流程)。
|
||
- 实例化节点(Node),建立边(Edge),负责热更新时的 diff & 切换。
|
||
- **Plugin Loader**:
|
||
- 动态加载插件 `.so`,校验节点类型和 ABI 版本。
|
||
- **AiScheduler**:
|
||
- 所有 AI 节点统一将推理任务提交到 AiScheduler,由其管理 NPU 资源。
|
||
- **HTTP Server**:
|
||
- 对外提供图状态查询、节点指标、配置热更新触发等。
|
||
|
||
### 2.2 数据流架构(DAG)
|
||
|
||
- **Graph(图)**:一个完整业务通道。例如:Camera 1 的“拉流→AI→报警+录像+推流”。
|
||
- **Node(节点)**:功能基本单元,由动态加载的 `.so` 实例实现。
|
||
- **Edge(边)**:节点间的数据通道,每条边对应一个 **SPSC(单生产者单消费者)环形队列**。
|
||
- **多分支支持**:一个节点可以有多个下游(多条边),实现一对多分支。
|
||
|
||
示意:
|
||
|
||
```text
|
||
[in] → [pre] → [ai_yolo] → [det_post] ───→ [alarm]
|
||
└──────→ [osd] → [storage]
|
||
└──→ [publish]
|
||
```
|
||
|
||
> 说明:`det_post` 是检测结果后处理节点(可选)。它会对 `frame->det` 做过滤/修正/二次验证,使 OSD 与告警读取到一致的“后处理结果”。
|
||
|
||
### 2.3 多硬件解耦架构(已完成)
|
||
|
||
为支持 RK3588 之外的平台(Atlas/Jetson 等),已将硬件强绑定模块抽象为统一接口层,并保留 RK3588 默认实现与 DMA-BUF 快路径:
|
||
|
||
- **推理**:`IInferBackend`(默认 `Rk3588InferBackend`)
|
||
- **图像处理**:`IImageProcessor`(默认 `Rk3588ImageProcessor`,RGA/Swscale 兜底)
|
||
- **编解码**:`IDecoder` / `IEncoder`(默认 RK3588 MPP 路径)
|
||
- **缓冲区**:`FrameBuffer` 统一 DMA/内存同步语义
|
||
|
||
运行时通过 `HwFactory` 根据配置选择后端实现:
|
||
|
||
- 配置字段:`platform` / `hw_platform`(不填默认 `rk3588`)
|
||
- 可扩展实现:`Atlas*` / `Jetson*`(保持现有业务配置不变,仅切换硬件实现)
|
||
|
||
---
|
||
|
||
## 三、数据模型(Frame & 元数据)
|
||
|
||
### 3.1 检测结果结构(Detection & DetectionResult)
|
||
|
||
> 约定:**所有 AI 节点写入此结构**,OSD / 报警 等节点只读。
|
||
|
||
```cpp
|
||
struct Rect {
|
||
float x; // 左上角X,像素或归一化坐标
|
||
float y; // 左上角Y
|
||
float w; // 宽
|
||
float h; // 高
|
||
};
|
||
|
||
struct Detection {
|
||
int cls_id; // 类别ID
|
||
float score; // 置信度 [0,1]
|
||
Rect bbox; // 检测框
|
||
int track_id; // 跟踪ID,可选(无则 -1 或 0)
|
||
};
|
||
|
||
struct DetectionResult {
|
||
std::vector<Detection> items;
|
||
int img_w; // 推理输入宽
|
||
int img_h; // 推理输入高
|
||
std::string model_name; // 模型名/版本
|
||
};
|
||
```
|
||
|
||
**约定:**
|
||
|
||
- `bbox` 坐标标准在 PRD 中约定好(建议:像素坐标),避免后续插件互相搞混。
|
||
- class 映射表由 AI 节点自行维护,OSD/报警通过 `cls_id` 做规则匹配。
|
||
|
||
### 3.2 Frame 结构
|
||
|
||
```cpp
|
||
enum class PixelFormat {
|
||
NV12,
|
||
YUV420,
|
||
RGB,
|
||
BGR,
|
||
UNKNOWN
|
||
};
|
||
|
||
struct Frame {
|
||
int width;
|
||
int height;
|
||
PixelFormat format;
|
||
|
||
int dma_fd; // DMA-BUF FD;无则为 -1
|
||
uint8_t* data; // CPU 内存指针(可选,有则指向内存buffer)
|
||
|
||
uint64_t pts; // 时间戳(微秒)
|
||
uint64_t frame_id; // 单调递增ID
|
||
|
||
std::shared_ptr<DetectionResult> det; // AI 检测结果(通用目标检测)
|
||
std::shared_ptr<FaceDetResult> face_det; // 人脸检测结果
|
||
std::shared_ptr<FaceRecogResult> face_recog;// 人脸识别结果
|
||
std::shared_ptr<void> user_meta; // 扩展元数据(具体类型由插件间约定)
|
||
};
|
||
```
|
||
|
||
**约定:**
|
||
|
||
- **零拷贝优先**:解码/前处理尽量通过 `dma_fd` 传递,必要时才用 data。
|
||
- 节点默认只读图像数据,**可以更新 `det` / `face_det` / `face_recog` / `user_meta`**。
|
||
- 所有队列中传递的都是 `std::shared_ptr<Frame>`,实现多下游共享。
|
||
|
||
### 3.3 人脸检测结果结构(FaceDetResult)
|
||
|
||
```cpp
|
||
struct Point2f {
|
||
float x;
|
||
float y;
|
||
};
|
||
|
||
struct FaceDetItem {
|
||
Rect bbox; // 人脸框
|
||
float score; // 检测置信度
|
||
int track_id; // 跟踪ID(可选,-1表示无)
|
||
bool has_landmarks; // 是否有关键点
|
||
std::array<Point2f, 5> landmarks; // 5点关键点:左眼/右眼/鼻尖/左嘴角/右嘴角
|
||
};
|
||
|
||
struct FaceDetResult {
|
||
std::vector<FaceDetItem> faces;
|
||
int img_w; // 原始图像宽
|
||
int img_h; // 原始图像高
|
||
std::string model_name; // 模型名(如 "retinaface")
|
||
};
|
||
```
|
||
|
||
### 3.4 人脸识别结果结构(FaceRecogResult)
|
||
|
||
```cpp
|
||
struct FaceRecogItem {
|
||
Rect bbox; // 人脸框(与检测结果对应)
|
||
int best_person_id; // 匹配的人员ID(-1表示陌生人)
|
||
std::string best_name; // 匹配的人员姓名("unknown"表示陌生人)
|
||
float best_sim; // 最高相似度
|
||
float second_sim; // 次高相似度(用于margin判定)
|
||
bool unknown; // 是否为陌生人
|
||
std::vector<float> embedding; // 特征向量(可选,调试/注册用)
|
||
};
|
||
|
||
struct FaceRecogResult {
|
||
std::vector<FaceRecogItem> items;
|
||
int img_w;
|
||
int img_h;
|
||
std::string model_name; // 模型名(如 "arcface")
|
||
};
|
||
```
|
||
|
||
---
|
||
|
||
## 四、插件模型与生命周期
|
||
|
||
### 4.1 节点通用字段(Node 通用配置)
|
||
|
||
每个节点配置中推荐包含以下通用字段:
|
||
|
||
```json
|
||
{
|
||
"id": "唯一节点ID",
|
||
"type": "节点类型,如 input_rtsp / ai_yolo",
|
||
"enable": true,
|
||
"role": "source|filter|sink", // 可选,但建议写上,便于校验
|
||
"queue": { // 可选:覆盖边上的默认队列策略
|
||
"size": 128,
|
||
"policy": "drop_oldest" // drop_oldest / drop_newest / block
|
||
},
|
||
"debug": { // 可选:调试/日志开关(生产默认建议关闭)
|
||
"stats": false, // 各节点的周期性统计日志(processed/queue/drops 等)
|
||
"stats_interval": 100, // 统计日志间隔(帧数)
|
||
"detections": false, // 部分 AI 节点的前几帧检测框调试输出
|
||
"ffmpeg_log_level": "error" // FFmpeg 日志级别(影响 HLS/RTSP mux 的内部日志;默认 error)
|
||
},
|
||
"...特定节点参数..."
|
||
}
|
||
```
|
||
|
||
- `enable = false`:GraphMgr 构建图时可直接忽略该节点及相关 edges。
|
||
- `role` 主要用于配置校验(source 不应有上游,sink 不应有下游等)。
|
||
|
||
**日志/性能建议:**
|
||
|
||
- 生产环境建议:`global.log_level=warn`,并保持各节点 `debug.stats=false`,避免高频 stdout/stderr 造成 CPU 抖动。
|
||
- 需要定位丢帧/队列积压时,再对目标节点打开 `debug.stats=true`(并把 `stats_interval` 调大,如 500/1000)。
|
||
|
||
### 4.2 INode 接口(含 Drain)
|
||
|
||
```cpp
|
||
// NodeStatus 用于描述处理结果
|
||
enum class NodeStatus {
|
||
OK, // 正常处理
|
||
DROP, // 丢弃该帧(例如不满足条件)
|
||
ERROR // 发生错误,需要记录日志
|
||
};
|
||
|
||
class INode {
|
||
public:
|
||
virtual ~INode() = default;
|
||
|
||
// 1. 初始化:解析 JSON 配置,申请静态资源
|
||
virtual bool Init(const Json::Value& config) = 0;
|
||
|
||
// 2. 启动:启动内部线程(如有),准备接收/发送数据
|
||
virtual bool Start() = 0;
|
||
|
||
// 3. 处理数据:GraphMgr 从队列中取到 Frame 后调用
|
||
// - 对 filter/sink 节点:正常消费上游 Frame
|
||
// - 对 source 节点:通常可忽略(见下文约定)
|
||
virtual NodeStatus Process(std::shared_ptr<Frame> frame) = 0;
|
||
|
||
// 4. 动态配置更新:支持热更参数(如改变报警阈值、bitrate)
|
||
// 返回 true 表示就地更新成功,无需重建节点
|
||
virtual bool UpdateConfig(const Json::Value& new_config) { return false; }
|
||
|
||
// 5. Drain:停止前,**不再有新输入**,但需处理完内部队列/缓冲数据
|
||
// 如:storage 完成当前切片写入,publish 发送剩余帧等
|
||
virtual void Drain() {}
|
||
|
||
// 6. 停止:释放资源(线程、句柄、内存等),Drain 之后调用
|
||
virtual void Stop() = 0;
|
||
};
|
||
```
|
||
|
||
### 4.3 插件导出与 ABI 版本
|
||
|
||
```cpp
|
||
#define ABI_VERSION 20250101
|
||
|
||
#define REGISTER_NODE(TYPE_NAME, CLASS_NAME) \
|
||
extern "C" { \
|
||
INode* CreateNode() { \
|
||
return new CLASS_NAME(); \
|
||
} \
|
||
const char* GetNodeType() { \
|
||
return TYPE_NAME; \
|
||
} \
|
||
int GetAbiVersion() { \
|
||
return ABI_VERSION; \
|
||
} \
|
||
const char* GetNodeDescription() { \
|
||
return "node: " TYPE_NAME; \
|
||
} \
|
||
}
|
||
```
|
||
|
||
GraphMgr 在加载插件 `.so` 时:
|
||
|
||
- 调用 `GetAbiVersion()` 校验兼容性。
|
||
- 通过 `GetNodeType()` 找到对应 `type` 的构造函数。
|
||
|
||
### 4.4 Source 节点约定
|
||
|
||
为避免把所有采集逻辑都硬塞进 `Process()`,PRD 中统一约定:
|
||
|
||
- `role == "source"` 的节点(如 `input_rtsp` / `input_file`):
|
||
- 在 `Start()` 中启动**内部采集线程**。
|
||
- 线程中从外部拉流/读文件,构造 `Frame`,通过框架提供的 `FrameEmitter` 写入下游队列。
|
||
- `Process()` 可以是空实现或仅做心跳/监控。
|
||
- `role != "source"` 的节点:
|
||
- 由 GraphMgr 驱动 `Process(frame)`,消费上游队列元素。
|
||
|
||
GraphMgr 负责:
|
||
|
||
- 对非 source 节点:循环从对应队列取 `Frame` → 调用 `Process()`。
|
||
- 对所有节点:在热更新 / 停止时,控制 `Drain()` 和 `Stop()` 的调用顺序。
|
||
|
||
---
|
||
|
||
## 五、配置系统(Config System)
|
||
|
||
整个系统由 `config.json` 驱动,主要包含三层:
|
||
|
||
- `global`:全局配置
|
||
- `templates`:pipeline 模板(复用节点与拓扑)
|
||
- `instances` / `graphs`:具体业务实例(通道)
|
||
|
||
### 5.1 顶层结构示例
|
||
|
||
```json
|
||
{
|
||
"global": {
|
||
"plugin_path": "/usr/lib/rknodes",
|
||
"log_level": "info",
|
||
"metrics_port": 9000
|
||
},
|
||
"templates": { ... },
|
||
"instances": [ ... ],
|
||
"graphs": [ ... ] // 可选:直接手写graph
|
||
}
|
||
```
|
||
|
||
> 说明:`global.log_level` 只控制框架内部 Logger(debug/info/warn/error);
|
||
> 若启用了 FFmpeg(例如 publish 的 HLS mux),建议通过节点 `debug.ffmpeg_log_level` 将 FFmpeg 内部日志降到 `error`,
|
||
> 避免出现大量类似 `hls ... Opening ...` 的 info 日志刷屏。
|
||
|
||
- **优先方式**:使用 `templates + instances` 快速生成多路通道。
|
||
- **高级用法**:直接使用 `graphs` 写复杂拓扑(例如:一条流拆成多个完全不同的分支)。
|
||
|
||
### 5.2 DAG 多分支完整示例(带报警 + 存储 + 推流)
|
||
|
||
```json
|
||
{
|
||
"graphs": [
|
||
{
|
||
"name": "cam1_pipeline",
|
||
"nodes": [
|
||
{
|
||
"id": "in_cam1",
|
||
"type": "input_rtsp",
|
||
"role": "source",
|
||
"enable": true,
|
||
"url": "rtsp://user:pwd@ip/stream1"
|
||
},
|
||
{
|
||
"id": "pre_cam1",
|
||
"type": "preprocess",
|
||
"role": "filter",
|
||
"enable": true,
|
||
"dst_w": 768,
|
||
"dst_h": 768,
|
||
"dst_format": "rgb",
|
||
"resize_mode": "letterbox"
|
||
},
|
||
{
|
||
"id": "ai_cam1",
|
||
"type": "ai_yolo",
|
||
"role": "filter",
|
||
"enable": true,
|
||
"model_path": "./models/ppe_det_yolov8_ppe11_768_rk3588.rknn",
|
||
"model_version": "v8",
|
||
"model_w": 768,
|
||
"model_h": 768,
|
||
"num_classes": 11,
|
||
"conf": 0.35,
|
||
"nms": 0.45,
|
||
"class_filter": [3, 6]
|
||
},
|
||
{
|
||
"id": "pp_cam1",
|
||
"type": "det_post",
|
||
"role": "filter",
|
||
"enable": true,
|
||
"default": { "enable": false },
|
||
"per_class": [
|
||
{
|
||
"class_id": 0,
|
||
"enable": true,
|
||
"processors": [
|
||
{ "type": "conf_gate", "conf_min": 0.65 },
|
||
{ "type": "bbox_gate", "min_w": 10, "min_h": 10 }
|
||
]
|
||
}
|
||
]
|
||
},
|
||
{
|
||
"id": "osd_cam1",
|
||
"type": "osd",
|
||
"role": "filter",
|
||
"enable": true,
|
||
"draw_bbox": true,
|
||
"draw_text": true
|
||
},
|
||
{
|
||
"id": "alarm_cam1",
|
||
"type": "alarm",
|
||
"role": "sink",
|
||
"enable": true,
|
||
"rules": [
|
||
{
|
||
"name": "intrusion_day",
|
||
"object": ["person"],
|
||
"roi": "roi1",
|
||
"min_duration_ms": 500,
|
||
"schedule": "08:00-20:00"
|
||
}
|
||
]
|
||
},
|
||
{
|
||
"id": "storage_cam1",
|
||
"type": "storage",
|
||
"role": "sink",
|
||
"enable": true,
|
||
"mode": "continuous",
|
||
"segment_sec": 300,
|
||
"path": "/rec/cam1"
|
||
},
|
||
{
|
||
"id": "publish_cam1",
|
||
"type": "publish",
|
||
"role": "sink",
|
||
"enable": true,
|
||
"codec": {
|
||
"video": "h264",
|
||
"bitrate_kbps": 2048,
|
||
"gop": 50
|
||
},
|
||
"outputs": [
|
||
{ "proto": "rtsp", "port": 8554, "path": "/live/cam1" },
|
||
{ "proto": "hls", "path": "/data/hls/cam1/index.m3u8", "segment_sec": 2 }
|
||
]
|
||
}
|
||
],
|
||
"edges": [
|
||
["in_cam1", "pre_cam1"],
|
||
["pre_cam1", "ai_cam1"],
|
||
["ai_cam1", "pp_cam1"],
|
||
["pp_cam1", "alarm_cam1"],
|
||
["pp_cam1", "osd_cam1"],
|
||
["osd_cam1", "storage_cam1"],
|
||
["osd_cam1", "publish_cam1"]
|
||
]
|
||
}
|
||
]
|
||
}
|
||
```
|
||
|
||
> 说明:如果不需要后处理:
|
||
>
|
||
> - **推荐**:保留 `pp_cam1` 节点(`enable:true`),并确保其不启用任何处理链(例如:`default.enable=false` 且 `per_class` 为空),此时 `det_post` 会作为轻量透传。
|
||
> - 若确实要移除该节点:需要**同时删除并重连拓扑**(例如改回 `ai_cam1 -> osd_cam1` 与 `ai_cam1 -> alarm_cam1`),仅设置 `enable=false` 会导致下游节点无输入而构图失败。
|
||
|
||
通过简单改动即可支持不同组合:
|
||
|
||
- 不报警:`alarm_cam1.enable = false` 或移除该节点/边。
|
||
- 只转码网关:直接连 `["in_cam1", "publish_cam1"]`,并禁用 AI/OSD/报警/storage。
|
||
- 只录像:`["in_cam1", "storage_cam1"]`。
|
||
|
||
### 5.3 模板(templates)与实例(instances)
|
||
|
||
#### 5.3.1 模板示例:标准安防流程
|
||
|
||
```json
|
||
"templates": {
|
||
"standard_security": {
|
||
"nodes": [
|
||
{ "id": "in", "type": "input_rtsp", "role": "source", "url": "${url}" },
|
||
{ "id": "pre", "type": "preprocess", "role": "filter", "dst_w": 768, "dst_h": 768, "resize_mode": "letterbox" },
|
||
{ "id": "ai", "type": "ai_yolo", "role": "filter", "model_path": "./models/ppe_det_yolov8_ppe11_768_rk3588.rknn", "model_version": "v8", "num_classes": 11, "conf": 0.35, "class_filter": [3, 6] },
|
||
{ "id": "pp", "type": "det_post", "role": "filter", "enable": true, "default": { "enable": false } },
|
||
{ "id": "osd", "type": "osd", "role": "filter" },
|
||
{ "id": "pub", "type": "publish", "role": "sink", "path": "/live/${name}" }
|
||
],
|
||
"edges": [
|
||
["in", "pre"],
|
||
["pre", "ai"],
|
||
["ai", "pp"],
|
||
["pp", "osd"],
|
||
["osd", "pub"]
|
||
]
|
||
}
|
||
}
|
||
```
|
||
|
||
#### 5.3.2 实例与 override(禁用某些节点)
|
||
|
||
```json
|
||
"instances": [
|
||
{
|
||
"name": "cam_01",
|
||
"template": "standard_security",
|
||
"params": {
|
||
"url": "rtsp://192.168.1.101/stream1",
|
||
"name": "office"
|
||
},
|
||
"override": {
|
||
"nodes": {
|
||
"ai": { "enable": true },
|
||
"osd": { "enable": true }
|
||
}
|
||
}
|
||
},
|
||
{
|
||
"name": "cam_02_only_transcode",
|
||
"template": "standard_security",
|
||
"params": {
|
||
"url": "rtsp://192.168.1.102/stream1",
|
||
"name": "transcoder"
|
||
},
|
||
"override": {
|
||
"nodes": {
|
||
"ai": { "enable": false },
|
||
"osd": { "enable": false }
|
||
}
|
||
}
|
||
}
|
||
]
|
||
```
|
||
|
||
> GraphMgr 在加载时将模板 + 实例 merge 成具体的 graph(节点 ID 会按实例名做前缀防冲突)。
|
||
|
||
### 5.4 热更新与回滚(简要)
|
||
|
||
- 通过 inotify 监控 `config.json`。
|
||
- 检测到变更时:
|
||
1. 读取新配置 → JSON Schema 校验;
|
||
2. 构建新的图对象(dry run),包括插件加载与节点实例化;
|
||
3. 与旧图做 diff:
|
||
- 能 `UpdateConfig` 的节点优先调用 `UpdateConfig`;
|
||
- 需要重建的节点:先创建新节点并预热(如加载模型),然后做 **边的原子切换**;
|
||
4. 对旧节点:依次调用 `Drain()` → `Stop()`;
|
||
5. 若任意步骤失败:回滚到旧配置,并输出错误日志。
|
||
- 保留上一份有效配置,支持手动回滚。
|
||
|
||
---
|
||
|
||
## 六、功能模块定义(插件类型)
|
||
|
||
> 下表是“典型插件类型”,后续可以扩展更多。
|
||
|
||
### 6.1 输入与前处理
|
||
|
||
| 节点类型 | 功能描述 | 关键参数 | 硬件依赖 |
|
||
| :------------- | :------------------------------- | :------------------------- | :--------------- |
|
||
| `input_rtsp` | 拉取 RTSP 流,断线重连 | `url`, `reconnect_sec` | MPP VDEC / 网络 |
|
||
| `input_file` | 读取本地 MP4/MKV 文件循环播放 | `path`, `loop` | MPP VDEC |
|
||
| `preprocess` | 缩放、裁剪、NV12→RGB/BGR 等 | `dst_w`, `dst_h`, `dst_format`, `resize_mode` | RGA / GPU |
|
||
|
||
#### Preprocess 节点参数说明
|
||
|
||
**关键参数:**
|
||
|
||
| 参数 | 类型 | 说明 | 默认值 |
|
||
|------|------|------|--------|
|
||
| `dst_w` | int | 输出宽度 | 640 |
|
||
| `dst_h` | int | 输出高度 | 640 |
|
||
| `dst_format` | string | 输出格式: `rgb`, `bgr`, `nv12`, `yuv420` | 保持原格式 |
|
||
| `resize_mode` | string | 缩放模式: `stretch`, `keep_ratio`, `letterbox` | `stretch` |
|
||
| `use_rga` | bool | 是否使用 RGA 硬件加速 | true |
|
||
|
||
**resize_mode 说明:**
|
||
|
||
- `stretch`: 拉伸填充,可能改变目标宽高比
|
||
- `keep_ratio`: 保持比例缩放,可能无法填满目标尺寸
|
||
- `letterbox`: 保持比例缩放,边缘填充黑色(推荐,避免目标变形)
|
||
|
||
当使用 `letterbox` 模式时,系统会自动记录变换元数据(`FrameTransformMeta`),后续节点(如 `ai_yolo`、`osd`)会自动处理坐标映射,无需手动转换。
|
||
|
||
### 6.2 AI 分析
|
||
|
||
| 节点类型 | 功能描述 | 关键参数 | 硬件依赖 |
|
||
| :-------------- | :------------------------- | :----------------------------------- | :------- |
|
||
| `ai_yolo` | 通用目标检测(YOLOv5/v8) | `model_path`, `model_version`, `num_classes`, `conf`, `nms`, `class_filter` | NPU(RKNN) |
|
||
|
||
**ai_yolo 配置示例(ppe_det_yolov8_ppe11_768_rk3588.rknn):**
|
||
|
||
```json
|
||
{
|
||
"id": "yolo_cam1",
|
||
"type": "ai_yolo",
|
||
"model_path": "./models/ppe_det_yolov8_ppe11_768_rk3588.rknn",
|
||
"model_version": "v8",
|
||
"model_w": 768,
|
||
"model_h": 768,
|
||
"num_classes": 11,
|
||
"conf": 0.35,
|
||
"nms": 0.45,
|
||
"class_filter": [3, 6]
|
||
}
|
||
```
|
||
|
||
**关键参数:**
|
||
|
||
| 参数 | 类型 | 说明 |
|
||
|------|------|------|
|
||
| `model_path` | string | RKNN 模型路径 |
|
||
| `model_version` | string | 模型版本: `v5` 或 `v8` |
|
||
| `num_classes` | int | 模型类别数(必须与实际一致) |
|
||
| `conf` | float | 置信度阈值(0-1) |
|
||
| `nms` | float | NMS IoU 阈值(0-1) |
|
||
| `class_filter` | array | 只输出指定类别的检测结果,如 `[3, 6]` 表示只检测 boots 和 Person |
|
||
| `ai_face_det` | 人脸检测(含5点关键点) | `model_path`, `conf`, `nms`, `max_faces`, `output_landmarks` | NPU(RKNN) |
|
||
| `ai_face_recog` | 人脸识别(对齐+特征提取+检索) | `model_path`, `gallery`, `threshold`, `align` | NPU(RKNN) |
|
||
| `ai_pose` | 关键点检测(可选扩展) | `model_path` | NPU |
|
||
| `ai_custom` | 自定义 AI 算法 | `model_path`, `custom_param` 等 | NPU |
|
||
|
||
#### 6.2.1 det_post(检测结果后处理,按类别策略链)
|
||
|
||
`det_post` 是一个 **Filter** 节点,位于 `ai_yolo` 之后,负责对 `frame->det->items` 做**按类别可配置**的后处理。
|
||
|
||
**设计目标:**
|
||
|
||
- 不同类别可以挂不同的处理器链(Processor/Strategy Registry),避免“一个类别一个插件”。
|
||
- 默认改写 `frame->det`,让 `osd` / `alarm` 读到一致结果。
|
||
|
||
**配置示例:**
|
||
|
||
```json
|
||
{
|
||
"id": "pp_cam1",
|
||
"type": "det_post",
|
||
"role": "filter",
|
||
"enable": true,
|
||
|
||
"default": { "enable": false },
|
||
"per_class": [
|
||
{
|
||
"class_id": 3,
|
||
"enable": true,
|
||
"processors": [
|
||
{ "type": "conf_gate", "conf_min": 0.65 },
|
||
{ "type": "bbox_gate", "min_w": 10, "min_h": 10 },
|
||
{ "type": "roi_gate", "roi": { "x": 0.1, "y": 0.1, "w": 0.8, "h": 0.8 }, "mode": "center" }
|
||
]
|
||
},
|
||
{
|
||
"class_id": 5,
|
||
"enable": true,
|
||
"processors": [
|
||
{ "type": "hsv_ratio", "h_min": 0, "h_max": 20, "s_min": 20, "v_min": 70, "ratio_min": 0.7,
|
||
"max_samples": 2048, "step": 0, "min_samples": 32,
|
||
"crop": { "x": 0.0, "y": 0.0, "w": 1.0, "h": 1.0 } }
|
||
]
|
||
},
|
||
{
|
||
"class_id": 7,
|
||
"enable": true,
|
||
"processors": [
|
||
{ "type": "lab_kmeans", "k": 3, "iters": 8, "l_max": 50, "ratio_min": 0.4,
|
||
"max_samples": 2048, "step": 0, "min_samples": 64,
|
||
"crop": { "x": 0.0, "y": 0.0, "w": 1.0, "h": 1.0 } }
|
||
]
|
||
}
|
||
]
|
||
}
|
||
```
|
||
|
||
**内置 processors(当前实现):**
|
||
|
||
- `conf_gate`:按置信度过滤(`conf_min`)
|
||
- `bbox_gate`:按框尺寸过滤(`min_w`, `min_h`)
|
||
- `roi_gate`:按 ROI 过滤(`roi:{x,y,w,h}` 归一化;`mode:center` 使用 bbox 中心点判断)
|
||
- `hsv_ratio`:框内采样像素转 HSV,统计阈值命中占比(`h_min/h_max/s_min/s_max/v_min/v_max/ratio_min`,支持 `crop/max_samples/step`)
|
||
- `lab_kmeans`:框内采样像素转 Lab,KMeans 聚类后取最暗簇做判定(`k/iters/l_max/ratio_min`,支持 `crop/max_samples/step`)
|
||
|
||
> 注意:`hsv_ratio/lab_kmeans` 需要 `Frame` 提供可读的像素数据(`frame->data` 可访问)。若上游是纯 DMA-BUF 且未映射到 CPU,这两类处理器会自然退化为“不过滤”。
|
||
|
||
**ai_yolo 参数说明:**
|
||
|
||
- `model_version`: `"v5"`, `"v8"` 或 `"auto"`(自动检测)
|
||
- `num_classes`: 模型类别数(默认 80)
|
||
- `class_filter`: 只检测指定类别 ID 的数组,如 `[0, 1, 2]`
|
||
|
||
> 所有 AI 节点通过 **AiScheduler** 使用 NPU,不直接持有 NPU 句柄。
|
||
|
||
#### 6.2.2 ai_face_det(人脸检测)
|
||
|
||
人脸检测节点,基于 RetinaFace/SCRFD 等轻量模型,输出人脸框和 5 点关键点。
|
||
|
||
**配置示例:**
|
||
|
||
```json
|
||
{
|
||
"id": "face_det_cam1",
|
||
"type": "ai_face_det",
|
||
"role": "filter",
|
||
"enable": true,
|
||
"model_path": "./models/face_det_scrfd_500m_640_rk3588.rknn",
|
||
"conf": 0.6,
|
||
"nms": 0.4,
|
||
"max_faces": 10,
|
||
"output_landmarks": true,
|
||
"input_format": "rgb"
|
||
}
|
||
```
|
||
|
||
**参数说明:**
|
||
|
||
- `model_path`: RetinaFace RKNN 模型路径
|
||
- `conf`: 置信度阈值(默认 0.6)
|
||
- `nms`: NMS 阈值(默认 0.4)
|
||
- `max_faces`: 最大检测人脸数
|
||
- `output_landmarks`: 是否输出 5 点关键点(用于后续对齐)
|
||
- `input_format`: 输入格式 `rgb` 或 `bgr`
|
||
|
||
**输出:** 写入 `frame->face_det`,供 `ai_face_recog` 和 `osd` 读取。
|
||
|
||
#### 6.2.3 ai_face_recog(人脸识别)
|
||
|
||
人脸识别节点,读取检测结果,对每个人脸进行对齐、特征提取、人脸库检索。
|
||
|
||
**配置示例:**
|
||
|
||
```json
|
||
{
|
||
"id": "face_recog_cam1",
|
||
"type": "ai_face_recog",
|
||
"role": "filter",
|
||
"enable": true,
|
||
"model_path": "./models/face_recog_mobilefacenet_arcface_112_rk3588.rknn",
|
||
"align": true,
|
||
"emit_embedding": false,
|
||
"max_faces": 10,
|
||
"input_format": "rgb",
|
||
"threshold": {
|
||
"accept": 0.45,
|
||
"margin": 0.05
|
||
},
|
||
"gallery": {
|
||
"backend": "sqlite",
|
||
"path": "./models/face_gallery.db",
|
||
"load_on_start": true,
|
||
"expected_dim": 512
|
||
}
|
||
}
|
||
```
|
||
|
||
**参数说明:**
|
||
|
||
- `model_path`: ArcFace/MobileFaceNet RKNN 模型路径(输入 112x112,输出 512D embedding)
|
||
- `align`: 是否使用 5 点关键点做仿射对齐(推荐开启)
|
||
- `emit_embedding`: 是否在结果中输出 embedding(调试用,生产关闭以省内存)
|
||
- `threshold.accept`: 相似度接受阈值(高于此值认为匹配成功)
|
||
- `threshold.margin`: top1 与 top2 相似度差值阈值(可选,用于降低误识率)
|
||
- `gallery.backend`: 人脸库后端(当前支持 `sqlite`)
|
||
- `gallery.path`: SQLite 数据库路径
|
||
- `gallery.expected_dim`: embedding 维度(需与模型匹配)
|
||
|
||
**判定规则:**
|
||
|
||
- `top1_sim >= accept` 且(可选)`top1_sim - top2_sim >= margin` → 识别为该人
|
||
- 否则标记为 `unknown`
|
||
|
||
**输出:** 写入 `frame->face_recog`,供 `osd` 和 `alarm` 读取。
|
||
|
||
#### 6.2.4 人脸识别 Pipeline 示例
|
||
|
||
```text
|
||
[input_rtsp] → [preprocess] → [ai_face_det] → [ai_face_recog] → [osd] → [publish]
|
||
```
|
||
|
||
**完整配置示例:**
|
||
|
||
```json
|
||
{
|
||
"name": "cam1_face_recog",
|
||
"nodes": [
|
||
{ "id": "in_cam1", "type": "input_rtsp", "url": "rtsp://..." },
|
||
{ "id": "pre_cam1", "type": "preprocess", "dst_w": 1280, "dst_h": 720, "dst_format": "rgb" },
|
||
{ "id": "face_det_cam1", "type": "ai_face_det", "model_path": "./models/face_det_scrfd_500m_640_rk3588.rknn", "conf": 0.6 },
|
||
{ "id": "face_recog_cam1", "type": "ai_face_recog", "model_path": "./models/face_recog_mobilefacenet_arcface_112_rk3588.rknn", "gallery": { "path": "./models/face_gallery.db" } },
|
||
{ "id": "osd_cam1", "type": "osd", "draw_face_det": true },
|
||
{ "id": "pub_cam1", "type": "publish", "outputs": [{ "proto": "rtsp_server", "port": 8555, "path": "/live/face" }] }
|
||
],
|
||
"edges": [
|
||
["in_cam1", "pre_cam1"],
|
||
["pre_cam1", "face_det_cam1"],
|
||
["face_det_cam1", "face_recog_cam1"],
|
||
["face_recog_cam1", "osd_cam1"],
|
||
["osd_cam1", "pub_cam1"]
|
||
]
|
||
}
|
||
```
|
||
|
||
> **注意**:人脸识别应在**原始分辨率**(如 1280x720)上进行,检测模型内部会自动缩放到 320x320 推理,输出坐标缩放回原始尺寸。这样从高清图裁剪对齐人脸,识别质量更高。
|
||
|
||
#### 6.2.5 人脸库(Gallery)说明
|
||
|
||
人脸库使用 SQLite 存储,表结构:
|
||
|
||
```sql
|
||
CREATE TABLE person (
|
||
id INTEGER PRIMARY KEY,
|
||
name TEXT NOT NULL,
|
||
created_at TEXT,
|
||
extra TEXT -- JSON 扩展字段
|
||
);
|
||
|
||
CREATE TABLE embedding (
|
||
id INTEGER PRIMARY KEY,
|
||
person_id INTEGER NOT NULL,
|
||
embedding BLOB NOT NULL, -- 512D float32 向量
|
||
created_at TEXT,
|
||
FOREIGN KEY (person_id) REFERENCES person(id)
|
||
);
|
||
```
|
||
|
||
**检索实现:**
|
||
|
||
- 小库(≤几千人):CPU 暴力点积,无需额外索引
|
||
- 大库(≥几万人):可扩展 HNSW/Faiss 等 ANN 索引
|
||
|
||
### 6.3 业务逻辑与输出
|
||
|
||
| 节点类型 | 功能描述 | 关键参数 | 硬件依赖 |
|
||
| :---------- | :--------------------------------- | :----------------------------------- | :----------------- |
|
||
| `osd` | 绘制检测框、文字等 | `draw_bbox`, `draw_text`, `labels`, `line_width`, `font_scale` | RGA / CPU |
|
||
| `alarm` | 报警规则 + 多种报警动作 | `rules`, `actions`(见下文详细说明) | CPU |
|
||
|
||
#### 6.3 Behavior Events
|
||
|
||
Behavior events are emitted through `frame->behavior_events` and are not encoded as synthetic detection classes.
|
||
|
||
First-release behavior nodes:
|
||
|
||
- `region_event`: rule-driven `intrusion` and rule-based `climb`
|
||
- `action_recog`: temporal-rule `fall` and `fight`
|
||
- `event_fusion`: stable `event_id` assignment and lifecycle normalization
|
||
|
||
Recommended first-release graph order:
|
||
|
||
```text
|
||
[input_rtsp] -> [preprocess] -> [ai_yolo] -> [tracker] -> [region_event] -> [action_recog] -> [event_fusion] -> [osd] -> [publish] -> [alarm]
|
||
```
|
||
|
||
Behavior event payload includes:
|
||
|
||
- event type
|
||
- lifecycle status
|
||
- related `track_id` values
|
||
- duration in milliseconds
|
||
- event bbox
|
||
- optional `region_id`
|
||
|
||
Behavior event alarm rules should use:
|
||
|
||
- `use_behavior_events: true`
|
||
- `event_types`
|
||
- `region_ids` when region filtering is needed
|
||
- `min_duration_ms`
|
||
- `cooldown_ms`
|
||
|
||
Example alarm rule:
|
||
|
||
```json
|
||
{
|
||
"name": "intrusion_zone_a",
|
||
"use_behavior_events": true,
|
||
"event_types": ["intrusion"],
|
||
"region_ids": ["zone_a"],
|
||
"min_duration_ms": 1000,
|
||
"cooldown_ms": 10000
|
||
}
|
||
```
|
||
| `storage` | 持续录像(MP4/TS 切片) | `mode`, `segment_sec`, `path` | MPP VENC + IO |
|
||
| `publish` | 编码并推流(RTSP/HLS) | `codec`, `bitrate`, `outputs` | MPP VENC + 网络 |
|
||
| `zlm_http` | 内嵌 HTTP 文件服务(为 HLS 提供访问) | `root`, `prefix`, `port`, `ssl` | ZLMediaKit(mk_api) |
|
||
|
||
> 说明:当前实现中 `publish` 的 `proto:"hls"` 为**落盘生成 m3u8/ts 文件**,`path` 应指向 `index.m3u8` 文件路径;若需要通过网络播放,建议新增 `zlm_http` 节点启动内嵌 HTTP,并将 `root` 指向 HLS 父目录(如 `/data/hls`)。
|
||
|
||
**osd 参数说明:**
|
||
|
||
- `labels`: 自定义类别标签数组,如 `["cat", "dog", "bird"]`,为空则使用 COCO 默认标签
|
||
|
||
### 6.4 alarm 插件详细说明
|
||
|
||
alarm 插件采用**模块化 Actions 架构**,支持多种报警动作的灵活组合:
|
||
|
||
**架构设计:**
|
||
|
||
```
|
||
┌─────────────────────────────────────────────────────────┐
|
||
│ AlarmNode │
|
||
│ ┌──────────────┐ ┌──────────────────────────────────┐ │
|
||
│ │ RuleEngine │ │ FrameRingBuffer (pre-event) │ │
|
||
│ │ - 类别过滤 │ │ - 保存最近 N 秒的帧 │ │
|
||
│ │ - ROI 检测 │ └──────────────────────────────────┘ │
|
||
│ │ - 持续时间 │ │
|
||
│ │ - 冷却控制 │ ┌──────────────────────────────────┐ │
|
||
│ └──────────────┘ │ AlarmActions (可配置) │ │
|
||
│ │ - LogAction → 日志输出 │ │
|
||
│ │ - HttpAction → HTTP 回调 │ │
|
||
│ │ - ExternalApiAction → 外部API报警 │ │
|
||
│ │ - SnapshotAction → 截图+上传 │ │
|
||
│ │ - ClipAction → 视频片段+上传 │ │
|
||
│ └──────────────────────────────────┘ │
|
||
└─────────────────────────────────────────────────────────┘
|
||
```
|
||
|
||
**完整配置示例:**
|
||
|
||
```json
|
||
{
|
||
"id": "alarm_cam1",
|
||
"type": "alarm",
|
||
"role": "sink",
|
||
"labels": ["矿体A", "矿体B", "异物"],
|
||
"rules": [
|
||
{
|
||
"name": "ore_detection",
|
||
"class_ids": [0, 1],
|
||
"objects": ["矿体A"],
|
||
"roi": { "x": 0.1, "y": 0.1, "w": 0.8, "h": 0.8 },
|
||
"min_duration_ms": 500,
|
||
"cooldown_ms": 5000,
|
||
"schedule": "08:00-20:00"
|
||
}
|
||
],
|
||
"actions": {
|
||
"log": { "enable": true, "level": "info" },
|
||
"http": {
|
||
"enable": true,
|
||
"url": "http://业务系统/api/alarm",
|
||
"timeout_ms": 3000,
|
||
"include_media_url": true
|
||
},
|
||
"external_api": {
|
||
"enable": false,
|
||
"getTokenUrl": "http://业务系统/api/getToken",
|
||
"putMessageUrl": "http://业务系统/api/putMessage",
|
||
"tenantCode": "32",
|
||
"channelNo": "${vod_channelNo}",
|
||
"timeout_ms": 3000,
|
||
"include_media_url": true,
|
||
"token_header": "X-Access-Token",
|
||
"token_json_path": "responseBody.token",
|
||
"token_cache_sec": 600
|
||
},
|
||
"snapshot": {
|
||
"enable": true,
|
||
"format": "jpg",
|
||
"quality": 85,
|
||
"upload": {
|
||
"type": "minio",
|
||
"endpoint": "http://minio:9000",
|
||
"bucket": "alarms",
|
||
"access_key": "${MINIO_ACCESS_KEY}",
|
||
"secret_key": "${MINIO_SECRET_KEY}"
|
||
}
|
||
},
|
||
"clip": {
|
||
"enable": true,
|
||
"pre_sec": 5,
|
||
"post_sec": 10,
|
||
"format": "mp4",
|
||
"upload": { "type": "local", "path": "/tmp/alarms" }
|
||
}
|
||
}
|
||
}
|
||
```
|
||
|
||
**external_api 动作说明(对接外部系统报警:先取 token,再上报告警):**
|
||
|
||
- 取 token:对 `getTokenUrl` 发起 HTTP POST,默认从响应 JSON 的 `responseBody.token` 读取(可用 `token_json_path` 修改点号路径)。
|
||
- 上报告警:对 `putMessageUrl` 发起 HTTP POST,并携带 Header:`Content-Type: application/json`、`X-Access-Token: <token>`(可用 `token_header` 修改)。
|
||
- 上报请求体(固定结构):
|
||
|
||
```json
|
||
{
|
||
"tenantCode": "32",
|
||
"channelNo": "<vod_channelNo>",
|
||
"alarmContent": "<msg>",
|
||
"alarmTime": "YYYY-MM-DD HH:MM:SS",
|
||
"picInfo": [{"url": "<picUrl>"}],
|
||
"videoInfo": [{"url": "<videoUrl>"}]
|
||
}
|
||
```
|
||
|
||
- `alarmTime` 使用本地时间格式化。
|
||
- `picUrl/videoUrl` 来自 `snapshot/clip` 动作上传后的 URL(通常为 MinIO 返回链接);若为空则对应数组为空。
|
||
- `alarmContent`:若配置中未提供 `alarmContent`,默认使用 `rule_name`。
|
||
|
||
**external_api 参数说明:**
|
||
|
||
- 必填:`getTokenUrl`, `putMessageUrl`, `tenantCode`, `channelNo`
|
||
- 常用可选:`timeout_ms`(默认 3000)、`include_media_url`(默认 true)、`token_cache_sec`(默认 600;为 0 时仅在 401/403 时刷新 token)
|
||
- 其它可选:`token_header`、`token_json_path`、`alarmContent`、`max_queue_size` / `queue_policy`、`max_retries` / `retry_backoff_ms`
|
||
|
||
**规则参数说明:**
|
||
|
||
- `class_ids`: 要监控的类别 ID 数组(与模型输出对应)
|
||
- `objects`: 要监控的类别名称数组(需配合 `labels` 使用)
|
||
- `roi`: 感兴趣区域,归一化坐标 (0-1)
|
||
- `min_duration_ms`: 目标在 ROI 内持续多久才触发报警
|
||
- `cooldown_ms`: 同一规则连续触发的冷却时间
|
||
- `schedule`: 有效时间段,格式 "HH:MM-HH:MM"
|
||
|
||
**上传器类型:**
|
||
|
||
- `local`: 保存到本地文件系统
|
||
- `minio`: 上传到 MinIO 对象存储
|
||
- `s3`: 上传到 AWS S3(兼容 MinIO)
|
||
|
||
### 6.5 storage 插件详细说明
|
||
|
||
storage 插件用于**持续录像**(7x24 小时),与 alarm 的事件录像功能互补。
|
||
|
||
**配置示例:**
|
||
|
||
```json
|
||
{
|
||
"id": "storage_cam1",
|
||
"type": "storage",
|
||
"role": "sink",
|
||
"mode": "continuous",
|
||
"format": "mp4",
|
||
"codec": "h264",
|
||
"segment_sec": 300,
|
||
"path": "/rec/cam1",
|
||
"filename_pattern": "%Y%m%d/%H%M%S",
|
||
"fps": 25,
|
||
"bitrate_kbps": 2000
|
||
}
|
||
```
|
||
|
||
**参数说明:**
|
||
|
||
- `mode`: 录像模式,当前支持 `continuous`(持续录像)
|
||
- `format`: 输出格式,`mp4` 或 `ts`
|
||
- `segment_sec`: 单个文件时长(秒)
|
||
- `filename_pattern`: 文件名模式,支持 strftime 格式
|
||
|
||
---
|
||
|
||
## 七、线程模型(Thread Model)
|
||
|
||
### 7.1 线程类型与职责
|
||
|
||
| 线程类型 | 职责 | 绑核策略(可配置) |
|
||
| :-------------- | :-------------------------------------- | :-------------------------- |
|
||
| `main` | 程序入口、配置加载、GraphMgr 调度 | 默认 CPU0 |
|
||
| `input-io` | RTSP 网络 IO | 大核/通用 |
|
||
| `decode` | 调用 MPP 解码 | 大核 |
|
||
| `preprocess` | RGA/GPU 前处理 | 视情况绑核 |
|
||
| `ai-worker` | 调度 AiScheduler,异步调用 NPU | 大核 |
|
||
| `post/osd` | OSD 绘制、报警逻辑等 | 小核优先 |
|
||
| `storage` | 文件写入、切片管理 | 小核 |
|
||
| `publish` | RTSP/HLS 推流 | 小核 |
|
||
| `metrics/log` | 指标采集、日志异步写入 | 任意核 |
|
||
|
||
### 7.2 配置控制
|
||
|
||
- 节点配置中可增加字段:
|
||
|
||
```json
|
||
"cpu_affinity": [2, 3] // 可选
|
||
```
|
||
|
||
- 若未配置,由框架根据 `role` 和负载自动分配。
|
||
|
||
---
|
||
|
||
## 八、性能指标(Performance Targets)
|
||
|
||
| 场景 | 指标 | 目标值 |
|
||
| :------------- | :------------- | :--------------------- |
|
||
| 8×1080p@25fps | 整机总处理帧率 | ≥ 200 fps |
|
||
| 单路端到端 | 延迟 | ≤ 500 ms(典型 ≤ 380) |
|
||
| NPU | 利用率 | ≥ 90% |
|
||
| 8 路全开 | CPU 占用 | ≤ 30% |
|
||
| 7×24 小时运行 | 内存泄漏 | 无明显增长(< 10MB) |
|
||
|
||
测试要求(简要):
|
||
|
||
- 在实际 RK3588 设备上,使用典型 YOLO 模型和 8 路 RTSP 输入进行长稳测试。
|
||
- 统计长时间运行中的 CPU、内存、NPU 使用情况。
|
||
|
||
---
|
||
|
||
## 九、监控与运维(Metrics & Ops)
|
||
|
||
### 9.1 节点级指标
|
||
|
||
每个节点提供以下基本指标(通过 HTTP / Prometheus 等暴露):
|
||
|
||
- `node_input_fps` / `node_output_fps`
|
||
- `queue_length`(入队/出队队列长度)
|
||
- `frame_drop_count`
|
||
- `error_count`
|
||
- `avg_process_time_ms`(Process 平均处理耗时)
|
||
|
||
### 9.2 图 / 通道级指标
|
||
|
||
- 通道状态:running / error / disabled
|
||
- 报警次数 / 最近报警时间
|
||
- 当前推流客户端数(RTSP/HLS)
|
||
- 当前录像文件信息(路径 / 大小 / 最近片段时间)
|
||
|
||
### 9.3 管理接口(REST 简要)
|
||
|
||
- `GET /api/graphs`:列出所有 graph 状态
|
||
- `GET /api/graphs/{name}`:单通道详情
|
||
- `POST /api/config/reload`:触发配<EFBFBD><EFBFBD><EFBFBD>重加载
|
||
- `GET /api/nodes/{id}/metrics`:查询节点指标
|
||
- `POST /api/nodes/{id}/config`:动态更新节点配置(调用 `UpdateConfig`)
|
||
|
||
---
|
||
|
||
## 十、开发与部署环境
|
||
|
||
- **硬件平台**:RK3588(4×A76 + 4×A55 + NPU + VPU + RGA)
|
||
- **工具链**:
|
||
- 板上编译:GCC 10+(推荐)
|
||
- 交叉编译:`aarch64-linux-gnu-gcc 12+`(可选)
|
||
- 构建:CMake ≥ 3.20
|
||
- **调试**:
|
||
- `gdbserver` + VSCode 远程调试
|
||
- RKNN Profiler 分析 NPU 利用率
|
||
- **日志**:
|
||
- `spdlog` 异步日志
|
||
- 日志级别可运行时调整(通过配置或 REST 接口)
|
||
|
||
### 10.1 板上编译(推荐)
|
||
|
||
在 RK3588 板子上直接编译,无需配置交叉编译环境。
|
||
|
||
**依赖安装:**
|
||
|
||
```bash
|
||
# Ubuntu/Debian
|
||
sudo apt update
|
||
sudo apt install -y build-essential cmake git pkg-config \
|
||
libavformat-dev libavcodec-dev libavutil-dev libswscale-dev
|
||
```
|
||
|
||
**编译命令:**
|
||
|
||
```bash
|
||
cd Rk3588Sys
|
||
|
||
# 配置(启用所有硬件加速)
|
||
cmake -S . -B build \
|
||
-DCMAKE_BUILD_TYPE=Release \
|
||
-DRK3588_ENABLE_FFMPEG=ON \
|
||
-DRK3588_ENABLE_MPP=ON \
|
||
-DRK3588_ENABLE_RGA=ON \
|
||
-DRK3588_ENABLE_ZLMEDIAKIT=ON \
|
||
-DRK_ZLMK_API_LIB_PATH=$PWD/third_party/rknpu2/examples/3rdparty/zlmediakit/aarch64/libmk_api.so \
|
||
-DRK_ZLMEDIAKIT_INCLUDE_DIR=$PWD/third_party/rknpu2/examples/3rdparty/zlmediakit/include
|
||
|
||
# 编译
|
||
cmake --build build -j$(nproc)
|
||
```
|
||
|
||
**CMake 选项说明:**
|
||
|
||
| 选项 | 说明 | 默认值 |
|
||
|------|------|--------|
|
||
| `RK3588_ENABLE_FFMPEG` | 启用 FFmpeg 拉流/软解码 | OFF |
|
||
| `RK3588_ENABLE_MPP` | 启用 MPP 硬件编解码 | OFF |
|
||
| `RK3588_ENABLE_RGA` | 启用 RGA 硬件图像处理 | OFF |
|
||
| `RK3588_ENABLE_RKNN` | 启用 RKNN NPU 推理 | OFF |
|
||
| `RK3588_ENABLE_ZLMEDIAKIT` | 启用内置 RTSP Server | OFF |
|
||
|
||
**运行:**
|
||
|
||
```bash
|
||
# 纯转码网关
|
||
./build/media-server --config configs/sample_cam1.json
|
||
|
||
# 带预处理的 pipeline
|
||
./build/media-server --config configs/sample_preprocess.json
|
||
|
||
# 内置 RTSP Server 模式
|
||
./build/media-server --config configs/sample_cam1_rtsp_server.json
|
||
```
|
||
|
||
### 10.2 交叉编译(可选)
|
||
|
||
在 x86 主机上交叉编译,适合 CI/CD 或批量部署。
|
||
|
||
```bash
|
||
# 需要安装交叉编译工具链
|
||
sudo apt install gcc-aarch64-linux-gnu g++-aarch64-linux-gnu
|
||
|
||
# 配置
|
||
cmake -S . -B build-cross \
|
||
-DCMAKE_TOOLCHAIN_FILE=cmake/aarch64-linux-gnu.cmake \
|
||
-DCMAKE_BUILD_TYPE=Release \
|
||
-DRK3588_ENABLE_FFMPEG=ON \
|
||
-DRK3588_ENABLE_MPP=ON \
|
||
-DRK3588_ENABLE_RGA=ON
|
||
|
||
# 编译
|
||
cmake --build build-cross -j$(nproc)
|
||
|
||
# 同步到板子
|
||
rsync -avz build-cross/ user@board_ip:/opt/media-server/
|
||
```
|
||
|
||
---
|
||
|
||
## 十一、扩展与演进
|
||
|
||
1. **新增算法插件**
|
||
- 实现新的 `INode` 子类(例如 `ai_cls`, `ai_reid`)。
|
||
- 使用 `REGISTER_NODE` 编译为 `.so` 放入 `plugin_path`。
|
||
- 在 `config.json` 中新增节点即可接入全流程。
|
||
|
||
2. **新增输出类型**
|
||
- 新增 `publish_webrtc`、`storage_s3` 等节点类型。
|
||
- 不改动上游图结构,只调整 sink 部分。
|
||
|
||
3. **分布式扩展(后续版本)**
|
||
- 引入 ZeroMQ / NanoMSG,将远端设备作为特殊节点处理(如 `remote_sink`)。
|
||
- 中控只维护抽象图,实际在多台 RK3588 设备上分布执行。
|
||
|
||
---
|
||
|
||
---
|
||
|
||
## 附录:问题修复与调试文档
|
||
|
||
### 已知问题修复
|
||
|
||
| 问题 | 文档 | 日期 |
|
||
|------|------|------|
|
||
| YOLOv8 FP16 数据解析错误 | [docs/bugfix_yolov8_fp16.md](docs/bugfix_yolov8_fp16.md) | 2025-02 |
|
||
| RKNN 输出格式配置错误 | [docs/fix_rknn_output_format.md](docs/fix_rknn_output_format.md) | 2026-02 |
|
||
|
||
### 调试与开发文档
|
||
|
||
- [docs/models.md](docs/models.md) - 模型转换与部署指南
|
||
- [docs/Agent_API_Extensions.md](docs/Agent_API_Extensions.md) - Agent API 扩展说明
|
||
- [docs/API_Device_RemoteMgmt_InterfaceTable.md](docs/API_Device_RemoteMgmt_InterfaceTable.md) - 远程管理接口
|