易语言 OPENCV DNN YOOLv11 OBB 带角度的目标检测实现 - 精易论坛

窗口程序集名	保留	保留	备注
程序集1
变量名	类型	数组	备注
置信度阈值	小数型		检测到的目标置信度分数
分数阈值	小数型		指类别分数，预测某个目标属于特定类别的概率。
非极大值抑制阈值	小数型		去除重叠检测框
输入高	整数型		模型输入高训练时已决定
输入宽	整数型		模型输入宽训练时已决定

子程序名	返回值类型	公开	备注
_启动子程序	整数型		本子程序在程序启动后最先执行

' 根据选择的检测模型文件进行配置
分数阈值＝ 0.25
置信度阈值＝ 0.45
非极大值抑制阈值＝ 0.5
输入高＝ 1024
输入宽＝ 1024
旋转目标检测 (“D:\新建文件夹\train\yolo11n-obb.onnx”, “C:\Users\Administrator\Desktop\plane.png”, 真)
返回 (0) ' 可以根据您的需要返回任意数值

子程序名	返回值类型	公开	备注
旋转目标检测
参数名	类型	参考	可空	数组	备注
模型路径	文本型
图片路径	文本型
是否填充为正方形	逻辑型

变量名	类型	静态	数组	备注
YOLO网络	神经网络类
输出层名称数组	数组容器
图片	数据矩阵类
拷贝图	数据矩阵类
数据块	数据矩阵类
张量数组	数组容器			推理输出结果集

' 加载模型
YOLO网络＝视觉_从ONNX读取网络 (模型路径)
输出层名称数组＝ YOLO网络.获取未连接输出层名称 ()
' 读取图片
图片＝视觉_图像读取 (图片路径, #读图_彩色 )

如果真 (图片.空 ())

视觉_控制台输出 (“无法打开或找到图像 :%T”, 图片路径)

返回 ()
拷贝图＝图片.克隆 ()

如果真 (是否填充为正方形且输入高＝输入宽)

拷贝图＝填充为正方形 (拷贝图)
数据块＝视觉_从图像创建数据块 (拷贝图, 1 ÷ 255, 尺寸整数 (输入宽, 输入高), 标量 (0, 0, 0), 真, 假, 5)
YOLO网络.设置输入 (数据块, “”, 1, 标量 ())
YOLO网络.前向传播V (张量数组, 输出层名称数组)
后期处理 (图片, 拷贝图.尺寸整型 (), 张量数组, YOLO网络, 15)
视觉_显示图像 (“小白鼠YOLO11 OBB”, 图片)
视觉_等待按键 (0)

子程序名	返回值类型	公开	备注
后期处理
参数名	类型	参考	可空	数组	备注
图片	数据矩阵类
输入尺寸	尺寸整型结构
张量数组	数组容器				1维数据矩阵类: 包含检测信息
YOLO网络	神经网络类
类数	整数型

变量名	类型	静态	数组	备注
缩放因子X	小数型
缩放因子Y	小数型
置信度数组	数组容器			1维小数型：用于存储检测到的目标的置信度
目标类别ID数组	数组容器			1维整数型：用于存储检测到的目标的类别 ID
边界框数组	数组容器			1维旋转矩形类：存储检测到的目标的旋转边界框
边界框数顶点二维数组	数组容器			2维坐标二维小数型结构：存储旋转边界框的四个顶点坐标，用于减少后续绘制时的计算量
边界框数顶点数组	数组容器
检测框数	整数型
属性数	整数型
二维矩阵	数据矩阵类
数据指针	小数型指针类
i	整数型
类别分数	小数型指针类
分数	数据矩阵类
类最大分数位置	坐标二维整型结构
类最小分数位置	坐标二维整型结构
类最大分数	双精度小数型
类最小分数	双精度小数型
横坐标	小数型
纵坐标	小数型
宽	小数型
高	小数型
角度	小数型
余弦值	小数型
正弦值	小数型
高旋转量	坐标二维小数型结构
宽旋转量	坐标二维小数型结构
顶点坐标	坐标二维小数型结构
检测框的索引	数组容器			用于存储经过非极大值抑制（NMS）后保留的检测框的索引
索引	整数型

' 计算输入图像尺寸与模型输入尺寸的缩放因子
缩放因子X ＝输入尺寸.宽 ÷ 输入宽
缩放因子Y ＝输入尺寸.高 ÷ 输入高
' 获取输出张量的形状信息
' [1, 84, 8400] -> [8400, 84]，其中 8400 是检测框的数量，84 是每个检测框的属性数量
检测框数＝张量数组.取数据矩阵类 (1).尺寸属性 (2)
属性数＝张量数组.取数据矩阵类 (1).尺寸属性 (1)
' 对输出张量进行形状调整，将其转换为二维矩阵
二维矩阵＝张量数组.取数据矩阵类 (1).重塑 (1, 属性数)
' 对矩阵进行转置操作
视觉_转置 (二维矩阵, 二维矩阵)
' 获取矩阵的数据指针
数据指针.指针＝二维矩阵.数据指针
' 遍历所有检测框

计次循环首 (检测框数, i)

' 跳过前 4 个元素（边界框的中心坐标和宽高），获取类别分数

类别分数.指针＝数据指针.指针

类别分数.偏移 (4)

' 创建一个数据矩阵对象来存储类别分数

分数.初始化指针 (1, 类数, #矩阵_单通道小数型, 类别分数.指针)

' 找出类别分数中的最大值及其对应的类别 ID

视觉_最小最大位置 (分数, 类最小分数, 类最大分数, 类最小分数位置, 类最大分数位置, )

' 如果最大类别分数大于设定的置信度阈值

如果真 (类最大分数＞置信度阈值)

' 将置信度和类别 ID 分别存入对应的数组容器中

置信度数组.加入小数型 (类最大分数)

目标类别ID数组.加入整数型 (类最大分数位置.横坐标)

' 计算边界框的中心坐标、宽高和旋转角度，并根据缩放因子进行缩放

横坐标＝数据指针.读 (0) × 缩放因子X

纵坐标＝数据指针.读 (1) × 缩放因子Y

宽＝数据指针.读 (2) × 缩放因子X

高＝数据指针.读 (3) × 缩放因子Y

角度＝数据指针.读 (19)

' 计算旋转角度的余弦和正弦值

余弦值＝求余弦 (角度)

正弦值＝求正弦 (角度)

' 计算边界框的四个顶点相对于中心的偏移向量

宽旋转量.初始化 (宽 ÷ 2 × 余弦值, 宽 ÷ 2 × 正弦值)

高旋转量.初始化 (－高 ÷ 2 × 正弦值, 高 ÷ 2 × 余弦值)

' 计算边界框的四个顶点坐标

顶点坐标.初始化 (横坐标, 纵坐标)

边界框数顶点数组.清空 ()

边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.加 (宽旋转量).加 (高旋转量))

边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.加 (宽旋转量).减 (高旋转量))

边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.减 (宽旋转量).减 (高旋转量))

边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.减 (宽旋转量).加 (高旋转量))

' 根据三个顶点创建旋转边界框加入数组

边界框数组.加入旋转矩形类 (旋转矩形P (边界框数顶点数组.取坐标二维小数型结构 (1), 边界框数顶点数组.取坐标二维小数型结构 (2), 边界框数顶点数组.取坐标二维小数型结构 (3)))

' 将四个顶点坐标存入对应的向量中

边界框数顶点二维数组.加入数组容器 (边界框数顶点数组)

' 移动数据指针到下一个检测框的起始位置

数据指针.偏移 (属性数)

计次循环尾 ()
' 执行非极大值抑制，过滤掉重叠的检测框
视觉_非最大抑制旋转框 (边界框数组, 置信度数组, 置信度阈值, 非极大值抑制阈值, 检测框的索引, 1, 0)
' 遍历经过 NMS 后保留的检测框的索引

计次循环首 (检测框的索引.成员数 (), i)

索引＝检测框的索引.取整数型 (i) ＋ 1 ' 索引0开始需要+1 符合易语言

绘制预测 (目标类别ID数组.取整数型 (索引), 置信度数组.取小数型 (索引), 边界框数顶点二维数组.取数组容器 (索引), 图片)

计次循环尾 ()

子程序名	返回值类型	公开	备注
绘制预测
参数名	类型	参考	可空	数组	备注
类ID	整数型
置信度	小数型
边界框数顶点数组	数组容器
图片	数据矩阵类

变量名	类型	静态	数组	备注
标签	文本型
i	整数型
基线	整数型
左边	整数型
顶边	整数型
标签尺寸	尺寸整型结构

标签＝到文本 (类ID) ＋ “:” ＋到文本 (四舍五入 (置信度 × 100, 1)) ＋ “%”
' 绘制旋转框

计次循环首 (4, i)

视觉_线小数 (图片, 边界框数顶点数组.取坐标二维小数型结构 (i), 边界框数顶点数组.取坐标二维小数型结构 (i ％ 4 ＋ 1), 标量 (255, 255, 255), 2, 8, 0)

计次循环尾 ()
视觉_圆小数 (图片, 边界框数顶点数组.取坐标二维小数型结构 (1), 3, 标量 (0, 0, 255), -1, 8, 0)
标签尺寸＝视觉_获取文本尺寸 (标签, #字体_简易无衬线, 0.5, 1, 基线)
左边＝边界框数顶点数组.取坐标二维小数型结构 (1).横坐标
顶边＝视觉_取最大值 (边界框数顶点数组.取坐标二维小数型结构 (1).纵坐标, 标签尺寸.高)
视觉_矩形坐标 (图片, 坐标二维整型 (左边, 顶边－标签尺寸.高), 坐标二维整型 (左边＋标签尺寸.宽, 顶边＋基线), 标量 (255, 255, 255), -1, 8, 0)
视觉_放置文本 (图片, 标签, 坐标二维整型 (左边, 顶边), #字体_简易无衬线, 0.5, 标量 (), 1, 8, 假)

子程序名	返回值类型	公开	备注
填充为正方形	数据矩阵类
参数名	类型	参考	可空	数组	备注
图	数据矩阵类

变量名	类型	静态	数组	备注
最大值	整数型
返回图	数据矩阵类

最大值＝视觉_取最大值 (图.列数, 图.行数)
返回图.初始化 (最大值, 最大值, #矩阵_三通道字节型U, 标量 (114, 114, 114))
图.复制 (返回图.感兴区域 (矩形整型 (0, 0, 图.列数, 图.行数)), )
返回 (返回图)

i支持库列表	支持库注释
OpenCV	(未知支持库)

.版本 2<br />
.支持库 OpenCV<br />
<br />
.程序集 程序集1<br />
.程序集变量 置信度阈值, 小数型, , , 检测到的目标置信度分数<br />
.程序集变量 分数阈值, 小数型, , , 指类别分数，预测某个目标属于特定类别的概率。<br />
.程序集变量 非极大值抑制阈值, 小数型, , , 去除重叠检测框<br />
.程序集变量 输入高, 整数型, , , 模型输入高 训练时已决定<br />
.程序集变量 输入宽, 整数型, , , 模型输入宽 训练时已决定<br />
<br />
.子程序 _启动子程序, 整数型, , 本子程序在程序启动后最先执行<br />
<br />
' 根据选择的检测模型文件进行配置<br />
分数阈值 ＝ 0.25<br />
置信度阈值 ＝ 0.45<br />
非极大值抑制阈值 ＝ 0.5<br />
输入高 ＝ 1024<br />
输入宽 ＝ 1024<br />
旋转目标检测 (“D:\新建文件夹\train\yolo11n-obb.onnx”, “C:\Users\Administrator\Desktop\plane.png”, 真)<br />
返回 (0)  ' 可以根据您的需要返回任意数值<br />
<br />
.子程序 旋转目标检测<br />
.参数 模型路径, 文本型<br />
.参数 图片路径, 文本型<br />
.参数 是否填充为正方形, 逻辑型<br />
.局部变量 YOLO网络, 神经网络类<br />
.局部变量 输出层名称数组, 数组容器<br />
.局部变量 图片, 数据矩阵类<br />
.局部变量 拷贝图, 数据矩阵类<br />
.局部变量 数据块, 数据矩阵类<br />
.局部变量 张量数组, 数组容器, , , 推理输出结果集<br />
<br />
' 加载模型<br />
YOLO网络 ＝ 视觉_从ONNX读取网络 (模型路径)<br />
输出层名称数组 ＝ YOLO网络.获取未连接输出层名称 ()<br />
' 读取图片<br />
图片 ＝ 视觉_图像读取 (图片路径, #读图_彩色)<br />
.如果真 (图片.空 ())<br />
    视觉_控制台输出 (“无法打开或找到图像 :%T”, 图片路径)<br />
    返回 ()<br />
.如果真结束<br />
拷贝图 ＝ 图片.克隆 ()<br />
.如果真 (是否填充为正方形 且 输入高 ＝ 输入宽)<br />
    拷贝图 ＝ 填充为正方形 (拷贝图)<br />
.如果真结束<br />
数据块 ＝ 视觉_从图像创建数据块 (拷贝图, 1 ÷ 255, 尺寸整数 (输入宽, 输入高), 标量 (0, 0, 0), 真, 假, 5)<br />
YOLO网络.设置输入 (数据块, “”, 1, 标量 ())<br />
YOLO网络.前向传播V (张量数组, 输出层名称数组)<br />
后期处理 (图片, 拷贝图.尺寸整型 (), 张量数组, YOLO网络, 15)<br />
视觉_显示图像 (“小白鼠YOLO11 OBB”, 图片)<br />
视觉_等待按键 (0)<br />
<br />
.子程序 后期处理<br />
.参数 图片, 数据矩阵类<br />
.参数 输入尺寸, 尺寸整型结构<br />
.参数 张量数组, 数组容器, , 1维 数据矩阵类: 包含检测信息<br />
.参数 YOLO网络, 神经网络类<br />
.参数 类数, 整数型<br />
.局部变量 缩放因子X, 小数型<br />
.局部变量 缩放因子Y, 小数型<br />
.局部变量 置信度数组, 数组容器, , , 1维 小数型：用于存储检测到的目标的置信度 <br />
.局部变量 目标类别ID数组, 数组容器, , , 1维 整数型：用于存储检测到的目标的类别 ID<br />
.局部变量 边界框数组, 数组容器, , , 1维 旋转矩形类：存储检测到的目标的旋转边界框<br />
.局部变量 边界框数顶点二维数组, 数组容器, , , 2维 坐标二维小数型结构：存储旋转边界框的四个顶点坐标，用于减少后续绘制时的计算量<br />
.局部变量 边界框数顶点数组, 数组容器<br />
.局部变量 检测框数, 整数型<br />
.局部变量 属性数, 整数型<br />
.局部变量 二维矩阵, 数据矩阵类<br />
.局部变量 数据指针, 小数型指针类<br />
.局部变量 i, 整数型<br />
.局部变量 类别分数, 小数型指针类<br />
.局部变量 分数, 数据矩阵类<br />
.局部变量 类最大分数位置, 坐标二维整型结构<br />
.局部变量 类最小分数位置, 坐标二维整型结构<br />
.局部变量 类最大分数, 双精度小数型<br />
.局部变量 类最小分数, 双精度小数型<br />
.局部变量 横坐标, 小数型<br />
.局部变量 纵坐标, 小数型<br />
.局部变量 宽, 小数型<br />
.局部变量 高, 小数型<br />
.局部变量 角度, 小数型<br />
.局部变量 余弦值, 小数型<br />
.局部变量 正弦值, 小数型<br />
.局部变量 高旋转量, 坐标二维小数型结构<br />
.局部变量 宽旋转量, 坐标二维小数型结构<br />
.局部变量 顶点坐标, 坐标二维小数型结构<br />
.局部变量 检测框的索引, 数组容器, , , 用于存储经过非极大值抑制（NMS）后保留的检测框的索引<br />
.局部变量 索引, 整数型<br />
<br />
' 计算输入图像尺寸与模型输入尺寸的缩放因子<br />
缩放因子X ＝ 输入尺寸.宽 ÷ 输入宽<br />
缩放因子Y ＝ 输入尺寸.高 ÷ 输入高<br />
' 获取输出张量的形状信息<br />
' [1, 84, 8400] -> [8400, 84]，其中 8400 是检测框的数量，84 是每个检测框的属性数量<br />
检测框数 ＝ 张量数组.取数据矩阵类 (1).尺寸属性 (2)<br />
属性数 ＝ 张量数组.取数据矩阵类 (1).尺寸属性 (1)<br />
' 对输出张量进行形状调整，将其转换为二维矩阵<br />
二维矩阵 ＝ 张量数组.取数据矩阵类 (1).重塑 (1, 属性数)<br />
' 对矩阵进行转置操作<br />
视觉_转置 (二维矩阵, 二维矩阵)<br />
' 获取矩阵的数据指针<br />
数据指针.指针 ＝ 二维矩阵.数据指针<br />
' 遍历所有检测框<br />
.计次循环首 (检测框数, i)<br />
    ' 跳过前 4 个元素（边界框的中心坐标和宽高），获取类别分数<br />
    类别分数.指针 ＝ 数据指针.指针<br />
    类别分数.偏移 (4)<br />
    ' 创建一个 数据矩阵 对象来存储类别分数<br />
    分数.初始化指针 (1, 类数, #矩阵_单通道小数型, 类别分数.指针)<br />
    ' 找出类别分数中的最大值及其对应的类别 ID<br />
    视觉_最小最大位置 (分数, 类最小分数, 类最大分数, 类最小分数位置, 类最大分数位置, )<br />
    ' 如果最大类别分数大于设定的置信度阈值<br />
    .如果真 (类最大分数 ＞ 置信度阈值)<br />
        ' 将置信度和类别 ID 分别存入对应的数组容器中<br />
        置信度数组.加入小数型 (类最大分数)<br />
        目标类别ID数组.加入整数型 (类最大分数位置.横坐标)<br />
        ' 计算边界框的中心坐标、宽高和旋转角度，并根据缩放因子进行缩放<br />
        横坐标 ＝ 数据指针.读 (0) × 缩放因子X<br />
        纵坐标 ＝ 数据指针.读 (1) × 缩放因子Y<br />
        宽 ＝ 数据指针.读 (2) × 缩放因子X<br />
        高 ＝ 数据指针.读 (3) × 缩放因子Y<br />
        角度 ＝ 数据指针.读 (19)<br />
        ' 计算旋转角度的余弦和正弦值<br />
        余弦值 ＝ 求余弦 (角度)<br />
        正弦值 ＝ 求正弦 (角度)<br />
        ' 计算边界框的四个顶点相对于中心的偏移向量<br />
        宽旋转量.初始化 (宽 ÷ 2 × 余弦值, 宽 ÷ 2 × 正弦值)<br />
        高旋转量.初始化 (－高 ÷ 2 × 正弦值, 高 ÷ 2 × 余弦值)<br />
        ' 计算边界框的四个顶点坐标<br />
        顶点坐标.初始化 (横坐标, 纵坐标)<br />
        边界框数顶点数组.清空 ()<br />
        边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.加 (宽旋转量).加 (高旋转量))<br />
        边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.加 (宽旋转量).减 (高旋转量))<br />
        边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.减 (宽旋转量).减 (高旋转量))<br />
        边界框数顶点数组.加入坐标二维小数型结构 (顶点坐标.减 (宽旋转量).加 (高旋转量))<br />
        ' 根据三个顶点创建旋转边界框 加入数组<br />
        边界框数组.加入旋转矩形类 (旋转矩形P (边界框数顶点数组.取坐标二维小数型结构 (1), 边界框数顶点数组.取坐标二维小数型结构 (2), 边界框数顶点数组.取坐标二维小数型结构 (3)))<br />
        ' 将四个顶点坐标存入对应的向量中<br />
        边界框数顶点二维数组.加入数组容器 (边界框数顶点数组)<br />
    .如果真结束<br />
<br />
    ' 移动数据指针到下一个检测框的起始位置<br />
    数据指针.偏移 (属性数)<br />
.计次循环尾 ()<br />
' 执行非极大值抑制，过滤掉重叠的检测框<br />
视觉_非最大抑制旋转框 (边界框数组, 置信度数组, 置信度阈值, 非极大值抑制阈值, 检测框的索引, 1, 0)<br />
' 遍历经过 NMS 后保留的检测框的索引<br />
.计次循环首 (检测框的索引.成员数 (), i)<br />
    索引 ＝ 检测框的索引.取整数型 (i) ＋ 1  ' 索引0开始 需要+1 符合易语言<br />
    绘制预测 (目标类别ID数组.取整数型 (索引), 置信度数组.取小数型 (索引), 边界框数顶点二维数组.取数组容器 (索引), 图片)<br />
.计次循环尾 ()<br />
<br />
.子程序 绘制预测<br />
.参数 类ID, 整数型<br />
.参数 置信度, 小数型<br />
.参数 边界框数顶点数组, 数组容器<br />
.参数 图片, 数据矩阵类<br />
.局部变量 标签, 文本型<br />
.局部变量 i, 整数型<br />
.局部变量 基线, 整数型<br />
.局部变量 左边, 整数型<br />
.局部变量 顶边, 整数型<br />
.局部变量 标签尺寸, 尺寸整型结构<br />
<br />
标签 ＝ 到文本 (类ID) ＋ “:” ＋ 到文本 (四舍五入 (置信度 × 100, 1)) ＋ “%”<br />
' 绘制旋转框<br />
.计次循环首 (4, i)<br />
    视觉_线小数 (图片, 边界框数顶点数组.取坐标二维小数型结构 (i), 边界框数顶点数组.取坐标二维小数型结构 (i ％ 4 ＋ 1), 标量 (255, 255, 255), 2, 8, 0)<br />
.计次循环尾 ()<br />
视觉_圆小数 (图片, 边界框数顶点数组.取坐标二维小数型结构 (1), 3, 标量 (0, 0, 255), -1, 8, 0)<br />
标签尺寸 ＝ 视觉_获取文本尺寸 (标签, #字体_简易无衬线, 0.5, 1, 基线)<br />
左边 ＝ 边界框数顶点数组.取坐标二维小数型结构 (1).横坐标<br />
顶边 ＝ 视觉_取最大值 (边界框数顶点数组.取坐标二维小数型结构 (1).纵坐标, 标签尺寸.高)<br />
视觉_矩形坐标 (图片, 坐标二维整型 (左边, 顶边 － 标签尺寸.高), 坐标二维整型 (左边 ＋ 标签尺寸.宽, 顶边 ＋ 基线), 标量 (255, 255, 255), -1, 8, 0)<br />
视觉_放置文本 (图片, 标签, 坐标二维整型 (左边, 顶边), #字体_简易无衬线, 0.5, 标量 (), 1, 8, 假)<br />
<br />
<br />
.子程序 填充为正方形, 数据矩阵类<br />
.参数 图, 数据矩阵类<br />
.局部变量 最大值, 整数型<br />
.局部变量 返回图, 数据矩阵类<br />
<br />
最大值 ＝ 视觉_取最大值 (图.列数, 图.行数)<br />
返回图.初始化 (最大值, 最大值, #矩阵_三通道字节型U, 标量 (114, 114, 114))<br />
图.复制 (返回图.感兴区域 (矩形整型 (0, 0, 图.列数, 图.行数)), )<br />
返回 (返回图)