YOLOv5

You Only Look Once

Featured image

“You Only Look Once”是一种使用卷积神经网络进行目标检测的算法。YOLO是其中速度较快的物体检测算法之一。虽然它不是最准确的物体检测算法,但是在需要实时检测并且准确度不需要过高的情况下,它是一个很好的选择。与识别算法相比,检测算法不仅预测类别标签,还检测对象的位置。因此,它不仅将图像分类到一个类别中,还可以在图像中检测多个对象。该算法将单个神经网络应用于整个图像。这意味着该网络将图像分成区域,并为每个区域预测边界框和概率。这些边界框是由预测的概率加权的。

YOLOv5系列

YOLOv5是一种基于深度学习的目标检测模型,它采用了一种单阶段的目标检测方法,可以快速而准确地检测图像或视频中的多个目标,并标记它们的位置和类别。在版本选择方面主要有YOLOv5s、YOLOv5m、YOLOv5l和YOLOv5x四个版本,分别对应小、中、大、特大,其中的区别主要在于模型的深度和宽度设置不同。分别使用参数depth_multiple和width_multiple来调整模型的深度和卷积核的个数,这样的设计使得模型的结构和大小可以方便地进行调整。YOLOv5s的网络结构分为四个部分输入端、Backbone(主干网络)、Neck网络和Prediction(输出端)。各部分具有的主要功能结构如下:输入端:Mosaic数据增强、自适应锚框计算,以及自适应图片缩放;主干网络:Focus结构、CSP结构;Neck网络:FPN+PAN结构;输出端:GIOU_Loss损失函数。