如需要完整文档点击下方 "点击下载文档" 按钮
利用人工智能中的视觉分析技术, 实现对高分辨率交通视频中出现的各个目标类别进行实时目标检测、语义分割和目标追踪。 数据集结合 BDD100K 和 Mapillary Vistas。 训练中不仅对模型中的参数进行调整,还对多个模型进行改进与创新。 目标检测模型使用 EfficientNet-B1 作为主干网络,使用 ASPP 与改进后的 FPN 作为脖颈网络,通过引入多种模型训练技巧,对模型进行优化,最终结果减少约 2. 3 倍的参数量,在不同数据集上的准确率都有所提升。 目标追踪使用DeepSort 追踪算法对多个目标类别进行追踪计数。 语义分割使用 Encoder-Decoder 结构,使用 EfficientNet-B4 作为主干网络,参照 U-Net++网络使用卷积层作为特征提取模块,反卷积层作为上采样模块,通过联结不同大小的特征图,得到最终输出结果。 将改进语义分割模型与 MobileNetV2 和 DeeplabV3 网络结合的模型进行对比,减少约 1. 35 倍的参数量。 实验证明,通过深度学习算法提取鲁棒性特征能够为自动驾驶和辅助驾驶场景中的检测识别提供便利。