跳至主要內容
〔CV〕问题集

问题一:RuntimeError: "upsample_nearest2d_channels_last" not implemented for 'Half'

RuntimeError: "upsample_nearest2d_channels_last" not implemented for 'Half'

这是 PyTorch 框架开启半精度导致的问题,表示你的电脑的 CPU 或 GPU 不支持 Half 参数。开启半精度后能够加快运行速度、减少 GPU 占用,并且只有不明显的 accuracy 损失。原生的 torch 是 32 位浮点型的(float32),我们可以借鉴模型量化的思想,将其变成 16 位浮点型的(float16)加快模型推理速度。


大林鸱大约 1 分钟AI计算机视觉YOLO
〔CV〕仪表盘识别论文

论文链接https://arxiv.org/pdf/2302.14323.pdf

基于类似人类对齐和识别算法的读取指针式仪表

摘要. 最近,开发一种用于模拟测量仪器的自动读数系统越来越受到关注,因为它能够收集多种类型的设备。尽管如此,两个主要障碍仍然阻碍了它在现实世界应用程序中的部署。第一个问题是,他们很少考虑整个管道的速度。第二个原因是它们无法处理一些低质量的图像(即仪表破损、模糊和不规则的刻度)。在本文中,我们提出了一种类人对齐和识别算法来克服这些问题。更具体地说,提出了一种基于改进的空间变换网络(STN)的空间变换模块(STM),用于以自主的方式获得图像的前视图。同时,提出了一个值获取模块(VAM),通过端到端训练的框架来推断准确的仪表值。与之前的研究相比,我们的模型完全通过可学习处理来对齐和识别仪表,这模仿了人类行为,从而实现了更高的性能。大量的结果验证了所提出的模型在准确性和效率方面的稳健性。代码和数据集可在中获得https://github.com/shuyansy/Detect-and-read-meters.


大林鸱大约 30 分钟AI计算机视觉YOLO
〔CV〕Flask 与 YOLOv5

暂时封笔,此功能实现后,重新整理

作者在之前的一个项目中使用 Darknet 提供预测服务,java 作为后端,使用 js 作为前端。那种方式部署很麻烦,深受其害。最近又有一个图像识别类型的演示案例需求,准备使用 Flask+YOLOv5+vue3 去开发。选择这种技术路线是考虑到将 YOLOv5 源码工程转为 Flask 比较简单。

1、Flask

  • Flask 介绍

Flask 是一种用 python 实现的轻量级的 web 服务架构。你如果熟悉 java 中的 web 服务架构,你会惊讶于 Flask 的简单。


大林鸱大约 3 分钟AI计算机视觉YOLO
〔CV〕数据集

上一篇博文中我们已经成功训练了模型,虽然只是简单的操作了一遍流程,但也是阶段性的胜利。这一篇章节作者要总结一下怎么收集样本数据。

公开数据集

作者平时收集的数据集相关网址:


大林鸱大约 2 分钟AI计算机视觉YOLO
〔CV〕YOLOv5 实践 1

作者在 2021 年的某个项目中使用 darknet 运行过 yolov4,用于实时检测视频中出现的**,具体检测什么就不说了。整体效果很不多,速度和准确率都很好,唯独不好部署。

这篇博文学习 yolov5,试着用 yolov5 识别鱼漂,作者尝试开发一款智能钓鱼 APP,如果效果好的话,也可以做成独立设备。对于 APP,我不急于求成,重点还是研发过程的总结。

准备

  1. 下载源码
git clone https://github.com/ultralytics/yolov5

大林鸱大约 9 分钟AI计算机视觉YOLO
〔CV〕YOLO
  • 参考文献:https://arxiv.org/pdf/2304.00501.pdf
  • 参考博文:https://blog.csdn.net/daydayup858/article/details/130018935

实时物体检测已经成为众多应用中的一个重要组成部分,横跨自主车辆、机器人、视频监控和增强现实等各个领域。在各种物体检测算法中,YOLO(You Only Look Once)框架因其在 速度准确性 方面的显著平衡而脱颖而出,能够快速、可靠地识别图像中的物体。自成立以来,YOLO 系列已经经历了多次迭代,每次都是在以前的版本基础上解决局限性并提高性能(见图 1)。本文旨在全面回顾 YOLO 框架的发展,从最初的 YOLOv1 到最新的 YOLOv8,阐释每个版本的关键创新、差异和改进。


大林鸱大约 39 分钟AI计算机视觉YOLO