问题一：RuntimeError: "upsample_nearest2d_channels_last" not implemented for 'Half'

RuntimeError: "upsample_nearest2d_channels_last" not implemented for 'Half'

这是 PyTorch 框架开启半精度导致的问题，表示你的电脑的 CPU 或 GPU 不支持 Half 参数。开启半精度后能够加快运行速度、减少 GPU 占用，并且只有不明显的 accuracy 损失。原生的 torch 是 32 位浮点型的（float32）,我们可以借鉴模型量化的思想，将其变成 16 位浮点型的（float16）加快模型推理速度。

大林鸱大约 1 分钟

〔CV〕仪表盘识别论文

论文链接：https://arxiv.org/pdf/2302.14323.pdf

基于类似人类对齐和识别算法的读取指针式仪表

摘要. 最近，开发一种用于模拟测量仪器的自动读数系统越来越受到关注，因为它能够收集多种类型的设备。尽管如此，两个主要障碍仍然阻碍了它在现实世界应用程序中的部署。第一个问题是，他们很少考虑整个管道的速度。第二个原因是它们无法处理一些低质量的图像（即仪表破损、模糊和不规则的刻度）。在本文中，我们提出了一种类人对齐和识别算法来克服这些问题。更具体地说，提出了一种基于改进的空间变换网络（STN）的空间变换模块（STM），用于以自主的方式获得图像的前视图。同时，提出了一个值获取模块（VAM），通过端到端训练的框架来推断准确的仪表值。与之前的研究相比，我们的模型完全通过可学习处理来对齐和识别仪表，这模仿了人类行为，从而实现了更高的性能。大量的结果验证了所提出的模型在准确性和效率方面的稳健性。代码和数据集可在中获得https://github.com/shuyansy/Detect-and-read-meters.

大林鸱大约 30 分钟

〔CV〕Flask 与 YOLOv5

暂时封笔，此功能实现后，重新整理

作者在之前的一个项目中使用 Darknet 提供预测服务，java 作为后端，使用 js 作为前端。那种方式部署很麻烦，深受其害。最近又有一个图像识别类型的演示案例需求，准备使用 Flask+YOLOv5+vue3 去开发。选择这种技术路线是考虑到将 YOLOv5 源码工程转为 Flask 比较简单。

1、Flask

Flask 介绍

Flask 是一种用 python 实现的轻量级的 web 服务架构。你如果熟悉 java 中的 web 服务架构，你会惊讶于 Flask 的简单。

大林鸱大约 3 分钟

〔CV〕数据集

上一篇博文中我们已经成功训练了模型，虽然只是简单的操作了一遍流程，但也是阶段性的胜利。这一篇章节作者要总结一下怎么收集样本数据。

公开数据集

作者平时收集的数据集相关网址：

https://zhuanlan.zhihu.com/p/25138563
https://blog.csdn.net/u012735708/article/details/82682673
https://zhuanlan.zhihu.com/p/468259599
阿里天池数据集
百度飞桨
北京大学开放研究数据平台
和鲸社区
仪表盘数据集：(百度网盘链接: https://pan.baidu.com/s/1YoVBWjuRzMFCR0Dl6lhb1g 提取码: q2r3)，一个开源项目的数据集，是我从 Google 云端硬盘上下载后传到百度网盘上的。分为两个文件，一个是仪表盘，一个是刻度，仅仅上传了刻度的数据集（使用 labelme 标注），仪表盘的文件太大了，如有需要可发送邮件：gremlinsbook@163.com

大林鸱大约 2 分钟

〔CV〕YOLOv5 实践 1

作者在 2021 年的某个项目中使用 darknet 运行过 yolov4，用于实时检测视频中出现的**，具体检测什么就不说了。整体效果很不多，速度和准确率都很好，唯独不好部署。

这篇博文学习 yolov5，试着用 yolov5 识别鱼漂，作者尝试开发一款智能钓鱼 APP，如果效果好的话，也可以做成独立设备。对于 APP，我不急于求成，重点还是研发过程的总结。

准备

下载源码

git clone https://github.com/ultralytics/yolov5

大林鸱大约 9 分钟

〔CV〕YOLO

参考文献：https://arxiv.org/pdf/2304.00501.pdf
参考博文：https://blog.csdn.net/daydayup858/article/details/130018935

实时物体检测已经成为众多应用中的一个重要组成部分，横跨自主车辆、机器人、视频监控和增强现实等各个领域。在各种物体检测算法中，YOLO（You Only Look Once）框架因其在速度和 准确性 方面的显著平衡而脱颖而出，能够快速、可靠地识别图像中的物体。自成立以来，YOLO 系列已经经历了多次迭代，每次都是在以前的版本基础上解决局限性并提高性能（见图 1）。本文旨在全面回顾 YOLO 框架的发展，从最初的 YOLOv1 到最新的 YOLOv8，阐释每个版本的关键创新、差异和改进。

大林鸱大约 39 分钟