网站首页 > 技术教程 正文
摘要:配备多头自注意(MHSA)的模型在计算机性能方面取得了显著的性能。它们的计算复杂性与输入特征图中的像素平方成正比,导致处理缓慢,特别是在处理高分辨率图像时。新型的token Mixer 被提出作为MHSA的替代品,以规避这个问题:基于FFT的token混合器,在全局操作中类似于MHSA,但计算复杂度较低。然而,尽管它具有吸引人的特性,但基于FFT的token混合器尚未仔细检查其与快速发展的MetaFormer架构的兼容性。在这里,我们提出了一种名为动态滤波器、DFFormer和CDFFFormer的新型token混合器,使用动态滤波器来弥合上述差距的图像识别模型。
CDFFormer实现了85.0%的Top-1精度,接近卷积和MHSA的混合架构。其他广泛的实验和分析,包括对象检测和语义分割,表明它们与最先进的架构具有竞争力;在处理高分辨率图像识别时,它们的吞吐量和内存效率是卷积和MHSA,与ConvFormer没有太大区别,远远优于CAFormer。我们的结果表明,动态过滤器是应该认真考虑的token混合器选项之一。
论文构建了符合MetaFormer的DFFormer和CDFFormer,DFFormer和CDFFormer(DFFormer块和ConvFormer块的混合模型)主要由MetaFormer块组成
Dfformer模型变体配置信息如下表所示:
在YOLOv5项目中添加模型作为Backbone使用的教程:
(1)将YOLOv5项目的models/yolo.py修改parse_model函数以及BaseModel的_forward_once函数
(2)在models/backbone(新建)文件下新建Dfformer.py,添加如下的代码:
(3)在models/yolo.py导入模型并在parse_model函数中修改如下(先导入文件):
(4)在model下面新建配置文件:yolov5_dfformer.yaml
(5)运行验证:在models/yolo.py文件指定--cfg参数为新建的yolov5_dfformer.yaml
猜你喜欢
- 2024-10-20 Φ I L O S O Φ 葡萄酒品牌包装设计 via:Backbone Branding
- 2024-10-20 YOLO算法改进Backbone系列之MogaNet
- 2024-10-20 YOLO算法改进Backbone系列之:Fcaformer
- 2024-10-20 YOLO算法改进Backbone系列之:EffificientFormer
- 2024-10-20 YOLO算法改进Backbone系列之:PVTv2
- 2024-10-20 食品包装设计分享 | Backbone Craft Beer国外英文字体精酿啤酒
- 2024-10-20 YOLO算法改进Backbone系列之:ParC-Net
- 2024-10-20 Backbone的优秀设计作品 | 水果 果汁 插画 手绘 创意 设计
- 2024-10-20 索尼参与开发PS版手机手柄公布 售价99.99美元
- 2024-10-20 EfficientFormer:轻量化ViT Backbone
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- sd分区 (65)
- raid5数据恢复 (81)
- 地址转换 (73)
- 手机存储卡根目录 (55)
- tcp端口 (74)
- project server (59)
- 双击ctrl (55)
- 鼠标 单击变双击 (67)
- debugview (59)
- 字符动画 (65)
- flushdns (57)
- ps复制快捷键 (57)
- 清除系统垃圾代码 (58)
- web服务器的架设 (67)
- 16进制转换 (69)
- xclient (55)
- ps源文件 (67)
- filezilla server (59)
- 句柄无效 (56)
- word页眉页脚设置 (59)
- ansys实例 (56)
- 6 1 3固件 (59)
- sqlserver2000挂起 (59)
- vm虚拟主机 (55)
- config (61)
本文暂时没有评论,来添加一个吧(●'◡'●)