网站首页 > 技术教程 正文
目前,设计更高效视觉Transformer的一个主要研究方向是通过采用稀疏注意力或使用局部注意力窗口来降低自我注意力模块的计算成本。相比之下,我们提出了一种不同的方法,旨在通过密集注意力模式来提高基于变换器的架构的性能。具体来说,我们为混合视觉转换器(FcaFormer)提出了前向交叉注意,即在同一阶段二次使用前一个区块的标记。为了实现这一目标,FcaFormer 利用了两个创新组件:可学习比例因子(LSFs)和标记合并与增强模块(TME)。LSFs 可以高效处理交叉令牌,而 TME 可以生成有代表性的交叉令牌。通过整合这些组件,拟议的 FcaFormer 增强了具有潜在不同语义的标记块之间的交互,并鼓励更多信息流向下层。
基于前向交叉注意力(Fca),我们设计了一系列 FcaFormer 模型,在模型大小、计算成本、内存成本和准确性之间实现了最佳权衡。例如,无需通过知识蒸馏来加强训练,我们的FcaFormer就能在Imagenet上实现83.1%的top-1准确率,而且只需1630万个参数和约36亿个MAC。与经过提炼的 EfficientFormer 相比,这节省了近一半的参数和少量计算成本,同时还提高了 0.7% 的准确率。
FcaFormer模型的整体结构如下图:
在YOLOv5项目中添加模型作为Backbone使用的教程:
(1)将YOLOv5项目的models/yolo.py修改parse_model函数以及BaseModel的_forward_once函数
(2)在models/backbone(新建)文件下新建fcaformer.py,添加如下的代码:
(3)在models/yolo.py导入模型并在parse_model函数中修改如下(先导入文件):
(4)在model下面新建配置文件:yolov5_fcaformer.yaml
(5)运行验证:在models/yolo.py文件指定--cfg参数为新建的yolov5_fcaformer.yaml
猜你喜欢
- 2024-10-20 Φ I L O S O Φ 葡萄酒品牌包装设计 via:Backbone Branding
- 2024-10-20 YOLO算法改进Backbone系列之MogaNet
- 2024-10-20 YOLO算法改进Backbone系列之:Dfformer
- 2024-10-20 YOLO算法改进Backbone系列之:EffificientFormer
- 2024-10-20 YOLO算法改进Backbone系列之:PVTv2
- 2024-10-20 食品包装设计分享 | Backbone Craft Beer国外英文字体精酿啤酒
- 2024-10-20 YOLO算法改进Backbone系列之:ParC-Net
- 2024-10-20 Backbone的优秀设计作品 | 水果 果汁 插画 手绘 创意 设计
- 2024-10-20 索尼参与开发PS版手机手柄公布 售价99.99美元
- 2024-10-20 EfficientFormer:轻量化ViT Backbone
你 发表评论:
欢迎- 04-26偶尔摸鱼18--招新海报
- 04-26一张还不知道能不能被采用的海报
- 04-26美工技巧:如何快速找素材找灵感?
- 04-26收集24个学好PPT的网站,拿走不谢
- 04-26美工设计必备的国内外素材网站大全
- 04-26电商设计师必备的国内外素材网站大全!
- 04-26安全防护标准化高清图,安全文明施工必备
- 04-26图说筏板基础施工那些事儿
- 最近发表
- 标签列表
-
- sd分区 (65)
- raid5数据恢复 (81)
- 地址转换 (73)
- 手机存储卡根目录 (55)
- tcp端口 (74)
- project server (59)
- 双击ctrl (55)
- 鼠标 单击变双击 (67)
- debugview (59)
- 字符动画 (65)
- flushdns (57)
- ps复制快捷键 (57)
- 清除系统垃圾代码 (58)
- web服务器的架设 (67)
- 16进制转换 (69)
- xclient (55)
- ps源文件 (67)
- filezilla server (59)
- 句柄无效 (56)
- word页眉页脚设置 (59)
- ansys实例 (56)
- 6 1 3固件 (59)
- sqlserver2000挂起 (59)
- vm虚拟主机 (55)
- config (61)
本文暂时没有评论,来添加一个吧(●'◡'●)