甘肃省网站备案,最好企业网站,东莞网站关键词优化公司,wordpress 下拉框写在前面#xff1a;本篇直接结合代码来理解网络的笔记 paper: Swiftformer-paper code: https://github.com/Amshaker/SwiftFormer 文章目录 网络结构精析零、整体一、patch embed二、stage 网络结构精析
零、整体
可以看到结构中#xff0c;整体就是#xff1a; stem -本篇直接结合代码来理解网络的笔记 paper: Swiftformer-paper code: https://github.com/Amshaker/SwiftFormer 文章目录 网络结构精析零、整体一、patch embed二、stage 网络结构精析
零、整体
可以看到结构中整体就是 stem - 5X(convEncoderSwiftformer) - head 对应代码在swiftformer.py在大概427行 head中self.dist的判断是有否蒸馏网络的分支。这就是整个的网络结果下面讲解各个部分。
一、patch embed
图片预处理输入到 ---- patch embed结构 代码中 swiftformer.py 定义在大概317行 stem函数的两个参数是输入通道和输出通道embed_dims[0]是模型根据尺寸(如XS/X/L1/L3)设定的超参的第0个值。这里输入是通道数是3图片是3层的然后定义如下
二、stage
未完待续