首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#架构

综合 CNN 和 Transformer, Microscopic-Mamba 仅用 4M 参数揭示微观图像的秘密 !

未来先知

然而,当直接应用于MIC任务时,这种有前景的架构的准确性无法匹配其效率。与具有明显目标特征的其他视觉任务不同,MIC需要捕捉全局上下文和局部详细特征。因此,本文...

2200

【AI大模型】深入Transformer架构:输入和输出部分的实现与解析

小言从不摸鱼

因为在Transformer的编码器结构中, 并没有针对词汇位置信息的处理,因此需要在Embedding层后加入位置编码器,将词汇位置不同可能会产生不同语义的信...

2600

YoloV9改进策略:BackBone改进:PoolFormer赋能YoloV9,视觉检测性能显著提升的创新尝试

AI浩

在深度学习的广阔领域中,目标检测作为计算机视觉的基石任务之一,始终吸引着研究者的广泛关注。近期,我们大胆尝试将前沿的PoolFormer主干网络引入经典的目标检...

1700

YoloV8改进策略:BackBone改进|PoolFormer赋能YoloV8,视觉检测性能显著提升的创新尝试

AI浩

在深度学习的广阔领域中,目标检测作为计算机视觉的基石任务之一,始终吸引着研究者的广泛关注。近期,我们大胆尝试将前沿的PoolFormer主干网络引入经典的目标检...

2200

YoloV9改进策略:BackBone改进|Swin Transformer赋能YoloV9,性能跃升的新篇章

AI浩

在深度学习领域,目标检测作为计算机视觉的核心任务之一,其性能的提升始终吸引着研究者们的目光。近期,我们创新性地将Swin Transformer这一前沿的Tra...

2100

YoloV10改进策略:BackBone改进|Swin Transformer赋能YoloV10,性能跃升的新篇章

AI浩

在深度学习领域,目标检测作为计算机视觉的核心任务之一,其性能的提升始终吸引着研究者们的目光。近期,我们创新性地将Swin Transformer这一前沿的Tra...

3100

YoloV8改进策略:BackBone改进|Swin Transformer赋能YoloV8,性能跃升的新篇章

AI浩

在深度学习领域,目标检测作为计算机视觉的核心任务之一,其性能的提升始终吸引着研究者们的目光。近期,我们创新性地将Swin Transformer这一前沿的Tra...

2600

YoloV10改进策略:卷积篇|ACConv2d模块在YoloV10中的创新应用与显著性能提升|简单易用|即插即用

AI浩

在本文中,我们创新性地将ACConv2d模块引入到YoloV10目标检测模型中,通过对YoloV10中原有的Conv卷积层进行替换,实现了模型性能的大幅提升。A...

1400

用于实时语义分割的可重参数化双分辨率网络

AI浩

语义分割在自动驾驶和医学图像等应用中发挥着关键作用。尽管现有的实时语义分割模型在准确性和速度之间取得了令人称赞的平衡,但其多路径块仍然影响着整体速度。为了解决这...

3100

YoloV9改进策略:注意力篇|Block改进|附结构图|自研基于xLSTM的注意力(全网首发)

AI浩

本文使用Vision-LSTM的xLSTM改进YoloV9的RepNCSPELAN4结构,增加自研的注意力机制,取得了不错的得分。如果大家想发顶会,或者比较好的...

2600

DenseNets再探索:超越ResNets和ViTs的范式转变

AI浩

https://arxiv.org/pdf/2403.19588 本文重新探讨了密集连接的卷积网络(DenseNets),并揭示了其在当前主流的ResNet风格...

1300

Vision-LSTM: xLSTM 作为通用视觉主干

AI浩

尽管Transformer最初是为自然语言处理引入的,但它现在已经被广泛用作计算机视觉中的通用主干结构。最近,长短期记忆(LSTM)已被扩展为一种可扩展且性能优...

1600

MobileNetV4实战:使用MobileNetV4实现图像分类任务(一)

AI浩

论文链接:https://arxiv.org/pdf/2404.10518 MobileNetV4,作为新一代移动设备神经网络架构,凭借其创新的通用倒置瓶颈UI...

3200

YoloV8改进策略:BN和LN的自适应结合的BCN| 正则化改进|有效涨点|代码二次改进,加注释详解

AI浩

归一化技术已被广泛应用于深度学习领域,因为它们能够提高学习率并减少对初始化的依赖。然而,流行的归一化技术的有效性通常仅限于特定领域。与标准的批量归一化(Batc...

3700

YoloV8改进策略:聚焦线性注意力重构YoloV8

AI浩

在视觉Transformer中应用聚焦线性注意力模块,可以扩大模型的感受野,使其能够更好地捕捉到长程依赖关系。此外,该模块可以作为一个插件模块,方便地应用于各种...

2800

YoloV8改进策略:FastVit与YoloV8完美融合,重参数重构YoloV8网络(全网首发)

AI浩

FastViT是一种混合ViT架构,它通过引入一种新型的token混合运算符RepMixer来达到最先进的延迟-准确性权衡。RepMixer通过消除网络中的跳过...

1200

YoloV8改进策略:SPD-Conv加入到YoloV8中,让小目标无处遁形

AI浩

SPD-Conv是一种新的构建块,用于替代现有的CNN体系结构中的步长卷积和池化层。它由一个空间到深度(SPD)层和一个非步长卷积(Conv)层组成。

5510

Spring底层架构源码解析(三)

ma布

有关spring的前置知识,可以观看我的上一篇文章spring底层架构源码解析(二)

2610

Spring底层架构源码解析(二)

ma布

BeanDefiniton是spring源码中比较一个重要的接口,该接口描述了Bena的基本属性,该BeanDefiniton继承了AttributeAcces...

4610

PowerBI优化:更快、更小、更高效

陈学谦

多年来,Power BI 一直是市场上领先的数据可视化工具。它可以用作自助式数据分析工具,也可以用作企业管理的商业智能工具。根据官方网站:

5310
领券
http://www.vxiaotou.com