慕课微课-掌握Java并发编程的“基石”，入门并发编程

zxit666 · · 534 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

### 慕课微课-掌握Java并发编程的“基石”，入门并发编程 download：https://www.zxit666.com/6378/ 大范围视觉预锻炼显著进步了大型视觉模型的性能。但是，作者察看到现有的低FLOPs模型无法从大范围预锻炼中受益的问题。在本文中，作者提出了一种通用的设计准绳，即ParameterNet，用于在大范围视觉预锻炼中增加更多参数的同时坚持低FLOPs。例如，采用动态卷积技术能够为网络提供更多参数，同时仅稍微增加FLOPs。提出的ParameterNet计划使得低FLOPs网络可以从大范围视觉预锻炼中受益。在大范围ImageNet-22K数据集上的实考证明了作者ParameterNet计划的杰出性能。例如，ParameterNet-600M相比普遍运用的Swin Transformer具有更高的精确性（81.6%对80.9%），并且具有更低的FLOPs（0.6G对4.5G）。 1、简介由于计算硬件和数据工程的开展，作为计算机视觉中的根底组成局部，大范围视觉预锻炼获得了令人注目的停顿。预锻炼的视觉模型能够作为表示学习器，并迁移到下游任务中，如图像辨认和目的检测。主流的预锻炼视觉模型通常需求大量的资源，包括数据、参数和FLOPs。这3个关键要素严重影响着性能，并根本遵照缩放定律。大范围的预锻炼数据能够为表示学习提供多样化的样本。这些数据集的范围从数百万到数十亿不等，例如，普遍运用的ImageNet-22K数据集包含了1400万张图像和21841个类别。为了更好地拟合大范围数据集，模型的大小（包括参数和FLOPs）近年来越来越大，例如，ViT-G/14模型具有18亿个参数和9650亿个FLOPs。挪动设备上的视觉应用通常需求快速推理，因而由于高计算本钱，很难部署现有的预锻炼视觉模型。为理解决这个问题，作者经历性地研讨了大范围视觉预锻炼中FLOPs的影响。作者采用ImageNet-22K作为大范围预锻炼数据集，而ImageNet-1K是一个相对较小的数据集用于比拟。然后，作者对预锻炼的Transformer和CNN模型在ImageNet-1K上停止微调以评价性能。如图2和图3所示，当模型的FLOPs逐步增加时，模型的精确性持续进步。关于高FLOPs的模型，22K预锻炼模型优于1K模型。但是，低FLOPs的模型无法从大范围预锻炼中获益，作者称之为低FLOPs圈套。在这篇论文中，作者经过增加更多的参数来构建低FLOPs的ParameterNet，同时坚持低FLOPs的特性，用于大范围视觉预锻炼。这是一个通用的设计准绳，有多种办法能够增加参数数量并坚持低FLOPs。例如，作者主要思索高效动态卷积，它能够大幅增加参数数量而简直不增加额外的FLOPs。ParameterNet计划能够使以前的网络从大范围视觉预锻炼中受益，并克制低FLOPs的圈套。在实验中，ImageNet-22K预锻炼的ParameterNets相比正常的ImageNet-1K锻炼能够进步约2%的性能。例如，ParameterNet-600M在ImageNet-1K考证集上完成了81.6%的top-1精确率，其FLOPs数量比Swin-T低7倍。

534 次点击

加入收藏微博

收入我的专栏

上一篇：浅谈生成式人工智能

下一篇：Jedis-分布式缓存服务Redis版-快速入门-连接实例-多语言连接-Java客户端

java

缩放

实验

所示

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

慕课微课-掌握Java并发编程的“基石”，入门并发编程

用户登录

今日阅读排行

一周阅读排行

慕课微课-掌握Java并发编程的“基石”，入门并发编程

用户登录

今日阅读排行

一周阅读排行

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏