环球播报:最大CLIP!LAION发布CLIP的扩增定律

  2022-12-25 18:24:26


(相关资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

相关新闻

猜你喜欢

环球播报:最大CLIP!LAION发布CLIP的扩增定律

2022-12-25

日本近来强降雪造成13死80多人伤 视点

2022-12-24

天天快资讯丨俄罗斯克麦罗沃发生火灾 已致13人死亡

2022-12-24

“重”焕新彩|武锅启新程 武珞圆新梦_时讯

2022-12-23

诚迈科技董事长王继平赴国家智能网联汽车创新中心交流车用操作系统合作事宜_每日视点

2022-12-23

新冠感染后“阳转阴”的10个误区,很多人都深陷其中!

2022-12-23

加速全屋智慧场景落地 长虹·美菱布局5G生态成套家电

2022-12-22

蔚来官宣全新车型将于12月24日举办的NIO Day 2022正式发布_天天热讯

2022-12-22

南充劳务报酬律师收费要多少-速看

2022-12-22

世界即时:竹叶贷贷款逾期49年多久上征信系统

2022-12-21

中汽协:前11月销量排名前十车企共销售2094.5万辆 每日热闻

2022-12-21

世界信息:85后不想上班,现在创业晚不晚?成功的几率有多大?

2022-12-21

提升未成年人网络环境安全性和健康度 严惩涉未成年人网络偷拍直播等行为|天天热文

2022-12-20

世界通讯!中金:维持和黄医药(00013.HK)“跑赢行业”评级 目标价30.27港元

2022-12-20

小米集团年底裁员 涉及多部门

2022-12-19

12月19日楚天科技跌5.07%,安信医药健康A基金重仓该股-全球消息

2022-12-19

2023年房企580亿美元债待偿 “内保外贷”重启下海外融资规模有望扩容-世界球精选

2022-12-19

《护卫者》首播,张丰毅不愧是老戏骨,演活了基层的老片警

2022-12-18

乐享借逾期9个月会上征信吗

2022-12-18

全球热头条丨2022年APEC中小企业创新与专业化(专精特新)国际合作研讨会举办

2022-12-17

奥瑞金(002701)股东上海原龙投资控股(集团)有限公司质押900万股,占总股本0.35% 全球热资讯

2022-12-16

当前速递!12月16日科士达跌6.01%,汇添富盈鑫基金重仓该股

2022-12-16

《食神》中的蛋炒饭不算啥,这9道蛋炒饭个比个香,看着都馋

2022-12-16

成都先导: 成都先导药物开发股份有限公司第二届董事会第七次会议决议公告

2022-12-15

环球最资讯丨舞钢:抗疫彰显公安担当 锦旗诠释警民情深

2022-12-15

精彩图集