作为计算机视觉领域的顶尖科学家,何恺明毕业于清华大学物理系,现任麻省理工学院电气工程与计算机科学系副教授(终身教职)。其最著名的成就,就是提出了ResNet架构,解决了深度神经网络中“越深越难训练”的根本性问题,ResNet也被称为现代深度学习发展史 ...
2026年架构革命的枪声已经打响!ResNet用十年证明了「加法捷径」能救训练,但也暴露了「只加不减」的天花板。DeepSeek新年王炸之后,普林斯顿和UCLA新作DDL让网络学会忘记、重写和反转。
点击上方“Deephub Imba”,关注公众号,好文章不错过 !大过节的qwen发布了image 2512,DeepSeek这边就偷摸的在arXiv 上挂出了这篇 mHC: Manifold-Constrained ...
为了将任意矩阵投影到这个流形上,论文采用了 Sinkhorn-Knopp 算法。该算法先对矩阵取指数使所有元素为正,然后交替对行和列进行归一化,迭代收敛到双随机矩阵。
本研究针对COVID-19等传染病快速诊断需求,提出一种基于咳嗽音的深度学习分类框架。团队通过融合ResNet、EfficientNet等预训练模型,实现了对正常与COVID-19咳嗽音的高精度区分,准确率达98.5%。该研究为无创、低成本的呼吸道疾病筛查提供了技术支撑,对公共卫生 ...
BN是深度学习中的一项里程碑技术。它在训练过程中使用small-batch-size统计来标准化激活的输出,但在推理过程中使用的是总体统计。 本文主要研究统计数据的估计。定义了BN的估计偏移的幅度来定量地测量其估计的统计量和预期的统计量之间的差异。本文的主要 ...
大模型的人才黑洞效应,还在持续。 量子位获悉,最新出现在大模型大牛转会名单上的重磅大牛,是90后AI大牛张祥雨,ResNet四位作者之一,孙剑首位深度学习博士生,未来科学大奖得主。 现在,他出现在了国产大模型独角兽阶跃星辰的引援传闻中。 而且六小强 ...
本文引入了橄榄型分布来衡量编码器中不同网络阶段卷积层数的测试精度和推理效率。此外,在解码器中提出了一个轻量级的上采样特征金字塔块(UFPB),以融合编码器最后3个阶段的特征。CarNet在推理效率和测试精度之间取得了较好的平衡,优于现有的最先进的 ...
智东西4月17日报道,近日,Nature杂志对21世纪以来引用次数最多的25篇论文进行了分析,揭示出一个有趣的现象:在科学界,讲述方法和软件的论文比著名的科学发现更常被引用,这些论文主要集中在人工智能(AI)、研究方法或综述、癌症统计和软件研究等领域。
【新智元导读】大自然的分形之美,蕴藏着宇宙的设计规则。刚刚,何恺明团队祭出「分形生成模型」,首次实现高分辨率逐像素建模,让计算效率飙升4000倍,开辟AI图像生成新范式。 图像生成建模全新范式来了。 你是否曾凝视过雪花的精致对称,或惊叹于 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果