Transformer Pytorch - 搜索 News

PyTorch创始人：Transformer太火很不好，AI易撞墙

Souminth Chintala 担心 Transformer 可能导致人工智能碰壁。 2017 年 Transformer 首次亮相，便迅速在 AI 领域扩散开来，CV、NLP 等任务都有其身影，越来越多的研究人员投入其中。要说 Transformer 有多厉害，比如 OpenAI 重磅推出的 GPT-3，就是基于 Transformer 实现的。至于传播 ...

电子工程专辑

GitHub7.5kstar量，各种视觉Transformer的PyTorch实现合集整理好了

这个项目登上了今天的GitHub Trending。近一两年，Transformer 跨界 CV 任务不再是什么新鲜事了。自 2020 年 10 月谷歌提出 Vision Transformer (ViT) 以来，各式各样视觉 Transformer 开始在图像合成、点云处理、视觉 - 语言建模等领域大显身手。之后，在 PyTorch 中实现 Vision ...

雷锋网

Pytorch-Transformers 1.0 发布，支持六个预训练框架，含 27 个预训练模型

雷锋网 AI 科技评论按：刚刚，在 Github 上发布了开源 Pytorch-Transformers 1.0，该项目支持 BERT, GPT, GPT-2, Transfo-XL, XLNet, XLM 等，并包含 27 个预训练模型。我们来看。哪些支持 ...

腾讯网

Transformer模型变长序列优化：解析PyTorch上的FlashAttention2与xFormers高 ...

随着生成式AI（genAI）模型在应用范围和模型规模方面的持续扩展，其训练和部署所需的计算资源及相关成本也呈现显著增长趋势，模型优化对于提升运行时性能和降低运营成本变得尤为关键。作为现代genAI系统核心组件的Transformer架构及其注意力机制，由于其 ...

新浪网

只需几个小操作，就能让transformer模型推理速度加3.5倍

你在用 PyTorch 写 transformer 吗？请关注下这个项目。大多数关于在生产中部署 Transformer 类模型的教程都是基于 PyTorch 和 FastAPI 构建的。两者都是很好的工具，但在推理方面的性能不是很好。而如果你花费时间进行研究，可以在 ONNX Runtime 和 Triton 推理服务器上 ...

生物通

深度视觉：利用PyTorch基于Transformer模型预测糖尿病视网膜病变

糖尿病视网膜病变（DR）自动筛查中，基于Transformer的模型（包括纯Transformer和CNN-Transformer混合架构）通过高斯滤波和CLAHE预处理提升图像质量，ConvNeXt-Transformer Hybrid模型达到93.14%准确率，证明混合架构在捕捉复杂视网膜细节方面具有临床实用价值。糖尿病视网膜 ...

新浪网

降龙十八掌：这套优化transformer内存占用的组合技值得收藏

很多时候，内存限制会阻碍 ViT 以及 LLM 的训练，这篇文章介绍了 9 种减少内存消耗峰值的方法。难能可贵的是，这几种方法可以同时使用，就好像降龙十八掌中最后一掌，正是将前几张组合起来就能打出最强大的效果。峰值内存消耗是训练深度学习模型（如 ...

36氪

AI生成苹果Metal内核，PyTorch推理速度提升87%

AI自动生成的苹果芯片Metal内核，比官方的还要好？ Gimlet Labs的最新研究显示，在苹果设备上，AI不仅能自动生成Metal内核，还较基线内核实现了87%的PyTorch推理速度提升。更惊人的是，AI生成的Metal内核还在测试的215个PyTorch模块上实现了平均1.87倍的加速，其中一些 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果