Vit是使用Transformer架构来解决图片识别的问题。

通过将大图片切割成一块块小图片并使用类似词向量的处理方式可以更好的提取每个小图片的信息,不需要卷积操作因此提高了模型的计算效率,可以通过大图片数据集来进行模型预训练提升准确率。

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐