Meta 周二发布了能像人类那样进行推理的 AI 图像创造模型 I-JEPA。相关论文将在 CVPR 2023 大会上展示,训练代码和模型快照(model checkpoints)发布在 GitHub 上,采用非商业的 CC BY-NC-SA-4.0 授权。Meta 称,I-JEPA 能根据相关世界的背景知识填补图像空缺,而不是其它生成式 AI 模型那样只考虑附近的像素,因此能有效避免生成式 AI 图像模型的常见错误,比如六个指头。I-JEPA 代表 Image Joint Embedding Predictive Architecture,通过对比图像的抽象表示而非像素,创造外部世界的内部模型进行学习。它的多项计算机视觉任务中表现优异,计算效率更高,无需大量微调,训练时间更短,正确率更高。
https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/
https://github.com/facebookresearch/ijepa