Google представила генератор изображений по тексту Muse, где по словам разработчиков, алгоритм качественнее аналогов отображает слова и концепции на картинках.
Система представляет собой нейросеть-трансформер и базируется на многозадачной языковой модели T5 от Google, которая использует методы сжатого дискретного скрытого пространства и параллельного декодирования.
В компании заявили, что Muse способна генерировать иллюстрации размером 512×512 пикселей за 1,3 секунды и это превышает скорость генерации картинок ИИ-алгоритмом Stable Diffusion 1.4, которая составляет 3,7 секунды.
Подробнее