Как работает Dalle-mini

Если ничего не произойдет, загрузите настольный компьютер GitHub и попробуйте еще раз.

Сохраненные поиски

Используйте сохраненные поиски, чтобы быстрее отфильтровать свои результаты

Вы вписались с другой вкладкой или окном. Перезагрузить, чтобы обновить сеанс. . . . Перезагрузить, чтобы обновить сеанс.

Dall · e mini – генерировать изображения из текстовой приглашения

Лицензия

.

Не мог загрузить ветви

Имя уже используется

. . Вы уверены, что хотите создать эту ветку?

Используйте GIT или Checkout с SVN, используя веб -URL.
. Узнайте больше о CLI.

Войдите в обязатель

Пожалуйста, войдите в систему, чтобы использовать Codespaces.

Если ничего не произойдет, загрузите настольный компьютер GitHub и попробуйте еще раз.

.

Запуск Xcode

.

Запуск кода Visual Studio

.

.

Последний коммит

Файлы

Не удалось загрузить последнюю информацию о коммите.

.

Dall · e mini

?

Как это работает?

  • Dall · e mini – генерировать изображения из любой текстовой приглашения
  • Dall · e mini – объяснил
  • Dall · E Mega – тренировочный журнал

Установка зависимостей

Только для вывода используйте PIP установить Dalle-Mini .

. . .

Обучение Dall · e mini

.

Часто задаваемые вопросы

?

Обученные модели находятся на �� Модельный концентратор:

  • VQGAN-F16-16384 для кодирования/декодирования изображений
  • Dall · e mini или dall · e mega для создания изображений из текстовой подсказки

?

«Кресло в форме авокадо» использовалось OpenAI при выпуске Dall · E, чтобы проиллюстрировать возможности модели. Успешные прогнозы по этому поводу представляют собой большую веху для нас.

. !

Вы также можете использовать эти замечательные проекты от сообщества:

  • Сверните свое собственное приложение с помощью репозитория Dall-E Playground (спасибо, Сахар)
  • Попробуйте Dall · E Project для создания, диффузии и масштабирования в рабочем процессе человека в петле (спасибо, Хан Сяо)
  • запустить на репликации, в браузере или через API

Благодарности

  • �� Обнимаю лицо для организации недели сообщества льна/JAX Community
  • Вес и предубеждения для обеспечения инфраструктуры для отслеживания экспериментов и управления моделями

Авторы и участники

Большое спасибо людям, которые помогли сделать это лучше:

  • Общины Dalle-Pytorch и Eleutherai для тестирования и обмена крутые идеи
  • Рохан Анил за добавление оптимизатора распределенного шампуня и всегда дает отличные предложения
  • Кэтрин Кроусон для супер кондиционирования
  • Команда Gradio сделала удивительный пользовательский интерфейс для нашего приложения

Цитируя Dall · e mini

Если вы найдете Dall · E Mini полезным в своем исследовании или хотите обратиться, используйте следующую запись Bibtex.

@misc, doi =, месяц =, title =, url =, year => 

  • “DeepNet: масштабирование трансформаторов до 1000 слоев”
  • «Нормообразование: улучшение преобразования трансформатора с дополнительной нормализацией»
  • “Suv Transformer: Transformer иерархического зрения с использованием смещенных окон”
  • «Cogview: освоение генерации текста до изображения через трансформаторы»
  • “Sinkformers: трансформаторы с удвоенным стохастическим вниманием”
  • “Фонд Трансформеры

< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@misc< title=, author=, year=, url= > 
 @misc< title=, author=, year=, eprint= archivePrefix=, primaryClass= > 
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= > 
@Inprocecendings< title=, author=, booktitle=, year= > 
< title = , author = , year = , eprint = , archivePrefix = , primaryClass = > 
@misc< title = , author = , year = , eprint = , archivePrefix = , primaryClass = > 
< title = , url = , author = , publisher = , year = , > 
@misc< title = , url = , author = , publisher = , year = , > 
@misc< title = , url = , author = , publisher = , year = , > 

О

Как работает Dalle-mini?

. .

Луи Бушар

Как работает Dalle-mini?

Я уверен, что в последние несколько дней вы видели такие фотографии, как в вашем ленте в Твиттере. . Если вы никогда не видели их, вам нужно прочитать эту статью, потому что вы упускаете. Если вам интересно, как это возможно, вы находитесь в идеальной статье и узнаете ответ менее чем за пять минут.

Это имя, dall · e, должно быть уже позвонить в колокол, когда я освещал две версии этой модели, сделанные Open AI в прошлом году с невероятными результатами. . Dall · E Mini-это созданный в сообществе проект с открытым исходным кодом, вдохновленный первой версией Dall · E, и с тех пор продолжает развиваться, с невероятными результатами благодаря Борису Дейму и всем участникам.

.
Ссылка находится в ссылках ниже, но дайте этой статье еще несколько секунд, прежде чем играть с ней. Это будет стоить, и вы узнаете гораздо больше об этом искусственном интеллекте, чем все, кого вы знаете вокруг себя.

В основе, Dall · E Mini очень похож на Dall · E, поэтому мое первоначальное видео на модели – отличное введение к этому. .

. . Здесь у нас есть языковая модель под названием BART. . Во время тренировки мы кормимся с изображениями с подписями в Dall · E Mini. Барт принимает подпись текста и преобразует его в дискретные токены, и мы настраиваем его на основе разницы между генерируемым изображением и изображением, отправленным в качестве входного.

Но тогда, что здесь, что генерирует изображение? Мы называем это декодером. Это потребуется это новое представление подписи, созданное BART, которое мы называем кодированием, и расширит его в изображение. В этом случае декодер изображений – VQGAN, модель, которую я уже рассмотрел на канале, поэтому я определенно приглашаю вас посмотреть его, если вам интересно.

Короче говоря, Vqgan – отличная архитектура, чтобы сделать наоборот. Он узнает, как переходить от такого кодирования картирования и генерировать из него изображение. . Вот то же самое, но с пикселями, образующими изображение вместо букв, образующих предложение. Он учится через миллионы паров кодирования и изображения из Интернета, поэтому в основном ваши опубликованные изображения с подписями и в конечном итоге становятся довольно точными в реконструкции начального изображения.

Затем вы можете накопить новые кодировки, которые похожи на тренировки, но немного отличаются, и это генерирует совершенно новый, но похожий изображение. Точно так же мы обычно добавляем немного шума к этим кодированиям, чтобы генерировать новое изображение, представляющее одну и ту же текстовую подсказку.

! Вот как Dall · E Mini учится генерировать изображения из ваших текстовых подписей.

Посмотрите больше результатов в видео:

Как я уже упоминал, это открытый источник, и вы даже можете играть с ним сразу, благодаря Huggingface. . . Я также недавно опубликовал два коротких видео на YouTube, демонстрируя некоторые забавные результаты, а также результаты сравнения с Dall · E 2 для тех же проведений текста.

Довольно круто видеть!

.

!

Рекомендации

►https: // Discord.

Зарегистрируйтесь, чтобы получить больше подобных.

Адаптировать LLM для выполнения конкретных задач!

Адаптация LLM для выполнения конкретных задач!

Повысить производительность искусственного искусства с точной настройкой

MVDream: Создание жизненных 3D -моделей из слов

MVDream: Создание жизненных 3D -моделей из слов

!

Ай глубокое обучение объяснено

Глубокое обучение с простой аналогией

. Большинству людей не хватает навыков или талантов, чтобы нарисовать. . Очарование Dall-E 2 вооружает каждого человека, независимо от мастерства или дохода, с выразительными способностями профессиональных художников.

Горячий котелок..

Далле-Мини

В то время как Dall-E 2 является закрытым исходным кодом и запатентованным, Dall-E Mini предоставляет удивительную альтернативу с открытым исходным кодом, позволяя любому получить возможности генерации изображений с правильным компьютером.

. Создайте селфи искусственных технологий, выстрелы в голову ИИ, корпоративные фотографии и гламурные снимки себя в различных стилях и сценах. .

Достижения в области искусственного интеллекта позволяют любому создавать искусство с простыми инструкциями, очень похоже на инструктирование человеческого художника. .

.AI и Openai, эти модели изображений ИИ могут понимать простые инструкции и создавать изображения – аналогично тому, как художники -люди получают инструкции от посетителей. ?

. . ?

Читать больше мыслей об искусстве искусственного искусства.