Как работает Dalle-mini
Если ничего не произойдет, загрузите настольный компьютер GitHub и попробуйте еще раз.
Сохраненные поиски
Используйте сохраненные поиски, чтобы быстрее отфильтровать свои результаты
Вы вписались с другой вкладкой или окном. Перезагрузить, чтобы обновить сеанс. . . . Перезагрузить, чтобы обновить сеанс.
Dall · e mini – генерировать изображения из текстовой приглашения
Лицензия
.
Не мог загрузить ветви
Имя уже используется
. . Вы уверены, что хотите создать эту ветку?
Используйте GIT или Checkout с SVN, используя веб -URL.
. Узнайте больше о CLI.
Войдите в обязатель
Пожалуйста, войдите в систему, чтобы использовать Codespaces.
Если ничего не произойдет, загрузите настольный компьютер GitHub и попробуйте еще раз.
.
Запуск Xcode
.
Запуск кода Visual Studio
.
.
Последний коммит
Файлы
Не удалось загрузить последнюю информацию о коммите.
.
Dall · e mini
?
Как это работает?
- Dall · e mini – генерировать изображения из любой текстовой приглашения
- Dall · e mini – объяснил
- Dall · E Mega – тренировочный журнал
Установка зависимостей
Только для вывода используйте PIP установить Dalle-Mini .
. . .
Обучение Dall · e mini
.
Часто задаваемые вопросы
?
Обученные модели находятся на Модельный концентратор:
- VQGAN-F16-16384 для кодирования/декодирования изображений
- Dall · e mini или dall · e mega для создания изображений из текстовой подсказки
?
«Кресло в форме авокадо» использовалось OpenAI при выпуске Dall · E, чтобы проиллюстрировать возможности модели. Успешные прогнозы по этому поводу представляют собой большую веху для нас.
. !
Вы также можете использовать эти замечательные проекты от сообщества:
- Сверните свое собственное приложение с помощью репозитория Dall-E Playground (спасибо, Сахар)
- Попробуйте Dall · E Project для создания, диффузии и масштабирования в рабочем процессе человека в петле (спасибо, Хан Сяо)
- запустить на репликации, в браузере или через API
Благодарности
- Обнимаю лицо для организации недели сообщества льна/JAX Community
- Вес и предубеждения для обеспечения инфраструктуры для отслеживания экспериментов и управления моделями
Авторы и участники
Большое спасибо людям, которые помогли сделать это лучше:
- Общины Dalle-Pytorch и Eleutherai для тестирования и обмена крутые идеи
- Рохан Анил за добавление оптимизатора распределенного шампуня и всегда дает отличные предложения
- Кэтрин Кроусон для супер кондиционирования
- Команда Gradio сделала удивительный пользовательский интерфейс для нашего приложения
Цитируя Dall · e mini
Если вы найдете Dall · E Mini полезным в своем исследовании или хотите обратиться, используйте следующую запись Bibtex.
@misc, doi =, месяц =, title =, url =, year =>
- “DeepNet: масштабирование трансформаторов до 1000 слоев”
- «Нормообразование: улучшение преобразования трансформатора с дополнительной нормализацией»
- “Suv Transformer: Transformer иерархического зрения с использованием смещенных окон”
- «Cogview: освоение генерации текста до изображения через трансформаторы»
- “Sinkformers: трансформаторы с удвоенным стохастическим вниманием”
- “Фонд Трансформеры
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, url= >
@misc< title=, author=, year=, eprint= archivePrefix=, primaryClass= >
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@Inprocecendings< title=, author=, booktitle=, year= >
< title = , author = , year = , eprint = , archivePrefix = , primaryClass = >
@misc< title = , author = , year = , eprint = , archivePrefix = , primaryClass = >
< title = , url = , author = , publisher = , year = , >
@misc< title = , url = , author = , publisher = , year = , >
@misc< title = , url = , author = , publisher = , year = , >
О
Как работает Dalle-mini?
. .
Луи Бушар
Я уверен, что в последние несколько дней вы видели такие фотографии, как в вашем ленте в Твиттере. . Если вы никогда не видели их, вам нужно прочитать эту статью, потому что вы упускаете. Если вам интересно, как это возможно, вы находитесь в идеальной статье и узнаете ответ менее чем за пять минут.
Это имя, dall · e, должно быть уже позвонить в колокол, когда я освещал две версии этой модели, сделанные Open AI в прошлом году с невероятными результатами. . Dall · E Mini-это созданный в сообществе проект с открытым исходным кодом, вдохновленный первой версией Dall · E, и с тех пор продолжает развиваться, с невероятными результатами благодаря Борису Дейму и всем участникам.
.
Ссылка находится в ссылках ниже, но дайте этой статье еще несколько секунд, прежде чем играть с ней. Это будет стоить, и вы узнаете гораздо больше об этом искусственном интеллекте, чем все, кого вы знаете вокруг себя.
В основе, Dall · E Mini очень похож на Dall · E, поэтому мое первоначальное видео на модели – отличное введение к этому. .
. . Здесь у нас есть языковая модель под названием BART. . Во время тренировки мы кормимся с изображениями с подписями в Dall · E Mini. Барт принимает подпись текста и преобразует его в дискретные токены, и мы настраиваем его на основе разницы между генерируемым изображением и изображением, отправленным в качестве входного.
Но тогда, что здесь, что генерирует изображение? Мы называем это декодером. Это потребуется это новое представление подписи, созданное BART, которое мы называем кодированием, и расширит его в изображение. В этом случае декодер изображений – VQGAN, модель, которую я уже рассмотрел на канале, поэтому я определенно приглашаю вас посмотреть его, если вам интересно.
Короче говоря, Vqgan – отличная архитектура, чтобы сделать наоборот. Он узнает, как переходить от такого кодирования картирования и генерировать из него изображение. . Вот то же самое, но с пикселями, образующими изображение вместо букв, образующих предложение. Он учится через миллионы паров кодирования и изображения из Интернета, поэтому в основном ваши опубликованные изображения с подписями и в конечном итоге становятся довольно точными в реконструкции начального изображения.
Затем вы можете накопить новые кодировки, которые похожи на тренировки, но немного отличаются, и это генерирует совершенно новый, но похожий изображение. Точно так же мы обычно добавляем немного шума к этим кодированиям, чтобы генерировать новое изображение, представляющее одну и ту же текстовую подсказку.
! Вот как Dall · E Mini учится генерировать изображения из ваших текстовых подписей.
Посмотрите больше результатов в видео:
Как я уже упоминал, это открытый источник, и вы даже можете играть с ним сразу, благодаря Huggingface. . . Я также недавно опубликовал два коротких видео на YouTube, демонстрируя некоторые забавные результаты, а также результаты сравнения с Dall · E 2 для тех же проведений текста.
Довольно круто видеть!
.
!
Рекомендации
►https: // Discord.
Зарегистрируйтесь, чтобы получить больше подобных.
Адаптация LLM для выполнения конкретных задач!
Повысить производительность искусственного искусства с точной настройкой
MVDream: Создание жизненных 3D -моделей из слов
!
Ай глубокое обучение объяснено
Глубокое обучение с простой аналогией
. Большинству людей не хватает навыков или талантов, чтобы нарисовать. . Очарование Dall-E 2 вооружает каждого человека, независимо от мастерства или дохода, с выразительными способностями профессиональных художников.
Горячий котелок..
Далле-Мини
В то время как Dall-E 2 является закрытым исходным кодом и запатентованным, Dall-E Mini предоставляет удивительную альтернативу с открытым исходным кодом, позволяя любому получить возможности генерации изображений с правильным компьютером.
. Создайте селфи искусственных технологий, выстрелы в голову ИИ, корпоративные фотографии и гламурные снимки себя в различных стилях и сценах. .
Достижения в области искусственного интеллекта позволяют любому создавать искусство с простыми инструкциями, очень похоже на инструктирование человеческого художника. .
.AI и Openai, эти модели изображений ИИ могут понимать простые инструкции и создавать изображения – аналогично тому, как художники -люди получают инструкции от посетителей. ?
. . ?
Читать больше мыслей об искусстве искусственного искусства.