Книга рисующих нейросетей
Шрифт:
Особенно здорово Вомбе удаются сюрреалистические странные пейзажи в этаком эшеровском пространстве, парадоксальные с вывернутой и искажённой перспективой. Если вы такое любите. Я, например, такое люблю нежно, они меня завораживают, тем более, что цвет неизменно выходит совершенно чудесный и его сочетания просто душу греют:
Если
Сейчас возможности нейросетей уже таковы, что можно выбрать любой вид стилизации — от имитации традиционной живописи до самого лихого авангарда.
Вот так выглядит пейзаж, сгенерированный Вомбой в стиле «Барокко», с меткой в промте «масляная живопись»
А так делает Кандинский, в режиме «без стиля», с указанием «графика, гравюра».
Маленькие хитрости.
Все фрагменты будущего горизонтального изображения генерируются с помощью либо одного промта, либо промт чуть-чуть меняется в деталях. Например, если требуется пейзаж с рекой, то в части изображений указывается река, а в части — нет. Потом можно будет выбрать изображения, которые совмещаются лучше всего, и убрать симметрию, превращающую картинку в орнамент.
В промте хорошо бы указывать колорит, цветовую гамму — потому что иначе даже изображения, созданные с помощью одной и той же инструкции, могут очень сильно различаться по цвету. Акцент на цвете решит проблему.
Вся метода очень хороша для виньеток, заставок, декоративных элементов, обоев — но не для иллюстраций.
Об аватарках, «компьютерном зрении» и прочем интересном
Быть может, он заменит мне Читателя, нарисованного Мэтьюзом
Ага-ага, мою любимую аватарку, которую я уже лет десять не менял. Потому что это создание мне кажется просто идеально подходящим: оно такое, понимаете, иномирное, чужое, но свойское — потому что ведь тот, кто книжку читает, наш человек же, верно? Вот! И оно зелёное, потому что не хищное — ну, те, кто зелёный, они принципиально не хищные обычно и, как правило, не ядовитые. И сидит оно на грибе, а гриб мне сейчас, после знакомства с лицин, кажется куском своеобразной такой нервной системы мира, станцией связи — весь этот ассоциативный ряд.
Читатель, в общем. Любой из нас ведь сначала Читатель, а потом уже всё остальное, я думаю.
Читатель Родни Мэтьюза
Но когда появились нейросети, я начал пытаться себе аватар нарисовать. Потому что Мэтьюз — это очень хорошо и даже прекрасно, но всё время тянет на что-то в максимальной степени своё. Более своё, чем то приблизительно подходящее, что ты себе подобрал на необозримом пляже, куда периодически выносят разное волны океана
мировой культуры.Самое очевидное было — дракон.
Но дракон меня как-то не до конца устраивал, потому что — что уж такого иномирного в драконе? Дракон — он дракон и есть. Водится в таком количестве разных фэнтезийных миров, что уже и не скажешь, откуда он точно родом. Космополит такой: и в Европе у него полно родичей, и на Дальнем Востоке, и в современной культуре он торчит из каждого мультика и каждой хохмы на фэнтезийную тему. В общем — ну…
Мне хотелось эндемика какого-то совершенно нового мира. Быть может, ещё не открытого.
Я пытался изобразить это существо уже лет пять. С очень посредственными успехами.
Но сейчас у меня в руках появился впрямь мощный инструмент, с которым мы хорошо спелись и друг друга понимаем. Даже два, есличо. Проблембо и Дрим Вомбо.
Стиль Родни Мэтьюза, ясное дело. В виде благодарности и реверанса, а ещё намёка и отсылки — и всё такое.
Но — как его описать-то? Промт-то какой? А? Э…
«Марсианский сверчок» — я пробовал. Как-то не задалось. Вернее — ну, кое-какие сверчки у меня получались, но… сказать по чести, они были просто букашки. А просто букашка меня не устраивала.
И я решил пойти на хитрость:— программа «Компьютерное зрение». Смысл такой: загружаешь картинку, по мотивам которой хочешь сотворить что-нить этакое — и Проблемба пишет тебе промт. Потом ей же предлагаешь промт — и профит.
Конечно, не надо воображать, что машина непременно всё поймёт правильно и сделает идеальный промт — и сама же его верно прочитает. Нейросеть — не человек. Всякие сложные штуки ей не особенно по зубам.
Вот, например, я показываю знаменитую картину Луиса Ройо «Серое на ещё более сером»:
Человек бы сказал: металлический робот обнимает девушку — и оба закутаны в клочья картины «Герника» Пикассо. А на заднем плане какие-то руины. Постапокалипсис, в общем. Из соответствующего альбома.
Но машина определяет так: мужчина и женщина сидят рядом на скале на фоне порванного, порванного, порванного, стиль Брома, дарк-фэнтези.
Ну бог с тобой, думаю я. Попробуй. Вдруг мне кажется, что это не точно, а ты изобразишь точно?
Машина выдаёт это:
Нейросеть — не человек, в общем. Не распознаёт. Тут сложно: лохмотья «Герники», робот этот… Роботов «компьютерное зрение» видит как людей. И манекены — как людей.
Самые лучшие результаты я получал, когда на исходной картинке не было ни людей, ни кого-то человекообразного. Вот, скажем, сделать пейзаж в определённом стиле — да, «компьютерное зрение» поможет. Или вот такая была история ещё: товарищ Ханнах мне показала милую картинку, где кошки высаживаются на Землю из летающей тарелки:
По идее мне страшно понравилось. Ну да, да! Поработили Землю, мохнатая гопота! И теперь у каждого — личный человек, а у некоторых даже по два-три, и те люди всегда готовы пушистых владык угощать вкусным, подстилать мягкое и менять наполнитель в лотке. В общем, тема для забавного фантастического рассказа.
Но мне само исполнение не особо зашло. Я долго пытался переделать — но совершенно безуспешно. А вот пропустил через «компьютерное зрение» — и у меня появилась своего рода болванка для промта, которую можно слегка подтачивать так и сяк, чтобы получить картинки в разном стиле, с разной эмоциональной наполненностью.