Ирина Никулина – Цифровая муза. Как творить и зарабатывать с ИИ (страница 2)

Шрифт

Если нет идей или невозможно найти референс для картины, ИИ всегда поможет. Нейросеть может создать референс в разных стилях: от реализма до абстракции, а также создать картину в стилях известных художников. Главное – правильно написать промпт (запрос).

Рис. 5. Абстракции и пейзажи, созданные ИИ

ИИ могут генерировать и картинки, созданные векторной графикой, которые можно использовать в дизайне рекламных макетов или как иллюстрации к сайтам и книгам.

Рис. 6. Котенок в стиле векторной графики, созданный нейросетью

Кроме того, в нейросети, генерирующей картинки, можно задать определённый стиль в промпте (запросе), например: «Создай картину, где есть девушка и часы в стиле Сальвадора Дали» или «Напиши сюжет рассказа в стиле Клайва Баркера».

Рис. 7. Картина ИИ в стиле Сальвадора Дали

При генерации картин (для референсов) можно описать стиль, цвет, материалы, эффекты и т.д.

Например, «создай интерьерную картину акрилом, текстурную, синие тюльпаны на темном фоне с поталью (золотом), чтобы было видно мазки кистью». См. рис. 8.

Рис. 8. Картина, сгенерированная ИИ по запросу: текстурная картина акрилом синие тюльпаны с поталью

Для соцсетей и маркетплейсов можно создавать коротенькие видео, улучшающие визуальное восприятие товара, «оживляющее его». Такое видео сейчас под силу многим нейросетям, его можно создать на основе промпта (запроса) или на основе существующей картинки. Раньше для такого видео понадобилось бы много часов работы и оплата специалистов. А сейчас – всего лишь пара секунд и умение работать с ИИ. См. рис. 9.

Рис. 9. Видео, сгенерированное ИИ

Дальше мы рассмотрим, как в нейросетях составить правильный промпт и сгенерировать нужные картинки, тексты и музыку.

Об авторе книги

Ирина Никулина – автор книг по дизайну, графике, иллюстрации. Преподаватель и блогер, автор изданных книги в жанре нон-фикшен, она написала более 60 книг на разные темы. Недавно в своей работе цифрового художника и преподавателя Ирина стала использовать искусственный интеллект, экономя свое время.

Первыми работами были сгенерированные картинки из нейросети «Лексика», которые использовались в создании обложек для книг, как иллюстрации для учебников и художественной литературы, а также были созданы наклейки в стиле аниме и напечатаны майки с картинками, сгенерированными через ИИ.

Сейчас Ирина является блогером, который пишет на разные темы, все ее тексты иллюстрирует ИИ.

Ирина сертифицированный специалист по растровой графике и обучалась нейросетями в онлайн-школе. См. рис. 10.

Рис. 10. Сертификат Ирины Никулиной

Глава 1: Краткая история творческих ИИ

Искусственный интеллект или ИИ – это Искусственный разум в самом широком смысле – это комплекс инструментов, позволяющих решать задачи уровня человеческого интеллекта и реализованных машинами, в частности компьютерными системами. В этой книге мы будем рассматривать в основном ИИ, помогающие творческим специалистам: дизайнерам, копирайтерам, писателям, художникам, музыкантам.

Эволюция ИИ: от идей до глобального явления

Всю историю развития нейросетей можно разделить на три основных этапа:

Предыстория. Зарождение идей (1950-е – 2010-е гг)

В 1950-м году Алан Тьюринг опубликовал статью «Вычислительные машины и разум», в которой предложил знаменитый «Тест Тьюринга» для проверки способности машины самостоятельно мыслить. Это была интеллектуальная основа для всего последующего развития ИИ, хотя на тот момент технологии не позволяли создать быстродействующий и «думающий» компьютер.

1950-60-е: в это время было появление первых нейросетей (перцептрон Франка Розенблатта) и рождение самого понятия «искусственный интеллект».

Перцептрон Розенблатта – это простейшая искусственная нейронная сеть, предложенная в 1958 году и послужившая первым шагом по использованию искусственного интеллекта.

В нем был один слой искусственных нейронов (именно такую однослойную модель сейчас называют «перцептроном Розенблатта»). Его задачей была Бинарная классификация (например, «да/нет»).

Принцип работы перцептрона:

Входные данные (признаки) умножаются на веса и суммируются.

Сумма проходит через пороговую функцию активации (ступенчатую), которая выдает результат: 1 или 0.

Обучение: простой алгоритм обучения с учителем. Веса корректируются, если перцептрон ошибся на обучающем примере.

Ограничение (главный недостаток): может решать только задачи, которые являются линейно разделимыми (их можно разделить гиперплоскостью). Например, не может решить задачу «исключающее ИЛИ».

Историческое значение: перцептрон стал первой рабочей моделью обучаемой нейронной сети, заложив основы для всего направления развития ИИ. Его ограничения, описанные Марвином Минским, на десятилетия замедлили развитие области, пока не появились многослойные сети (многослойные перцептроны).

1980-2000-е: в это время произошло развитие более сложных архитектур нейросетей (рекуррентные сети, LSTM). Однако недостаток данных и вычислительной мощности не позволял создать что-то масштабное (такое, как сейчас).

2017 год: в это время был совершен ключевой прорыв. Исследователи из Google представили обществу архитектуру Transformer. Это была настоящая революция в ИИ! Transformer отлично справлялся с обработкой последовательностей (таких, например, как текст) и мог обучаться намного быстрее и эффективнее старых моделей. Это основа всех современных больших языковых моделей, включая ChatGPT.

История Чат GPT

Эра больших языковых моделей была с 2018 по 2020 гг. Компания OpenAI стала пионером в применении архитектуры Transformer, созданной специалистами Google, для разработки гигантских моделей нейросетей.

GPT (2018). Первая версия GPT была создана в 2018 году и называлась Generative Pre-trained Transformer. В основе лежала работа с текстом и анализ данных из сети Интернет. Модель показала, что предварительное обучение на огромных массивах текста из интернета позволяет ей хорошо генерировать связный текст.

GPT-2 (2019). Вскоре появилась более мощная модель. Ее способность генерировать реальные тексты сначала напугала самих создателей, и они отказались от немедленного публичного релиза, опасаясь злоупотребления своей нейросети. Позже модель все же была открыта.

GPT-3 (2020). Это был настоящий прорыв к высоким технологиям. Модель была создана с 175 миллиардами параметров. Она продемонстрировала возможность инконтекстного обучения – способности решать задачи, просто получив несколько примеров в промпте, без дообучения. Это был шок для всего мира ИИ.

Рождение ChatGPT и новая эра (2022 – настоящее время). До этого модели были мощными, но не всегда «разговорчивыми» и безопасными. Нужен был последний шаг, который свершился в 2022 году. В это время OpenAI представляет чат-бот на основе доработанной модели GPT-3.5. Главное новшество – обучение с подкреплением на основе человеческих предпочтений (RLHF).

Как это работало

1. Обучение с учителем: модель обучали на диалогах, где люди показывали правильные ответы.

2. RLHF: разметчики оценивали разные ответы модели по шкале «лучше-хуже». На основе этих оценок модель дообучалась, чтобы давать более полезные, реальные и безопасные ответы.

Результат: ChatGPT вышел не просто как мощная модель, а как удобный, вежливый и понятный собеседник для большого количества пользователей в сети Интернет. Он моментально стал популярным и за два месяца набрал 100 миллионов пользователей, став самым быстрорастущим приложением в истории.

GPT-4 (март 2023): в это время было создано следующее поколение модели GPT. Еще более мощное, надежное, способное работать не только с текстом, но и с изображениями (как входными данными). ChatGPT был обновлен до этой модели для платных пользователей.

Таким образом, ChatGPT, как впрочем и другие ИИ – это не внезапное изобретение, а результат более 70 лет исследований, увенчанный несколькими ключевыми прорывами за последние 5 лет.

Рис. 11. ChatGPT сейчас

История DeepSeek

Но сейчас многие функции ChatGPT стали платными. Поэтому как альтернатива ему был создан DeepSeek. Это творение компанией DeepSeek из Китая. Он создавался с целью быть по-настоящему полезным и главное доступным ИИ-ассистентом для всех людей. DeepSeek является бесплатным.

Этот ИИ поддерживает долгие диалоги, может написать анекдот, стих, пост, статью, сюжет книги и т. д. – при этом отлично владеет русским языком. Он поддерживает контекст до 128K токенов – это значит, что может работать с очень длинными текстами. Имеет возможность обрабатывать загружаемые файлы (изображения, PDF, Word, Excel и др.).

При этом DeepSeek все время обучается и улучшается на разнообразных данных.

Был создан компанией DeepSeek – это команда талантливых исследователей и инженеров, увлеченных созданием передовых ИИ-технологий в январе 2024 года. Это качественный ИИ, доступный для всех, не требующий платы за базовые функции.

Рис. 12. DeepSeek рассказывает свою историю

Глава 2. Обзор основных творческих инструментов ИИ

Сейчас многих людей в изучении нейросетей останавливает то, что некоторые ИИ являются платными и оплатить их из нашей страны проблематично. Это вопрос решается просто: существуют сайты, на которых можно бесплатно протестировать многие ИИ. Например, с помощью BotHub (https://bothub.chat) можно протестировать популярные нейросети для генерации изображений, такие как Flux, DALL·E и Midjourney. Внутри сервиса действует своя валюта – капсы. Сервис дарит 100 000 валюты при регистрации по реферальной ссылке. Забрав капсы, можно начать тестировать нейросети бесплатно.

1 2 3 4 Вперед