Евгений Ожев – Ваш карманный генИИ (страница 5)
Когда вы пишете системный промпт, вы программируете виртуальное существо. Вы определяете не только «что» сказать, но и как оно должно мыслить. Это уровень управления, доступный раньше только разработчикам.
История-кейс 6: «Как системный промпт создал речь для TEDx»
К спикеру Ирине обратились с просьбой выступить на TEDx. Она использовала системный промпт:
Ты – Саймон Синек. Твоя цель – помочь мне создать речь в стиле «Золотого круга».
Структура:
WHY (Почему эта тема важна для мира).
HOW (Как я вижу решение).
WHAT (Что конкретно я предлагаю).
Принципы:
Используй короткие предложения.
Делай паузы для осмысления.
Никакого жаргона.
Формат: текст речи с пометками [ПАУЗА], [ВЗГЛЯД В ЗАЛ].
ИИ сгенерировал речь, которая получила овации. Ирина не копировала текст – она использовал его как каркас, наполняя личными историями.
Вывод главы:
Любой может спросить ИИ. Только архитектор может прописать ему личность, правила и границы.
Домашнее задание:
Выберите одну частую задачу (написание постов, анализ данных, планирование). Напишите для неё системный промпт по структуре выше. Протестируйте на 3 заданиях. Зафиксируйте разницу.
ГЛАВА 7: МУЛЬТИМОДАЛЬНОСТЬ: КОГДА ИИ ВИДИТ, СЛЫШИТ И ПОНИМАЕТ
История-кейс: «Дизайнер, который сэкономил 20 часов на подборе референсов»
Дизайнер Алиса получила задание: создать логотип для эко-стартапа. Раньше она бы потратила часы на поиск референсов в Pinterest, Behance, Dribbble. Теперь она загрузила в GPT-4V 10 изображений природы, эко-упаковки, современных логотипов и попросила: «Проанализируй визуальные тренды на этих изображениях и предложи 5 направлений для логотипа». За 2 минуты ИИ выдал: «1. Минимализм + листья. 2. Градиенты + геометрия. 3. Рукописный шрифт + органические формы…» Алиса выбрала направление и приступила к работе.
Что такое мультимодальность в 2026?
Это способность ИИ работать с разными типами данных: текст, изображения, аудио, видео, таблицы. Модели типа GPT-4V, Gemini 1.5, Claude 3 могут:
Анализировать изображения (объекты, стиль, эмоции).
Читать текст с картинок (скриншоты, документы).
Генерировать описания для изображений.
Работать с аудио (транскрибация, анализ тона).
Обрабатывать видео (по кадрам).
ПРАКТИКУМ 7.1: Анализ изображения через ИИ
Найдите в интернете сложную инфографику (например, про изменение климата).
Загрузите её в GPT-4V или Gemini.
Задайте вопросы:
«Что изображено на этой инфографике?»
«Какие ключевые выводы можно сделать?»
«Есть ли какие-то манипуляции с данными?»
Попросите преобразовать информацию в таблицу.
Пример запроса:
«Ты – аналитик данных. Проанализируй инфографику. Выдели 5 ключевых фактов. Представь их в таблице: факт → цифра → источник (если есть). Оцени достоверность данных по шкале от 1 до 5».
Ограничения мультимодальности:
Детализация: Модель может не увидеть мелкие детали.
Контекст: Без пояснений может неправильно интерпретировать изображение.
Этика: Нельзя загружать конфиденциальные или личные изображения.
Инсайт:
Мультимодальность – это суперсила, которая стирает границы между типами информации. Вы можете попросить ИИ «прочитать» лекцию с доски, проанализировать график продаж из PDF, описать эмоции на фотографии. Но эта сила требует чётких инструкций – иначе ИИ будет фантазировать.
История-кейс 7: «Как ИИ помог историку расшифровать старую карту»
Историк Пётр работал с картой XVIII века. Многие надписи стёрлись. Он загрузил фото карты в GPT-4V и попросил: «Предположи, что написано в размытых областях, основываясь на контексте, географии и стиле почерка». ИИ предложил несколько вариантов. Пётр сравнил их с другими источниками и смог восстановить 70% текста. Без ИИ это заняло бы месяцы.
Советы по работе с мультимодальностью:
Давайте контекст: «Это фотография чека из ресторана. Расшифруй сумму, дату, название».
Конец ознакомительного фрагмента.
Текст предоставлен ООО «Литрес».
Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.