реклама
Бургер менюБургер меню

Людмила Семушева – Хирургия контекста. Как перестать быть пользователем и стать повелителем нейросетей (страница 2)

18

Лайфхак: пишете техническую документацию? Ставьте температуру 0.2 – строго и по делу. Пишете стихи? Поднимите до 1.0 – пусть рифмует как бог на душу положит.

Top_p (nucleus sampling): вместо того, чтобы смотреть на все возможные слова, нейросеть отбирает только самые вероятные, которые в сумме дают вероятность p. Например, p=0.9 означает, что учитываются варианты, набирающие 90% вероятности, а остальные отбрасываются. Это отсекает совсем уж дикие варианты, оставляя пространство для манёвра.

Top_k: берутся k самых вероятных вариантов (например, топ-40) и из них выбирается случайно. Это грубее, чем top_p, но иногда полезно.

На практике лучшие результаты даёт комбинация: умеренная температура (0.7-0.9) и top_p=0.9-0.95.

Вредный совет: если поставить температуру 2.0 и top_p=1, нейросеть начнёт нести такую чушь, что даже маркиз де Сад покраснеет. Используйте для генерации абсурдных хайку или сценариев для снов про обезьяну.

Итог главы

Вы теперь знаете, что нейросеть – это не магический шар, а сложный статистический механизм. Она умеет находить закономерности и комбинировать их. Механизм внимания позволяет ей видеть контекст целиком. Галлюцинации – не ошибка, а следствие работы вероятностной модели. А температура и top_p – ваши инструменты тонкой настройки креативности.

Вооружившись этим знанием, переходим к следующей главе, где мы научимся делать хирургически точные промпты. Теперь вы хотя бы примерно понимаете, что происходит внутри «пациента» на столе.

А теперь вопрос к вам, уважаемый читатель: если нейросеть – это генератор случайностей с весами, то как заставить её не просто генерировать, а решать конкретные задачи? Об этом – в главе 2.

Глава 2. Прокрустово ложе инструкции

Как формулировать промпты, чтобы нейросеть делала именно то, что вы хотите.

Вы когда-нибудь пытались объяснить бабушке, как пользоваться смартфоном? Вы говорите: «Нажми на зелёную трубочку». Она нажимает на иконку телефона, потом тычет в экран пальцем и удивляется, что никто не звонит. Примерно так же нейросеть понимает размытые инструкции.

В этой главе мы научимся строить промпты как инженерные конструкции – чёткие, устойчивые и предсказуемые. Забудьте про «напиши что-нибудь интересное». Мы будем использовать методологию CO-STAR и другие приёмы, которые заставят даже самую строптивую модель плясать под вашу дудку.

Почему нейросеть делает не то, что вы просили?

Давайте сразу договоримся: нейросеть не умеет читать ваши мысли. Она видит только то, что вы написали. Если в вашем промпте есть двусмысленность, она выберет самый вероятный вариант из своей статистической модели. А самый вероятный – обычно самый банальный.

Пример плохого промпта: «Напиши пост для соцсетей о новой кофейне».

Что получится? Что-то вроде:«Откройте для себя уютную кофейню в центре города! Ароматный кофе, свежая выпечка, приятная атмосфера. Ждём вас!»

Шаблонно, скучно, бесполезно. Нейросеть просто скопировала миллион таких же постов из обучающих данных.

Как надо: мы должны дать контекст, цель, аудиторию, тон и формат.

CO-STAR: скелет идеального промпта

CO-STAR – это мнемоническая аббревиатура, разработанная специалистами по промпт-инжинирингу (в частности, популяризированная в Сингапуре). Она помогает не забыть ни одного важного элемента.

C – Context (Контекст): всё, что нужно знать нейросети для понимания задачи. Почему это важно? Какая предыстория?

O – Objective (Цель): что конкретно вы хотите получить? Не просто «напиши пост», а «увеличить продажи кофе на вынос» или «привлечь студентов».

S – Style (Стиль): подражание известному автору, жанру, бренду. «В стиле Ильфа и Петрова», «как пост в сети у блогера-миллионника», «сухим техническим языком».

T – Tone (Тон): эмоциональная окраска: дружелюбный, дерзкий, официальный, ироничный.

A – Audience (Аудитория): кому это предназначено? Студентам, пенсионерам, айтишникам? Это сильно влияет на лексику.

R – Response (Формат ответа): структура выдачи. Список, таблица, эссе, JSON, код с комментариями.

Давайте перепишем наш плохой промпт с использованием CO-STAR.

Контекст: мы открываем маленькую кофейню «Уголок» рядом с университетом. Кофе варим на профессиональной машине, есть веганские десерты. Конкуренты – Робуст и Урбанкофе. Мы хотим выделиться уютом и возможностью посидеть с ноутбуком.

Цель: написать пост для сети, который привлечёт студентов в первую неделю работы. Акцент – на бесплатный Wi-Fi и розетки у каждого столика.

Стиль: современный молодёжный, с лёгким юмором, как у популярных городских пабликов.

Тон: дружеский, чуть хулиганский, без пафоса.

Аудитория: студенты 18–24 лет, которые пьют кофе между парами и часто работают/учатся в кафе.

Формат: пост длиной 150–200 слов, 3–5 предложений, хештеги, призыв к действию (например, скидка по студенческому).

Теперь посмотрим, что выдаст нейросеть.

Промпт (собранный):

«Напиши пост для сети. Контекст: новая кофейня "Уголок" рядом с университетом, есть веганские десерты, дорогой кофе. Цель: привлечь студентов, подчеркнуть наличие бесплатного Wi-Fi и розеток у каждого столика. Стиль: современный молодёжный, как у городских пабликов. Тон: дружеский, с лёгким юмором. Аудитория: студенты 18–24. Формат: 150–200 слов, закончи призывом к действию про скидку по студенческому, добавь хештеги.»

Ответ нейросети:

«Студенты, этот пост для вас! Представляем "Уголок" – место, где можно не только зарядиться кофеином, но и воткнуть ноутбук в розетку (да-да, у каждого столика!). Забыли зарядку? Не беда – у нас есть пауэрбанки напрокат. Варим кофе на профильной машине, так что капучино получится лучше, чем в Робуст, а веганский чизкейк просто тает во рту. Работаешь над дипломом? Приходи, у нас тихо, Wi-Fi летает. И да, по студенческому – скидка 10% на весь день. Ждём в "Уголке"!

#кофейня #студенты #скидка #университет #wi-fi»

Согласитесь, это уже не шаблон, а живой пост, который действительно может сработать.

Лайфхак: не обязательно каждый раз писать все шесть пунктов в одну строку. Можно просто мысленно (или в черновике) пробежаться по списку и убедиться, что ничего не забыли. Для сложных задач полезно оформлять промпт как структурированный документ с заголовками.

Модификации CO-STAR и другие фреймворки

CO-STAR – не единственный способ. Иногда используют более простые варианты:

RTF (Role, Task, Format): кто ты, что сделать, как оформить. Подходит для быстрых задач.

TAG (Task, Action, Goal): задача, действие, цель. Хорошо для постановки бизнес-задач.

CREATE (C ontext, R ole, E xamples, A udience, T one, E moji): вариация с акцентом на примеры и эмоции.

Но CO-STAR остаётся золотым стандартом, потому что он покрывает все критические аспекты.

Пример использования RTF.

Роль: ты профессиональный копирайтер. Задача: написать 5 заголовков для статьи о пользе медитации. Формат: список, каждый заголовок с новой строки.

Быстро и эффективно.

Как правильно давать примеры (Few-shot внутри промпта)

Иногда одного описания недостаточно. Особенно если задача нестандартная. Тогда мы показываем нейросети примеры того, что хотим получить. Это называется few-shot learning.

Пример: допустим, нам нужно, чтобы нейросеть переделывала скучные названия товаров в креативные для интернет-магазина.

Промпт: перепиши названия товаров в креативном стиле.

Вот примеры.

Обычное: «Кроссовки мужские белые Nike Air Max». Креативное: «Облака на ногах: Nike Air Max для тех, кто парит над асфальтом».

Обычное: «Кофеварка капельная Philips». Креативное: «Утренний ритуал: Philips, который сварит кофе быстрее, чем вы проснётесь».

Теперь сделай так же для:

Обычное: «Ноутбук Dell XPS 13 серебристый».

Нейросеть увидит паттерн и создаст нечто подобное.

Лайфхак: давайте 2–3 примера, не больше. И старайтесь, чтобы примеры были разнообразными, показывали разные приёмы. Это поможет модели обобщить задачу, а не просто скопировать шаблон.

Вредные советы: как гарантированно провалить промпт.

Чтобы закрепить материал, вот список анти-паттернов, которые превратят любой промпт в тыкву:

1.Неопределённость: «Сделай красиво». Что такое красиво? Для одного – минимализм, для другого – гламур.