Andy Smith – Как правильно пользоваться ИИ в 2026 году (страница 1)
Andy Smith
Как правильно пользоваться ИИ в 2026 году
Предисловие
Для кого эта книга и зачем она написана
Эта книга написана для людей, которые хотят разобраться в искусственном интеллекте без лишнего шума. Не для программистов, не для инженеров, не для тех, кто следит за каждым обновлением каждой модели. Она для тех, кто использует компьютер, смартфон и интернет в повседневной жизни и работе, и кто понимает, что мир изменился, но пока не вполне понимает, как именно и что с этим делать.
Книг об искусственном интеллекте на рынке уже десятки. Проблема большинства из них сводится к одному из двух полюсов: либо безудержный восторг перед технологией, от которого читатель выходит с ощущением, что завтра наступит утопия, либо тревожные прогнозы о том, как ИИ отнимет все рабочие места и поработит человечество. Ни то, ни другое не помогает решить конкретную задачу в понедельник утром.
Эта книга устроена иначе. Она построена на трёх принципах. Первый: только факты и проверяемые данные, никаких прогнозов о сингулярности и никаких обещаний, что ИИ решит все проблемы. Второй: практическая применимость каждой главы. Прочитав главу, читатель должен уметь сделать что-то конкретное, чего не умел раньше. Третий: честность о границах. ИИ — мощный инструмент, но у него есть вполне определённые ограничения, и понимание этих ограничений не менее важно, чем понимание возможностей.
Предполагаемый читатель — человек, который уже слышал о ChatGPT, возможно, пробовал задать ему пару вопросов, но не продвинулся дальше поверхностного знакомства. Или профессионал, который чувствует давление: коллеги всё чаще упоминают нейросети, конкуренты ускоряются, а ощущение отставания нарастает. Или студент, который хочет научиться учиться эффективнее. Или предприниматель, который ищет реальные способы сократить издержки и ускорить процессы.
Книгу можно читать последовательно — она выстроена от базовых понятий к продвинутым техникам. Но каждая глава достаточно автономна: если читатель уже понимает, как работают языковые модели, можно пропустить вторую главу и перейти сразу к промптингу. Если интересует только работа с текстом — открыть седьмую главу. Приложения в конце книги содержат словарь терминов, готовые шаблоны промптов и чек-листы, которые можно использовать как справочник.
Все данные, названия продуктов, цены и характеристики в этой книге актуальны на конец апреля 2026 года. Мир ИИ меняется быстрее, чем любая другая технологическая область в истории. Модели, которые были лучшими полгода назад, уступают место новым. Цены падают. Возможности расширяются. Но фундаментальные принципы работы с ИИ — формулировка задач, проверка результатов, критическое мышление — остаются стабильными. Именно им эта книга уделяет главное внимание.
Глава 1. Почему ИИ стал новой грамотностью
От лабораторного эксперимента к повседневному инструменту
В ноябре 2022 года произошло событие, которое не было ни запуском ракеты, ни выходом нового смартфона, но которое изменило повседневную жизнь сотен миллионов людей быстрее, чем любое технологическое нововведение в новейшей истории. Компания OpenAI выпустила ChatGPT — чат-бот на основе языковой модели GPT-3.5. За первые два месяца его аудитория превысила 100 миллионов пользователей. Для сравнения: TikTok достигал этой отметки девять месяцев, Instagram — два с половиной года.
Но скорость распространения — лишь внешний показатель. Существеннее другое: впервые в истории технология, которая десятилетиями существовала исключительно в научных лабораториях и отчётах корпоративных R&D-отделов, стала доступна любому человеку с интернет-подключением. Не нужно было ничего устанавливать, не нужно было разбираться в программировании, не нужно было даже платить. Достаточно было открыть браузер, ввести вопрос на обычном языке и получить осмысленный ответ.
Чтобы понять масштаб перемен, стоит оглянуться назад. История искусственного интеллекта насчитывает более семидесяти лет. Сам термин был введён в 1956 году на конференции в Дартмуте, где группа математиков и инженеров решила, что создание мыслящей машины — задача, которую можно решить за одно лето. Это оказалось несколько оптимистичнее реальности.
Следующие десятилетия были отмечены чередой подъёмов и разочарований, которые исследователи называют «зимами ИИ». В 1960-е годы первые программы научились играть в шашки и доказывать теоремы — и казалось, что до общего интеллекта остался один шаг. Затем стало ясно, что реальный мир неизмеримо сложнее формальных систем, и финансирование исследований сократилось. В 1980-е годы произошёл новый всплеск интереса, связанный с экспертными системами — программами, которые кодировали знания специалистов в виде набора правил. Но и этот подход упёрся в стену: реальный мир не укладывается в конечный набор правил «если — то».
Подлинный перелом наступил с развитием нейронных сетей и, в особенности, с появлением метода глубокого обучения в конце 2000-х — начале 2010-х годов. Идея нейронных сетей, вдохновлённая структурой биологического мозга, была известна с 1940-х годов, но для её реализации не хватало ни данных, ни вычислительных мощностей. К 2010-м годам оба условия были выполнены: интернет создал океан данных, а графические процессоры (GPU), изначально разработанные для видеоигр, оказались идеально приспособлены для массивно-параллельных вычислений, которых требуют нейросети.
В 2012 году нейронная сеть AlexNet, разработанная группой исследователей из Торонтского университета, выиграла конкурс по распознаванию изображений ImageNet с результатом, на порядок превосходящим все предыдущие методы. Это было не постепенное улучшение, а скачок — и он перевернул отрасль. Все крупные технологические компании — Google, Facebook, Microsoft, Amazon, Apple — начали агрессивно инвестировать в исследования глубокого обучения, переманивать учёных из университетов и скупать ИИ-стартапы.
Трансформер: архитектура, изменившая всё
В 2017 году группа исследователей из Google опубликовала научную статью с названием, которое впоследствии стало одним из самых цитируемых в истории компьютерных наук: «Attention Is All You Need» — «Всё, что нужно, — это внимание». В статье описывалась новая архитектура нейронных сетей — трансформер.
До появления трансформеров языковые модели обрабатывали текст последовательно, слово за словом, как человек, читающий книгу от начала до конца. Трансформер изменил этот подход: механизм «внимания» (attention) позволил модели одновременно учитывать связи между всеми словами в тексте, независимо от расстояния между ними. Это означало, что модель могла «видеть» весь контекст сразу, а не забывать начало предложения к его концу.
Именно на базе трансформера были построены все ключевые языковые модели последующих лет. GPT (Generative Pre-trained Transformer) от OpenAI, BERT от Google, а затем и все их потомки — это вариации одной и той же фундаментальной архитектуры. GPT-2 в 2019 году продемонстрировал способность генерировать связные тексты длиной в несколько абзацев — настолько убедительные, что OpenAI поначалу отказалась публиковать модель целиком, опасаясь злоупотреблений. GPT-3 в 2020 году увеличил количество параметров модели до 175 миллиардов (для сравнения: GPT-2 имел 1,5 миллиарда) и показал нечто, удивившее даже создателей: модель, обученная просто предсказывать следующее слово в тексте, научилась переводить, писать код, решать математические задачи и вести диалог — хотя её никто этому специально не обучал.
Ноябрь 2022: ChatGPT и взрывной рост
ChatGPT, запущенный 30 ноября 2022 года, не был технологическим прорывом в чистом виде. Модель GPT-3.5, лежавшая в его основе, существовала и раньше и была доступна через API — программный интерфейс для разработчиков. Прорыв был в другом: ChatGPT обернул сложную технологию в простейший интерфейс — окно чата. Любой человек мог написать вопрос на своём языке и получить ответ. Не нужно было знать, что такое API, токен или трансформер. Интерфейс был таким же привычным, как мессенджер.
То, что последовало за этим запуском, не имело аналогов в истории технологий. В январе 2023 года ChatGPT ежедневно использовали более 13 миллионов человек. К марту 2023 года OpenAI выпустила GPT-4 — модель, которая могла обрабатывать не только текст, но и изображения, сдавала экзамен на адвоката в топ-10 процентов результатов и решала олимпиадные задачи по математике. Google экстренно запустил свой ответ — Bard (позже переименованный в Gemini). Anthropic, компания, основанная бывшими сотрудниками OpenAI, выпустила Claude. Microsoft инвестировал в OpenAI 10 миллиардов долларов и начал интеграцию ИИ во все свои продукты — от Office до поисковика Bing. Meta (бывший Facebook) открыл код своей языковой модели Llama.
К 2024 году гонка набрала полную мощность. Каждые несколько недель выходила новая модель, превосходящая предыдущую. Появились мультимодальные модели, понимающие одновременно текст, изображения, аудио и видео. Появились «рассуждающие» (reasoning) модели, которые перед ответом проходят через цепочку внутренних рассуждений. Появились ИИ-агенты, способные не просто отвечать на вопросы, а выполнять сложные многоэтапные задачи: бронировать билеты, писать и запускать код, управлять браузером.