Тимур Казанцев – Нейросети. Выстрой свою систему из 5 уровней автоматизации (страница 4)
• крупные модели стоят десятки-сотни миллионов долларов на обучение[2];
• дата-центры уже потребляют около 415 ТВт·ч в год – примерно 1,5% мировой электроэнергии, и эта цифра растёт примерно на 12% в год[3];
• только в США дата-центры уже вышли на 4–5% потребления всей электроэнергии страны и могут подняться до 7–12% к концу десятилетия[4];
• международные отчёты предсказывают, что спрос на электричество для дата-центров и ИИ может удвоиться или больше к 2030 году[5].
Это значит, что ИИ – не просто про «умные ответы», а про то, кто контролирует энергетику, чипы и инфраструктуру, и как обычный человек вписывается в эту картину.
Если вы поймёте, как устроена эта пирамида, вам будет проще:
• трезво оценивать новости про ИИ и не вестись на хайп;
• понимать, где настоящие точки роста и денег;
• объяснять заказчикам/клиентам, за что они платят, когда «покупают ИИ»;
• видеть риски и возможности на горизонте 5–10 лет.
Пятиуровневая пирамида инфраструктуры ИИ
Я предлагаю смотреть на индустрию ИИ как на пятиуровневую пирамиду.
Снизу вверх:
1. Электроэнергия
2. Видеокарты (GPU), чипы и дата-центры
3. Модели (LLM и другие)
4. Приложения
5. Пользователи
Если смотреть на новости про ИИ только с пользовательского уровня, может показаться, что вся эта пирамида строится ради удобного чата и красивых картинок.
На самом деле крупные игроки вкладывают миллиарды долларов не только ради того, чтобы вам было проще переписать письмо.
Ставка делается в том числе на гонку к более общим и мощным системам – вплоть до уровней, которые в публичной дискуссии называют AGI (общий искусственный интеллект сравнимый с возможностями человеческого разума) или супер-интеллектом (значительно превосходящим человеческий разум).
Каждый новый процент точности модели, каждый шаг в сторону более устойчивого «понимания» мира опирается:
• на дополнительные мегаватты электроэнергии;
• на всё более плотные кластеры GPU и специализированных чипов;
• на растущие дата-центры и сложную сетевую инфраструктуру.
Снаружи это выглядит как очередное обновление нейросети.
Внутри – как стратегическая игра государств и корпораций за контроль над энергетикой, вычислениями и данными, которые могут привести их ближе к системам уровня AGI.
Но здесь есть важный разворот для читателя этой книги.
Для вас принципиально не то, “кто именно первым добежит до AGI”, а то, где вы находитесь в этой пирамиде:
• вы просто пользователь красивого приложения;
• вы человек, который понимает, на каких слоях всё это стоит;
• или вы тот, кто учится строить свои продукты и системы поверх этой инфраструктуры – так, чтобы не оказаться заложником одной кнопки, одного провайдера и одного сценария будущего.
Эта глава – про то, как увидеть в новостях про «чипы», «дата-центры», «энергетический кризис из-за ИИ» не абстрактный фон, а карту сил, на которой вам ещё жить и работать.
А разговор про AGI здесь нужен только для одного: показать, что гонка за «будущим сверх-интеллектом» уже сегодня меняет физическую и политическую реальность, в которой вы делаете бизнес, строите карьеру и принимаете решения.
При обсуждениях нейросетей и ИИ, мы привыкли начинать сверху пирамиды – с пользователя. Но чтобы понять, откуда берётся ценность и за что идёт борьба, начнём, наоборот, снизу.
ИИ – это в первую очередь про электроэнергию.
Каждый ваш запрос к нейросети – это не просто строка текста. Это:
• тысячи-миллионы операций на графических процессорах;
• серверы, которые нужно питать и охлаждать;
• сети, которые нужно поддерживать.
По оценкам международных энергетических агентств:
• в 2024 году дата-центры глобально потребляли 415 ТВт·ч в год[6],
• это примерно электропотребление крупной развитой страны,
• к 2030 году потребление может удвоиться и более, приближаясь к 900–1000 ТВт·ч, что сопоставимо с потреблением целых регионов мира.
Ключевой парадокс:
ИИ продаётся как «цифровая магия», но за кулисами – это очень материальная история про мегаватты, кабели, бетон, территорию и воду для охлаждения.
Отсюда несколько выводов:
• Страны с дешёвой и устойчивой генерацией (гидро, атом, геотермальная) получают стратегическое преимущество[7].
• Регионы с дефицитом энергии будут вынуждены ограничивать развитие ИИ-инфраструктуры или импортировать мощности.
• Крупные ИИ-компании уже заключают прямые контракты на поставку энергии и даже инвестируют в собственные энергетические проекты, включая атомную генерацию и SMR (малые модульные реакторы).
По сути, электричество становится тем, чем нефть была в XX веке – базой любой технологической гонки.
Если электричество – это «нефть», то GPU и дата-центры – это нефтяные вышки и НПЗ.
Сегодня рынок дата-центровых GPU растёт двузначными темпами, оценивается в сотни миллиардов долларов, и к 2030 году может практически удвоиться[8].
При этом на рынке специализированных чипов для ИИ (GPU, ускорители) доминирует NVIDIA, контролируя более 90% сегмента дата-центровых GPU в ключевых отчётах по 2024–2025 годам[9]. На этом фоне неудивительно, что NVIDIA недавно стала крупнейшей компанией в мире по рыночной капитализации, превысив отметку в 5 трлн долларов и обогнав предыдущих лидеров, вроде Apple и Microsoft.
Что это означает:
• Любая крупная компания, которая хочет обучать и запускать свои модели, оказывается в очереди за чипами.
• Пропускная способность этой «очереди» определяется не только деньгами, но и политикой экспортного контроля США и их союзников[10].
• NVIDIA фактически стала инфраструктурной компанией нового типа: она не продаёт конечный продукт пользователю, но контролирует критически важный слой – тот, через который проходит всё остальное.
Спрос настолько велик, что:
• компании строят целые дата-центровые кластеры под ИИ-сервера;
• капитальные затраты на ИТ-инфраструктуру (серверы, сети, системы хранения) занимают более 70–80% расходов на новые дата-центры[11];
• любая задержка в поставке GPU может стоить компаниям миллионы долларов упущенной выручки.
Война за GPU – это уже не метафора, а ежедневная реальность: топ-менеджеры договариваются о партиях чипов, как раньше договаривались о доступе к месторождениям.
На третьем уровне находятся модели – те самые большие языковые модели (LLM – large language models) вроде ChatGPT или Claude, Gemini, DeepSeek, QWEN, а также модели для работы с изображениями (которые “видят” и генерируют картинки и видео: Midjourney, Sora, VEO, Kling, NanoBanana и др), модели для звука (распознавание и синтез речи, музыка: ElevenLabs, Suno, и др) и мультимодальные модели, которые одновременно воспринимают и комбинируют текст, изображение, звук и иногда видео.
Чтобы обучить одну фронтирную модель: