Тимур Казанцев – Нейросети. Выстрой свою систему из 5 уровней автоматизации (страница 4)

Шрифт

• крупные модели стоят десятки-сотни миллионов долларов на обучение[2];

• дата-центры уже потребляют около 415 ТВт·ч в год – примерно 1,5% мировой электроэнергии, и эта цифра растёт примерно на 12% в год[3];

• только в США дата-центры уже вышли на 4–5% потребления всей электроэнергии страны и могут подняться до 7–12% к концу десятилетия[4];

• международные отчёты предсказывают, что спрос на электричество для дата-центров и ИИ может удвоиться или больше к 2030 году[5].

Это значит, что ИИ – не просто про «умные ответы», а про то, кто контролирует энергетику, чипы и инфраструктуру, и как обычный человек вписывается в эту картину.

Если вы поймёте, как устроена эта пирамида, вам будет проще:

• трезво оценивать новости про ИИ и не вестись на хайп;

• понимать, где настоящие точки роста и денег;

• объяснять заказчикам/клиентам, за что они платят, когда «покупают ИИ»;

• видеть риски и возможности на горизонте 5–10 лет.

Пятиуровневая пирамида инфраструктуры ИИ

Я предлагаю смотреть на индустрию ИИ как на пятиуровневую пирамиду.

Снизу вверх:

1. Электроэнергия

2. Видеокарты (GPU), чипы и дата-центры

3. Модели (LLM и другие)

4. Приложения

5. Пользователи

Если смотреть на новости про ИИ только с пользовательского уровня, может показаться, что вся эта пирамида строится ради удобного чата и красивых картинок.

На самом деле крупные игроки вкладывают миллиарды долларов не только ради того, чтобы вам было проще переписать письмо.

Ставка делается в том числе на гонку к более общим и мощным системам – вплоть до уровней, которые в публичной дискуссии называют AGI (общий искусственный интеллект сравнимый с возможностями человеческого разума) или супер-интеллектом (значительно превосходящим человеческий разум).

Каждый новый процент точности модели, каждый шаг в сторону более устойчивого «понимания» мира опирается:

• на дополнительные мегаватты электроэнергии;

• на всё более плотные кластеры GPU и специализированных чипов;

• на растущие дата-центры и сложную сетевую инфраструктуру.

Снаружи это выглядит как очередное обновление нейросети.

Внутри – как стратегическая игра государств и корпораций за контроль над энергетикой, вычислениями и данными, которые могут привести их ближе к системам уровня AGI.

Но здесь есть важный разворот для читателя этой книги.

Для вас принципиально не то, “кто именно первым добежит до AGI”, а то, где вы находитесь в этой пирамиде:

• вы просто пользователь красивого приложения;

• вы человек, который понимает, на каких слоях всё это стоит;

• или вы тот, кто учится строить свои продукты и системы поверх этой инфраструктуры – так, чтобы не оказаться заложником одной кнопки, одного провайдера и одного сценария будущего.

Эта глава – про то, как увидеть в новостях про «чипы», «дата-центры», «энергетический кризис из-за ИИ» не абстрактный фон, а карту сил, на которой вам ещё жить и работать.

А разговор про AGI здесь нужен только для одного: показать, что гонка за «будущим сверх-интеллектом» уже сегодня меняет физическую и политическую реальность, в которой вы делаете бизнес, строите карьеру и принимаете решения.

При обсуждениях нейросетей и ИИ, мы привыкли начинать сверху пирамиды – с пользователя. Но чтобы понять, откуда берётся ценность и за что идёт борьба, начнём, наоборот, снизу.

ИИ – это в первую очередь про электроэнергию.

Каждый ваш запрос к нейросети – это не просто строка текста. Это:

• тысячи-миллионы операций на графических процессорах;

• серверы, которые нужно питать и охлаждать;

• сети, которые нужно поддерживать.

По оценкам международных энергетических агентств:

• в 2024 году дата-центры глобально потребляли 415 ТВт·ч в год[6],

• это примерно электропотребление крупной развитой страны,

• к 2030 году потребление может удвоиться и более, приближаясь к 900–1000 ТВт·ч, что сопоставимо с потреблением целых регионов мира.

Ключевой парадокс:

ИИ продаётся как «цифровая магия», но за кулисами – это очень материальная история про мегаватты, кабели, бетон, территорию и воду для охлаждения.

Отсюда несколько выводов:

• Страны с дешёвой и устойчивой генерацией (гидро, атом, геотермальная) получают стратегическое преимущество[7].

• Регионы с дефицитом энергии будут вынуждены ограничивать развитие ИИ-инфраструктуры или импортировать мощности.

• Крупные ИИ-компании уже заключают прямые контракты на поставку энергии и даже инвестируют в собственные энергетические проекты, включая атомную генерацию и SMR (малые модульные реакторы).

По сути, электричество становится тем, чем нефть была в XX веке – базой любой технологической гонки.

Если электричество – это «нефть», то GPU и дата-центры – это нефтяные вышки и НПЗ.

Сегодня рынок дата-центровых GPU растёт двузначными темпами, оценивается в сотни миллиардов долларов, и к 2030 году может практически удвоиться[8].

При этом на рынке специализированных чипов для ИИ (GPU, ускорители) доминирует NVIDIA, контролируя более 90% сегмента дата-центровых GPU в ключевых отчётах по 2024–2025 годам[9]. На этом фоне неудивительно, что NVIDIA недавно стала крупнейшей компанией в мире по рыночной капитализации, превысив отметку в 5 трлн долларов и обогнав предыдущих лидеров, вроде Apple и Microsoft.

Что это означает:

• Любая крупная компания, которая хочет обучать и запускать свои модели, оказывается в очереди за чипами.

• Пропускная способность этой «очереди» определяется не только деньгами, но и политикой экспортного контроля США и их союзников[10].

• NVIDIA фактически стала инфраструктурной компанией нового типа: она не продаёт конечный продукт пользователю, но контролирует критически важный слой – тот, через который проходит всё остальное.

Спрос настолько велик, что:

• компании строят целые дата-центровые кластеры под ИИ-сервера;

• капитальные затраты на ИТ-инфраструктуру (серверы, сети, системы хранения) занимают более 70–80% расходов на новые дата-центры[11];

• любая задержка в поставке GPU может стоить компаниям миллионы долларов упущенной выручки.

Война за GPU – это уже не метафора, а ежедневная реальность: топ-менеджеры договариваются о партиях чипов, как раньше договаривались о доступе к месторождениям.

На третьем уровне находятся модели – те самые большие языковые модели (LLM – large language models) вроде ChatGPT или Claude, Gemini, DeepSeek, QWEN, а также модели для работы с изображениями (которые “видят” и генерируют картинки и видео: Midjourney, Sora, VEO, Kling, NanoBanana и др), модели для звука (распознавание и синтез речи, музыка: ElevenLabs, Suno, и др) и мультимодальные модели, которые одновременно воспринимают и комбинируют текст, изображение, звук и иногда видео.

Чтобы обучить одну фронтирную модель:

3 4 5 Вперед