Александр Костин – Нейросети в инвестициях: как зарабатывать с ИИ на фондовом рынке (страница 2)

Шрифт

Частота данных и цена шума

Высокочастотные данные кажутся привлекательными: больше точек, больше информации. На практике они несут больше шума и требуют гораздо более жёсткого контроля издержек и ошибок исполнения. Для большинства частных инвесторов дневные или даже недельные данные оказываются более устойчивыми.

Частота должна соответствовать горизонту решений. Использовать минутные данные для долгосрочного портфеля – типичная ошибка, ведущая к переобучению.

Переобучение как следствие плохих данных

Когда модель начинает подстраиваться под случайные колебания, проблема часто не в алгоритме, а в структуре данных. Избыточное количество признаков, коррелированные ряды, короткий период наблюдений – всё это усиливает риск переобучения.

Чем чище и проще данные, тем выше шанс, что модель уловит действительно значимую зависимость, а не шум.

Хранение и версии данных

Финансовый проект без системы хранения данных быстро превращается в хаос. Минимально необходимо сохранять исходные данные отдельно от обработанных, фиксировать версии и не перезаписывать историю.

Это кажется избыточным, пока модель работает. Но как только результат ухудшается, без истории изменений невозможно понять причину.

Базовые признаки как фундамент

Простейшие производные от цен – доходности, волатильность, корреляции – часто оказываются полезнее сложных экзотических признаков. Они устойчивы, интерпретируемы и хорошо масштабируются на разные рынки.

Стремление сразу добавить десятки индикаторов обычно снижает качество модели, а не повышает его.

Внешние данные: осторожно и дозированно

Календарь событий, отчётность, макропоказатели могут улучшить модель, если используются как контекст, а не как прямой сигнал. Важно всегда задавать вопрос: как именно эта информация могла быть использована участниками рынка в тот момент времени.

Если на этот вопрос нет чёткого ответа, данные лучше исключить.

Паспорт датасета как привычка

Полезная практика – создавать краткий «паспорт» каждого набора данных: источник, период, частота, основные преобразования, ограничения. Это дисциплинирует мышление и защищает от самообмана.

Главный вывод этой главы прост и неприятен: нейросети не исправляют плохие данные. Они лишь делают ошибки более убедительными. Тот, кто научился отбирать и проверять данные, уже получил значительную часть преимущества ещё до начала моделирования.

Глава 3. Как ИИ делает прогнозы рынка и почему ошибается

Финансовый рынок часто представляют как задачу предсказания: если собрать достаточно данных и применить достаточно «умную» модель, будущее будто бы должно стать яснее. Именно здесь нейросети выглядят особенно соблазнительно. Они умеют находить сложные зависимости, работать с нелинейностями и адаптироваться к большим массивам информации. Однако рынок – это не физический процесс с устойчивыми законами, а социальная система, в которой правила постоянно меняются. Понимание этого – ключ к тому, чтобы не переоценить возможности ИИ.

Рынок как система с меняющимися режимами

Одна из главных причин ошибок прогнозирования – игнорирование рыночных режимов. Периоды роста, падения, бокового движения, высокой или низкой волатильности принципиально различаются по своей структуре. Модель, обученная на спокойном рынке, может полностью потерять адекватность в кризисной фазе.

Нейросеть не «знает», что режим сменился. Она лишь продолжает применять выученные зависимости, пока статистика не станет явно противоречивой. Именно поэтому даже хорошо протестированные модели могут резко деградировать без видимых причин.

Корреляция и причинность

ИИ великолепно находит корреляции. Проблема в том, что рынок переполнен случайными совпадениями. Если в данных достаточно измерений, всегда найдётся признак, который «объясняет» движение цены в прошлом. Это не означает, что он имеет причинное влияние.

Финансовые модели чаще всего работают не с причинами, а с устойчивыми статистическими эффектами. Как только эффект становится массово известным или условия меняются, он исчезает. Нейросеть не предупреждает об этом заранее.

Утечка будущей информации

Одна из самых опасных и распространённых ошибок – обучение модели на данных, которые в реальности были бы недоступны в момент принятия решения. Это может быть отчётность, пересчитанная задним числом, индикаторы, использующие будущее значение цены, или неправильное выравнивание временных рядов.

В тестах такие модели выглядят блестяще. В реальности они перестают работать сразу. Причина не в «плохом рынке», а в том, что модель изначально опиралась на информацию из будущего.

Проверка по времени, а не случайным образом

Финансовые данные нельзя перемешивать случайным образом, как это делают в классических задачах машинного обучения. Единственно корректная схема – разделение по времени: обучение на прошлом, проверка на более позднем периоде, тестирование на самом свежем отрезке.

Если модель не выдерживает такой проверки, она не готова к реальному использованию, как бы хорошо ни выглядели метрики.

Нестабильность признаков

Многие признаки «умирают» первыми. То, что работало несколько лет, может перестать иметь значение за месяцы. Особенно это касается производных от цены и объёма, которые быстро адаптируются рынком.

ИИ не чувствует этой деградации сам по себе. Без регулярного контроля модель продолжает использовать устаревшие сигналы, постепенно теряя качество.

Иллюзия доказательства через графики

Красивая кривая доходности – слабый аргумент. Графики легко вводят в заблуждение, особенно если не показаны альтернативные сценарии и периоды неудач. Нейросети часто демонстрируют «идеальные» линии роста именно потому, что подстроены под прошлое.

В финансах важнее не максимальная доходность, а поведение стратегии в неблагоприятных условиях.

Реальные издержки как источник ошибок

Комиссии, проскальзывание, налоги и ограничения ликвидности могут полностью уничтожить математическое преимущество модели. Многие прогнозы выглядят прибыльными до тех пор, пока не добавлены реальные издержки.

ИИ не учитывает их автоматически. Если они не заложены в цель и тестирование, прогноз становится теоретическим упражнением.

Сигнал против шума

Одна из самых сложных задач – отличить слабый, но реальный сигнал от случайного шума. Нейросети склонны «видеть смысл» даже там, где его нет. Чем сложнее модель, тем выше этот риск.

Парадокс в том, что упрощение модели часто повышает её устойчивость. Меньше параметров – меньше способов подогнать прошлое.

Как формулировать цель прогноза

Попытка предсказывать точную цену обычно наименее полезна. Гораздо практичнее работать с вероятностями неблагоприятных исходов, диапазонами доходности или оценкой риска. Такие цели лучше согласуются с реальными инвестиционными решениями.

ИИ становится полезным, когда отвечает на вопрос «насколько риск сейчас выше обычного», а не «какая будет цена завтра».

Чек-лист ошибок прогнозирования

Если модель показывает слишком стабильную доходность – это повод насторожиться.

Если результат сильно зависит от одного признака – риск переобучения высок.

Если прогноз нельзя объяснить простыми словами – контроль потерян.

Если модель не переживает смену рыночного режима – она опасна.

Главный вывод этой главы заключается в следующем: нейросети не ошибаются случайно, они ошибаются системно. Понимание того, почему и где они дают сбой, важнее, чем попытка выжать из них ещё один процент доходности. Именно это понимание превращает ИИ из источника иллюзий в рабочий инструмент инвестора.

Глава 4. Метрики: как оценивать модели, чтобы не обмануться

В финансах нет ничего опаснее, чем «хорошие результаты», полученные неправильным способом. Нейросети особенно усиливают эту проблему: они умеют оптимизировать практически любую метрику, которую вы им зададите. Вопрос лишь в том, отражает ли эта метрика реальную ценность для инвестора или создаёт красивую, но пустую иллюзию успеха. Понимание того, что именно измерять и как интерпретировать результаты, – ключевой навык при работе с ИИ в деньгах.

Метрики прогноза и их ограничения

Первая группа показателей относится к качеству прогноза как такового. Ошибка, точность направления, калибровка вероятностей – всё это полезно, но лишь в ограниченном контексте. Низкая ошибка прогноза цены не означает прибыльность стратегии. Модель может отлично угадывать мелкие колебания и при этом терять деньги из-за издержек или неправильных решений.

Особенно коварны метрики направления движения. Угадать рост или падение чуть чаще, чем в половине случаев, кажется успехом. На практике это может не иметь никакой ценности, если величина движений асимметрична или если убытки превышают прибыли.

Метрики стратегии: ближе к деньгам

Куда важнее показатели, связанные с поведением стратегии в целом. Доходность без контекста почти ничего не говорит. Она должна рассматриваться вместе с риском, просадками и стабильностью результатов.

Просадка – один из самых недооценённых параметров. Именно она определяет, сможет ли инвестор психологически и финансово выдержать стратегию. Две системы с одинаковой средней доходностью могут радикально отличаться по качеству именно из-за глубины и длительности просадок.

Волатильность и соотношение доходности к риску помогают понять, насколько «дорого» обходится каждый процент прибыли. Нейросети часто увеличивают доходность ценой резкого роста нестабильности – и без правильных метрик это остаётся незаметным.

1 2 3 Вперед