Ярослав Суков – Цена реальности: Индекс потребительских цен (страница 5)
2. Региональный арбитраж.
Официальный ИПЦ часто публикуется с задержкой и в агрегированном виде. Но существуют региональные индексы (например, CPI для отдельных городов США, данные Росстата по регионам РФ). Если вы можете отследить, что инфляция в регионе, где сосредоточены ваши активы или обязательства, отличается от федеральной, вы можете:
- Хеджировать региональные риски через инструменты, привязанные к федеральному ИПЦ, с учётом спреда.
- В случае инвестиций в недвижимость или бизнес в конкретном регионе — корректировать ожидания доходности с учётом реальной региональной инфляции.
3. Построение персонального индекса и стратегий хеджирования.
Продвинутые инвесторы и финансовые советники уже переходят к персонализированной инфляции. Алгоритм:
- Собрать данные о личных расходах клиента за последние 12–24 месяца.
- Разбить по категориям, соответствующим структуре ИПЦ (или более детальным).
- Присвоить каждой категории веса.
- Ежемесячно обновлять цены по категориям, используя открытые источники (официальная статистика по категориям, альтернативные данные).
- Получить персональный индекс инфляции.
Если персональная инфляция систематически выше официальной, клиенту требуется более агрессивная защита: увеличение доли реальных активов, использование товарных фьючерсов, пересмотр структуры потребления. Если ниже — можно позволить себе больше инструментов с фиксированной доходностью.
Итог:
Потребительская корзина — это попытка остановить мгновение. Она фиксирует структуру потребления «среднего» человека в прошедшем периоде и объявляет её нормой. Но экономика — это живой поток, а люди — не средние. Чем динамичнее мир, тем больше разрыв между корзиной и реальностью. Тот, кто научится видеть реальную структуру потребления быстрее, чем статистическое ведомство, получает не просто знание, а власть.
Глава 5. Сбор данных: от магазинов до алгоритмов
Как рождается число, которое меняет мир
ИПЦ начинается не в кабинетах чиновников и не в эконометрических моделях. Он начинается на полке магазина, в кафе, в парикмахерской. В маленькой записной книжке сотрудника статистического ведомства, который фиксирует цену на говяжий фарш в третьем супермаркете на окраине города. Или, в наше время, в дата-центре, где серверы каждую минуту проглатывают миллионы цен с сайтов ритейлеров.
Эта глава — о том, как из хаоса миллиардов ежедневных транзакций рождается одна цифра, которую ждёт весь мир. Мы увидим, как технологии меняют правила игры, и почему «ошибка измерения» — это не технический сбой, а фундаментальная проблема философии познания.
5.1 Методы наблюдения цен: от карандаша до API
Долгие десятилетия сбор цен был работой, напоминающей подвиг. Сотрудники статистических бюро (в США их называют *data collectors*) выходили на маршруты, вооружённые планшетами или даже бумажными бланками. Они ходили по одним и тем же магазинам, в одни и те же дни месяца, чтобы зафиксировать цену на конкретный товар с чёткими характеристиками: «молоко пастеризованное, 2,5% жирности, бренд Х, объём 1 л». Если товар исчезал с полки, начинался танец с поиском аналога.
Традиционные методы.
До недавнего времени существовало три основных способа сбора цен:
1. Личное наблюдение. Самый точный и самый дорогой метод. Сотрудник физически идёт в торговую точку, записывает цену на ценнике. Плюс: видит реальную ситуацию (скидки, акции, пустые полки). Минус: масштабируемость ограничена, охват не может быть полным.
2. Телефонный опрос. Используется для услуг, где нет физического товара (тарифы на связь, стоимость билетов, цены на ремонт). Дешевле, но не позволяет проверить качество услуги.
3. Административные данные. Некоторые цены поступают из государственных или корпоративных источников: регулируемые тарифы (газ, электричество), стоимость проезда в общественном транспорте, цены на лекарства по программам госзакупок.
Каждый метод имеет свои искажения. Личное наблюдение страдает от «эффекта наблюдателя» — продавец может временно изменить цену, когда видит человека с блокнотом. Телефонные опросы — от нежелания отвечать. Административные данные — от того, что они часто отражают цены «для галочки», а не реальные транзакционные цены.
Эволюция: от бумаги к планшетам.
В 1990–2000-е годы статистические ведомства перешли на электронные устройства сбора данных. Это сократило ошибки ввода, позволило встроить логические проверки (если цена изменилась более чем на 50%, система требует подтверждения). Но фундаментально процесс оставался ручным.
Революция: сканер-данные и веб-скрейпинг.
Настоящий перелом произошёл в 2010-е годы. Крупные ритейлеры (сети супермаркетов, электроники) начали предоставлять статистическим органам данные со своих кассовых аппаратов — *scanner data*. Это не просто цены, а *реальные транзакции*: по какому количеству товаров, по какой цене, с какими скидками, в каком объёме. В США BLS начал использовать сканер-данные для продуктов питания и некоторых непродовольственных товаров с 2010-х. В России Росстат также постепенно интегрирует данные ритейлеров.
Параллельно развивался веб-скрейпинг — автоматизированный сбор цен с интернет-сайтов. Сейчас многие товары и услуги продаются онлайн, и их цены можно собирать каждые несколько часов. Это даёт невиданную ранее частоту и детализацию. BLS, например, собирает онлайн-цены на авиабилеты, гостиницы, электронику, одежду.
5.2 Онлайн-данные и большие данные: новый мир возможностей
Большие данные изменили не только скорость, но и саму природу измерения цен. Мы переходим от «наблюдения за ценниками» к «анализу транзакций».
Преимущества больших данных:
1. Полнота охвата. Вместо тысяч наблюдений — миллионы. Вместо одного дня в месяц — непрерывный поток.
2. Учёт скидок и акций. Традиционные методы часто фиксируют «регулярную» цену, пропуская временные распродажи. Сканер-данные показывают, сколько товаров было продано по какой цене, что даёт *средневзвешенную цену*, реально уплаченную потребителем.
3. Динамика замещения. Когда цена на говядину растёт, люди покупают курицу. Сканер-данные видят это немедленно, позволяя корректировать веса корзины почти в реальном времени.
4. Географическая детализация. Онлайн-цены можно собирать для любого региона, а не только для тех городов, куда доезжают сотрудники статистики.
Проблемы и риски больших данных:
Но большие данные — не панацея. Они создают новые методологические головоломки.
1. Репрезентативность. Онлайн-цены не отражают офлайн-покупки. В разных странах доля онлайн-торговли разная, и она растёт, но всё ещё не доминирует. Если полагаться только на онлайн-данные, можно пропустить динамику в традиционной рознице, где цены могут вести себя иначе.
2. Проблема «длинного хвоста». Сканер-данные покрывают крупные сети, но не учитывают маленькие магазины, рынки, частных продавцов. Для многих товаров (свежие продукты на рынке, услуги частных мастеров) малые торговцы играют важную роль.
3. Качество и сопоставимость. Товары в интернете часто имеют нестандартные описания. Один и тот же товар может продаваться под разными артикулами, с разными комплектациями. Обеспечить «сопоставимость во времени» (чтобы мы сравнивали яблоки с яблоками) гораздо сложнее, чем в традиционном наблюдении, где сотрудник визуально идентифицирует товар.
4. Доступ к данным. Крупные ритейлеры не всегда готовы делиться данными. Коммерческая тайна, технические барьеры, стоимость передачи — всё это ограничивает охват. В некоторых странах законодательство обязывает предоставлять данные, но исполнение оставляет желать лучшего.
5. Алгоритмическое ценообразование. В интернете цены могут меняться несколько раз в день в зависимости от спроса, времени суток, поведения пользователя. Какая цена «истинная»? Та, которую увидел случайный посетитель в 10 утра, или та, которую заплатил реальный покупатель в пиковый час? Статистикам приходится разрабатывать правила усреднения, которые сами по себе становятся источником искажений.
Пример: как BLS использует большие данные.
В США BLS уже несколько лет использует веб-скрейпинг для сбора цен на авиабилеты, гостиницы, электронику, автомобили, одежду. Для авиабилетов собираются миллионы тарифов ежемесячно, что позволяет строить гораздо более точные индексы, чем прежний метод (звонки в несколько авиакомпаний). Для гостиниц собираются цены с Booking.com и аналогичных платформ, что учитывает динамическое ценообразование.
В Европе Евростат и национальные статистические службы активно развивают проекты по интеграции сканер-данных и веб-скрейпинга. В некоторых странах (Франция, Нидерланды) сканер-данные уже являются основным источником для ИПЦ на продукты питания.
В России Росстат также движется в этом направлении, используя данные крупных ритейлеров и агрегаторов. Однако масштаб применения больших данных пока ограничен по сравнению с лидирующими странами.
5.3 Ошибки измерений и как с ними борются
Даже при самых современных методах ИПЦ остаётся приближением. Ошибки измерений неизбежны. Вопрос не в том, чтобы их устранить (это невозможно), а в том, чтобы их понять, минимизировать и сделать прозрачными.