реклама
Бургер менюБургер меню

Ярослав Суков – Цена реальности: Индекс потребительских цен (страница 6)

18

Типы ошибок измерений:

1. Ошибка выборки. Мы не можем отследить каждую транзакцию в каждой точке. Мы берём выборку магазинов, товаров, времени. Любая выборка даёт статистическую погрешность. В США BLS публикует доверительные интервалы для ИПЦ, но большинство стран этого не делают.

2. Ошибка неответа. Не все магазины соглашаются участвовать. Не все товары доступны в момент наблюдения (временное отсутствие). Статистики вынуждены заполнять пропуски, используя данные по аналогичным товарам или предыдущим периодам. Каждое такое действие вносит дополнительную неопределённость.

3. Ошибка качества. Самый коварный тип. Товар меняется (улучшается или ухудшается), но цена остаётся той же. Если не скорректировать цену на изменение качества, мы либо завысим инфляцию (когда качество растёт, а цена нет), либо занизим (когда качество падает). Отсюда — гедонистические методы, о которых мы поговорим в следующей главе.

4. Ошибка замещения. Когда потребитель заменяет подорожавший товар более дешёвым, фиксированная корзина завышает инфляцию. Современные индексы пытаются учесть замещение, но делают это с лагом и приблизительно.

5. Ошибка новых товаров. Новые товары не входили в базовую корзину. Когда они появляются, их цены часто высоки на старте, а затем быстро снижаются. Если включать их с запаздыванием, мы пропускаем начальное снижение цен и завышаем инфляцию.

Как с этим борются: арсенал статистика.

Статистические ведомства разработали целый арсенал методов для борьбы с ошибками.

- Импутация. Для пропущенных наблюдений используют «цепочечную импутацию»: если товар временно отсутствует, его цена считается как средняя по группе. Если товар исчез навсегда, ищется замена с корректировкой на качество.

- Гедонистическая регрессия. Метод, позволяющий оценить «вклад» каждой характеристики товара в его цену. Если у нового товара появились улучшенные характеристики, гедонистическая модель «отрезает» стоимость улучшений, чтобы сравнимые цены оставались сопоставимыми. Подробно разберём в главе 6.

- Цепочечные индексы (chained indices). Вместо того чтобы десятилетиями держать одну и ту же корзину, веса обновляются чаще (раз в год или даже чаще). Это снижает ошибку замещения.

- Триангуляция данных. Статистики комбинируют несколько источников: традиционные наблюдения, сканер-данные, веб-скрейпинг, административные данные. Каждый источник компенсирует слабости других.

- Ревизии (пересмотры). Почти все страны пересматривают ИПЦ задним числом, когда поступают более полные данные. В США месячные данные могут пересматриваться несколько раз в течение года. Это нормальная практика, но она создаёт проблему для трейдеров, которым нужно принимать решения «здесь и сейчас».

Алгоритмическое преимущество – Альтернативные данные и текущее данные

Для участников финансовых рынков официальный ИПЦ выходит с опозданием (2–4 недели после окончания месяца). В эпоху, когда центральные банки реагируют на каждое движение цен, способность предсказать ИПЦ до его публикации даёт колоссальное преимущество.

Nowcasting: предсказание настоящего.

Nowcasting — это не прогноз на будущее, а оценка текущего состояния, которое ещё не отражено в официальной статистике. Используя альтернативные данные, можно построить модель, которая выдаёт оценку ИПЦ с высокой точностью за несколько дней или даже недель до релиза.

Источники данных для nowcasting:

1. Сканер-данные ритейлеров. Некоторые инвестиционные фонды покупают данные о транзакциях у крупных сетей напрямую или через агрегаторов. Это даёт реальную картину цен по дням.

2. Данные с сайтов объявлений и агрегаторов. Цены на аренду жилья можно собирать с Циана, Avito, Zillow, Craigslist. Аренда — крупнейший компонент ИПЦ (в США — 30–40%), и она сильно запаздывает в официальной статистике. Реальные рыночные ставки опережают OER на 12–18 месяцев. Отслеживая арендные ставки в реальном времени, можно предсказать будущее направление OER.

3. Данные о ценах на топливо. Цены на бензин собираются ежедневно, и они напрямую входят в ИПЦ. Используя эти данные, можно точно оценить вклад энергии в месячный индекс.

4. Данные об авиабилетах и гостиницах. Веб-скрейпинг позволяет отслеживать динамику цен в этих категориях.

5. Альтернативные индексы. Существуют частные индексы, например, PriceStats (бывший MIT Billion Prices Project), который ежедневно публикует оценки инфляции на основе сотен миллионов онлайн-цен.

Модели nowcasting:

Самый простой подход — построить регрессионную модель, где зависимая переменная — официальный ИПЦ (или его компоненты), а независимые — альтернативные данные. Более сложные методы используют машинное обучение и факторные модели (динамические факторные модели, ДФМ).

Важно: nowcasting работает хорошо только если альтернативные данные коррелируют с официальными. Но методология официальной статистики может меняться, и корреляции могут ломаться. Поэтому successful nowcaster постоянно адаптирует модель.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.