Оценка недвижимости с помощью машинного обучения: дело не только в данных

Машинное обучение (ML) открывает большие перспективы для оценки недвижимости. Но актуальные, высококачественные и своевременные данные о недвижимости остаются дорогостоящим вкладом. Без потока данных, уже доступного для других активов, сбалансированное сочетание моделирования и данных остается наиболее вероятным способом оценки собственности в ближайшие годы. В этой статье поверхностно рассматривается этот вопрос.

Цены на недвижимость наблюдаются при переходе собственности из рук в руки. Высокие затраты и большой средний объем типичной транзакции (по сравнению, например, с фондовыми рынками) приводят к нечастым наблюдениям за одним и тем же активом. В перерывах между сделками профессионалы в области недвижимости и инвесторы должны полагаться на оценки - наиболее вероятную цену, которую можно было бы получить на рынке, если бы недвижимость была выставлена ​​на продажу. Это гипотетическая стоимость, а не фактическая зарегистрированная цена.

Оценки являются относительно простыми, но все же включают упражнения, когда аналогичные объекты с точки зрения гедонистических переменных [i] (также называемые сопоставимыми объектами) совершаются на рынке незадолго до даты оценки. В отсутствие надежных сопоставимых сделок возможную стоимость объекта недвижимости (будь то жилой или коммерческий) необходимо оценить с использованием метода оценки. От скрытых моделей ставок капитализации, прозрачных таблиц дисконтированных денежных потоков до сложных эконометрических моделей - любая надежная оценка выиграет от точных прогнозов ожидаемых уровней денежных потоков и ставок дисконтирования. На решение о покупке или продаже дополнительно влияет воспринимаемое текущее состояние цикла недвижимости, а также прогнозируемое направление цикла.

Прогнозирование арендной платы требует хорошего понимания сил спроса и предложения, действующих на космическом рынке, строительстве и способах его финансирования, эволюции естественной нормы вакансий и возможных миграционных потоков как фирм, так и работников, среди наиболее важных факторов. Прогнозирование факторов дисконтирования требует глубокого понимания денежно-кредитной политики (как фактора, определяющего краткосрочные ставки) и временной структуры премий за риск. Если оценка проводится в рамках портфеля, будущие корреляции вышеупомянутых переменных также могут потребоваться для оценки диверсификационных преимуществ продажи или приобретения позиций в определенном секторе недвижимости.

Учитывая чувствительность оценок к изменениям ставок дисконтирования, стоит потратить несколько абзацев на определение краткосрочных ставок и безрискового компонента ставки дисконтирования.

Если углубиться в кроличью нору денежно-кредитной политики, уровень краткосрочных ставок обычно регулируется центральным банком с использованием варианта правила Тейлора. Это справедливо для большинства центральных банков по всему миру, применяющих таргетирование инфляции. Правило представляет собой формулу, которая связывает короткие ставки с разрывами выпуска (которые измеряют, насколько далеко наблюдаемый выпуск от устойчивого неинфляционного уровня) и инфляционными разрывами (которые измеряют, насколько наблюдаемая инфляция отличается от предполагаемого целевого показателя, обычно устанавливаемого на уровне 2%). ). Положительные гэпы приводят к увеличению процентной ставки, а отрицательные гэпы - к снижению ставки.

При условии наличия множества других факторов, изменения на коротком конце кривой будут распространяться по всей кривой доходности, хотя и не всегда однородно. Таким образом, расширяя вышесказанное также с помощью модели временной структуры процентных ставок, мы можем прийти к безрисковой ставке, которая, как ожидается, будет соблюдаться на дату будущей сделки. Премия за риск наверху, также весьма изменчивая и циклическая, и, наконец, у нас есть ставки дисконтирования в разные моменты времени в будущем.

Этот короткий слалом указывает на нехватку данных, а также на интенсивный характер моделирования оценки недвижимости. Чем дольше требуемый период владения активом, тем дальше нужно прогнозировать вышеупомянутую переменную. Чем дальше мы смотрим, тем мрачнее оценки и, следовательно, они менее надежны.

Цены на недвижимость известны своей цикличностью в течение длительных периодов времени как на развитых, так и на развивающихся рынках. То же самое и в отношении кредита. Взаимодействие между ВВП, кредитом и недвижимостью представляет собой ценный источник информации о будущем направлении цикла собственности. В качестве краткого мотивации напомним, что самый последний эпизод жилищного бума и спада в США характеризовался слабыми стандартами кредитования и высоким соотношением ссуды к стоимости (LTV) как одним из важных спусковых механизмов бума, а также внезапной и внезапной остановкой кредита в масштабах всей экономики. гальванизатор бюста.

Продолжительность и амплитуда цикла меняются во времени и имеют разные особенности в разных странах. Изменения в структурных характеристиках как рынков недвижимости (переход от местного законодательства о строительстве и зонировании), так и кредитных рынков (дерегулирование и изменение нормативных лимитов риска) способствуют изменению статистических свойств циклов собственности.

Как и когда эти изменения отражаются в сводных данных о ценах на недвижимость? Влияют ли эти изменения на прогнозирование? Как оценка недвижимости должна отражать эти изменения? Эти вопросы могут быть решены в рамках гибкой стратегии моделирования, в которой актуальность структур опережения и задержки и выбор переменных лучше всего доверить усердной работе алгоритмов машинного обучения.

На этом фоне и помогают данные, опубликованные Оскаром Жорда, Морицем Шулариком и Аланом М. Тейлором в их Макрофинансовой истории и фактах нового делового цикла. (доступно по адресу http://www.macrohistory.net/data/), я анализирую изменяющиеся во времени тенденции и циклическое поведение ВВП, цен на недвижимость и кредита за более чем 100 лет для нескольких развитых стран. Цель состоит в том, чтобы определить и оценить актуальность локальных и глобальных циклов и побочные эффекты как финансовых, так и реальных циклов в других странах.

Если на анализируемом рынке действует глобальная низкочастотная составляющая, эта статистическая информация полезна для улучшения прогнозов, используемых при оценке. Несмотря на то, что рынки недвижимости остаются преимущественно местными, глобальные торговые и финансовые потоки могут привести к перетеканию с одного рынка недвижимости на другой. Разложение переменных в тренде и циклической составляющей также полезно для оценки возможных действий центральных банков через 3-5 лет и, таким образом, для оценки будущих краткосрочных ставок. Это связано с тем, что предполагаемые циклические компоненты представляют собой пробелы, необходимые в качестве входных данных в типичном правиле Тейлора.

Давайте сначала посмотрим на данные. Я вычисляю 10-летнее скользящее среднее темпов роста цен на жилую недвижимость, ВВП на душу населения и кредитов нефинансовым корпорациям. В данных присутствуют некоторые разрывы, обычно наблюдаемые в период Второй мировой войны, но в остальном данные хорошо обрабатываются. Обращает на себя внимание синхронность кредитных цен и цен на жилье с использованием 10-летнего среднего значения (рис. 1). Это подкрепляет предыдущие исследования, которые указывают на важность кредита для объяснения динамики цен на жилье.

Естественно, можно задаться вопросом, является ли 10-летнее среднее значение подходящим диапазоном данных для анализа этих трех переменных. ML может использоваться здесь для поиска оптимального размера окна, минимизирующего ошибку прогнозирования, поскольку оцененные пробелы используются в модели прогнозирования. Это вполне может меняться со временем (в некоторые периоды среднее значение за 10 лет может быть лучшим выбором, в какой-то другой период это может быть среднее значение за 7 лет), переменные и страны.

Среднее значение за 10 лет можно рассматривать как наивную оценку основного тренда. Это низкочастотный компонент данных. Затем циклический компонент получается путем вычитания значения тренда из наблюдаемого значения во все моменты времени. Самый последний период показывает повышенную синхронизацию тенденций, что дает некоторое дополнительное объяснение наблюдаемой высокой корреляции цен на недвижимость на большинстве международных рынков.

Кроме того, представление о совместной динамике по странам может быть получено путем оценки кривой Лесса по доступному сечению 10-летних средних значений (рис. 2). Это простое приложение, предназначенное для выявления глобальных факторов в сфере недвижимости, ВВП и роста кредита. Розовые полосы показывают периоды рецессии в США.

Интересным эмпирическим наблюдением является изменяющаяся во времени зависимость между ростом кредита и объемом производства и то, как он качественно изменился с течением времени.

На протяжении большей части рассматриваемого периода высокие темпы роста кредита приводили как к более высоким темпам роста производства, так и к росту цен на жилье - напомним, мы говорим о тенденциях в темпах роста. Пики трех переменных вместе приходятся на 1920-е, 1950-е и 1980-е годы. Однако это не относится к пику 2007 года, когда высокий рост кредитования привел к высокому росту цен на недвижимость, но к сдержанной реакции на динамику ВВП. Это наблюдение продолжает указывать на то, что вековая стагнация не может полностью объяснить замедленный посткризисный рост.

Возможна более структурная интерпретация, например, в недавней статье с Anh D.M. Нгуен из Банка Литвы. В этой статье мы строим многомерную ненаблюдаемую компонентную модель, чтобы объяснить эволюцию разрыва выпуска в экономике США на протяжении более чем столетия. Рабочая версия статьи доступна по адресу https://www.lb.lt/en/publications/no-51-mihnea-constantinescu-anh-d-m-nguyen-a-century-of-gaps.

Предварительные результаты были представлены и обсуждены на нескольких недавних исследовательских семинарах в Банке Румынии (http://www.bnr.ro/Bucharest-Economic-Analysis-and-Research-Seminar-(BEARS)-16413.aspx) и Банк Украины (https://bank.gov.ua/control/ru/publish/article?art_id=87169943&cat_id=76291), а также несколько научных конференций.

В условиях кросс-страны ML предлагает естественный выбор для выбора оптимальных весов, используемых для вычисления глобального среднего. Экономическая теория показывает, что торговля или ВВП могут использоваться для построения соответствующих весов, необходимых при вычислении среднего значения (например, более крупные страны имеют более высокий вес в расчете при использовании ВВП для взвешивания). Хотя этот путь легче интерпретировать с экономической точки зрения, он может не быть оптимальным с точки зрения прогнозирования. Выбор изменяющейся во времени матрицы коэффициентов улучшает результаты прогнозирования. Естественно, для каждого рынка оценка может быть дополнительно уточнена с использованием данных отдельных транзакций для конкретной страны.

Быстрый обход данных / моделирования / понимания подчеркивает, что данные, хотя и являются важными входными данными, нуждаются в объективе для интерпретации. Это обеспечивается моделями и предшествующими концептуальными рамками, которые индивидуально подходят для выбранного вопроса, в нашем случае оценки недвижимости.

Вполне возможно, что мы получаем такое же эконометрическое понимание из тщательно отобранной модели, связывающей NVR с равновесной рентой, что мы получаем из PCA большого списка слабосвязанных ковариат. Очевидно, что лучшая стратегия - извлечь любую полезную информацию из всех доступных ковариат. Без сомнения, причинно-следственная интерпретация предпочтительнее подхода черного ящика. Анализ данных должен стать практическими бизнес-решениями, решениями, которые можно было бы легко передать и понять, а не обернуть их непонятной статистической терминологией. Хотя время от времени «econ 101» является нечетким, он остается важным источником причинно-следственной интерпретации и выбора переменных для построения и оценки моделей.

Волна искусственного интеллекта приносит с собой уникальные деловые и этические проблемы, от которых недвижимость не останется невосприимчивой. Что еще более важно, это указывает на возросшую роль своевременных данных высокой чистоты. Данные транзакций, хранящиеся в блокчейне, становятся ценным производственным фактором, имеющим все более важное значение в экономике, основанной на искусственном интеллекте. Таким образом, будущие бизнес-модели должны разрабатывать новые продукты и услуги не путем обфускации ценности этих входных данных, чтобы избежать компенсации пользователям за их вклад в данные, а путем формального признания их ценности и организации надлежащего рынка, необходимого для их проведения.