Репетитор оценщика
Готовые работы заочников
Тесты:
Задачи:
Примеры работ по оценке
Экспертная и репетиторская помощь по решению тестов, задач, практикумов и всех других видов работ. Сергей.admin@refmag.ru,
Примеры выполненных работ: | контрольные | курсовые | дипломные | отзывы |
Букинистическая книга:
Список литературы по оценке недвижимости > О статистическом методе построения прогноза цены недвижимости по неоднородным данным
Харламов А.В. О статистическом методе построения прогноза цены недвижимости по неоднородным данным // Известия Саратовского университета. Новая серия. Серия: Экономика. Управление. Право. 2019. Т. 19. № 2. С. 189-193.
Скачать оригинал статьи
Фрагмент работы на тему "О статистическом методе построения прогноза цены недвижимости по неоднородным данным"Управление 189 УДК 330.43 О статистическом методе построения прогноза цены недвижимости по неоднородным данным А. В. Харламов Харламов Александр Владимирович, кандидат экономических наук, доцент кафедры основ математики и информатики, Са- ратовский национальный исследовательский государствен- ный университет имени Н. Г. Чернышевского, harlamovav@ info.sgu.ru Введение. В статье рассмотрены вопросы построения про- гнозов на рынке недвижимости по неоднородным данным. Установление «справедливой» цены жилья является акту- альной задачей при назначении залога, в целях страхова- ния, определения эффективности инвестпроектов и т.д. Для решения этой задачи применяют эконометрические модели ценообразования, специфицированные по всей обследуе- мой совокупности. В случае значительной неоднородности обследуемой совокупности получаемые по этим моделям прогнозы могут содержать существенные ошибки. Теоре- тический анализ. На сегодняшний день существуют раз- нообразные методы и модели анализа неоднородных, в том числе пространственно распределенных данных. Для преодо- ления неоднородности исходных данных применяют зониро- вание обследуемой совокупности или строят модели пере- менной структуры, что сопряжено с рядом проблем. Дается обзор подходов, реализующих эти методы, перечисляются их плюсы и минусы. Для повышения качества прогноза пред- ложен новый метод построения зон однородности на основе результатов построения оценок глобальной модели. Описан соответствующий алгоритм вычисления поправочного локаль- ного коэффициента, позволяющего корректировать прогноз глобальной модели. Эмпирический анализ. Для демон- страции эффективности работы предложенного метода по эмпирическим данным регионального рынка недвижимости рассчитаны прогнозы стоимости жилья, дан анализ резуль- татов прогнозирования. Результаты. Предложенный новый метод определения зон однородности по результатам прогно- зов с помощью расчета поправочного локального позволяет избежать ряда проблем, возникающих при использовании других подходов, и представляет эффективный инструмент прогнозирования. Ключевые слова: пространственное моделирование, не- однородные данные, геокодированные данные, модели пере- менной структуры, зонирование. DOI: https://doi.org/10.18500/1994-2540-2019-19-2-189-193 Введение Как правило, многие статистические иссле- дования социально-экономических явлений за- канчиваются выводами о тенденциях в развитии этих явлений, т. е. представлением прогнозов. Причем достаточно часто прогнозирование яв- ляется самостоятельной и порой единственной задачей подобных исследований. Например, анализ рынка жилой недвижимости преследует практически единственную цель – уточнение «справедливой рыночной» цены квартиры для продажи, для определения залога или для целей страхования. Для решения данной задачи успеш- но применяются эконометрические модели [1]. Построение и оценка классических эконо- метрических моделей, таких как модель множе- ственной линейной регрессии, требуют соблюде- ния достаточно жестких исходных предпосылок, таких как гомоскедастичность, независимость регрессоров, нормальное распределение ошибок. Что, как правило, выполняется при анализе одно- родных данных. Применение классической модели регрессии для анализа процессов и явлений на простран- ственно неоднородных территориях может не- верно описывать реальную ситуацию. Например, стоимость объектов недвижимости может сильно отличаться в разных районах города. Поэтому для анализа неоднородных данных используют специальные методы и строят моде- ли, учитывающие специфику данных. Теоретический анализ Исходные статистические данные считаются однородными, если все они зарегистрированы при одних и тех же значениях сопутствующих переменных, в противном случае – неоднород- ными. Учет территориальной неоднородности может рассматриваться в контексте общей проб- лемы построения регрессионных моделей по неоднородным данным [1, 2]. Можно отметить два подхода решения проблемы неоднородности. Это выделение тем или иным образом однород- ных зон или построение моделей переменной структуры, учитывающих имеющиеся неодно- родности. Иногда эти подходы совмещаются. При анализе неоднородной совокупности исходные данные можно разделить на однород- ные зоны и провести моделирование в каждой из них. При этом однородные совокупности малых объемов не позволят оценить модель, что является существенным недостатком данного подхода. Поэтому для анализа неоднородных А. В. Харламов. О статистическом методе построения прогноза цены недвижимости © Харламов А. В., 2019 190 Научный отдел Изв. Сарат. ун-та. Нов. сер. Сер. Экономика. Управление. Право. 2019. Т. 19, вып. 2 данных применяют регрессионные модели переменной структуры [2]. Разнообразие этих моделей достаточно велико, и выбор модели определяется конкретной ситуацией. Напри- мер, принадлежность выделенным зонам можно определять, вводя соответствующие бинарные фиктивные переменные, которые отражают эти различия [3, 4]. Разделение обследуемой территории на зоны связано с задачей выбора размеров и границ зон. Различные решения данной задачи могут оказывать значительное влияние на результаты моделирования. Различают четкие и нечеткие границы. Обычно четкие границы определяются принадлежностью к административному району. Прогнозная модель в этом случае может быть специфицирована следующим образом: 0 11 2 2 ... i M M M i M M i M kM ki M i M y xx x ?? ? ? ? ? ? ? ?? ? ? ? ?? ? , где M – номер зоны. В результате получают отличающиеся между собой наборы оценок коэффициентов для каждой зоны. При эмпири- ческом определении зон произвольное опреде- ление границ может приводить к совершенно противоположным результатам в оценках коэф- фициентов и их ошибочной интерпретации [5]. Поэтому в процессе зонирования используют нечеткие границы. В этом случае оценивается модель вида 0 1 12 2 ( , ) ( , ) ( , ) ... ( , ) i i i k ki i y uv uvx uvx uvx ? ? ? ?? ? ?? ? ? ? . Пара (,) u v определяет местоположение центра зоны. Границы нечеткие, и каждый объ- ект имеет возможность попасть в любую зону с той или иной вероятностью. При этом возникает задача вычисления оптимального размера зон. Изменения структуры модели могут носить различный характер. Например, значения ко- эффициентов могут меняться скачкообразно на границах построенных интервалов, как в случае кусочно-линейных или сплайн моделей [1]. Такие модели называют моделями с переключениями, при их построении считают, что момент скачка зависит от значений какой-либо управляющей переменной или происходит в определенный момент времени, и фактор времени является косвенной объясняющей переменной. Таким образом, кусочно-линейная регрес- сия может быть представлена в виде системы линейных моделей: 0 11 ... l l ll ll l t t n nt t y xx ? ? ?? ? ?? ? ? , l r ?1, , оцениваемых на каждом сегменте. В случае сплайн-моделей в систему добавляют условия на границах сегментов. Изменения коэффициентов могут иметь и эволюционный характер, обуслов- ленный постоянными переменами во внешней среде [2]. Модель с эволюционно меняющимися коэффициентами имеет вид 0 11 ( ) ( ) ... ( ) t t n nt t y t tx tx ? ? ?? ? ?? ? ? , где коэффициенты модели меняются во времени. Построение оценок коэффициентов доста- точно трудоемко и в общем случае практически невозможно, поэтому выдвигаются предположе- ния о закономерностях их изменения. Например, предполагается, что они являются линейными функциями некоторого внешнего фактора [6]: 0 1 ( ) i i i t it ? ?? t zu ?? ? , где 0 1 , ? ? i i – неизвестные коэффициенты; t z – из- вестные значения фактора в момент t; it u – ошиб- ки аппроксимации. После подстановки коэффициентов полу- чают линейную модель вида 0 1 1 1 1, 2 1 2 1, ... ... t t n nt n n t n n t t y ?? ? ? ? ? x xx x ? ? ?? ? ? ? ?? ? ? , где ? ? 0 00 ? , ? ? 1 10 ? , …, ? ? n n ? 0 , ? ? n?1 01 ? , …, ? ? 21 1 n n ? ? , nt t 1, x z ? ? , nt tt 2, 1 x zx ? ? , …, 2 1, n t t nt x zx ? ? , 0 11 ... t t t t t nt nt ? ? ? ? ?? ? u xu xu . В зависимости от свойств ошибок применя- ют тот или иной метод построения оценок. Спецификация моделей переменной струк- туры в пространстве еще больше усугубляет описанные проблемы, так как изменению под- вержены уже два параметра – координаты ме- стоположения объектов. Эти проблемы решаются при использовании метода географически взвешенной регрессии [3, 4], когда применяются методы оптимизации по величине зоны и числу объектов в ней. Модель географически взвешенной регрес- сии имеет вид 0 (,) (,) i i i k i i ik i k y uv uv x ? ? ?? ?? ? ? , где (,) i i u v – координаты точки i, i n ?1, и неиз- вестные коэффициенты зависят от координат. Оценки коэффициентов модели вычисляются в каждой точке, в которой проводились измерения, и также являются функциями координат. В целях выявления местных особенностей используются не все данные, а только «ближайшие соседи». Предполагается, что регрессионные модели для соседних объектов схожи, но могут варьировать- ся по территории, степень близости объектов учитывается с помощью весов. Матрица весовых коэффициентов вычисляется для местоположе- ния каждого объекта. Классическую (глобальную) модель можно рассматривать как частный случай географи- ческого подхода для ситуации, когда оценки Управление 191 коэффициентов не меняются при изменении местоположения и остаются постоянными на всей территории. Вычислительные процедуры при данном подходе достаточно громоздки, теряется нагляд- ность и возможна ситуация, когда оптимальные размеры «скользящей зоны» практически соиз- меримы с обследуемой областью, что полностью сглаживает эффект применения этого метода. Рассмотрим другой подход решения пере- численных проблем при прогнозировании по неоднородным данным [7]. Предлагается ис- пользовать классическую модель множественной линейной регрессии, специфицированную по всей обследуемой совокупности, а однородные зоны определять относительно точки (объек- та) прогноза. Такой подход позволит избежать многих сформулированных выше проблем, в частности проблемы спецификации модели по малой выборке. Единая (глобальная) модель, специфици- рованная по всей обследуемой совокупности, усредняет прогнозируемые значения, сглаживая специфические особенности местности, как, впрочем, и все модели переменной структуры. Такие модели не могут определять экстремаль- ные территориальные особенности, существенно влияющие на цену объекта. Предлагаемый под- ход лишен этого недостатка и позволяет выявлять подобные ситуации. Приведем следующий алгоритм построения прогноза с помощью выделения зон однород- ности и определения на их основе локальных коэффициентов (Клок) коррекции прогноза. 1. Строится классическая модель множе- ственной линейной регрессии по всей обсле- дуемой территории. При этом используются геокодированные данные. 2. Выбирается объект прогнозирования и определяется его местоположение на обследуе- мой территории. 3. Вокруг объекта определяются «ближай- шие соседи», участвовавшие в построении модели, и анализируются модельные «остатки» этих соседних объектов. Число ближайших соседей можно определять из условия про- странственной однородности анализируемых остатков. 4. Возможны несколько вариантов значе- ний остатков в выделенной зоне (рисунок): а) остатки внутри зоны имеют однородный ха- рактер, как и по всей территории, и вычисление локального коэффициента не повысит точности прогноза; б) остатки внутри зоны имеют пре- имущественно положительные значения, и не- обходимо применять повышающий локальный коэффициент; в) остатки внутри зоны имеют преимущественно отрицательное значение, и необходимо применять понижающий локальный коэффициент. 5. Прогнозное значение, вычисленное по глобальной модели, умножается на локальный коэффициент. Значение локального коэффициента можно рассчитывать, например, как отношение средней, возможно, взвешенной по «близости», стоимости «соседей» к среднему прогнозу, полученному по модели для этих «соседей». Варианты однородности остатков в зоне Variants of Homogeneity of Residues in the Zone аб в Эмпирический анализ Апробация предложенного метода прогно- зирования была проведена на рынке одноком- натных квартир г. Саратова (исходные данные являются выборкой с сайта https://kvadrat64. ru/, полученной в январе 2019 г.). Глобальная модель множественной линейной регрессии имеет вид 12 3 45 6 7 8 9 10 11 12 13 14 2928 41,3 64,1 21,4 81,2 72,1 463,1 102,2 42,3 175,4 56,1 48,3 99,1 176,2 298,3 y xx x xx x x x xx x x x x ?? ? ? ? ? ? ? ? ?? ? ? ? ? ? А. В. Харламов. О статистическом методе построения прогноза цены недвижимости 192 Научный отдел Изв. Сарат. ун-та. Нов. сер. Сер. Экономика. Управление. Право. 2019. Т. 19, вып. 2 Здесь y – цена квартиры, тыс. руб.; x1 – жилая площадь, м2; x2 – площадь кухни, м2; x3 – допол- нительная площадь, м2; x4 – квартира расположе- на на первом этаже; x5 – квартира расположена на последнем этаже; x6 – дом малой этажности; x7 – пятиэтажный дом; x8 – дом выше девяти этажей; x9 – кирпичный дом; x10 – монолитный дом; x11 – раздельный санузел; x12 – планировка гостиничного типа; x13 – планировка студия; x14 – логарифм расстояния до центра города, ln(м). Коэффициент детерминации R2 = 0,72, все факторы статистически значимы на уровне 5%. Для спецификации модели использовано 95% исходных данных. Из оставшихся 5% дан- ных был выбран объект для расчета прогнозной цены. Прогноз, рассчитанный по модели, равен 1 867 534 руб. Визуально были выделены 18 «ближайших соседей» с положительными остат- ками (случай б). Значение локального коэффици- ента равно Клок=1,118. Исправленное прогнозное значение равно 2 087 903 руб., что всего на 2,9% ниже заявленной в объявлении стоимости квар- тиры, равной 2 150 000 руб. Результаты Предложенный метод прогнозирования цены жилой недвижимости по неоднородным исходным данным позволяет избежать ряда существенных проблем, возникающих при ис- пользовании известных подходов, связанных с зонированием обследуемой территории и по- строением моделей переменной структуры. Так как модель оценивается по совокуп- ности данных, то учитываются все ценообра- зующие факторы, потеря значимости которых возможна при локализации обследуемой тер- ритории. Анализ остатков глобальной модели в зоне положения объекта прогнозирования позволя- ет учитывать специфические особенности вли- яния территории на цену недвижимости, что, как правило, сглаживается в других случаях. Апробация метода по эмпирическим дан- ным позволила получить удовлетворительный результат по прогнозу. Хотя еще некоторые вопросы не нашли окончательного ответа, например, критерий оптимального размера зоны однородности и число «ближайших соседей» или способ расчета локального коэффициента – по стоимости объ- ектов или стоимости квадратного метра, тем не менее, данный метод можно считать некоторой техникой оценивания объектов жилой недвижи- мости, достаточно близкой к построению оце- нок по «аналогам», используемым в оценочной практике, но основанным на массовой оценке. Список литературы 1. Эконометрика : учебник / под ред. В. С. Мхитаряна. М. : Проспект, 2009. 384 с. 2. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М. : ЮНИТИ, 1998. 1000 с. 3. Fotheringham A. S., Brunsdon C., Charlton M. Geographically Weighted Regression the Analysis of Spatially Varying Relationships. University of Newcastle, UK : John Wiley & Sons Ltd, 2002. 284 p. 4. Балаш О. С., Харламов А. В. Эконометрическое мо- делирование пространственных данных. Саратов : Научная книга, 2010. 112 с. 5. Appleton D. R., French J. M., Vanderpump M. P. Ignoring a Covariate : An Example of Simpson’s Paradox // The American Statistician. 1996. Vol. 50, iss. 4. P. 340–341. 6. Anselin L. Spatial Externalities, Spatial Multipliers and Spatial Econometrics // International Regional Science Review. 2003. Vol. 26, iss. 2. P. 153–166. 7. Харламов А. В. Применение пространственного коэффициента при прогнозировании по геокодиро- ванным данным // Математическое и компьютерное моделирование в экономике, страховании и управ- лении рисками : материалы VII Междунар. молод. науч.-практ. конф. Саратов : Научная книга, 2018. С. 157–160. Образец для цитирования: Харламов А. В. О статистическом методе построения прогноза цены недвижимости по неоднородным данным // Изв. Сарат. ун-та. Нов. сер. Сер. Экономика. Управление. Право. 2019. Т. 19, вып. 2. С. 189–193. DOI: https://doi. org/10.18500/1994-2540-2019-19-2-189-193 The Statistical Method of Constructing a Forecast for the Real Estate Price Using Heterogeneous Data A. V. Harlamov Alexandеr V. Harlamov, https://orcid.org/0000-0002-1709-6518, Saratov State University, 83 Astrakhanskaya St., Saratov 410012, Russia, harlamovav@info.sgu.ru Introduction. The article deals with the issues of constructing forecasts in the real estate market using heterogeneous data. Establishing a “fair” price of housing is an urgent task for collateral assigning, for insurance purposes, for determining the investment projects effectiveness, etc. To solve this problem, econometric pricing models are used, which are specified for the entire surveyed population. In case of significant heterogeneity of the surveyed population, the predictions obtained from these Управление 193 models may contain significant errors. Theoretical analysis. Now, there is a variety of methods and models for the analysis of heterogeneous, spatially distributed data. Population zoning or a variable structure model is used to overcome data heterogeneity. It is connected with a number of problems. An overview of the approaches that implement these methods is given, their advantages and disadvantages are listed. A new method for constructing homogeneity zones, based on the results of the global model estimates building, is proposed to improve the forecast quality. The corresponding algorithm for calculating the local correction factor is described, which makes it possible to correct the global model forecast. Empirical analysis. To demonstrate the effectiveness of the proposed method in action, a forecast for the real estate price, based on the empirical data of the regional real estate market, was calculated, and an analysis of the forecast results was given. Results. The proposed new method for determining homogeneity zones based on the results of forecasts using the local correction calculation makes it possible to avoid a number of problems arising from the use of other approaches and represents an effective forecasting tool. Keywords: spatial modeling, heterogeneous data, geocoded data, variable structure models, zoning. References: 1. Ekonometrika [Econometrics. Ed. by V. S. Mkhitarian]. Moscow, Prospekt Publ., 2009. 384 p. (in Russian). 2. Aivazian S. A., Mkhitarian V. S. Prikladnaia statistika i osnovy ekonometriki [Applied Statistics and the Basics of Econometrics]. Moscow, IuNITI Publ., 1998. 1000 p. (in Russian). 3. Fotheringham A. S., Brunsdon C., Charlton M. Geographically Weighted Regression the Analysis of Spatially Varying Relationships. University of Newcastle, UK, John Wiley & Sons Ltd, 2002. 284 p. 4. Balash O. S., Kharlamov A. V. Ekonometricheskoe modelirovanie prostranstvennykh dannykh [Econometric Modeling of Spatial Data]. Saratov, Nauchnaia kniga Publ., 2010. 112 p. (in Russian). 5. Appleton D. R., French J. M., Vanderpump M. P. Ignoring a Covariate: An Example of Simpson’s Paradox. The American Statistician, 1996, vol. 50, iss. 4, pp. 340–341. 6. Anselin L. Spatial Externalities, Spatial Multipliers and Spatial Econometrics. International Regional Science Review, 2003, vol. 26, iss. 2, pp. 153–166 7. Kharlamov A. V. Primenenie prostranstvennogo koeffitsienta pri prognozirovanii po geokodirovannym dannym [Applying of Spatial Coeffi cient in Geocoded Data Forecast]. In: Matematicheskoe i komp’iuternoe modelirovanie v ekonomike, strakhovanii i upravlenii riskami: materialy VII Mezhdunar. molod. nauch.-prakt. konf. [Mathematical and Computer Modeling in Economics, Insurance and Risk Management: Proceedings of the VII Intern. young sci.-pract. conf.]. Saratov, Nauchnaia kniga Publ., 2018, pp.157–160 (in Russian). Cite this article as: Harlamov A. V. The Statistical Method of Constructing a Forecast for the Real Estate Price Using Heterogeneous Data. Izv. Saratov Univ. (N. S.), Ser. Economics. Management. Law, 2019, vol. 19, iss. 2, pp. 189–193 (in Russian). DOI: https://doi.org/10.18500/1994-2540-2019-19-2-189-193 А. В. Харламов. О статистическом методе построения прогноза цены недвижимости Другие книги из этого разделаРиски участников строительства в условиях экономического кризисаК вопросу о моделях ценообразования и сегментации рынка жилой недвижимостиЭволюция понятия "недвижимое имущество" в истории законодательства России и зарубежных странРиски участников строительства в условиях экономического кризисаК вопросу о моделях ценообразования и сегментации рынка жилой недвижимостиЭволюция понятия "недвижимое имущество" в истории законодательства России и зарубежных стран