Оценка стоимости недвижимости (Нейросеть)

Особенностью процесса оценки стоимости недвижимости является его рыночный характер. Данный процесс не ограничивается учетом одних только затрат на создание или приобретение оцениваемого объекта собственности — необходим учет совокупности рыночных факторов, экономических особенностей оцениваемого объекта, а также макро- и микроэкономического окружения. Кроме того, рынок недвижимости очень динамичный, поэтому требуется периодическая переоценка объектов собственности.

Создание моделей на основе искусственных нейронных сетей для оценки стоимости недвижимости может существенно повысить эффективность работы организаций, занимающихся риэлтерской деятельностью.

Запустить демо

Установить локально

Описание алгоритма

1. Импорт данных

а) Исходные данные

Таблица Объекты недвижимости:

Имя Метка
 iD ID объекта
 district Район
 type_plan Тип планировки
 rooms Количество комнат
 first_last Первый/Последний этаж
 total Общая площадь (м2)
 live Жилая площадь (м2)
 kitchen Площадь кухни (м2)
 agency Наличие агентства
 condition Состояние
 price Стоимость (т.руб.)

2. Очистка данных

а) Редактирование выбросов

В узле Редактирование выбросов набор проверяется на наличие выбросов и экстремальных значений. Для выбросов задан метод обработки Оставить без изменения, а для экстремальных значений — Удалять записи.

Настройки узла Редактирование выбросов произведены следующим образом:

  • поля Общая площадь (м2), Жилая площадь (м2), Площадь кухни (м2), Стоимость (т.руб) — включены в выборку.

Модели, построенные на нейронных сетях, достаточно устойчивы к выбросам и экстремальным значениям, поэтому предпринимать особых усилий по подготовке выборки для них не требуется. Тем не менее, экстремальные значения лучше удалять для улучшения качества обучения модели.

3. Оценка недвижимости

а) Настройки узла Нейросеть(регрессия)

Первый шаг к обучению (настройке) Нейросети — определение того, какие данные подаются на вход, и что должно быть на выходе. В данном примере на выходе — прогнозируемая стоимость недвижимости, соответственно на вход подаются данные, от которых напрямую зависит цена объекта.

Данные были нормализованы для приведения всех величин к единому интервалу. Если нормализацию не производить, то входные данные разных порядков будут оказывать неодинаковое влияние на нейроны, что может привести к некорректным расчетам алгоритма. Также необходимо учесть, что для непрерывных и дискретных видов данных применяются разные методы нормализации.

Настройки нормализации в узле Нейросеть (регрессия) произведены следующим образом:

  • поля Район, Тип планировки, Количество комнат, Первый/последний этаж, Наличие агентства и СостояниеИндикатор.
  • для остальных полей Нормализатор отсутствует.

Следующий этап — разделение данных на обучающую и тестовую выборки (множества) и выбор метода валидации прогноза Нейросети.

Настройки разбиения на множества в узле Нейросеть (регрессия) произведены следующим образом:

  • для Обучающее размер в процентах выбран 90%.
  • для Тестовое размер в процентах выбран 10%.
  • Метод разбиенияСлучайный.
  • Метод валидацииK-fold кросс валидация.
  • Метод сэмплингаСлучайный.
  • Колод кросс-валидации — 10.

При изменении каких-либо настроек Нейросеть необходимо переобучить.

В остальных шагах настройки все параметры использованы по умолчанию.

б) Расчёт ошибки аппроксимации

С помощью узла Калькулятор и функции RelErr рассчитывается ошибка аппроксимации для каждого объекта. Полученные значения показывают, насколько расчетные значения отличаются от фактических, и таким образом дают представление о качестве модели.

RelErr(price, price_predicted) * 100

в) Расчёт средней ошибки аппроксимации

С помощью компонента Группировка рассчитана средняя ошибка аппроксимации всех объектов.

Настройка узла Средняя ошибка аппроксимации произведена следующим образом:

  • поле Ошибка аппроксимации (Среднее) перемещено в Показатели.

Средняя ошибка аппроксимации получилась в районе 8%. Это считается хорошим результатом (ошибка до 10-12% приемлема).

Интерпретация

а) Диаграмма

Диаграмма построена на основе исходной (по оси абсцисс) и прогнозируемой стоимости. Тип графиков в обоих случаях — Разброс.

Нейросеть. Диаграмма
Рисунок 1. Нейросеть. Диаграмма

Разброс значений прогнозируемой стоимости сосредоточен вблизи значений исходной стоимости. Диаграмма наглядно демонстрирует качество обучения Нейросети и применимость модели на практике.

б) Статистика
Нейросеть. Статистика
Рисунок 2. Нейросеть. Статистика

В Статистике никаких предварительных настроек не требуется. Смещение гистограммы влево говорит о том, что Нейросеть занижает прогноз для некоторой части объектов, соответственно, эта недвижимость упадет в цене.

в) Таблица

Детальные значения прогноза можно посмотреть в выходных данных узла Нейросеть(регрессия), используя визуализаторы Таблица или Быстрый просмотр.


Классификация данных при помощи нейронных сетей

Скачайте и откройте файл в программе Loginom, которую при необходимости можно скачать бесплатно

Скачать демопример

Минимальные требования к системе:

  • Операционная система: Windows 10 и выше
  • CPU x64: 2 core 1
  • Оперативная память: 4 GB
  • Жесткий диск: 10 GB

1 Поддерживается работа на x64 процессорах Intel Core, AMD FX и более новых, содержащих инструкции SSE4.2, POPCNT.