Оценка стоимости недвижимости (Нейросеть)
Особенностью процесса оценки стоимости недвижимости является его рыночный характер. Данный процесс не ограничивается учетом одних только затрат на создание или приобретение оцениваемого объекта собственности — необходим учет совокупности рыночных факторов, экономических особенностей оцениваемого объекта, а также макро- и микроэкономического окружения. Кроме того, рынок недвижимости очень динамичный, поэтому требуется периодическая переоценка объектов собственности.
Создание моделей на основе искусственных нейронных сетей для оценки стоимости недвижимости может существенно повысить эффективность работы организаций, занимающихся риэлтерской деятельностью.
Описание алгоритма
1. Импорт данных
Таблица Объекты недвижимости:
Имя | Метка |
---|---|
iD | ID объекта |
district | Район |
type_plan | Тип планировки |
rooms | Количество комнат |
first_last | Первый/Последний этаж |
total | Общая площадь (м2) |
live | Жилая площадь (м2) |
kitchen | Площадь кухни (м2) |
agency | Наличие агентства |
condition | Состояние |
price | Стоимость (т.руб.) |
2. Очистка данных
В узле Редактирование выбросов набор проверяется на наличие выбросов и экстремальных значений. Для выбросов задан метод обработки Оставить без изменения, а для экстремальных значений — Удалять записи.
Настройки узла Редактирование выбросов произведены следующим образом:
- поля Общая площадь (м2), Жилая площадь (м2), Площадь кухни (м2), Стоимость (т.руб) — включены в выборку.
Модели, построенные на нейронных сетях, достаточно устойчивы к выбросам и экстремальным значениям, поэтому предпринимать особых усилий по подготовке выборки для них не требуется. Тем не менее, экстремальные значения лучше удалять для улучшения качества обучения модели.
3. Оценка недвижимости
Первый шаг к обучению (настройке) Нейросети — определение того, какие данные подаются на вход, и что должно быть на выходе. В данном примере на выходе — прогнозируемая стоимость недвижимости, соответственно на вход подаются данные, от которых напрямую зависит цена объекта.
Данные были нормализованы для приведения всех величин к единому интервалу. Если нормализацию не производить, то входные данные разных порядков будут оказывать неодинаковое влияние на нейроны, что может привести к некорректным расчетам алгоритма. Также необходимо учесть, что для непрерывных и дискретных видов данных применяются разные методы нормализации.
Настройки нормализации в узле Нейросеть (регрессия) произведены следующим образом:
- поля Район, Тип планировки, Количество комнат, Первый/последний этаж, Наличие агентства и Состояние — Индикатор.
- для остальных полей Нормализатор отсутствует.
Следующий этап — разделение данных на обучающую и тестовую выборки (множества) и выбор метода валидации прогноза Нейросети.
Настройки разбиения на множества в узле Нейросеть (регрессия) произведены следующим образом:
- для Обучающее размер в процентах выбран 90%.
- для Тестовое размер в процентах выбран 10%.
- Метод разбиения — Случайный.
- Метод валидации — K-fold кросс валидация.
- Метод сэмплинга — Случайный.
- Колод кросс-валидации — 10.
При изменении каких-либо настроек Нейросеть необходимо переобучить.
В остальных шагах настройки все параметры использованы по умолчанию.
С помощью узла Калькулятор и функции RelErr рассчитывается ошибка аппроксимации для каждого объекта. Полученные значения показывают, насколько расчетные значения отличаются от фактических, и таким образом дают представление о качестве модели.
RelErr(price, price_predicted) * 100
С помощью компонента Группировка рассчитана средняя ошибка аппроксимации всех объектов.
Настройка узла Средняя ошибка аппроксимации произведена следующим образом:
- поле Ошибка аппроксимации (Среднее) перемещено в Показатели.
Средняя ошибка аппроксимации получилась в районе 8%. Это считается хорошим результатом (ошибка до 10-12% приемлема).
Интерпретация
Диаграмма построена на основе исходной (по оси абсцисс) и прогнозируемой стоимости. Тип графиков в обоих случаях — Разброс.
Разброс значений прогнозируемой стоимости сосредоточен вблизи значений исходной стоимости. Диаграмма наглядно демонстрирует качество обучения Нейросети и применимость модели на практике.
В Статистике никаких предварительных настроек не требуется. Смещение гистограммы влево говорит о том, что Нейросеть занижает прогноз для некоторой части объектов, соответственно, эта недвижимость упадет в цене.
Детальные значения прогноза можно посмотреть в выходных данных узла Нейросеть(регрессия), используя визуализаторы Таблица или Быстрый просмотр.
Классификация данных при помощи нейронных сетей
Скачайте и откройте файл в программе Loginom, которую при необходимости можно скачать бесплатно
Минимальные требования к системе:
- Операционная система: Windows 10 и выше
- CPU x64: 2 core 1
- Оперативная память: 4 GB
- Жесткий диск: 10 GB
1 Поддерживается работа на x64 процессорах Intel Core, AMD FX и более новых, содержащих инструкции SSE4.2, POPCNT.