Оценка качества моделей машинного обучения: выбор, интерпретация и применение метрик

Алексей Михнин, 2023

В данной книге рассматриваются метрики качества моделей машинного обучения, обеспечивая понимание их выбора, интерпретации и применения. Описываются различные метрики, их особенности и применение в задачах машинного обучения. Книга содержит практические примеры использования метрик для наглядности. Она будет полезна специалистам в области машинного обучения, бизнес-аналитикам и новичкам, желающим освоить оценку качества моделей и принимать обоснованные решения на основе анализа результатов моделирования.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Оценка качества моделей машинного обучения: выбор, интерпретация и применение метрик предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Термины и определения

Модель машинного обучения — алгоритм, который использует статистические методы для обучения на данных и прогнозирования результатов на новых данных.

Метрика качества модели — инструмент для оценки производительности модели машинного обучения. Метрики качества модели позволяют измерить точность и качество работы модели на данных.

Задача классификации — задача машинного обучения, при которой модель должна отнести объекты к определенным классам на основе характеристик объектов.

Задача регрессии — задача машинного обучения, при которой модель должна предсказать численный выход на основе входных данных.

Задача кластеризации — задача машинного обучения, при которой модель должна группировать объекты в кластеры на основе сходства между объектами.

Задача обнаружения аномалий — задача машинного обучения, при которой модель должна определять объекты, которые отличаются от нормального поведения.

Задача обнаружения объектов — задача машинного обучения, при которой модель должна обнаруживать объекты на изображениях и видео.

Accuracy (Точность) — метрика качества модели для задач классификации, которая определяет долю правильных ответов, которые модель дает для всех классов.

Precision (Точность) — метрика качества модели для задач классификации, которая определяет долю истинно положительных ответов относительно всех положительных ответов.

Recall (Полнота) — метрика качества модели для задач классификации, которая определяет долю истинно положительных ответов относительно всех истинно положительных и ложно отрицательных ответов.

F1-score (F-мера) — метрика качества модели для задач классификации, которая является гармоническим средним между точностью и полнотой.

ROC AUC — метрика качества модели для задач классификации, которая измеряет способность модели различать между классами.

Mean Squared Error (MSE) — метрика качества модели для задач регрессии, которая измеряет среднеквадратическую ошибку между прогнозируемым и фактическими значениями.

Root Mean Squared Error (RMSE) — метрика качества модели для задач регрессии, которая является корнем из среднеквадратической ошибки.

Mean Absolute Error (MAE) — метрика качества модели для задач регрессии, которая измеряет среднюю абсолютную ошибку между прогнозируемым и фактическим значением.

R-squared (коэффициент детерминации) — метрика качества модели для задач регрессии, которая измеряет долю дисперсии, которая может быть объяснена моделью.

Silhouette coefficient (коэффициент силуэта) — метрика качества модели для задач кластеризации, которая измеряет степень разделения кластеров.

Calinski-Harabasz index (индекс Калински-Харабаса) — метрика качества модели для задач кластеризации, которая измеряет степень разделения кластеров и межкластерное расстояние.

Davies-Bouldin index (индекс Дэвиса-Болдина) — метрика качества модели для задач кластеризации, которая измеряет суммарное сходство кластеров и их компактность.

AUROC (площадь под кривой операционной характеристики получателя) — метрика качества модели для задач обнаружения аномалий и классификации, которая измеряет способность модели различать между классами и находить аномалии.

Mean Average Precision (mAP) — метрика качества модели для задач обнаружения объектов, которая измеряет среднюю точность распознавания объектов на изображениях.

Intersection over Union (IoU) — метрика качества модели для задач обнаружения объектов, которая измеряет степень перекрытия между прогнозируемыми и фактическими объектами на изображениях.

Overfitting (переобучение) — явление, когда модель слишком хорошо запоминает данные обучения и не может обобщать на новые данные.

Underfitting (недообучение) — явление, когда модель не может достичь достаточной точности на данных обучения и не может обобщать на новые данные.

Cross-validation (кросс-валидация) — метод оценки производительности модели путем разделения данных на несколько частей и обучения модели на одной части и тестирования на другой. Этот процесс повторяется несколько раз с разными разбиениями данных, чтобы усреднить оценку производительности модели.

Hyperparameters (гиперпараметры) — параметры модели машинного обучения, которые настраиваются перед обучением и влияют на ее производительность и способность обобщать на новые данные.

Bias (смещение) — ошибка модели, которая происходит из-за ее недостаточной сложности и невозможности захватить сложные зависимости в данных.

Variance (дисперсия) — ошибка модели, которая происходит из-за ее слишком большой сложности и способности переобучаться на данных обучения.

Regularization (регуляризация) — метод, используемый для уменьшения переобучения модели путем добавления штрафа за сложность модели.

Feature engineering (инженерия признаков) — процесс преобразования и выбора признаков для улучшения производительности модели и увеличения ее способности обобщать на новые данные.

Оглавление

* * *

Приведённый ознакомительный фрагмент книги Оценка качества моделей машинного обучения: выбор, интерпретация и применение метрик предоставлен нашим книжным партнёром — компанией ЛитРес.

Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других

Смотрите также

а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ э ю я