Какие бывают модели в Machine Learning?
Ответ
Чтобы выполнить определенную задачу, каждая модель обучается на данных. Это нужно и для распознания получившихся образов, и для классификации, и для результатов или предсказаний. Данные — это основа. Только с ними обнаруживаются закономерности или зависимости.
Существует классическая работа программиста, который пишет алгоритмы движения программы. Они основываются на определенных условиях, например: если какое-то событие произошло, то необходимо выполнить те или иные действия. И таких ответвлений может быть чрезвычайно много. Именно таким образом строится алгоритм работы робота-пылесоса: при столкновении со стеной ему необходимо повернуть, скажем, вправо, затем проехать, развернуться и т.д.
Отличия Machine Learning состоят в том, что алгоритм анализа данных не прописывается. Machine Learning дается большой объем размеченных данных, на основе которых уже обучается модель (в нем – обучении – в большинстве случаев человек также принимает участие). То есть классический программист пишет жесткие условия, а в машинном обучении происходит настройка алгоритмических связей, как бы прокладывается путь, по которым модель будет действовать.
Важно: результат работы нейросетей - это не всегда точное значение. Это вероятность. Алгоритм, построенный программистом, действует по принципу 3+2=5, а вот калькулятор на основе нейросети на тот же вопрос выдаст ответ следующего характера: “с вероятностью 99%, ответ равен 5” или “ответ близок к 4,99”.
Задача человека, который обучает модели, приблизить результат к максимально более точному значению.
Модели создаются с помощью алгоритмов:
Линейной регрессии. В этом случае отображается зависимость одних исходных данных от других. Показатели наносятся на график, и зависимость отображается максимально точно.
Деревьев решений. Этот тип модели напоминает тест. Отвечая на вопрос за вопросом, машина проходит определенный путь и выносит вердикт. Каждый новый вопрос-ответ формирует разветвление, потому модель и названа деревом решений.
Нейронных сетей. Такой алгоритм можно сравнить с огромной панелью, на которой находится множество лампочек. Например, вы дали задачу установке определить, кто изображен на снимке, скажем, кота. Она обрабатывает данные, которые вы предоставили, и распознает усы, лапы и хвост. Условно загорается несколько лампочек, и модель говорит, что перед ней кот. Конечно, наш пример довольно примитивен. В реальности система будет иметь дело с тысячами данных и включать в своем процессоре тысячи лампочек.
Чтобы машины давали точные результаты и были эффективными, их нужно правильно обучить: не допустить переобучения или недообучения, дать правильные настройки параметров. Не стоит забывать, что любой механизм — от диагностической установки в операционной до домашней кофемашины — нужно контролировать и время от времени усовершенствовать. Как видим, у инженеров по машинному обучению дел невпроворот.
Существует классическая работа программиста, который пишет алгоритмы движения программы. Они основываются на определенных условиях, например: если какое-то событие произошло, то необходимо выполнить те или иные действия. И таких ответвлений может быть чрезвычайно много. Именно таким образом строится алгоритм работы робота-пылесоса: при столкновении со стеной ему необходимо повернуть, скажем, вправо, затем проехать, развернуться и т.д.
Отличия Machine Learning состоят в том, что алгоритм анализа данных не прописывается. Machine Learning дается большой объем размеченных данных, на основе которых уже обучается модель (в нем – обучении – в большинстве случаев человек также принимает участие). То есть классический программист пишет жесткие условия, а в машинном обучении происходит настройка алгоритмических связей, как бы прокладывается путь, по которым модель будет действовать.
Важно: результат работы нейросетей - это не всегда точное значение. Это вероятность. Алгоритм, построенный программистом, действует по принципу 3+2=5, а вот калькулятор на основе нейросети на тот же вопрос выдаст ответ следующего характера: “с вероятностью 99%, ответ равен 5” или “ответ близок к 4,99”.
Задача человека, который обучает модели, приблизить результат к максимально более точному значению.
Модели создаются с помощью алгоритмов:
Линейной регрессии. В этом случае отображается зависимость одних исходных данных от других. Показатели наносятся на график, и зависимость отображается максимально точно.
Деревьев решений. Этот тип модели напоминает тест. Отвечая на вопрос за вопросом, машина проходит определенный путь и выносит вердикт. Каждый новый вопрос-ответ формирует разветвление, потому модель и названа деревом решений.
Нейронных сетей. Такой алгоритм можно сравнить с огромной панелью, на которой находится множество лампочек. Например, вы дали задачу установке определить, кто изображен на снимке, скажем, кота. Она обрабатывает данные, которые вы предоставили, и распознает усы, лапы и хвост. Условно загорается несколько лампочек, и модель говорит, что перед ней кот. Конечно, наш пример довольно примитивен. В реальности система будет иметь дело с тысячами данных и включать в своем процессоре тысячи лампочек.
Чтобы машины давали точные результаты и были эффективными, их нужно правильно обучить: не допустить переобучения или недообучения, дать правильные настройки параметров. Не стоит забывать, что любой механизм — от диагностической установки в операционной до домашней кофемашины — нужно контролировать и время от времени усовершенствовать. Как видим, у инженеров по машинному обучению дел невпроворот.