Процесс машинного обучения

Сегодня мы собираемся узнать о процессе, связанном с моделью машинного обучения, очень глубоко, мы можем легко понять, что происходит.

Есть 3 шага, связанные с ML.

1. Предварительная обработка данных

2. Моделирование

3. Оценка

Предварительная обработка данных

В дальнейшей предварительной обработке данных у нас есть три задания.

1.импорт данных
2.очистка данных
3.разделение наборов данных на тестовые и обучающие наборы.

Пояснение 1

При импорте данных у нас есть много способов получить данные, например, из нашей базы данных, файла, Интернета, онлайн-потока данных, веб-скрапинга и т. д.

Это зависит от требований и условий заказчика или компании, откуда брать данные.

В основном, как инженер машинного обучения, вы будете получать данные в таблице или через Интернет.

Пояснение 2

Очистка данных — наиболее важная часть машинного обучения. Как инженер по машинному обучению, вы несете ответственность за очистку данных в соответствии с требованиями или условиями.

Существует множество способов очистки данных, поскольку модели машинного обучения работают только с числовыми значениями, поэтому нам необходимо сделать набор данных числовым и т. д. Некоторые важные шаги по очистке данных перечислены ниже.

1. Удаление выбросов
2. Удаление или заполнение значений nan
3. Преобразование значений наборов данных в числовые значения.

4. Преобразование наборов данных в категориальные

Я приду со следующей темой, специально посвященной очистке данных.

Пояснение 3

Почему мы разделяем наборы данных на обучающие и тестовые?

У инженера был вопрос почему и как, правильно?😊

Мы разделяем наборы данных в основном на 80:20 случайным образом, потому что мы используем 80% случайных данных в нашей модели, чтобы увидеть, как наша модель прогнозируется или выполняется. Затем мы используем эти предсказанные значения для сравнения с фактическими значениями, которые составляют 20% случайных данных.

Увидев и оценив производительность модели, мы пойдем дальше, я подробно объясню вам в следующей главе о выборе модели.

2. Моделирование

На этапах моделирования мы выбираем модель на основе требований в таблице, в основном мы видим, какие проблемы мы решаем, такие как кластеризация, регрессия или классификация.

При выборе модели мы используем специальную формулу, чтобы выбрать модель, которая будет эффективно решать наши задачи.

После выбора нашей модели мы обучаем модель на наших наборах данных, которые ранее были разделены на наборы поездов, и тестируем во время этого процесса, мы используем данные набора поездов 80:20.

После обучения данных мы проверяем производительность модели, сравнивая прогнозируемые значения и фактические значения, если они настолько хороши, то мы двигаемся дальше, иначе мы выбираем другую модель, которая лучше всего соответствует требованиям.

3.Оценка

Оценка модели — это метод, который используется для получения производительности модели с помощью таких формул, как матрица решений и т. д.

Это все основы, которые вам не нужно знать, прежде чем углубиться в ML.

Я надеюсь, что вы возьмете что-нибудь в корзину ML.😊

Спасибо 😊

материалы по теме:

Новые материалы

Создание корзины покупок с помощью Redux-Toolkit

В этой статье мы рассмотрим, как использовать Redux Toolkit для управления состоянием в приложении React, на примере корзины покупок. Когда я начал использовать инструментарий redux, моя..

Предварительная обработка данных для машинного обучения

Предварительная обработка данных включает в себя подготовку данных, включающую интеграцию, очистку, нормализацию и преобразование данных; и задачи по сокращению данных; такие как выбор..

Различия между обычными функциями и стрелочными функциями с точки зрения «этого»

Концепции Javascript Различия между обычными функциями и стрелочными функциями с точки зрения «этого» Основное различие между обычными функциями и стрелочными функциями с точки зрения this..

Python + Flask: раскрытие возможностей веб-разработки

Привет! Меня зовут Гейб, и я увлечен обучением других Python и машинному обучению. Сегодня я хочу погрузиться в захватывающий мир веб-разработки с помощью Python и Flask. Это тема,..

Как хранить данные для вашего процесса обработки данных

Узнайте, как разработать эффективную стратегию хранения данных… Данные - новое масло: Все мы знаем, что в современном мире «данные - это новая нефть». Область науки о данных также является..

Нужно ли высшее образование, чтобы быть разработчиком программного обеспечения?

Самый простой ответ: нет. С тех пор, как я поджег операционную систему своего ПК, установив плохо разработанное программное обеспечение со всевозможными ошибками, я знал, что это то, чему я..

ИИ в бизнесе / Развенчаны самые распространенные мифы

Поскольку искусственный интеллект (ИИ) становится все более распространенным в деловом мире, вокруг этой технологии возникло множество мифов и заблуждений. Некоторые из этих мифов могут..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Front End Development Typescript Java Computer Science Development Programming Languages NLP Tech Python Programming Algorithms ChatGPT Data Angular HTML Javascript Tips Developer Reactjs CSS API Code Data Visualization Computer Vision Neural Networks Statistics Learning