Введение:

В обширной области машинного обучения алгоритм K-ближайших соседей (KNN) занимает видное место как простой, но эффективный метод классификации и регрессии. Как интуитивно понятный и непараметрический алгоритм, KNN приобрел популярность благодаря своей способности обрабатывать категориальные и числовые данные. В этой статье мы рассмотрим основы, принципы работы и применение алгоритма KNN в машинном обучении.

Понимание алгоритма KNN:

Алгоритм K ближайших соседей — это метод обучения с учителем, используемый для задач классификации и регрессии. Он работает по принципу, что подобные состояния близки в пространстве признаков. В KNN «K» представляет количество ближайших соседей, используемых для предсказания или принятия решения.

Работа алгоритма KNN:

Подготовьте данные:

Собирайте и обрабатывайте наборы данных, следя за тем, чтобы данные были в соответствующем формате. Разделите базу данных на обучающий набор и тестовый набор, чтобы оценить производительность модели.

  • Вычислить расстояние. Определяет меру расстояния, обычно евклидово расстояние, для измерения сходства между событиями в пространстве признаков.
    Вычисляет расстояние между тестовым экземпляром и всеми обучающими экземплярами.
  • Определение соседей K. Выберите ближайшего соседа к тестовой выборке на основе рассчитанного расстояния.
    Выбор K имеет решающее значение и может быть определен с помощью таких методов, как перекрестная проверка.

  • Классификация или регрессия.Для задачи классификации определите класс большинства среди K ближайших соседей и назначьте его тестовому набору.
    Для задач регрессии вычислите среднее или средневзвешенное значение K ближайших соседей. целевые значения и назначить их тесту.
  • Оценка. Оцените точность или производительность модели KNN, используя соответствующие показатели оценки, такие как точность, правильность, полнота или среднеквадратическая ошибка (MSE).

Применения алгоритма KNN:

Распознавание изображений. KNN успешно используется в задаче распознавания изображений путем сравнения сходства значений пикселей.

Система рекомендаций.KNN можно использовать в системе рекомендаций, чтобы предлагать продукты, фильмы или музыку на основе пользовательских предпочтений и сходства между пользователями.

Обнаружение аномалий. Выявляя экземпляры, которые значительно отличаются от своих соседей, KNN может помочь обнаружить аномалии или выбросы в базе данных.

Интеллектуальный анализ текста.KNN можно использовать для классификации текстовых документов на основе их сходства или для прогнозирования тональности заданного текста.

Здравоохранение.KNN применяется в здравоохранении, например для диагностики заболеваний на основе симптомов пациента или прогнозирования результатов лечения пациентов.

импортируйте KNeighborsClassifier из sklearn.neighbors
sklearn.model_selection

# Набор данных
X = [[2, 1], [7, 4], [3, 1], [2, 5], [6, 1], [8, 3]]
y = ['А', 'Б', 'А', 'Б', 'Б', 'А']

# Разделить базу данных на наборы для обучения и тестирования
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0,2, random_state=42)

# Создать классификатор KNN с k = 3
knn = KNeighborsClassifier ( n_neighbors = 3 )

# Обучить классификатор
knn.fit(X_train, y_train)

# Делаем предположения по тестовому набору
y_pred = knn.predict(X_test)

# Рассчитать точность классификатора
точность = показатель точности (y_test, y_pred)
print («Точность:», точность)

Результаты:

Алгоритм K-ближайших соседей (KNN) — это универсальный и широко используемый метод машинного обучения. Его простота, ясность и способность обрабатывать различные типы данных делают его ценным инструментом для многих задач классификации и регрессии. Используя понятия подобия и близости, алгоритм KNN делает эффективные прогнозы и решения. Понимание принципов и приложений KNN позволяет специалистам по машинному обучению применять эти алгоритмы в различных областях и использовать их потенциал для точного и глубокого анализа.

Хэштеги:

#MachineLearning #AI #DataScience #Python #knn #KNearestNeighbors