Матрица | Вектор интеллекта

Когда мы слышим слово «матрица», у нас возникает интуитивное представление о прямоугольном массиве чисел, или так это называется в книгах.

Изучая главу «Матрица» в школьной математике, кто бы мог подумать, что это прямоугольное представление чисел и есть то, за чем охотится ИИ. Для лучшего понимания того, как матрица взаимодействует с машинным обучением, предположим, что у вас есть «m» признаков объекта, которые вы хотите, чтобы ваш алгоритм машинного обучения искал, для классификации этого объекта как «A» или «B». Если мы представляем эти функции в виде вектора-столбца, то мы говорим, что этот вектор представляет собой одномерную матрицу-столбец, содержащую функции, которые классифицируют нашу модель в любой из вышеупомянутых категорий. Теперь можем ли мы классифицировать неизвестный объект по категории, взглянув только на один пример функции? Концепция здесь довольно проста. Нам нужны, может быть, тысячи подобных функций, которые идентифицируют объект как «А» или «Б». Давайте увеличим количество столбцов до «n», каждый из которых содержит характеристики объекта. Теперь у нас есть матрица данных, скажем «A», порядка m x n, в которой каждый столбец является вектором признаков, а строки — обучающими примерами.

Например, возьмем неглубокую нейронную сеть, имеющую только один скрытый слой в качестве нашего классификатора, а скрытый слой состоит из четырех нейронов. Один из столбцов признаков, скажем «x», содержащий x1,x2,x3 .. до xm, выбирается из матрицы, и мы инициализируем матрицу radom 'w' порядка 4 x m, которая называется матрицей весов. Скалярное произведение матрицы весов и вектора-столбца добавляется к другой случайно инициализированной матрице "b", известной как смещение. Обратите внимание, что размеры b равны (4,1), потому что результирующая матрица скалярного произведения w(4,m) и x(m,1) имеет размеры (4,1). Результирующая матрица, скажем, «а», передается в функцию активации (предпочтительно сигмовидную функцию в случае неглубокой сети), которая отображает каждый элемент матрицы в функцию. Сигмовидная функция связывает каждый элемент в диапазоне [0,1]. Заметим, что вертикальной асимптоты этой функции не существует.

Работа, которую мы сделали до сих пор, выглядит примерно так

Та же процедура повторяется на следующем слое сети, который, наконец, классифицирует объекты в один из классов. Выходные данные можно обрабатывать с помощью функции softmax, которая распределяет выходные данные на основе вероятностей. При прогнозировании вычисляется средняя абсолютная ошибка, а затем в игру вступает алгоритм обратного распространения ошибки, который заставляет нейронную сеть обучаться.

Заключение

Кажется, что определение «прямоугольное представление» подходит и для машинного обучения. Матрица является одним из наиболее важных понятий, необходимых в области линейной алгебры, которая способствует машинному обучению.

Machine Learning Mathematics

материалы по теме:

Новые материалы

Google исследует, как использовать AutoML для оптимизации прогнозирования временных рядов

Новый метод, предложенный Google, использует AutoML для изучения различных архитектур временных рядов для данной проблемы. Недавно я запустил образовательный информационный бюллетень,..

Задача NumPy: создание одномерного массива NumPy

Задача NumPy: создание одномерного массива NumPy Создайте функцию с именем array_numpy(n) , которая принимает целое число n в качестве аргумента и возвращает одномерный массив NumPy со..

Один простой способ разделить данные на обучающие и тестовые наборы для машинного обучения.

Давайте посмотрим, как это сделать с помощью Scikit-Learn. Почему мы разделяем данные? В машинном обучении обычной практикой является разделение набора данных на 2 подмножества: набор для..

Получить в руки Mongo DB

Привет, ребята, надеюсь, вам понравилось читать мой последний блог, в котором мы обсуждали основы Mongo DB. Вместе мы прошли все ключевые функции, такие как установка среды Mongo DB, создание базы..

Сведения о типе исключения

Пару статей назад мы определили базовый тип исключения. Сегодня мы более подробно рассмотрим, как работают эти типы исключений. Мы рассмотрим, как можно перехватывать все исключения, а также..

Подсчет машин на шоссе с помощью компьютерного зрения C #

В этой статье я покажу вам, как создать приложение, которое может считать автомобили на шоссе. Итак, вот как выглядит окончательное приложение: Мое приложение воспроизводит видео о пробках и..

Docker 101 и почему он полезен в сфере Data Science

Если вы работали в области разработки программного обеспечения, вы, вероятно, слышали о Docker, популярной платформе, позволяющей создавать, запускать и совместно использовать приложения с помощью..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Python Software Development Web Development Coding Deep Learning AI React Software Engineering Nodejs Front End Development Typescript Java Computer Science Development NLP Tech Programming Languages Algorithms HTML Angular Python Programming Javascript Tips Data ChatGPT API Reactjs Developer Code Data Visualization CSS Neural Networks Tutorial Computer Vision Statistics