Публикации по теме 'gradient-descent'
Все о градиентном спуске
Градиентный спуск — это алгоритм оптимизации, который используется при обучении модели машинного обучения. Он основан на выпуклой функции и итеративно настраивает ее параметры, чтобы минимизировать данную функцию до ее локального минимума. Мы можем начать с определения значений начального параметра (наклона и точки пересечения), а затем алгоритм градиентного спуска использует исчисление для итеративной корректировки значений, чтобы они минимизируют данную функцию стоимости. Чтобы полностью..
Проблемы с градиентным спуском и как их решить?
При работе с нейронной сетью обратного распространения мы меняем значение весов в каждую эпоху так, чтобы значение функции стоимости было минимальным. Для минимизации функции стоимости используется градиентный спуск. Градиентный спуск — это итерационный метод. Мы начинаем с некоторого набора значений для параметров нашей модели (веса и смещения) и постепенно улучшаем их.
Основные проблемы при работе с нейронной сетью обратного распространения:
1. Исчезающие градиенты
2. Взрывной..
Вопросы по теме 'gradient-descent'
Уменьшит ли больший размер пакета время вычислений в машинном обучении?
Я пытаюсь настроить гиперпараметр, то есть размер пакета в CNN. У меня есть компьютер с corei7, RAM 12 ГБ, и я тренирую сеть CNN с набором данных CIFAR-10, который можно найти в этом блог . Теперь сначала, что я прочитали и узнали о размере...
19.05.2024
Почему мой градиент неверен (Coursera, Logistic Regression, Julia)?
Я пытаюсь сделать логистическую регрессию из Coursera в Julia, но это не работает.
Код Джулии для расчета градиента:
sigmoid(z) = 1 / (1 + e ^ -z)
hypotesis(theta, x) = sigmoid(scalar(theta' * x))
function gradient(theta, x, y)
(m, n) =...
13.04.2024
Новые материалы
Анатомия SDK
Анатомия SDK
Большинство инженеров полагаются на комплекты для разработки программного обеспечения или SDK в своей повседневной работе. Многие в нашей отрасли признают SDK набором..
Понимание агентов (Часть — 3)
Это третья часть серии «Введение в ИИ». Присоединяйтесь к нам, поскольку мы исследуем различные аспекты искусственного интеллекта во всей этой серии. Начальные части серии будут связаны ниже..
Обоснование вызовов кодирования 2023 в Javascript
Здравствуйте! Я собираюсь познакомить вас с подробным объяснением двух проблем с кодированием, с которыми я столкнулся во время интервью в 2023 году. Внимание! Я подробно описал здесь многое,..
5 причин, по которым ML и AI подвели нас в нефтегазовом секторе
Пришло время осознать: ИИ и машинное обучение - замысловатые словечки. Вы когда-нибудь слышали о невероятном механизме искусственного интеллекта в виде черного ящика, поддерживаемом машинным..
Обзор кода — Миссия невыполнима?
Обзор кода — миссия невыполнима?
3 расширения VsCode, которые помогут вам ориентироваться в коде!
Как новый пользователь Visual Studio Code, мне иногда трудно перемещаться по открывающему и..
BrightFuture (реализация интерфейса Java Future на Golang)
Отказ от ответственности: это моя первая статья на medium.com. Я постарался сделать это по-настоящему простым, и люди, находящиеся на любом этапе своей учебной лестницы, могут извлечь..
Серия блогов по ускорению вывода на основе глубокого обучения — Часть 2 — Аппаратное обеспечение
Глубокие нейронные сети стали обычной практикой во многих приложениях машинного обучения. Их способность достигать человеческой и даже сверхчеловеческой точности сделала их важной вехой в истории..