LLLit: Изучение и практика программирования

Публикации по теме 'gradient-descent'


Все о градиентном спуске
Градиентный спуск — это алгоритм оптимизации, который используется при обучении модели машинного обучения. Он основан на выпуклой функции и итеративно настраивает ее параметры, чтобы минимизировать данную функцию до ее локального минимума. Мы можем начать с определения значений начального параметра (наклона и точки пересечения), а затем алгоритм градиентного спуска использует исчисление для итеративной корректировки значений, чтобы они минимизируют данную функцию стоимости. Чтобы полностью..

Проблемы с градиентным спуском и как их решить?
При работе с нейронной сетью обратного распространения мы меняем значение весов в каждую эпоху так, чтобы значение функции стоимости было минимальным. Для минимизации функции стоимости используется градиентный спуск. Градиентный спуск — это итерационный метод. Мы начинаем с некоторого набора значений для параметров нашей модели (веса и смещения) и постепенно улучшаем их. Основные проблемы при работе с нейронной сетью обратного распространения: 1. Исчезающие градиенты 2. Взрывной..

Вопросы по теме 'gradient-descent'

Уменьшит ли больший размер пакета время вычислений в машинном обучении?
Я пытаюсь настроить гиперпараметр, то есть размер пакета в CNN. У меня есть компьютер с corei7, RAM 12 ГБ, и я тренирую сеть CNN с набором данных CIFAR-10, который можно найти в этом блог . Теперь сначала, что я прочитали и узнали о размере...

Почему мой градиент неверен (Coursera, Logistic Regression, Julia)?
Я пытаюсь сделать логистическую регрессию из Coursera в Julia, но это не работает. Код Джулии для расчета градиента: sigmoid(z) = 1 / (1 + e ^ -z) hypotesis(theta, x) = sigmoid(scalar(theta' * x)) function gradient(theta, x, y) (m, n) =...

Новые материалы

Анатомия SDK
Анатомия SDK Большинство инженеров полагаются на комплекты для разработки программного обеспечения или SDK в своей повседневной работе. Многие в нашей отрасли признают SDK набором..

Понимание агентов (Часть — 3)
Это третья часть серии «Введение в ИИ». Присоединяйтесь к нам, поскольку мы исследуем различные аспекты искусственного интеллекта во всей этой серии. Начальные части серии будут связаны ниже..

Обоснование вызовов кодирования 2023 в Javascript
Здравствуйте! Я собираюсь познакомить вас с подробным объяснением двух проблем с кодированием, с которыми я столкнулся во время интервью в 2023 году. Внимание! Я подробно описал здесь многое,..

5 причин, по которым ML и AI подвели нас в нефтегазовом секторе
Пришло время осознать: ИИ и машинное обучение - замысловатые словечки. Вы когда-нибудь слышали о невероятном механизме искусственного интеллекта в виде черного ящика, поддерживаемом машинным..

Обзор кода — Миссия невыполнима?
Обзор кода — миссия невыполнима? 3 расширения VsCode, которые помогут вам ориентироваться в коде! Как новый пользователь Visual Studio Code, мне иногда трудно перемещаться по открывающему и..

BrightFuture (реализация интерфейса Java Future на Golang)
Отказ от ответственности: это моя первая статья на medium.com. Я постарался сделать это по-настоящему простым, и люди, находящиеся на любом этапе своей учебной лестницы, могут извлечь..

Серия блогов по ускорению вывода на основе глубокого обучения — Часть 2 — Аппаратное обеспечение
Глубокие нейронные сети стали обычной практикой во многих приложениях машинного обучения. Их способность достигать человеческой и даже сверхчеловеческой точности сделала их важной вехой в истории..