Статьи по тематике gradient-descent

Публикации по теме 'gradient-descent'

Все о градиентном спуске

Градиентный спуск — это алгоритм оптимизации, который используется при обучении модели машинного обучения. Он основан на выпуклой функции и итеративно настраивает ее параметры, чтобы минимизировать данную функцию до ее локального минимума. Мы можем начать с определения значений начального параметра (наклона и точки пересечения), а затем алгоритм градиентного спуска использует исчисление для итеративной корректировки значений, чтобы они минимизируют данную функцию стоимости. Чтобы полностью..

Проблемы с градиентным спуском и как их решить?

При работе с нейронной сетью обратного распространения мы меняем значение весов в каждую эпоху так, чтобы значение функции стоимости было минимальным. Для минимизации функции стоимости используется градиентный спуск. Градиентный спуск — это итерационный метод. Мы начинаем с некоторого набора значений для параметров нашей модели (веса и смещения) и постепенно улучшаем их. Основные проблемы при работе с нейронной сетью обратного распространения: 1. Исчезающие градиенты 2. Взрывной..

Вопросы по теме 'gradient-descent'

Уменьшит ли больший размер пакета время вычислений в машинном обучении?

Я пытаюсь настроить гиперпараметр, то есть размер пакета в CNN. У меня есть компьютер с corei7, RAM 12 ГБ, и я тренирую сеть CNN с набором данных CIFAR-10, который можно найти в этом блог . Теперь сначала, что я прочитали и узнали о размере...

19.05.2024

Почему мой градиент неверен (Coursera, Logistic Regression, Julia)?

Я пытаюсь сделать логистическую регрессию из Coursera в Julia, но это не работает. Код Джулии для расчета градиента: sigmoid(z) = 1 / (1 + e ^ -z) hypotesis(theta, x) = sigmoid(scalar(theta' * x)) function gradient(theta, x, y) (m, n) =...

gradient julia logistic-regression gradient-descent

13.04.2024

Новые материалы

Анатомия SDK

Анатомия SDK Большинство инженеров полагаются на комплекты для разработки программного обеспечения или SDK в своей повседневной работе. Многие в нашей отрасли признают SDK набором..

Понимание агентов (Часть — 3)

Это третья часть серии «Введение в ИИ». Присоединяйтесь к нам, поскольку мы исследуем различные аспекты искусственного интеллекта во всей этой серии. Начальные части серии будут связаны ниже..

Обоснование вызовов кодирования 2023 в Javascript

Здравствуйте! Я собираюсь познакомить вас с подробным объяснением двух проблем с кодированием, с которыми я столкнулся во время интервью в 2023 году. Внимание! Я подробно описал здесь многое,..

5 причин, по которым ML и AI подвели нас в нефтегазовом секторе

Пришло время осознать: ИИ и машинное обучение - замысловатые словечки. Вы когда-нибудь слышали о невероятном механизме искусственного интеллекта в виде черного ящика, поддерживаемом машинным..

Обзор кода — Миссия невыполнима?

Обзор кода — миссия невыполнима? 3 расширения VsCode, которые помогут вам ориентироваться в коде! Как новый пользователь Visual Studio Code, мне иногда трудно перемещаться по открывающему и..

BrightFuture (реализация интерфейса Java Future на Golang)

Отказ от ответственности: это моя первая статья на medium.com. Я постарался сделать это по-настоящему простым, и люди, находящиеся на любом этапе своей учебной лестницы, могут извлечь..

Серия блогов по ускорению вывода на основе глубокого обучения — Часть 2 — Аппаратное обеспечение

Глубокие нейронные сети стали обычной практикой во многих приложениях машинного обучения. Их способность достигать человеческой и даже сверхчеловеческой точности сделала их важной вехой в истории..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Front End Development Typescript Java Computer Science Development NLP Tech Algorithms Programming Languages Python Programming Angular HTML Javascript Tips ChatGPT Data Reactjs Developer API Code Data Visualization CSS Tutorial Neural Networks Computer Vision Statistics