Статьи по тематике data

Публикации по теме 'data'

8 советов и рекомендаций по работе с большими наборами данных в машинном обучении

Основное руководство по оптимизации памяти и кода Pandas и Scikit-learn - популярные библиотеки в сообществе специалистов по науке о данных, поскольку они обладают высокой производительностью и простыми в использовании структурами и функциями данных. Pandas предоставляет инструменты анализа данных для подготовки и анализа данных. Эти библиотеки хорошо работают, работая с наборами данных в памяти (данными, которые помещаются в ОЗУ), но когда дело доходит до обработки наборов данных..

Оправдывает ли повышенная точность дополнительную сложность модели машинного обучения?

Поскольку вычислительная мощность компьютеров становится дешевле и доступнее, для достижения большей точности все чаще используются сложные алгоритмы машинного обучения. Однако оправдывает ли повышение точности добавленную сложность? Чтобы ответить на этот вопрос, я провел небольшой эксперимент. Я обучил и протестировал набор данных Доход взрослых с различными алгоритмами классификации машинного обучения, чтобы наблюдать разницу в AUC (площадь под кривой) и времени, затрачиваемом..

5 статей для чтения по использованию искусственного интеллекта с роботизированной автоматизацией

Управление трафиком с помощью социального робота-гуманоида ( arXiv ) Автор: Фейсал Гаффар Аннотация . С развитием таких технологий, как искусственный интеллект, машинное обучение и Интернет вещей, стало легко разрабатывать больше роботов-гуманоидов и автоматизировать различные процессы. Интерактивный робот должен иметь высокое социальное поведение, чтобы его могли легко принять люди, использующие его. В этом исследовании мы разработали робота дорожной полиции (TRAPROB) для..

Как подготовить данные для машинного обучения

Подготовка данных к моделированию — один из первых фундаментальных этапов работы с данными Обучение прогностических моделей требует, чтобы наши данные были в соответствующем формате. Мы не можем передать наш файл .csv модели и ожидать, что она научится правильно обобщать. В этой статье мы рассмотрим, как подготовить данные для машинного обучения, начиная с конвейера подготовки данных и заканчивая его разделением на наборы для обучения, проверки и тестирования. Конвейер подготовки..

Работа с полиномиальной регрессией, часть 1 (машинное обучение)

Оптимальный план подвыборки для полиномиальной регрессии (arXiv) Автор: Торстен Рейтер , Райнер Швабе . Аннотация: Улучшения в технологии приводят к увеличению доступности больших наборов данных, что делает потребность в сокращении данных и информативных подвыборках еще более важной. В этой статье мы строим D-оптимальные планы подвыборки для полиномиальной регрессии в одной коварианте для инвариантных распределений ковариаты. Мы более внимательно изучаем квадратичную регрессию для..

Банки Digital Next с интеллектуальными платформами на базе AI/ML

Сегодня банки имеют доступ к огромному количеству данных о клиентах, продуктах и операционных данных. Данные поступают из внутренних и внешних источников, включая потоковые данные в реальном времени с датчиков, устройств, мобильных приложений, IoT и корпоративных центров обработки данных. Банки также борются с использованием неструктурированных данных, таких как комментарии, жалобы, электронные письма и т. д., помимо структурированных данных, находящихся в архиве. По мере того, как..

Добавление динамических данных из Javascript на сайты Hype

Hype от Tumult - отличный инструмент для некодеров, позволяющий создавать впечатляющие веб-сайты, особенно если вы ищете что-то довольно динамичное. Для людей, знакомых с AfterEffects или Sketch, его интерфейс очень похож. Hype даже позволяет вам добавлять свои собственные функции javascript, что означает, что вы даже можете создать динамический веб-сайт, подобный CMS, без необходимости знать какой-либо код. В этом руководстве мы собираемся использовать Hype для динамического обновления..

Новые материалы

Я спросил GPT

Я спросил GPT о самосознании: Самосознание – это способность распознавать и понимать собственные мысли, чувства и поведение. Это предполагает осознание себя и понимание того, как свои..

Работа с алгоритмом Forward-Backward часть 2 (искусственный интеллект)

Стохастический алгоритм прямого и обратного типа Ценга для монотонных включений (arXiv) Автор: Ван Дунг Нгуен , Нгуен Винь Аннотация: В этой статье мы предлагаем стохастическую версию..

Сжатие цифровых изображений: обзор

Эта история была написана Лаик Аслам , членом группы технического контента Educative. Введение в цифровые изображения В этом блоге обсуждаются цифровые изображения и некоторые методы..

Примеры использования командной строки Laravel Artisan 2020

Платформа Laravel предоставляет три основных инструмента для взаимодействия через командную строку, а именно: Artisan, Ticker и REPL . В этой главе подробно рассказывается о Artisan...

Что такое визуализация данных?

Визуализация данных в машинном обучении и науке о данных Визуализация данных — очень важная тема в машинном обучении и науке о данных. Визуализация данных, как следует из названия,..

Генерация взрывов с помощью Python

Объяснение генераторов Python и комбинаторного взрыва Я рад показать вам весь новый мир генераторов на Python и, надеюсь, привнесу немного математики во все ваши жизни (потому что каждому всегда..

8 советов и рекомендаций по работе с большими наборами данных в машинном обучении

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Python Software Development Coding Deep Learning AI React Software Engineering Nodejs Front End Development Typescript Computer Science Java Development Algorithms NLP Angular Javascript Tips HTML Python Programming ChatGPT Developer Tech Programming Languages API Data Visualization Reactjs Data CSS Neural Networks Code Tutorial Open Source Computer Vision