Публикации по теме 'data-science'
Разработка и развертывание проекта Data Science в облаке — Часть I
Применение: анализ и обнаружение оскорбительной речи в тексте
Предисловие
По мере того, как онлайн-платформы становятся привычными для людей, их мнение по проблемам , событиям, людям и т. д. постепенно менялось . сильный>. Это одна из основных причин того, что ненависть и оскорбительные высказывания во многих случаях вызывают разногласия и споры. В результате это стало серьезной проблемой не локально, а глобально .
Обнаружение такого оскорбительного контента..
Большая подборка : лучшие записные книжки на Kaggle — Часть 1
Блокноты, из которых вы узнаете больше всего…
Я участвую в соревнованиях Kaggle последние 4 года в свободное время, и это была невероятная кривая обучения. Как бы мне ни нравилось писать собственное решение проблем на платформе, я тщательно просмотрел некоторые из лучших блокнотов только для того, чтобы найти драгоценные камни, скрытые под ними.
Новый ImageNet: новый эталон восприятия DeepMind для моделей глубокого обучения
Новый тест ориентирован на мультимодальные модели компьютерного зрения.
Недавно я запустил образовательный информационный бюллетень, посвященный ИИ, у которого уже более 125 000 подписчиков. TheSequence — это информационный бюллетень, ориентированный на машинное обучение, без BS (то есть без шумихи, без новостей и т. д.), чтение которого занимает 5 минут. Цель …
Анализ данных и модели машинного обучения для прогнозирования сердечных заболеваний
Введение
По данным ВОЗ, болезни сердца или сердечно-сосудистые заболевания являются основной причиной смерти во всем мире и ежегодно уносят около 17,9 миллионов жизней. В рамках этого проекта я использовал python3 и строил графики, используя matplotlib и seaborn, и наблюдал различные тенденции между факторами риска сердечных заболеваний. Затем я создал логистическую регрессию , машину опорных векторов (SVM), деревья решений и гауссовские наивные байесовские модели ML, используя..
Модель прогнозирования неплательщиков кредитных карт с объяснимостью модели с использованием значений Shap.
Обнаружение мошенничества с кредитными картами — распространенная проблема в машинном обучении. Единственным недостатком является то, что количество неплательщиков значительно меньше, чем честных работающих людей — это создает дисбаланс классов, который создает плохие модели. В этом анализе мы шаг за шагом рассмотрим, как устранить дисбаланс классов с помощью SMOTE, настройки гиперпараметров и объяснимости модели с помощью значений Shaply.
Набор данных:
Набор данных для анализа был..
Последние исследования по реконструкции поверхности 2023, часть 3
Быстрая реконструкция поверхности мозговых оболочек с гарантией топологии слоя (arXiv)
Автор: Пейю Дуань , Юань Сюэ , Шо Хань , Лианруй Цзо , Аарон Карасс , Кейтлин Бернхард , Саванна Хейс , Питер А. Калабрези , Сьюзан М. Резник . , Джеймс С. Дункан , Джерри Л. Принс
Резюме: Мозговые оболочки, расположенные между черепом и мозгом, состоят из трех мембранных слоев: мягкой, паутинной и твердой мозговой оболочки. Реконструкция этих слоев может помочь в изучении различий в..
Руководство специалиста по данным по K-ближайшим соседям
В моей предыдущей статье о пяти лучших моделях мл, которые должен знать каждый специалист по данным , я упомянул K-ближайших соседей как популярный алгоритм машинного обучения с учителем. Модели KNN чрезвычайно просты в построении, и в этой статье мы рассмотрим основы, которые познакомят вас с этой техникой.
Новые материалы
Как развивается смешанно-целочисленное программирование, часть 7
Унифицированная техника раннего завершения для первично-двойственных алгоритмов в смешанно-целочисленном коническом программировании (arXiv)
Автор : Ювэнь Чэнь , Кэтрин Нин , Поль Гулар..
Как научить модель Keras распознавать текст переменной длины
Я некоторое время играл с официальным примером Keras image_ocr.py и хочу поделиться своими выводами в этом посте.
В официальном примере выполняется только обучение модели, но отсутствует..
Практическая пакетная нормализация
История начинается после использования инициализации He вместе с ELU (или любым вариантом ReLU) может значительно снизить опасность проблем с исчезающими/взрывающимися градиентами в начале..
Поэзия онлайн-кодирования: путешествие пикселей и страсти
В мире, наполненном инновациями, онлайн-обучение программированию становится холстом, на котором обретает форму полотно вашей мечты. Это больше, чем просто создание строк кода; это сродни..
Обработка изображений с помощью Python - размытие и повышение резкости для начинающих
Как применить ядра свертки к цветным изображениям?
В этой статье мы обсудим, как применять ядра размытия и повышения резкости к изображениям. Эти базовые ядра составляют основу многих более..
Ограничение скорости в .NET Core 7 Web API
Что такое ограничение скорости?
Ограничение скорости — это процесс, используемый для ограничения количества запросов, разрешенных для определенного ресурса в указанном временном окне. .NET..
Стабильная Diffusion 1.0 выдаёт более красивые картинки, чем SD 2.1?! Почему?
Удивительные открытия, которые я сделал недавно. Смотрите в видео: https://youtu.be/PakgD6FewoU
Есть одно логичное объяснение — что у вас?