1. Оптимальный план подвыборки для полиномиальной регрессии (arXiv)

Автор: Торстен Рейтер, Райнер Швабе.

Аннотация: Улучшения в технологии приводят к увеличению доступности больших наборов данных, что делает потребность в сокращении данных и информативных подвыборках еще более важной. В этой статье мы строим D-оптимальные планы подвыборки для полиномиальной регрессии в одной коварианте для инвариантных распределений ковариаты. Мы более внимательно изучаем квадратичную регрессию для конкретных распределений. В частности, мы делаем заявления о форме результирующих оптимальных планов подвыборки и о влиянии размера подвыборки на план. Чтобы проиллюстрировать преимущества оптимальных планов подвыборки, мы исследуем эффективность однородной случайной подвыборки.

2. Полиномиальная сплайн-регрессия: теория и применение (arXiv)

Автор: Митхун Кумар Ачарджи, Кумер Пиал Дас.

Аннотация: чтобы иметь дело с нелинейными отношениями между предикторами и откликом, мы можем использовать преобразования, чтобы данные выглядели линейными или приблизительно линейными. Однако на практике методы преобразования могут оказаться неэффективными, и может оказаться более эффективным использование гибких методов регрессии, которые могут автоматически обрабатывать нелинейное поведение. Одним из таких методов является регрессия полиномиального сплайна (PS). Поскольку количество возможных моделей сплайн-регрессии велико, требуются эффективные стратегии для выбора лучшей из них. В этом исследовании теоретически и практически исследуются различные модели сплайновой регрессии (полиномиальный сплайн на основе усеченной мощности, B-сплайн и P-сплайн). Мы сосредоточимся на фундаментальных концепциях, поскольку сплайн-регрессия теоретически богата. В частности, мы фокусируемся на прогнозировании с использованием перекрестной проверки (CV), а не на интерпретации, поскольку полиномиальные сплайны сложно интерпретировать. Мы сравниваем разные модели PS на основе реального набора данных и делаем вывод, что модель P-сплайна является лучшей.