Нормализация текста — это процесс преобразования необработанного текста в более структурированный формат, пригодный для дальнейшего анализа и обработки. В обработке естественного языка (NLP) нормализация текста является важным этапом предварительной обработки, который может значительно повысить производительность последующих задач, таких как классификация текста, поиск информации и машинный перевод.