You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
{{ message }}
This repository was archived by the owner on Oct 26, 2021. It is now read-only.
Необходимо написать python-скрипт, который будет запускать обработку датасета на нескольких предопределенных конфигурационных файлах (список процессоров внутри на свой вкус).
Необходимо написать python-скрипт, который будет запускать обработку датасета на нескольких предопределенных конфигурационных файлах (список процессоров внутри на свой вкус).
Для справки:
Loader - базовый класс в TDC для запуска процессоров: https://github.com/TextDatasetCleaner/TextDatasetCleaner/blob/master/src/textdatasetcleaner/loaders.py
Пример использования Loader: https://github.com/TextDatasetCleaner/TextDatasetCleaner/blob/master/src/textdatasetcleaner/cli.py#L57
Также, в этой задаче нужно подготовить несколько конфигов (>2), чтобы запускать обработку на них в цикле.
Будет хорошим бонусом, если:
.gitignoreили сделать ссылкой в скачивании)