Корпус с аргументативной разметкой текстов для обучения генеративных моделей.

Включает 3 подкорпуса:
    - ArgSciArtRu --- корпус научных статей;
    - news        --- новостной корпус;
    - reviews     --- корпус рецензий на научные статьи.

Каждый подкорпус - это файл формата JSON Lines, где каждая запись включает:
    - text_id     --- идентификатор текста;
    - source      --- исходный текст;
    - target      --- разметка (аргументация в тексте).

Для каждого корпуса приложен файл с разбивкой на 5 фолдов. Каждый фолд включает три поля:
    - train       --- список идентификаторов текстов, на которых обучаемся;
    - dev         --- тексты для валидации;
    - test        --- тексты для тестирования.