Кто должен платить авторам, чьи тексты учат нейросети

Генеративные модели не появляются из воздуха: чтобы научиться писать связный текст, они прочитывают миллиарды чужих страниц. Среди этих страниц — книги, статьи и посты, которые кто-то написал, рассчитывая на оплату или хотя бы на упоминание. Вопрос, кто и сколько должен платить авторам за такое обучение, перестал быть теоретическим. Я считаю, что бесплатное использование чужих текстов для тренировки коммерческих моделей несправедливо, и попробую объяснить почему, не сводя всё к лозунгам.

Что показывают настроения авторов

Опросы внутри писательского сообщества дают довольно однозначную картину. Около 90% авторов считают, что им должны платить за использование их произведений в обучении ИИ, а примерно две трети поддерживают идею коллективного лицензирования — единой системы, которая собирала бы отчисления и распределяла их между правообладателями. Это не каприз: значительная доля авторов прямо говорит, что видит в генеративных моделях угрозу своей профессии.

Можно спорить, преувеличена ли эта тревога. Но факт остаётся фактом: люди, чей труд стал сырьём, в массе своей не давали на это осознанного согласия и не получили за это ничего.

Аргумент про обучение как чтение

Самое популярное возражение звучит так: модель просто учится на текстах, как учится человек, который много читает. Мы же не платим писателю каждый раз, когда кто-то прочитал его книгу и стал лучше формулировать мысли.

Аналогия красивая, но хромает в важном месте. Человек читает в ограниченных масштабах и не воспроизводит прочитанное промышленно. Коммерческая модель копирует тексты целиком на этапе подготовки данных, хранит их и используется потом для извлечения прибыли в объёмах, недоступных ни одному читателю. Разница не в природе процесса, а в масштабе и в коммерческой цели.

Юридическая реальность уже сдвигается

Это не абстрактные рассуждения. В 2025 году одна из крупных ИИ-компаний согласилась на крупную выплату по иску авторов и издателей после того, как суд установил, что она незаконно скачивала и хранила защищённые авторским правом книги. Сам факт такого урегулирования — сигнал: подход сначала возьмём, потом разберёмся начинает дорого обходиться.

Параллельно крупные издательства вводят правила, обязывающие авторов раскрывать использование ИИ при подаче рукописей. То есть индустрия уже признаёт, что граница между человеческим и машинным трудом важна и её надо как-то фиксировать.

Почему добровольных мер недостаточно

Мне возразят: рынок сам всё отрегулирует, появятся лицензионные сделки между платформами и правообладателями. Частично это уже происходит. Но точечные сделки выгодны прежде всего крупным игрокам — большим издательствам и медиахолдингам, у которых есть юристы и переговорная сила.

Независимый автор блога физически не может судиться с корпорацией.
Фрилансер не отследит, попал ли его текст в обучающий набор.
Небольшое издание не получит индивидуальную сделку — оно слишком мелкое, чтобы с ним договариваться отдельно.

Именно поэтому идея коллективного лицензирования выглядит разумнее: единый механизм, который собирает отчисления и делит их по понятным правилам, защищает не только сильных.

Контраргумент про инновации

Есть честный встречный довод: если обложить обучение моделей платой, развитие технологий замедлится, а небольшие команды вообще не смогут конкурировать с гигантами, у которых есть деньги на лицензии. Это реальный риск, и отмахиваться от него нельзя.

Но из него не следует, что платить не нужно вовсе. Из него следует, что система оплаты должна быть устроена грамотно: с порогами для исследовательских и некоммерческих проектов, с прозрачными ставками, с приоритетом для тех, кто реально зарабатывает на моделях. Защита инноваций за счёт неоплаченного чужого труда — это не защита инноваций, а перекладывание издержек на самых незащищённых.

Что я предлагаю по сути

Моя позиция не в том, чтобы запретить обучение моделей. Она в том, что у создателя текста должно быть право знать, используется ли его работа, и получать за это долю, если на ней зарабатывают.

Реалистичный набор требований выглядит так:

Прозрачность: компании раскрывают, какие категории источников вошли в обучение.
Согласие по умолчанию в пользу автора, а не платформы.
Коллективный механизм отчислений для тех, кто не может договариваться сам.
Послабления для некоммерческих и учебных проектов.

Технологии, которые учатся на культуре целого человечества, не обязаны быть бесплатными для тех, кто на них зарабатывает. Справедливая оплата авторам — не тормоз прогресса, а условие, при котором у прогресса останутся те, кто производит для него сырьё.