New York Times има предимство в делото срещу OpenAI и Microsoft

Символично случаят обещава сблъсък на титаните - трудоемко човешко събиране на новини срещу информация, създавана с помощта на изкуствен интелект

19:15 | 28 декември 2023

Автор: Ноа Фелдман

Източник: Bloomberg L.P.

Съдебният иск, подаден от New York Times срещу OpenAI и Microsoft за нарушаване на авторските права, изправя една от най-големите медийни институции срещу създателя на нова трансформираща технология. Символично случаят обещава сблъсък на титаните - трудоемко човешко събиране на новини срещу информация, създавана с помощта на изкуствен интелект. Но от правна гледна точка случаят представлява нещо различно -класически пример за изоставането на утвърденото право от нововъзникващите технологии, пише анализаторът Ноа Фелдман за рубриката Bloomberg Opinion.

Още по темата

New York Times съди Microsoft и OpenAI за нарушаване на авторски права

Законът за авторското право - набор от правила, които датират от времето на печатарската преса - не е предназначен да обхваща големи езикови модели като ChatGPT. Той ще трябва да бъде съзнателно развит от съдилищата или изменен от Конгреса, за да отговаря на настоящите обстоятелства.

Основният правен въпрос по делото ще бъде доктрината, известна като справедливо използване. Утвърден в Закона за авторското право от 1976 г., принципът за справедливо използване ви казва кога е допустимо да използвате текст, чиито авторски права са защитени от някой друг. Тестът за справедливо използване включва четири фактора. По-голяма е вероятността използването за образователни цели и с нестопанска цел да бъде признато за справедливо използване. Творческата дейност е по-защитена от авторските права, отколкото техническото писане или новините. От значение е обемът на копираната работа, както и централното място на копирания материал. И може би най-важното за иска на Times е, че съдилищата също така разглеждат дали копирането ще навреди на настоящия или бъдещия пазар на копираното произведение.

Ако познавате закона, можете да предположите приблизително как ще се развият правните аргументи по делото. Times ще посочи примери, в които потребителят задава въпрос на ChatGPT или Bing, а те отговарят с нещо съществено като статия в New York Times. Вестникът ще отбележи, че ChatGPT е част от бизнеса и събира такси за достъп до най-новите си версии, както и че Bing е основна част от бизнеса на Microsoft. The Times ще наблегне на творческите аспекти на журналистиката. Преди всичко тя ще твърди, че ако можете да попитате търсачка, задвижвана от LLM, за новините от деня и да получите съдържание, извлечено директно от New York Times, това ще навреди значително и може би дори ще убие бизнес модела на Times.

Повечето от тези точки са правдоподобни правни аргументи. Но OpenAI и Microsoft ще бъдат подготвени за тях. Вероятно ще ви отговорят, че техният LLM не копира, а по-скоро се учи и прави статистически прогнози, за да получи нови отговори. Например, ако прочетем статия в New York Times и след това напишем колонка с мнение по същата тема в Bloomberg, това не е нарушение на авторските права, въпреки че може да сме научили много от статията в Times и да сме използвали тази информация, за да формираме собственото си мнение. Поради тази причина много експерти по авторски права изказват мнение, че не може да бъде нарушение на авторските права, ако студент по право се учи от съществуващ онлайн материал, дори и той да е под авторско право. Може да се очаква, че ответниците също така ще твърдят, че новините се състоят от факти и поради това следва да се третират по-свободно от творческите материали.

Но на Microsoft и OpenAI ще им бъде трудно да опровергаят последния аргумент - че техният продукт, който разчита на фирми за събиране на новини като Times, ще навреди на тези фирми. ChatGPT и други големи езикови модели (LLM) не могат да събират и проверяват нови факти. В обозримо бъдеще те са ограничени да „учат“ от вече публикувана информация.

От това следва, че за да могат LLM да предоставят полезна информация, някой друг трябва първо да събере информацията, да се увери, че тя е точна, и да я публикува. Това е същността на събирането на новини. Правилната настройка е скъпоструваща.

Нещо повече, за да знаем, че можем да разчитаме на новините, те трябва да идват от институция, на която можем да се доверим - институция с опит и репутация, която има бизнес интерес да поддържа. В противен случай нямаше да имаме новини. Бихме имали итеративна ехо камера, несвързана с реалността.

Именно тук основният обществен интерес от поддържането на свободната преса става важен за въпроса за справедливото използване. Ако можете да получите информация от магистър по право по-евтино, отколкото от New York Times, може да се откажете от абонамента си. Но ако всички правеха това, нямаше да има New York Times. Казано по друг начин, OpenAI и Microsoft се нуждаят от съществуването на New York Times и други новинарски организации, ако искат да предоставят надеждни новини като част от своите услуги. Следователно от рационална и икономическа гледна точка те трябва да бъдат задължени да плащат за информацията, която използват.

Съдилищата няма да се справят лесно с този мощен обществен интерес в закона за авторското право. Буквалното копиране е най-лесната за наказване форма на нарушение. При обичайни правни обстоятелства, ако LLM промени думите достатъчно, за да се приеме, че става дума за обобщаване, а не за копиране, това отслабва делото на Times. И все пак обобщенията с други думи биха били достатъчни, за да убият Times и други подобни организации - и да ни оставят без новини.

Съдилищата ще трябва да се съобразяват с всичко това. Ако не се справят, Конгресът ще трябва да действа. Инфраструктурата на новините вече се разклаща и ако я унищожим напълно, демокрацията ще бъде губеща.

Ноа Фелдман е колумнист на Bloomberg Opinion и водещ на подкаста „Deep Background“. Той е професор по право в Харвардския университет и е бил помощник на съдията от Върховния съд на САЩ Дейвид Соутър.

Още по темата

Apple загуби съдебен спор за авторски права

Нарушенията на авторски права в България са 5 пъти повече от средното ниво в Европа

Етикети