Apple, Nvidia, Salesforce i kilka innych dużych firm technologicznych na świecie zostało oskarżonych o trenowanie swoich modeli AI za pomocą filmów z YouTube’a znanych twórców. Zgodnie z raportem Wired, giganci technologiczni dostarczyli pliki napisów pobrane przez organizację non-profit z ponad 170 000 filmów popularnych twórców, w tym MrBeast, Marques Brownlee (MKBHD), PewDiePie, John Oliver i Jimmy Kimmel i innych, bez ich zgody. Dla tych, którzy nie wiedzą, pliki napisów są w zasadzie transkrypcjami treści wideo. Podczas gdy wielu może uważać to za naruszenie prywatności i zasad YouTube’a, jest to również poważny problem potencjalnego naruszenia praw autorskich.
Przeczytaj także: Hybrydowa sztuczna inteligencja to sposób na to, by sztuczna inteligencja stała się bardziej praktyczna w smartfonach: Won-Joon Choi z Samsunga
Jak Apple i Nvidia zdobyły dane
Raport twierdzi, że dochodzenie Proof News ujawniło, że kilku gigantów technologicznych wykorzystało napisy do tysięcy filmów na YouTube do trenowania sztucznej inteligencji. Chociaż YouTube miał politykę, która nie pozwala nikomu zbierać materiałów z ich platformy bez zezwolenia. Jednak duzi gracze technologiczni podobno czerpali dane z EleutherAI, platformy, która twierdzi, że pomaga małym deweloperom i naukowcom trenować modele sztucznej inteligencji. Wygląda na to, że dane wyodrębnione przez EleutherAI były również wykorzystywane przez takie firmy, jak Apple i Nvidia.
Przeczytaj także: Apple Intelligence kontra Samsung Galaxy AI: Kto prowadzi w wyścigu sztucznej inteligencji telefonów komórkowych?
Praca badawcza EleutherAI ujawnia, że ich zestawy danych, zwane Pile, są otwarte i dostępne dla każdego, kto ma wystarczającą moc obliczeniową i przestrzeń, aby uzyskać do nich dostęp. Praca badawcza i posty dużych firm technologicznych odzwierciedlają również sposób, w jaki te firmy, wyceniane na setki miliardów i bilionów dolarów, używały Pile do trenowania AI. Dokumenty rzucają również światło na to, że Apple używa Pile EleutherAI do trenowania swojego popularnego modelu o nazwie OpenELM, który zadebiutował w kwietniu.
Przeczytaj także: OpenAI opracowuje system śledzenia postępów w kierunku sztucznej inteligencji na poziomie ludzkim
Czy Apple ponosi odpowiedzialność za naruszenie?
Warto zauważyć, że warunki korzystania z serwisu YouTube nie zostały złamane przez Apple, ale przez EleutherAI, który pozyskał dane z platformy streamingowej Google i rozpowszechnił je wśród wielu deweloperów za pośrednictwem Pile. To nie jest pierwszy przykład, w którym dane zostały pozyskane nielegalnie w celu trenowania systemów AI. Często można zauważyć, że chatboty AI dostarczają informacji, jednocześnie plagiatując cały tekst, gdy są proszone o informacje na temat niszowych tematów.
Jeszcze jedno! Jesteśmy teraz na kanałach WhatsApp! Obserwuj nas tam, aby nigdy nie przegapić żadnych aktualizacji ze świata technologii. Aby śledzić kanał HT Tech na WhatsApp, kliknij Tutaj aby dołączyć teraz!