Nowy Jork:
Firma Meta Platforms wypuściła we wtorek największą wersję swoich w większości darmowych modeli sztucznej inteligencji Llama 3, które oferują obsługę wielu języków i ogólne wskaźniki wydajności depczące po piętach płatnym modelom oferowanym przez takich konkurentów jak OpenAI.
Jak poinformowała spółka macierzysta Facebooka we wpisach na blogu i w opracowaniu badawczym zapowiadającym premierę, nowy model Llama 3 potrafi komunikować się w ośmiu językach, pisać wyższej jakości kod komputerowy i rozwiązywać bardziej złożone problemy matematyczne niż poprzednie wersje.
Z 405 miliardami parametrów, czyli zmiennych, które algorytm bierze pod uwagę, aby generować odpowiedzi na zapytania użytkowników, przyćmiewa poprzednią wersję wydaną w zeszłym roku, ale nadal jest mniejsza od wiodących modeli oferowanych przez konkurencję.
Z kolei model GPT-4 firmy OpenAI ma podobno bilion parametrów, a Amazon przygotowuje model z 2 bilionami parametrów.
Promując Llama 3 w wielu kanałach, dyrektor generalny Mark Zuckerberg powiedział, że spodziewa się, że przyszłe modele Llama prześcigną zastrzeżonych konkurentów do przyszłego roku. Chatbot Meta AI zasilany tymi modelami jest na dobrej drodze, aby stać się najpopularniejszym asystentem AI do końca tego roku, z setkami milionów ludzi korzystających z niego już, powiedział.
Publikacja ta pojawia się w okresie, gdy firmy technologiczne ścigają się, aby wykazać, że ich rosnące portfolio pochłaniających wiele zasobów dużych modeli językowych może przynieść na tyle znaczące korzyści w znanych problematycznych obszarach, jak np. zaawansowane rozumowanie, że uzasadnia to ogromne kwoty inwestowane w nie.
Jeden z czołowych naukowców zajmujących się sztuczną inteligencją w Meta uważa, że tego typu modele napotkają ograniczenia w rozumowaniu i że w celu dokonania przełomu potrzebne będą inne rodzaje systemów sztucznej inteligencji.
Firma poinformowała, że oprócz flagowego modelu o 405 miliardach parametrów, Meta wypuszcza również udoskonalone wersje swoich lżejszych modeli Llama 3 o 8 miliardach i 70 miliardach parametrów, które pierwotnie zaprezentowano wiosną.
Wszystkie trzy nowe modele są wielojęzyczne i mogą obsługiwać większe żądania użytkowników za pośrednictwem rozszerzonego „okna kontekstowego”, co zdaniem Ahmada Al-Dahle, szefa działu generatywnej sztucznej inteligencji w firmie Meta, usprawniłoby w szczególności proces generowania kodu komputerowego.
„To była najważniejsza opinia, jaką otrzymaliśmy od społeczności” – powiedział Al-Dahle w wywiadzie dla Reutersa, zauważając, że większe okna kontekstowe zapewniają modelom coś w rodzaju dłuższej pamięci, która pomaga w przetwarzaniu wieloetapowych żądań.
Niezależnie od tego Al-Dahle stwierdził, że jego zespołowi udało się poprawić wydajność modelu Llama 3 w takich zadaniach, jak rozwiązywanie problemów matematycznych, wykorzystując sztuczną inteligencję do generowania części danych, na których był szkolony.
Meta udostępnia swoje modele Llama w dużej mierze bezpłatnie do użytku przez deweloperów, strategia ta, jak twierdzi Zuckerberg, przyniesie korzyści w postaci innowacyjnych produktów, mniejszej zależności od potencjalnych konkurentów i większego zaangażowania w główne sieci społecznościowe firmy. Niektórzy inwestorzy podnieśli jednak brwi z powodu kosztów, jakie to ze sobą niesie.
Firma może również skorzystać, jeśli deweloperzy zdecydują się na korzystanie z jej darmowych modeli zamiast płatnych, co podważyłoby modele biznesowe jej rywali. W swoim ogłoszeniu Meta zachwalała zyski w kluczowych testach matematycznych i wiedzy, które mogą uczynić tę perspektywę bardziej atrakcyjną.
Chociaż mierzenie postępów w rozwoju sztucznej inteligencji jest powszechnie znane jako trudne, wyniki testów dostarczone przez Meta zdają się sugerować, że jej największy model Llama 3 niemal dorównuje, a w niektórych przypadkach przewyższa model Claude 3.5 Sonnet firmy Anthropic i GPT-4o firmy OpenAI, które są powszechnie uważane za dwa najpotężniejsze modele graniczne na rynku.
Przykładowo, w teście porównawczym MATH obejmującym zadania tekstowe z matematyki na poziomie konkursowym, model Meta uzyskał wynik 73,8, podczas gdy GPT-4o uzyskał 76,6, a Claude 3.5 Sonnet 71,1.
Model uzyskał wynik 88,6 w teście MMLU, obejmującym dziesiątki przedmiotów z zakresu matematyki, nauk ścisłych i nauk humanistycznych, podczas gdy GPT-4o uzyskał wynik 88,7, a Claude 3.5 Sonnet – 88,3.
W swoim artykule naukowcy z Meta zapowiedzieli również pojawienie się w drugiej połowie roku „multimodalnych” wersji modeli, które będą nakładały funkcje obrazu, wideo i mowy na podstawowy model tekstowy Llama 3.
Wczesne eksperymenty wskazują, że modele te mogą „konkurencyjnie” współpracować z innymi modelami multimodalnymi, takimi jak Gemini 1.5 firmy Google i Claude 3.5 Sonnet firmy Anthropic – twierdzą naukowcy.
(Poza nagłówkiem, artykuł ten nie był edytowany przez zespół NDTV i został opublikowany za pośrednictwem kanału syndykowanego.)