(©Envato)
Zadaniem generatywnej sztucznej inteligencji, której przykładem jest ChatGPT (Generative Pre-Trained Transformer) jest kreowanie różnorodnych treści (kontentu) w postaci tekstu, dźwięku (w tym muzyki), obrazów, filmów, artykułów naukowych, a nawet kodów programistycznych. Algorytmy oparte na dużych modelach językowych (LLM) są trenowane za pomocą technologii deep i machine learning na olbrzymich bazach danych zawierających miliardy parametrów, a za generowanie wyniku ich działania odpowiadają sieci neuronowe. Firma OpenAI nie ujawniła kosztów ChatGPT, ale McKinsey szacuje, że został on wyszkolony na bazie 45 terabajtów danych tekstowych, a to porównać można z ponad 300 tysiącami metrów półek z książkami, co przekłada się na jedną czwartą woluminów w bibliotece Kongresu USA, która zgromadziła ponad 170 mln książek!
Algorytmy nie tylko wyszukują, ale mogą tworzyć zupełnie nowe treści werbalne, graficzne czy dźwiękowe. Odróżnienie rezultatów ich aktywności od pracy człowieka staje się niezwykle trudne. Jeśli jest niemożliwe można uznać, że maszyna zdała test Turinga, który zaproponował ponad 70 lat temu słynny brytyjski matematyk.
Udostępniona pod koniec listopada zeszłego roku przez amerykański startup OpenAI aplikacja stała się rekordowo szybko bardzo popularna. Po zaledwie pięciu dniach zdobyła milion użytkowników, a po dwóch miesiącach miała już ich 100 milionów. Dotychczas żadna inna aplikacja nie osiągnęła tak zaskakujących wyników rozpowszechnienia. Dość powiedzieć, że Instagram zdobył milion fanów dopiero po dwóch i pół miesiącach. Chatbot w oparciu o rozbudowane zapytania może generować treści praktycznie dotyczące każdej dziedziny życia, nauki czy kultury. Może też stawiać diagnozy i sugerować terapie i tworzyć przepisy kulinarne. Bliźniacza aplikacja firmy OpenAI – DALL-e kreuje w oparciu o otrzymany opis obrazy i inne formy artystyczne.
Chatbot w oparciu o rozbudowane zapytania może generować treści praktycznie dotyczące każdej dziedziny życia, nauki czy kultury.
Coraz większe inwestycje
Zeszły rok był rekordowy pod względem inwestycji funduszy venture capital w startupy zajmujące się generatywną sztuczną inteligencją. Inwestorzy zasilili je kwotą ponad 2,6 mld dolarów wobec 1,5 mld rok wcześniej. Branża jest bardzo młoda, ale funkcjonuje w niej wg danych CB Insights ponad 250 startupów, z czego około jedna trzecia nie została do tej pory wsparta przez kapitał VC. Poza twórcą aplikacji ChatGPT startup-em OpenAI aż pięć firm uzyskało jednak już status jednorożca. Należy do nich: kalifornijski Anthropic, pracujący nad podobnym do ChatGPT rozwiązaniem i zajmujący się także bezpieczeństwem dużych systemów AI, który dostał już od inwestorów ponad pół miliarda dolarów i Jasper działający podobnie jak Open AI w obszarze kreacji kontentu. Warto też zwrócić uwagę na londyński Stability AI, który oferuje ogólnodostępne narzędzie do przetwarzania tekstu w obrazy (Stable Diffusion), rozwija także otwarte modele AI dla przetwarzania dźwięku, video i projektów architektonicznych, pracuje nad zastosowaniem sztucznej inteligencji do procesu sekwencjonowania genów i w zakresie biochemii.
Według analizy International Data Corporation całkowita, globalna wartość rynku sztucznej inteligencji w zeszłym roku wyniosła blisko 120 mld dolarów i ma wzrosnąć do 300 miliardów w 2026 roku. Segmentem tego rynku są rozwiązania konwersacyjne oparte o duże modele językowe – takie jak Chat GPT. W 2021 roku wartość tej branży wyceniana była na 3,3 mld dolarów, a prognoza na rok 2026 wskazywała na kwotę 16 miliardów dolarów. Może być jednak mocno niedoszacowana, gdyż została sformułowana kilka miesięcy przed debiutem ChatGPT.
Sukces prezentowanej aplikacji spowodował gwałtowny wzrost wycen firm działających w podobnym obszarze zastosowań sztucznej inteligencji, których wartość jak w przypadku BigBear.ai wzrosła kilkukrotnie. Natomiast OpenAI w styczniu otrzymał od inwestorów, którym przewodził Microsoft, inwestujący w startup już od 2019 roku, 10 mld dolarów, a nieoficjalna wycena firmy skoczyła niemal do 30 mld dolarów. Dla porównania, globalna wartość finansowania startupów przez kapitał VC wyniosła w styczniu 31 mld dolarów! Jednocześnie Microsoft ogłosił 7 lutego, że jego wyszukiwarka Bing i przeglądarka Edge zostaną zintegrowane z rozszerzoną wersją Chat GPT. Bezpośrednio po tym Bing zanotował ponad siedmiokrotny wzrost pobrań aplikacji przez internautów, najwyższy od debiutu wyszukiwarki w 2009 roku.
Wyzwanie dla globalnych bigtechów
Inne globalne firmy technologiczne również przystąpiły do wyścigu o przywództwo w technologii sztucznej inteligencji. Jednak pośpieszne udostępnienie przez Google podobnego do ChatGPT narzędzia o nazwie Bard doprowadziło 8 lutego do spadku kapitalizacji jego firmy matki Alphabet o 100 mld dolarów, bo wykazano, że bot udziela też nieprawdziwych odpowiedzi. Firma jednocześnie dokonała inwestycji w wysokości 400 mln dolarów we wspomniany wcześniej startup Anthropic, dając sygnał, że chce bronić swojego rynku. A trzeba wiedzieć, że wyszukiwarka, a właściwie reklamy, które towarzyszą rezultatom i kolejności demonstracji wyników wyszukiwania są kluczowym źródłem przychodów Google. Z 282 mld dolarów przychodów uzyskanych w roku 2022 aż 162 mld pochodziło z wyszukiwania wraz z Google Maps, Google Play i Gmaila. Google nie notuje już tak wysokiej dynamiki wzrostu przychodów jak w 2021 roku, gdy wyniosła ona 41 procent rok do roku, spadając w zeszłym zaledwie do 9 procent. Tym większa jego determinacja aby utrzymać dominację na globalnym rynku wyszukiwania, w którym w połowie zeszłego roku udział giganta z Mountain View bliski był 92 procent wobec 3,2 procent Microsoftu. A każdy punkt procentowy udziału w rynku przekłada się na przychody w wysokości 2 mld dolarów. Dodatkową korzyścią z zastosowania narzędzia typu ChatGPT może być fakt, że algorytm generuje lepiej pasujące do zapytania odpowiedzi, więc internauci na wskazanych w linkach stronach mogą spędzić więcej czasu, a to oznacza, że marketingowo są one znacznie bardziej wartościowe dla firm, które zintegrują go ze swoją wyszukiwarką.
Dodatkową korzyścią z zastosowania narzędzia typu ChatGPT może być fakt, że algorytm generuje lepiej pasujące do zapytania odpowiedzi, więc internauci na wskazanych w linkach stronach mogą spędzić więcej czasu, a to oznacza, że marketingowo są one znacznie bardziej wartościowe dla firm, które zintegrują go ze swoją wyszukiwarką.
Integracja chatbota opartego na modelach (LLM) z wyszukiwarką Google może być jednak kosztowna. Jak zauważył cytowany przez Reutersa prezes Alphabet John Hannessy, koszt jednego zapytania wzrosnąć może nawet dziesięciokrotnie, a obecnie według analizy Morgan Stanley to pół centa. W zeszłym roku suma zapytań przekraczała 3,3 biliony, więc minimalny wzrost kosztów wynieść może 6 miliardów dolarów. Wynika to głównie z konieczności wykorzystania większej mocy obliczeniowej do obsłużenia zapytań (tzw. inference) składających się ze znacznie większej liczby znaków, co daje bardziej trafione rezultaty wyszukiwania. Firma może poszukiwać możliwości obniżenia tych kosztów poprzez redukcję liczby parametrów wykorzystywanych do treningu algorytmów i zwiększenia efektywności technologii, nie jest jednak pewne czy nie wpłynie to na jakość wyszukiwania. Przykład Barda raczej na to wskazuje. Inną opcją jest wprowadzenie płatnych miesięcznych subskrypcji dla zdefiniowanych segmentów klientów – wdraża to właśnie OpenAI, w przypadku którego koszt miesięczny korzystania z bardziej zaawansowanych wersji ChatGPT wynieść ma 20 dolarów (na razie tylko w USA), a dla profesjonalistów i firm jeszcze więcej.
Zastosowania sztucznej inteligencji rozwijają też chińskie firmy technologiczne. Tamtejszy gigant wyszukiwania Baidu poinformował o przygotowaniach do wdrożenia generującego tekst bota Ernie, który będzie rozumiał ludzki język, mówił i kreował teksty oraz posiadał funkcję przetwarzania języka w obrazy (text to image). Bot, zintegrowany z wyszukiwarką Baidu, będzie miał większe możliwości, opierając się na 260 miliardach parametrów wobec 175 mld, które wykorzystuje obecnie w wersji treningowej GPT-3. Podobne zamiary ogłosił gigant ecommerce Alibaba, który testuje rozwiązania chmurowe. Jego konkurent – JD.com zapowiedział z kolei wdrożenie stosownego narzędzia AI do użytkowania dla swoich biznesowych klientów.
Najmniej wiadomo o technologii Tencenta, który stoi za super aplikacją WeChat. W przypadku tego bigtecha najbardziej znanym rozwiązaniem generującym kontent jest aplikacja Different Dimension Me dostępna w social mediach, która przetwarza obrazy ludzi w postacie animowane. Aplikacja trafiła do Ameryki Łacińskiej, gdzie okazało się, że charakteryzują ją uprzedzenia rasowe, gdyż wytrenowana na parametrach chińskich ignoruje albo zniekształca osoby o ciemnej karnacji i o obfitszych kształtach. Pismo MIT Technology Review udowodniło również interwencję chińskiej cenzury w algorytmy, gdyż generowane teksty unikają słów i treści uważanych w Chinach za politycznie wrażliwe. Przeszkodą w rozwoju generatywnej sztucznej inteligencji w Państwie Środka może być amerykańskie, japońskie i niderlandzkie embargo na eksport do tego kraju półprzewodników najnowszych generacji.
Szerokie zastosowania i ryzyka
Technologia, którą reprezentuje Chat GPT może mieć bardzo szerokie i różnorodne zastosowania. Właściwie trudno wymienić dziedziny, w których byłoby to trudne lub zbyteczne. Sztuczna inteligencja i modele językowe zdolne są do analizy wielkich zbiorów danych, co okazuje się przydatne w medycynie, bo przyspiesza wynalazki nowych leków i terapii, ułatwia zrozumienie przyczyn wielu chorób, a leczenie będzie dzięki temu miało spersonalizowany charakter. W biznesie technologia GPT umożliwi efektywne oszczędzanie czasu uzyskiwania wyników wielu analiz, znacznie przyśpieszając podejmowanie bardziej trafnych decyzji. Dokonywać może streszczeń dokumentów i wypełniać formularze, redukując czynności manualne na przykład w pracy prawników. ChatGPT potrafi też pisać kody programistyczne do aplikacji IT, co jest pracochłonne, a także potrafi weryfikować poprawność kodowania przez informatyków. W ten sposób oszczędza czas i eliminuje w dużym stopniu potrzebę wykonywania prostszych prac przez ludzi, zostawiając miejsce na bardziej kreatywne czynności.
Analiza dużych zbiorów danych tworzy też możliwości przewidywania zachowań i potrzeb klienta, co nosi nazwę analityki predyktywnej. To stanie się podstawą hiperpersonalizacji wielu usług i tworzenia treści marketingowych (tekstowych i graficznych) w social mediach. W branży finansowej znajdzie najszersze zastosowanie w obsłudze klienta, w zapleczu operacyjnym banków, ubezpieczycieli i firm inwestycyjnych. Dzięki temu analiza sytuacji finansowej klienta detalicznego i biznesowego w procesie udzielania kredytu ulegnie automatyzacji, a ryzyko takich decyzji również z uwagi na lepsze i szybsze identyfikowanie wyłudzeń i oszukańczych transakcji znacznie się zmniejszy. To przełoży się na osiąganie znacznie lepszych wyników biznesowych. Na rynku reklamowym targetowanie klientów i zakup mediów również będą odbywały się w sposób automatyczny. W ten sposób kampanie reklamowe staną się znacznie efektywniejsze. Niestety niekorzystnym skutkiem komercyjnych zastosowań technologii GPT będzie jeszcze większa nierównowaga w relacji firma-klient.
Nowy wymiar sztucznej inteligencji, którego przykładem jest ChatGPT, będzie jednak generował spory zakres znacznie poważniejszych i wielowymiarowych ryzyk i wątpliwości. Ponieważ GPT-3 w sposób automatyczny bez zgody autorów wycina z dokumentów dostępnych w internecie urywki tekstów, łączy je z innymi, tworząc nowe opracowania, artykuły naukowe i treści literackie, naruszać może w ten sposób prawa do własności intelektualnej, co wiąże się z konsekwencjami prawnymi. Technologia może też wykorzystywać style pracy twórców, tworząc nawet w ciągu kilkunastu sekund cyfrowe dzieła sztuki w postaci obrazów, filmów, powieści czy choćby elementy kampanii reklamowych, co budzić może także zastrzeżenia. Choć oczywiście może też służyć wsparciem w procesie twórczym i badaniach naukowych.
Ponieważ GPT-3 w sposób automatyczny bez zgody autorów wycina z dokumentów dostępnych w internecie urywki tekstów, łączy je z innymi, tworząc nowe opracowania, artykuły naukowe i treści literackie, naruszać może w ten sposób prawa do własności intelektualnej, co wiąże się z konsekwencjami prawnymi.
Pesymiści obawiają się jednak, że świat zalać może fala plagiaryzmu, a wielu twórców może stracić pracę. Właśnie w obawie o plagiaty niektóre uniwersytety i wydawnictwa naukowe (np. uznane Science) zabraniają naukowcom i studentom wykorzystywania nowego narzędzia. To nie teoretyczne zagrożenie. Doświadczenie przeprowadzone w Minnesota University Law School udowodniło, że ChatGPT może zdać egzamin z zakresu prawa konstytucyjnego i podatkowego, odpowiadając na pytania testowe i pisząc wymagany esej. Takie same możliwości istnieją w zakresie testów medycznych i końcowego egzaminu na studiach MBA, co wykazał profesor Christian Terwiesch z Wharton School, University of Pensylwania. W odpowiedzi na te fakty i obawy Open AI opracował już narzędzie, które może zweryfikować stopień oryginalności treści pisanych.
Instytucjami, które zakazują pracownikom obsługi klienta przy pomocy technologii ChatGPT są także niektóre banki, jak choćby JPMorgan, bojąc się procesów i kar od regulatorów. Problem stanowić może bowiem ochrona prywatności, szczególnie jeśli technologia AI generować będzie fałszywe treści lub choćby zestawiać ze sobą fakty, które wiele osób czy klientów może stawiać w niekorzystnym świetle, co tworzy podstawy do powstawania uprzedzeń i podejmowania w oparciu o to niekorzystnych, czy krzywdzących decyzji. Możliwości pojawienia się takich toksycznych treści nie wykluczyli także założyciele OpenAI. Algorytmy bowiem są tak dobre jak treści, na których się opierają, a fałszywe informacje rozprzestrzeniają się szybciej niż te prawdziwe, czego dowiódł choćby okres pandemii. Panaceum mają być dedykowane programy (RLHF) do identyfikacji i eliminacji z rezultatów wyszukiwania fake news-ów i blokowania tworzenia w oparciu o nie nowych treści. Sam Facebook usuwa rocznie około miliarda fałszywych kont, których założyciele z reguły nie mają dobrych intencji.
Problem może być jednak znacznie szerszy, grożąc wręcz podstawom demokracji. Boty mogą bowiem wpływać na procesy legislacyjne, tworząc komentarze i oceny nie tylko do artykułów prasowych, ale także do procesowanych aktów prawnych i wysyłać je do skrzynek ustawodawców, kongresmanów, posłów oraz influencerów, wpływając także na wynik wyborów, co przypomina działalność przed kilku laty firmy Cambridge Analytica. Algorytmy musiałyby zostać w tym celu odpowiednio wytrenowane. Po narzędzia takie chętnie mogą sięgać lobbyści i wrogie reżimy. Regulacje w powyższym zakresie staną się więc niezbędne. Prace nad odpowiednią dyrektywą zapowiedział już unijny komisarz ds. rynku wewnętrznego Thierry Breton. Do końca kwietnia propozycję odpowiedniego ustawodawstwa powinien przedstawić Parlament Europejski. Wyzwaniem jest jednak fakt, że prawo coraz wolniej nadąża za rozwojem technologii.