Chyba zaczynam rozumieć dlaczego ludzie mają tendencję do specjalizacji. Absolutnie nie nadążam za wszystkimi bańkami, które próbuję obserwować. Z drugiej strony rezonuje ze mną idea bycia generalistą (paskudna kalka językowa). Na ile ma to jakiś głębszy sens, a na ile w ramach rozrywki pochłaniam informacje? Ciężko powiedzieć. Na pewno za dużo czasu spędzam przed ekranem. Jakoś nie potrafię sobie odpuścić, dzieje się tyle ciekawych rzeczy. Poza tym, specjalizacja jest dla owadów. Prawda?
Nie aspiruję do opanowania powyższej listy, to tylko luźna inspiracja, która dała mi kiedyś do myślenia. Koszt specjalizacji wydaje mi się zbyt wysoki. Owszem, prawdopodobnie zarobiłbym wtedy dość pieniędzy, aby opłacić całą grupę innych specjalistów. Cena jest jednak wyższa niż tylko rezygnacja z innych pasji i zajawek. Co jeśli w przyszłości sztuczna inteligencja zmusiłaby mnie do przebranżowienia? A pół roku później drugi raz? Ta specjalizacja to jakaś bardzo ryzykowna akcja. Bardzo dużo zależności. Z drugiej strony, pewnie ominie mnie doświadczenie uzyskania profesji... Ale zaraz, właśnie, miałem przecież pisać o AI.
AI to taka banieczka, którą obserwuję bardzo powierzchownie. Czekam na kilka konkretnych wydarzeń. Tylko od czasu do czasu, kiedy zainteresuje mnie jakiś news to wbijam się trochę głębiej i sprawdzam jak tam progres w tworzeniu generatywnego Internetu, czy aplikacji do robienia aplikacji. Bardzo chciałbym zostać programistą, który nie potrafi napisać nawet linijki kodu. Tak będzie. Oczywiście fajnie gdybyśmy najpierw mieli solidnie rozwinięty Internet 3.0, ale o tym pisałem już wcześniej.
Tymczasem okazuje się, że nauka języków obcych za chwilę nie będzie miała innego sensu poza chyba tylko trenowaniem mózgu. Wystarczy próbka wideo z głosem, aby algorytm HeyGen przetłumaczył dowolne wideo z jeden z kilku aktualnie dostępnych języków obcych. Dopracowana jest nawet synchronizacja ruchu warg. Na razie usługa jest obwarowana dość wysokimi opłatami, jednak w tej branży inflacji raczej bym się nie spodziewał.
Wiele z dostępnych modeli jest tworzonych jako oprogramowanie Open Source. Tak jest między innymi z Illusion Diffusion, który przeżywa ostatnio swoje 5 minut sławy. Dzięki tej zabawce stworzyłem ilustracje z logiem Hive do tego wpisu. Model ten generuje obrazy tworząc kompozycje uporządkowane zgodnie z zadanym wzorem. Do doskonałości wciąż daleko, dziwne artefakty są powszechne, a cienie rzucane są praktycznie losowo. Przy odrobinie cierpliwości uzyskać można jednak bardzo interesujące efekty.
O kroczek bliżej do doskonałości wydaje się być natomiast najnowszym generator obrazów od OpenAI. DALL-E 3 świetnie radzi sobie z rozbudowanymi, złożonymi kompozycjami, bez trudu generuje tekst, dłonie i tłumy ludzi. Sztuczna inteligencja wciąż posługuje się w tym ostatnim przypadku uproszczeniami, ale hej, artyści też przecież to robią! Model na razie dostępny jest dla testerów, a od października będzie można z niego skorzystać po wykupieniu subskrypcji. Co ciekawe twórcy modelu dali artystom możliwość usunięcia swoich prac z bazy danych treningowych. Miły gest, chociaż wszyscy wiemy jak można by to lepiej rozwiązać, prawda? Tutaj kilka prac, które znalazłem na Twitterze X.
Następnym darmowym narzędziem jest AI Human Generator. Nie wiem na ile jest to nowość, natomiast dopiero ostatnio pokazała mi to kumpela. Możliwości kustomizacji (czy to jest w ogóle po polsku?) wygenerowanej postaci są gigantyczne, można bez trudu stworzyć cyfrowego awatara z wrzuconego zdjęcia i przetestować nową stylówkę, fryzurę albo skutki operacji powiększania piersi. Tak, można też wygenerować nagie ciała. Podobnie jak w wypadku innych algorytmów, tutaj, stworzone postacie również mają w sobie pewną sztuczność i łatwiej wyobrazić je sobie w Simsach, niż w realanym świecie. Na razie to bardziej zabawka, która na dodatek generuje masę pomyłek, ale widziałem też możliwości, które wyślą na bezrobocie osoby zajmujące się fotografią produktów.
To co zrobiło na mnie największe wrażenie, to jeden Pan z popularnego scentralizowanego serwisu z filmami wideo. Stworzył on sobie całą firmę programistyczną w swoim komputerze. Nie do końca rozumiem jak to działa, a tego akurat będę musiał się nauczyć jeśli będę chciał tworzyć oprogramowanie bez kodowania. Działa to mniej więcej tak, że kilka niezależnych "agentów" posługujących się Chatem-GPT wchodzi ze sobą w interakcje i tworzą oprogramowanie. Pomysł jest genialny. Zamiast jednego bardzo rozwiniętego modelu, mamy współpracę wielu. Każdy z "pracowników" tej wirtualnej firmy ma inne zadania i zajmuje się inną częścią pracy. Lepsze wyniki takiej kooperacji wskazują, że ejaje (tak jak ludzie) to istoty społeczne. W materiale wideo pojawia się nawet sugestia, że właśnie tak może wyglądać droga do AGI. Teoretycznie taka grupa algorytmów mogłaby też (bardzo tanim kosztem) prowadzić na przykład profil w mediach społecznościowych. I tutaj zaczynamy zahaczać o dystopię.
A skoro już o dystopiach, to ostatnio słuchałem ciekawego podkastu o popularności chińskich streamerów sprzedażowych. Takie Telezakupy Mango na sterydach, które generują miliardy(!) dolarów zysku. Okazuje się, że co bardziej przedsiębiorczy streamerzy już teraz 24/7 puszczają sprzedażowe DeepFake'i. Usługa stworzenia swojej wirtualnej kopii to koszt rzędu $1000, jednak taka inwestycja szybko się zwraca. Właśnie dlatego mam problemy z zaufaniem.
Teraz czas na coś z naszego Hive'owego podwórka, tydzień temu trafiłem na post od zespołu PeakD o dodaniu funkcjonalności AI do ich interfejsu. Teraz wystarczą dwa kliknięcia, aby uzyskać streszczenie długiego tekstu, tłumaczenie albo jego krytyczną analizę. Temat technicznie nas przerasta? AI wytłumaczy to jak 5-latkowi. Jest jeszcze kilka innych ciekawych możliwości. Spokojnie, sztuczna wciąż nie będzie generować nam tekstów na bloga. To też dość dystopijna wizja.
Nie mniej niż przedtem, nadal jestem przekonany, że Hive stanowi model mogący być podstawą i inspiracją dla zrównoważonych struktur socjo-ekonomicznych przyszłości. Biorąc pod uwagę powyższe dystopijne wizje, to nawet jeszcze bardziej. No chyba, że wpadniemy na coś jeszcze lepszego. Nie sądzę przy tym, że to właśnie Hive jest tym jedynym idealnym rozwiązaniem dla wszystkich. Uważam, że powinny powstawać tysiące Hive'ów z różnorodnymi parametrami. Patrząc na historię, wraz z rewolucjami technologicznym, zawsze przychodziły nowe pomysły na organizacje ludzkiej koegzystencji. Czy wyobrażacie sobie futurystyczny świat, w którym mamy prezesów banków centralnych i spoty wyborcze? Te wszystkie przaśne flagi, debaty polityczne i asymetryczne relacje międzyludzkie? Uśmiechnąłem się ostatnio widząc nagłówek tekstu, w którym ktoś próbował przewidywać kiedy księżyc zostanie podzielony granicami między państwa. Zasługujemy na coś lepszego.
ENG
I think I'm starting to understand why people tend to specialize. I absolutely can't keep up with all the little buckets I'm trying to observe. On the other hand, the idea of being a generalist resonates with me. To what extent does it make deeper sense, and to what extent am I consuming information for entertainment? It's hard to say. I certainly spend too much time in front of the screen. Somehow, I can't let go; there are so many interesting things happening. Besides, specialization is for insects, right?
I don't aspire to master the above list; it's just loose inspiration that made me think once. The cost of specialization seems too high to me. Yes, I'd probably make enough money to pay a whole group of other specialists. However, the price is higher than just giving up other passions and interests. What if in the future artificial intelligence forced me to change my profession? And half a year later, again? Specialization seems like a very risky move. So many dependencies. From the other hand it might be much harded for me to go realy deep, maybe I should have named this account @widerese... But wait, I was supposed to write about AI.
AI is one of those little buckets that I'm observing very superficially. I'm waiting for a few specific events. Only from time to time, when some news catches my interest, I dig a little deeper and check how the progress is going in creating the generative Internet or applications for making applications. I really want to become a programmer who can't even write a line of code. That's how it's going to be. Of course, it would be nice (actually necessery) if we first had a well-developed Web 3.0, but I already wrote about that earlier.
Meanwhile, it turns out that learning foreign languages may soon have no other purpose except perhaps for training the brain. All it takes is a video sample with a voice for the HeyGen algorithm to translate any video into one of the currently available foreign languages. Even lip movement synchronization is well refined. For now, the service is subject to relatively high fees, but I wouldn't expect inflation here."
Many of the available models are created as open-source software. This is the case with Illusion Diffusion, which has recently been in the spotlight. Thanks to this tool, I created illustrations with the Hive logo for this post. This model generates images by creating compositions according to a specified pattern. It is still far from perfection, and strange artifacts are common, while shadows are practically random. With a little patience, however, you can achieve satisfying effects.
One step closer to perfection seems to be the latest image generator from OpenAI, DALL-E 3. It handles complex compositions effortlessly, easily generates text, hands, and crowds of people. In this last case, artificial intelligence still uses simplifications, but hey, artists do that too, right? The model is currently available to testers, and starting from October, you can use it by subscribing. Interestingly, the creators of the model have given artists the option to remove their works from the training database. A nice gesture, although we all know how this could be done better, don't we? Here are a few works that I found on Twitter X.
Another free tool is the AI Human Generator. I'm not sure how new it is, but a friend of mine just showed it to me recently. The customization options for the generated character are enormous. You can easily create a digital avatar from a uploaded photo and test out a new cloths, hairstyle, or the effects of breast augmentation surgery. Yes, you can also generate naked bodies. Like other algorithms, the characters created here also have a certain artificiality to them, and it's easier to imagine them in The Sims than in the real world. For now, it's more of a toy that generates a lot of mistakes, but I've also seen possibilities that could put people who work in product photography out of business.
What impressed me the most was a man having his channel on a popular centralized video platform. He created an entire software company on his computer. I don't fully understand how it works, but I'll have to learn it if I want to create software without coding. It works roughly like this: several independent virtual 'agents' using Chat-GPT interact with each other and create software. The idea is brilliant. Instead of one highly developed model, we have the collaboration of many. Each 'employee' of this virtual company has different tasks and handles a different part of the work. There are managers, coders and testers. Better results from such cooperation suggest that AI entities (just like humans) are social beings. In the video, there's even a suggestion that this could be the path to AGI. In theory, such a group of algorithms could also (at a very low cost) manage, for example, a social media profile. And here, we start to touch on dystopia.
And speaking of dystopias, I recently listened to an interesting podcast about the popularity of Chinese live-streaming salespeople. These are like Supercharged Home Shopping Network shows that generate billions(!) of dollars in profit. It turns out that some of the more entrepreneurial streamers are already running sales DeepFakes 24/7. Apparently, the cost of creating your virtual copy is around $1000, but such an investment quickly pays off. That's why I have trust issues.
Now it's time for something from our Hive community. A week ago, I came across a post from the PeakD team about adding AI functionality to their interface. Now, it only takes two clicks to get a summary of a long text, a translation, or its critical analysis. Is the technical aspect beyond us? AI will explain it like you're five. There are still a few other interesting possibilities. Don't worry; AI still won't be generating blog posts for us. That's quite a dystopian vision as well.
I am still convinced (probably more than before) that Hive represents a model that can serve as the basis and inspiration for sustainable socio-economic structures in the future. Unless we come up with something even better. I don't think Hive is the only perfect solution for everyone. I believe there should be thousands of Hives with various parameters. Looking at history, new ideas for human coexistence have always come with technological revolutions. Can you imagine a futuristic world where we have central bank presidents and election campaigns? All those stuffy flags, political debates, and asymmetric human relationships? I recently smiled when I saw a headline where someone tried to predict when the moon would be divided by national borders. We deserve better.