praktyczne.AI - Język polski najlepszy do promptowania?!

Wielu cudzoziemców przeprowadzających się do Polski rwie włosy z głowy podczas nauki języka. Osobiście regularnie muszę tłumaczyć przyjaciółce pochodzącej z Kenii zasady, które dla Polaków są oczywiste. Czasami się poddaję i na pytanie "dlaczego tak się mówi" stwierdzam "bo tak, po prostu zapamiętaj".

Czyżby teraz naukowcy z University of Maryland dali mi argument przemawiający za przewagą polskiego nad tymi "prostszymi" językami?

Co faktycznie odkryli naukowcy?

Otóż pojawiły się wiadomości, że według badań naukowców ze wspomnianego uniwersytetu język polski został uznany za najbardziej efektywny w komunikacji z AI (LLM). To dzięki bogatej i uporządkowanej gramatyce język polski ogranicza możliwość wieloznaczności, dzięki czemu łatwiej możemy formułować jednoznaczne komunikaty.

Czy to oznacza rewolucję? Czy specjaliści od AI na całym świecie zaczną uczyć się polskiego dla lepszych rezultatów? Nie!🤦‍♂️

Prawda jest bardziej złożona

Raport One Ruler to Measure Them All: Benchmarking Multilingual Long-Context Language Models opisuje konkretną, ograniczoną sytuację.

Naukowcy przeprowadzili eksperymenty, w których modele językowe otrzymywały instrukcje i teksty o różnej długości (nawet do 128 000 tokenów czyli odpowiednik setek stron książek). Modele musiały operować na dostarczonych danych, między innymi odnajdywać określone informacje.

            Kluczowe odkrycie: dopiero w przypadku bardzo długich tekstów (od około 64 000 tokenów) w języku polskim i konkretnie w zadaniu polegającym na wyszukiwaniu informacji, modele myliły się najrzadziej. Język angielski uplasował się dopiero na szóstym miejscu. W przypadku innych zadań różnice były zupełnie inne.
        

Praktyczne wnioski

W jakim języku promptować? To zależy od modelu, od narzędzia, od zadania, od danych wejściowych.

Moja rada: promptuj w tym języku, w którym opiszesz instrukcję wystarczająco precyzyjnie. Jeżeli nie uzyskasz oczekiwanych rezultatów:

Iteracyjnie modyfikuj prompt,
Spróbuj innego języka,
Przetestuj inne narzędzie.

Nie ma uniwersalnej recepty, eksperymentuj i dostosowuj podejście do konkretnej sytuacji.

Ranking OneRuler - skuteczność dla 64k & 128k Wykres

polski – 88%
francuski – 87%
włoski – 86%
hiszpański – 85%
rosyjski – 84%
angielski – 83.9%
ukraiński – 83.5%
portugalski – 82%
niemiecki – 81%
holenderski – 80%
norweski – 79%
szwedzki – 78%
duński – 77%
węgierski – 76%
fiński – 75%
czeski – 73%
japoński – 72%
wietnamski – 71%
perski – 70%
serbski – 69%
koreański – 66%
hindi – 65%
chiński – 62.1%
tamilski – 61%
swahili – 55%
sesotho – 45%