Wielu cudzoziemców przeprowadzających się do Polski rwie włosy z głowy podczas nauki języka. Osobiście regularnie muszę tłumaczyć przyjaciółce pochodzącej z Kenii zasady, które dla Polaków są oczywiste. Czasami się poddaję i na pytanie "dlaczego tak się mówi" stwierdzam "bo tak, po prostu zapamiętaj".
Czyżby teraz naukowcy z University of Maryland dali mi argument przemawiający za przewagą polskiego nad tymi "prostszymi" językami?
Co faktycznie odkryli naukowcy?
Otóż pojawiły się wiadomości, że według badań naukowców ze wspomnianego uniwersytetu język polski został uznany za najbardziej efektywny w komunikacji z AI (LLM). To dzięki bogatej i uporządkowanej gramatyce język polski ogranicza możliwość wieloznaczności, dzięki czemu łatwiej możemy formułować jednoznaczne komunikaty.
Czy to oznacza rewolucję? Czy specjaliści od AI na całym świecie zaczną uczyć się polskiego dla lepszych rezultatów? Nie!🤦♂️
Prawda jest bardziej złożona
Raport One Ruler to Measure Them All: Benchmarking Multilingual Long-Context Language Models opisuje konkretną, ograniczoną sytuację.
Naukowcy przeprowadzili eksperymenty, w których modele językowe otrzymywały instrukcje i teksty o różnej długości (nawet do 128 000 tokenów czyli odpowiednik setek stron książek). Modele musiały operować na dostarczonych danych, między innymi odnajdywać określone informacje.
Praktyczne wnioski
W jakim języku promptować? To zależy od modelu, od narzędzia, od zadania, od danych wejściowych.
Moja rada: promptuj w tym języku, w którym opiszesz instrukcję wystarczająco precyzyjnie. Jeżeli nie uzyskasz oczekiwanych rezultatów:
- Iteracyjnie modyfikuj prompt,
- Spróbuj innego języka,
- Przetestuj inne narzędzie.
Nie ma uniwersalnej recepty, eksperymentuj i dostosowuj podejście do konkretnej sytuacji.
Ranking OneRuler - skuteczność dla 64k & 128k
- polski – 88%
- francuski – 87%
- włoski – 86%
- hiszpański – 85%
- rosyjski – 84%
- angielski – 83.9%
- ukraiński – 83.5%
- portugalski – 82%
- niemiecki – 81%
- holenderski – 80%
- norweski – 79%
- szwedzki – 78%
- duński – 77%
- węgierski – 76%
- fiński – 75%
- czeski – 73%
- japoński – 72%
- wietnamski – 71%
- perski – 70%
- serbski – 69%
- koreański – 66%
- hindi – 65%
- chiński – 62.1%
- tamilski – 61%
- swahili – 55%
- sesotho – 45%
