Z dumą informujemy, że Mykola Haltiuk – doktorant i pracownik Wydziału Informatyki AGH – znalazł się w zespole badaczy, którzy opracowali Lapa LLM v0.1.2, najbardziej efektywny otwarty model językowy dla języka ukraińskiego.

Model został stworzony przez interdyscyplinarny zespół naukowców z UCU Faculty of Applied Sciences (Ukrainian Catholic University), AGH University of Krakow, National Technical University of Ukraine “Kyiv Polytechnic Institute” oraz Lviv Polytechnic National University. Celem projektu było stworzenie otwartego, wysoko wydajnego modelu językowego zoptymalizowanego pod kątem przetwarzania języka ukraińskiego.

Lapa LLM bazuje na architekturze Gemma-3-12B i wyróżnia się efektywnością oraz dokładnością w porównaniu z wcześniejszymi modelami. Zespół opracował m.in. nowy, zoptymalizowany tokenizator języka ukraińskiego, autorstwa Mykoly Haltiuka, który pozwala modelowi przetwarzać tekst o 1,5 razy mniejszej liczbie tokenów przy zachowaniu wysokiej jakości wyników.

Model osiągnął najlepsze wyniki na 18 ukraińskich benchmarkach językowych, a także wyróżnia się jako najlepszy tłumacz angielsko-ukraiński (33 BLEU na FLORES) i jeden z najlepszych modeli do streszczania i odpowiadania na pytania (Q&A) w swojej klasie rozmiaru.

Projekt ma ogromne znaczenie nie tylko naukowe, ale i społeczne – to krok w stronę wzmacniania technologicznej niezależności Ukrainy poprzez tworzenie narzędzi językowych, które wspierają rozwój AI w języku ojczystym.

Zespół podkreśla, że Lapa LLM jest w pełni otwartym modelem (open-source), dostępnym do zastosowań naukowych i komercyjnych.

  • 8 godzin, 27 minut temu