Przetwarzanie języka naturalnego

Przetwarzanie języka naturalnego

Prowadzone są badanie w obszarze analizy tekstów prawnych - orzeczeń oraz przepisów prawa, których celem jest stworzenie inteligentnego systemu informacji prawnej. Stworzony został korpus dziedzinowy obejmujący prawie 2 miliony tekstów z dziedziny prawa. Na podstawie danych korpusowych tworzony jest słownik terminów prawnych oraz modele językowe opierające się na wektorowej reprezentacji znaczenia słów oraz całych tekstów. Rozwijane są również narzędzia ogólnego przeznaczenia do analizy polskiego tekstu. Wśród nich można wskazać narzędzie do automatycznego podziału tekstu na zdania oraz tokeny, tagger dla języka polskiego, narzędzie rozpoznające jednostki nazewnicze oraz skróty. Prowadzone są również badania obejmujące ekstrakcję informacji z tekstu oraz detekcję zjawiska nękania z szczególnym uwzględnieniem tekstów pochodzących z sieci społecznościowych.

keywords: przetwarzanie języka naturalnego, ekstrakcja informacji, tagowanie, automatyczne streszczanie, segmantacja tekstu, automatyczne tworzenie słowników, wyszukiwanie pełnotekstowe, systemy dialogowe

Projekty: https://lemkin.plhttps://arxiv.org/abs/1808.00926

Zespół: dr inż. A. Smywiński-Pohl, dr adw. M. Strzała, mgr inż. K. Wróbel, mgr inż. M. Piech, mgr inż. K. Bałazy

Kontakt: Aleksander Smywiński-Pohl

e-mail: apohllo@agh.edu.pl