Problemy opisu związków frazeologicznych w formalizmie „Multiflex” ...

Page 1

Iwona Kosek, Monika Czerepowicka Uniwersytet Warmińsko-Mazurski w Olsztynie

Problemy opisu związków frazeologicznych w formalizmie „Multiflex” (na przykładzie rodzaju wyrażeń frazeologicznych) Wstęp W Polsce od ok. 20 lat żywo rozwija się lingwistyka informatyczna, stawiająca sobie za cel stworzenie formalnego opisu polszczyzny, przynoszącego w konsekwencji różnego typu narzędzia do automatycznego przetwarzania języka naturalnego. Zgodnie z diagnozą postawioną w 2006 r. przez Marka Świdzińskiego, który w znacznej mierze był inspiratorem tego typu badań, „problem automatycznej analizy morfologicznej jest dziś dla polszczyzny rozwiązany” (Świdziński 2006: 31). Badacze języka polskiego dysponują już kilkoma analizatorami morfologicznymi: Pomorem Roberta Wołosza, SAMem Krzysztofa Szafrana, Morfeuszem Marcina Wolińskiego, AMORem Joanny Rabiegi-Wiśniewskiej i Michała Rodolfa. Uwaga lingwistów koncentruje się dziś głównie na analizie składniowej, która dzięki zaawansowanym metodom dehomonimizacji oraz dospecyfikowaniu reguł gramatyki formalnej również posuwa naprzód rygorystyczny opis współczesnej polszczyzny. Poloniści dysponują korpusem narodowym. Przygotowuje się słowniki elektroniczne (programy komputerowe) już nie leksemów, ale połączeń wyrazowych, np. Słownik nazw topograficznych Warszawy, Słownik jednostek wielosegmentowych. Niniejszy artykuł opiera się na doświadczeniach związanych z drugim z wymienionych opracowań. Ponieważ program, o którym mowa (Toposław), korzysta z formalizmu Multiflex, na wstępie kilka objaśnień.

1. Od Multifleksa do Toposława Multiflex (więcej w: Savary 2009) jest formalnym systemem opisu języków naturalnych powstałym na gruncie francuskim, z powodzeniem używanym od około ośmiu lat. Formalizm ten jest częścią obszernego wielofunkcyjnego systemu Unitex, służącego do przetwarzania wielojęzycznych korpusów tekstów. Poza Multifleksem Unitex dysponuje także edytorem grafów (zdających sprawę z relacji morfologicznych między składnikami opisywanych wyrażeń), modułem morfologicznym do odmiany pojedynczych słów, modułem do analizy morfologicznej tekstów, wyszukiwarką wzorców morfoskładniowych w korpusie

1


jedno lub dwujęzycznym. Sam Multiflex składa się z dwu części. Pierwsza ma charakter uniwersalny, niezależny od języka naturalnego, którego wyrażenia są przedmiotem opisu. Umożliwia generowanie form wieloczłonowych na podstawie grafów. Druga natomiast współpracuje z modułem morfologicznym pochodzącym z Unitexa lub innego systemu umożliwiającego analizę i generację morfologiczna. Do efektywnej analizy poszczególnych członów oraz generowania wszystkich form połączenia konieczne jest współdziałanie z programem odmieniającym leksemy odpowiedniego języka naturalnego. W Multifleksie wykorzystano jeden z najefektywniejszych polskich analizatorów morfologicznych1, a mianowicie Morfeusz. Jest to program komputerowy oparty na słowniku fleksyjnym (właściwie Słowniku gramatycznym języka polskiego; dalej: SGJP), mającym postać bazy danych. Jego autorem jest Marcin Woliński, natomiast autorami bazy danych – Zygmunt Saloni oraz pozostali autorzy SGJP: Włodzimierz Gruszczyński, Robert Wołosz oraz Marcin Woliński. Multiflex z polskim modułem fleksyjnym został po raz pierwszy wykorzystany na potrzeby projektu, którego celem był opis wieloczłonowych jednostek topograficznych Warszawy (projekt LUNA; więcej na: http://www.ist-luna.eu/; dostęp 16.08.2010). Potrzebny był jednak program, który „spinałby” Multifleksa, Morfeusza, unitexowy edytor grafów oraz system bazy danych przetwarzanych jednostek. Tym programem jest Toposław, który pozwala na sprawne korzystanie z czterech wymienionych programów naraz, a zarazem wnosi nowe funkcje, takie jak. filtrowanie grafów, podświetlanie ścieżek, używanie hierarchii pojęć. Autorem Toposława jest Piotr Sikora. Program umożliwia opis wyrażeń frazeologicznych na poziomie ortograficznym, fleksyjnym i składniowym. W tym tekście skupimy się na jednym z aspektów opisu fleksyjno-składniowego, a mianowicie problemie rodzaju w odniesieniu do pewnej podgrupy związków frazeologicznych.

2. Problemy rodzaju wyrażeń frazeologicznych Związek frazeologiczny rozumiemy tu tradycyjnie, jako asumaryczne znaczeniowo połączenie wyrazów tekstowych. Taka definicja jest wystarczająca dla potrzeb omawianego problemu, a jednocześnie nie wypacza obrazu całości. Rodzaj zaś jest w artykule traktowany jako kategoria gramatyczna o charakterze morfologiczno-składniowym, w odniesieniu do rzeczowników jako kategoria w pierwszym rzędzie składniowa, tzn. określana na podstawie połączeń tekstowych (szerzej o tym zob. w:

1

Więcej w: Bień J. S., Szafran K. 2001.

2


Kosek 2008: 110-111). Wartość rodzaju przypisywana jest jednostce, a nie jej formom, z czego wynika, że nie wyróżnia się odrębnych wartości rodzajowych w liczbie pojedynczej i mnogiej. W przypadku rzeczownika (w przeciwieństwie do przymiotnika) parametr rodzajowy jest niezmienny przy zmienności (sing, pl) parametru liczby. Nie dyskutując w tym miejscu problemów związanych z liczbą i cechami klas rodzajowych wyróżnianych przez różnych autorów (zob. Kosek 2008: 111-114 i przywoływaną tam literaturę), przyjmujemy w punkcie wyjścia, dla potrzeb analizy, niebudzące zastrzeżeń wartości M1, M2, M3 rodzaju, tylko ten wycinek klasyfikacji będzie nas bowiem dalej interesował.2 Podstawowym kontekstem diagnostycznym, decydującym o przypisaniu jednostce określonej wartości rodzaju, są połączenia w bierniku liczby pojedynczej i mnogiej, mianownik obu liczb traktowany jest jako kontekst pomocniczy. Procedura przypisywania rodzaju w odniesieniu do interesującego nas fragmentu wygląda więc następująco: (Widzę) tych…(mianownik: ten…był) – M1, te, tego… (mianownik: ten…był) – M2, te, ten…(mianownik: ten…był) – M3. Wskazanym typom połączeń tekstowych odpowiadają określone synkretyzmy w paradygmacie: dla rodzaju M1 biernik obu liczb jest synkretyczny z dopełniaczem, dla M2 – b. l.poj. = d. l. poj; b. l. mn. = m. l. mn., dla M3 – biernik obu liczb jest synkretyczny z mianownikiem. Przyjęcie, że związki frazeologiczne są funkcjonalnie równoważne leksemom (a taką tendencję widać obecnie zarówno w opracowaniach teoretycznych, jak i np. w większości słowników języka polskiego), oznacza możliwość przypisywania im własności gramatycznych przysługującym leksemom i ich klasom. W odniesieniu do frazeologizmów równoważnych funkcjonalnie rzeczownikom, a więc wyrażeń rzeczownikowych w rozumieniu Lewickiego (1986), byłaby to m.in. kategoria klasyfikująca rodzaju. Analizując wielosegmentowe jednostki imienne, można łatwo zauważyć, że istotny wpływ na rodzaj ma ich motywacja gramatyczna i składnia wewnętrzna. Rodzaj całości jest zwykle zbieżny z rodzajem rzeczownika homonimicznego z głównym (wewnętrznie nadrzędnym) komponentem wyrażenia. I tak na przykład, żywy trup ma taką wartość rodzaju, jak trup (M2), wyścig szczurów – jak wyścig (M3), damski bokser – jak bokser (M1), hiobowa wieść jak wieść, końskie zaloty – jak zaloty itd. Frazeologizmy nie są jednak regularnym (semantycznie i składniowo) połączeniem składników, więc takiej zależności, choć obserwujemy ją w wielu 2

Dla prezentowanego tu problemu nieistotne jest, czy grupy te traktujemy jako „odmiany” rodzaju męskiego, czy też mają one status odrębnych klas rodzajowych.

3


przykładach, nie da się uznać za całkowicie regularną. Istnieją grupy wyrażeń niepodlegające podanej prawidłowości, mające własną wartość rodzajową. Rozbieżność między rodzajem jednostki a jej składnią wewnętrzną dotyczy przede wszystkim podgrupy wyrażeń rodzaju męskiego, mających osobową denotację, natomiast etymologicznie niemęskoosobowy (M2 lub M3) komponent nadrzędny. W przypadku tych wyrażeń nie da się „automatycznie” przypisać całości takiego parametru rodzajowego, jaki ma homonimiczny z nadrzędnym segmentem rzeczownik. Do jednostek ujawniających taką właściwość należą np. białe kołnierzyki, chamski cyc, czarny koń, czerwony pająk, dziadek do orzechów, głupi jaś (‘zastrzyk uspokajający’), kozioł ofiarny, królik doświadczalny, młode wilki, mól książkowy, niebieski ptak (ptaszek), niebieskie kołnierzyki, ranny ptaszek, stary koń, szczur lądowy, wilk morski. Teksty wyraźnie pokazują, że w odniesieniu do podanych przykładów użytkownicy języka korelują gramatykę z denotacją, przede wszystkim poprzez postać biernika i łączliwość składniową w tym przypadku, wtórnie – poprzez postać mianownika l. mn. I tak np. głupi jaś ma wartość rodzaju M2, podobnie jak dziadek do orzechów (por. W gablotach ustawiono dziadki do orzechów, „Ja pobruszę, ty – odpocznij”, Turystyka nr 7, dodatek do GW nr 41, 17/18.02.01). Ich nieosobowość zaznaczana jest przez biernik, ale także mianownik liczby mnogiej (te głupie jasie, te dziadki do orzechów). Moherowe berety oscylują między wartością M3 a M2 (w normie potocznej jest to wyraźnie wartość M2, z denotacją sygnalizowaną niekiedy także fleksyjnie – końcówką -a w d. l. poj, np. dzień z życia moherowego bereta). Jaś Wędrowniczek 1 jako nazwa whisky jest rodzaju M2, w przeciwieństwie do Jasia Wędrowniczka 2 jako określenia osoby często zmieniającej przynależność partyjną lub kluby sportowe, który ma rodzaj M1. W przypadku białych i niebieskich kołnierzyków z tekstów prasowych wyłania się wartość M2. Z wyjątkiem Jasia Wędrowniczka 1, rodzaj jest w podanych przykładach inny niż rodzaj nadrzędnego składnika i nie da się go wobec tego opisać przez odesłanie do własności rzeczownika, z formą którego homonimiczny jest główny składnik wyrażenia. Jednostki z „komponentem zwierzęcym” wykazują w bierniku l. mn. łączliwość alternatywną. Alternatywny jest też zatem synkretyzm przypadków – w tekstach obserwujemy albo biernik identyczny z postacią mianownika (cecha charakterystyczna dla typu M2), albo z postacią dopełniacza (tak, jak w typie M1), por. np. U osób sfrustrowanych życiowo dochodzi jeszcze psychiczna potrzeba polowania na kozły ofiarne. („Nie tracić z oczu człowieka”, Rzeczpospolita, 22.06.02) i Uważają się za kozłów ofiarnych poświęconych przez zwierzchników. („Czyste sumienie Gonzalesa”, Rzeczpospolita, 09.01.95); Co się stało, że 4


zamiast Człowieka Myślącego mamy teraz mole książkowe? (S. Laugier, Koncepcja zwykłości i demokracja intelektualna, „Esprit”, maj 2000, przekł. M. Apelt) i Dziś na moli książkowych czekają kolejne atrakcje. („Pisarze na rynku”, GW Bydgoszcz nr 118, 21.05.04). Osobowe traktowanie takich wyrażeń jest też sugerowane w kontekście składniowym mianownika (podmiotu), przez łączliwość z liczebnikami, np. Dzisiaj, w drodze do pracy dwóch chamskich cyców próbowało mnie zabić. Wskazaną łączliwość, charakterystyczną dla jednostek rodzaju M1, trudno w podanych przykładach ignorować, trudno też uznać podawane konteksty za niegramatyczne, sprzeczne z systemem, który „oferuje” składniowe i fleksyjne wykładniki osobowej denotacji. Wobec takiej sytuacji, takich „tekstowych zachowań”, rodzaj omawianych jednostek należałoby opisywać co najmniej jako alternatywny – M2 / M1, choć ich ewolucja wydaje się zmierzać w kierunku M13 – dla części jednostek identyczna łączliwość w bierniku jak w dopełniaczu i synkretyzm tych dwu przypadków w liczbie mnogiej wydają się stabilizować. Takie wrażenie sprawia na przykład mól książkowy. Bez

względu

na

szczegółowe

rozstrzygnięcia

teoretyczne,

w

opisie

(np.

leksykograficznym) takich jednostek w jakiś sposób trzeba zaznaczać wszelkie alternatywne możliwości gramatyczne, zwłaszcza że nie da się ich opisać żadną regułą ogólną. Regułą nie jest ani „dziedziczenie” przez wyrażenie rodzaju po rzeczowniku, z którym nadrzędny składnik wyrażenia jest homonimiczny, ani też np. przybieranie rodzaju alternatywnego (M2 / M1), jeśli występuje „konflikt” między gramatyczną nieosobowością nadrzędnego składnika a osobową denotacją jednostki. O ile to ostatnie zjawisko obserwujemy w przypadku jednostek kozioł ofiarny, mol książkowy czy chamski cyc, o tyle nie ma (przynajmniej na razie) przesunięć rodzajowych, rozchwiania łączliwości, w wyrażeniach lew salonowy czy pies ogrodnika, pies łańcuchowy (ich rodzaj jest taki, jak rzeczowników lew, pies). Każdą jednostkę trzeba więc rozpatrywać indywidualnie.

3. Opis wyrażeń frazeologicznych w Toposławie Teoretycznie, w leksykografii tradycyjnej opisane wahania mogłyby znaleźć odzwierciedlenie w postaci rozbudowanego artykułu słownikowego. Praktycznie – nie znajdują go. „Leksykografia teoretyczna, podobnie jak leksykologia, zajmuje się słownictwem z punktu widzenia semantyki” (Świdziński 1992: 299). Słowniki języka 3

Mówiąc o wartości M1, trzeba wyraźnie podkreślić, że jako kryterium takiej klasyfikacji traktowane są konteksty z biernikiem i jego postać (synkretyzm). Nie stanowią takiego kryterium połączenia z formami czasownika i przymiotnika w mian.l.mn, w tych kontekstach standardowa jest bowiem dla omawianych wyrażeń frazeologicznych postać niemęskoosobowa – te kozły ofiarne (szczury lądowe, ranne ptaszki…) były.

5


polskiego jakkolwiek odnotowują połączenia frazeologiczne, to ich właściwości składniowe podają sporadycznie. Na przykład wyrażenie kozioł ofiarny odnajdziemy w Słowniku języka polskiego pod red. W. Doroszewskiego (dalej: SJPDor.) w artykule

KOZIOŁ

jako podhasło

frazeologiczne bez jakiejkolwiek informacji gramatycznej. W Uniwersalnym słowniku języka polskiego pod red. S. Dubisza (dalej: USJP) wyrażenie to znajdziemy również w haśle KOZIOŁ,

ale pod artykułem odczytamy zapis synkretyzmów z podziałem na poszczególne

znaczenia. Dla interesującego nas połączenia podaje się synkretyzm charakterystyczny dla głównego rzeczownika, czyli dla rodzaju M2: AccSg = GenPl, AccPl = NomPl. Podawana w słownikach wartość rodzaju dotyczy zazwyczaj leksemów, nie wyrażeń rzeczownikowych. Wyjątek stanowi Inny słownik języka polskiego (dalej: ISJP), w którym w haśle

KOZIOŁ

redaktorzy rejestrują wyrażenie kozioł ofiarny z informacją „fraza rzeczownikowa, rodzaj męskoosobowy”. W przykładach brak jednak zdań w liczbie mnogiej. Jak miałyby więc brzmieć odpowiednie formy mianownika i biernika? Oczywiście, słowniki ogólne nie podają wprost również form poszczególnych leksemów. Pełne tabele odmiany wszystkich leksemów odmiennych podają jedynie słowniki fleksyjne, a w szczególności Słownik gramatyczny języka polskiego. Okazuje się jednak, że nie wszystkie dane lingwistyczne można sprowadzić do stosownego algorytmu, zamkniętego w formie tabeli. Wiele cennych informacji, dotyczących poszczególnych typów koniugacyjnych, w Słowniku się nie znalazło. Dane czasownikowe zostały wcześniej opublikowane w wersji tradycyjnej (książkowej) w Czasowniku polskim Z. Saloniego. Pod kilkunastoma tabelami znajdują się szczegółowe komentarze,

dotyczące

wariantów

odmiany,

produktywności

typu

koniugacyjnego,

wyjątkowych sposobów tworzenia poszczególnych form (por. tab. 72, 73). W SGJP, opartym na tych samych danych, te informacje zostały „zgubione”. Problem stanowi bowiem podanie tej samej złożonej informacji w sposób sformalizowany, absolutnie „bezdyskusyjny”. Podobne

trudności

napotyka

leksykograf

przygotowujący

opis

wyrażeń

frazeologicznych na potrzeby automatycznego przetwarzania polszczyzny, a więc opis możliwie rygorystyczny. Przyjrzyjmy się zatem, jak przebiega opis jednostek złożonych w Toposławie. Pierwszym krokiem opisu fleksyjnego jest hasłowanie, czyli wybór leksemu, kolejnym – wybór charakterystyki gramatycznej (więcej w: Czerepowicka 2010). Operacje te są możliwe dzięki zastosowaniu analizatora morfologicznego Morfeusz. Następnie za pomocą grafu opisywane są zależności między składnikami wyrażenia, m.in. wskazuje się jego centrum. Rodzaj gramatyczny jednostki w większości wypadków jest, jak wspomniano, dziedziczony po członie rzeczownikowym, np. połączenie telefon zaufania ma rodzaj taki jak 6


rzeczownik telefon, tęgi umysł – jak umysł, absolutyzm oświecony – jak absolutyzm. Wyrażenia frazeologiczne, które mają inną wartość rodzaju niż którykolwiek z komponentów, przysparzają kłopotów leksykografowi. W obecnej wersji programu Toposław żadne z nich nie otrzymuje pełnego opisu. Jakkolwiek możliwe jest ustalenie, wpisanie „na sztywno” wartości rodzaju wyrażenia, nie ma to wpływu na zasób i kształt poszczególnych form, np.:

W wyrażeniu kozioł ofiarny możliwe jest ustalenie wartości rodzaju M2, czyli takiej jak składnika rzeczownikowego. Choć program dopuszcza sytuację, w której wartość rodzaju połączenia nie zgadza się z wartością któregoś z komponentów, to nie ma to konsekwencji w postaci odpowiednich form. Ponieważ w słowniku, którym dysponuje analizator morfologiczny, brak rzeczownika rodzaju M1, połączenie nie może automatycznie otrzymać takiej charakterystyki. Nawet jeśli wartość M1 zadamy wprost (odpowiednim równaniem w grafie), nie wpłynie to na opis i zasób form. W klatce AccPl znajduje się forma M2 „przepisana” z rzeczownika

KOZIOŁ:

kozły ofiarne (nie: kozłów ofiarnych). Przy ustaleniu

wartości rodzaju Toposław korzysta z analizatora morfologicznego i słownika fleksyjnego, nie odwołując się do jakiejkolwiek reguły składniowej, co więcej program tego typu regułami 7


nie dysponuje. Wpisana w grafie wartość rodzaju M1 nie przynosi w konsekwencji form odpowiednich dla rodzaju M1. Wydaje się, że gdyby Toposław „potrafił” właściwie odczytać informację o rodzaju i „przełożyć” ją na synkretyzm form (AccPl = GenPl nie: AccPl = NomPl), możliwy byłby opis zadowalający. Program nie daje leksykografowi możliwości ingerencji w wygenerowaną tabelę, formy nie można wprowadzić „ręcznie”. Toposław nie przewiduje również miejsca – dodatkowej klatki w tabeli – dla formy alternatywnej, drugiej. Dlatego na podobne trudności natrafimy opisując połączenie mól książkowy, którego rodzaj także nie zgadza się z rodzajem gramatycznym głównego komponentu. W tekstach (korpusie) odnajdziemy w bierniku liczby mnogiej zarówno formę moli książkowych, jak i mole książkowe. W Toposławie tych subtelności nie zakodujemy. Tabela podaje wyłącznie formę mole książkowe, czyli taką, jaką przewiduje Morfeusz:

Natomiast możliwy jest poprawny opis wyrażenia dziadek do orzechów. Dzieje się tak, ponieważ słownik analizatora morfologicznego przewiduje homonimię w zakresie

8


rzeczowników o nazwie

4

DZIADEK

, stąd postać NomPl i AccPl dziadki do orzechów (nie:

dziadkowie i dziadków) por.:

Trzeba jednak zaznaczyć/podkreślić, że dzieje się tak wyłącznie dzięki temu, że przedmiotem opisu redaktorów Słownika gramatycznego były nie tylko, wbrew deklaracjom, leksemy o charakterze ciągłym, ale i, jak widać, połączenia wyrazowe. DZIADEK M1 to leksem występujący w dowolnych kontekstach zdaniowych,

DZIADEK

M2 – w bliskim

sąsiedztwie logicznym (często formalnym) wyrażenia przyimkowego do orzechów.

Zakończenie Skonstruowanie automatycznego, rygorystycznego opisu języka naturalnego nie jest zadaniem banalnym, o czym mogą świadczyć implementacje poszczególnych gramatyk formalnych. Formalny opis wyrażeń frazeologicznych wydaje się tym bardziej kłopotliwy. Współpracujący z programem Toposław analizator morfologiczny, jakkolwiek obszerny, jest 4

Słownik gramatyczny notuje oba rzeczowniki z odpowiednimi glosami: ‘o człowieku’ oraz ‘przyrząd do łupania orzechów’.

9


niewystarczający. Wydaje się, że rzecz jednak nie w rozbudowanym słowniku, który z oczywistych powodów nie zarejestruje absolutnie wszystkich możliwych jednostek. Konieczna jest możliwość ingerencji w klatki poszczególnych paradygmatów (zmiana i/lub dodanie formy), bo te różnią się od odpowiednich wzorów odmiany składników połączeń. Rozważyć należałoby dodanie do programu reguł składniowych. W wypadku wyrażeń frazeologicznych widać wyraźnie, jak silnie powiązane są zagadnienia fleksyjne i składniowe – to nie doraźnie połączone formy leksemów i choć formalnie konstrukcje – składniowo często niepowtarzalne i wyjątkowe.

Bibliografia Bień J. S., Szafran K., 2001, Analiza morfologiczna języka polskiego, Biuletyn Polskiego Towarzystwa Językoznawczego, LVII, wersja elektroniczna (dostępna pod adresem: http://www.mimuw.edu.pl/~jsbien/publikacje/JSB-KS-PTJ01). Czerepowicka

M.,

2010,

Toposław

jako

narzędzie

znakowania

jednostek

wieloczłonowych, Nowe zjawiska w języku, tekście, komunikacji III (w druku). Kosek I., 2008, Fleksja i składnia nieciągłych imiennych jednostek leksykalnych, Olsztyn: Wydawnictwo UWM. Lewicki A. M., 1986, Składnia związków frazeologicznych, Biuletyn PTJ XL, s. 75– 82. Savary A., 2009, Multifex: a Multilingual Tool for Describing the Morphosyntax of Multi-Word Units – wydruk komputerowy, ss. 22; złożony do „Linguisticae Investigationes”. Świdziński M., 1988, Ukierunkowany gramatycznie średni słownik ogólny: Longman Dictionary of Contemporary English, Studia z polskiej leksykografii współczesnej, Wrocław – Warszawa – Kraków „Ossolineum”, s. 299–333. Świdziński M., 2006, Lingwistyka korpusowa w Polsce, LingVaria, nr 1, s. 23–34.

Streszczenie Celem artykułu jest przedstawienie jednego z problemów sformalizowanego, rygorystycznego opisu gramatycznego polszczyzny. O ile w odniesieniu do leksemów problem automatycznej analizy morfologicznej jest rozwiązany (jak stwierdził Marek Świdziński), dysponujemy już odpowiednimi narzędziami do automatycznego przetwarzania języka naturalnego, o tyle w przypadku jednostek ponadwyrazowych (złożonych) wiele kwestii wymaga dopracowania bądź rozwiązania. Artykuł dotyczy jednego z aspektów automatycznego opisu fleksyjno-składniowego jednostek złożonych, a mianowicie rodzaju 10


wyrażeń frazeologicznych. Przedmiotem uwagi są jednostki, których rodzaj nie jest zgodny z rodzajem głównego (wewnętrznie nadrzędnego) składnika wyrażenia lub które wykazują alternatywną wartość tej kategorii (np. kozioł ofiarny czy mól książkowy). W pracy przedstawiono problemy rygorystycznego opisu rodzaju tych frazeologizmów i ewentualne rozwiązania na przykładzie programu komputerowego Toposław.

Słowa kluczowe: formalizm, Multiflex, Toposław, wyrażenie frazeologiczne, rodzaj.

11


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.