Viennozīmības definīcija valodu studijās

In valodniecība, noskaidrošana ir process, lai noteiktu, kura a jēga vārdu tiek izmantots noteiktā kontekstā. Zināms arī kā leksiskā definīcija.

Skaitļošanas lingvistikā šo diskriminējošo procesu sauc vārda nozīmes skaidrojums (WSD).

Piemēri un novērojumi

“Gadās tā, ka mūsu komunikācija, vienaldzīgs valodas vienādi, ļauj izmantot vienu un to pašu vārda formu, lai apzīmētu dažādas lietas atsevišķos komunikatīvos darījumos. Sekas ir tādas, ka konkrētā darījumā ir jānoskaidro dotā vārda paredzētā nozīme starp ar to potenciāli saistītajām nozīmēm. Kamēr neskaidrības kas izriet no šādām daudzveidīgām formas nozīmes asociācijām ir pie leksikas līmenī, tie bieži ir jāatrisina, izmantojot plašāku kontekstu no diskurss vārda iegulšana. Tādējādi vārda “pakalpojums” dažādās nozīmes var atšķirt tikai tad, ja var skatīties tālāk par pašu vārdu, piemēram, pretstatā “ spēlētāja pakalpojums Vimbldonā" ar "viesmīļa pakalpojumu Sheratonā". Šis vārdu nozīmju noteikšanas process diskursā parasti ir zināms kā

instagram viewer

vārda jēga noskaidrošana (WSD)." (Oi Yee Kwong, Jaunas perspektīvas skaitļošanas un kognitīvajās stratēģijās vārdu sajūtas noskaidrošanai. Springer, 2013)

Leksiskā noskaidrošana un vārdu nozīmes noskaidrošana (WSD)

"Leksisks noskaidrošana tās plašākajā definīcijā nav nekas cits kā katra vārda nozīmes noteikšana kontekstā, kas, šķiet, ir lielā mērā neapzināts process cilvēkos. Kā skaitļošanas problēma bieži tiek aprakstīta kā “AI-pabeigta”, tas ir, problēma, kuras risināšanai ir nepieciešams risinājums dabiskā valoda izpratne vai veselā saprāta spriešana (Ide un Véronis 1998).

"Datorlingvistikas jomā problēma parasti tiek saukta par vārda nozīmes noskaidrošanu (WSD) un tiek definēta kā problēma skaitļošanas veidā noteikt, kura vārda “jēga” tiek aktivizēta, lietojot vārdu konkrētā kontekstā. WSD būtībā ir klasifikācijas uzdevums: vārdu sajūtas ir klases, konteksts nodrošina pierādījumi, un katrs vārda gadījums tiek piešķirts vienai vai vairākām iespējamām klasēm, pamatojoties uz pierādījumi. Šis ir tradicionāls un izplatīts WSD raksturojums, kas to uzskata par nepārprotamu skaidrības procesu attiecībā uz fiksētu vārdu sajūtu sarakstu. Tiek pieņemts, ka vārdiem ir ierobežots un diskrēts sajūtu kopums no a vārdnīca, leksiskā zināšanu bāze vai ontoloģija (pēdējā nozīmē, ka sajūtas atbilst jēdzieniem, kurus vārds leksikalizē). Var izmantot arī lietojumprogrammām raksturīgos krājumus. Piemēram, mašīntulkošanas (MT) iestatījumā vārdu tulkojumus var uzskatīt par vārda maņām, an pieeja, kas kļūst arvien realizējamāka, jo ir pieejamas lielas daudzvalodu valodas paralēli korpusi kas var kalpot kā treniņu dati. Tradicionālā WSD fiksētais inventārs samazina problēmas sarežģītību, taču pastāv alternatīvi lauki.. .." (Eneko Agirre un Filips Edmonds, "Ievads". Vārda jēgas noskaidrošana: algoritmi un lietojumprogrammas. Springer, 2007)

Homonīmija un atdalīšana

"Leksisks noskaidrošana ir īpaši piemērots gadījumiem homonīmija, piemēram, notikums bass ir jāattiecina uz kādu no leksiskajiem vienumiem bass₁ vai bass₂, atkarībā no paredzētās nozīmes.

"Leksiskā skaidrība nozīmē kognitīvu izvēli un ir uzdevums, kas kavē izpratnes procesus. Tas ir jānošķir no procesiem, kas noved pie vārda maņu diferenciācijas. Pirmais uzdevums tiek veikts diezgan droši arī bez daudz kontekstuālas informācijas, bet otrais nav (sal. Veronis 1998, 2001). Ir arī pierādīts, ka homonīmi vārdi, kuriem nepieciešama skaidrība, palēnina leksisko piekļuvi, savukārt polisēmiski vārdi, kas aktivizē vārdu maņu daudzveidību, paātrina leksisko piekļuvi (Rodd e.a. 2002).

"Tomēr gan semantisko vērtību produktīvai modifikācijai, gan tiešai izvēlei starp leksiski atšķirīgiem vienumiem ir kopīgs tas, ka tiem nepieciešama papildu neleksiskā informācija." (Pīters Bošs, "Produktivitāte, polisēmija un predikātu indeksalitāte". Loģika, valoda un aprēķini: 6. Starptautiskais Tbilisi simpozijs par loģiku, valodu un aprēķiniem, red. autors Balders D. desmit Keita un Henki V. Zeevat. Springer, 2007)

Leksiskā kategoriju definīcija un iespējamības princips

"Korlijs un Krokers (2000) piedāvā plaša pārklājuma modeli leksiskā kategorijanoskaidrošana pamatojoties uz Varbūtības princips. Konkrēti, viņi to iesaka teikumam, kas sastāv no vārdiem w₀... w_n, teikumu apstrādātājs pieņem visticamāko runas daļa secība t₀... t_n. Konkrētāk, viņu modelis izmanto divas vienkāršas varbūtības: (i) vārda nosacītā varbūtība w_i dota noteikta runas daļa t_i, un (ii) varbūtība t_i ņemot vērā iepriekšējo runas daļu t_i-1. Kad tiek atrasts katrs teikuma vārds, sistēma piešķir tam šo runas daļu t_i, kas palielina šo divu varbūtību reizinājumu. Šis modelis gūst labumu no daudziem ieskatiem sintaktiskā neskaidrībām ir leksisks pamats (MacDonald et al., 1994), kā (3):

(3) Noliktavas cenas/markas ir lētākas nekā pārējās.

"Šie teikumi īslaicīgi ir neskaidri starp lasījumu, kurā cenas vai padara ir galvenais darbības vārds vai daļa no a salikts lietvārds. Pēc apmācības lielā korpusā modelis paredz visticamāko runas daļu cenas, pareizi ņemot vērā to, ka cilvēki saprot cena kā lietvārds bet padara kā darbības vārdu (sk. Crocker & Corley, 2002 un tajā minētās atsauces). Modelis ne tikai ņem vērā virkni noskaidrošanas preferenču, kas sakņojas leksiskajā kategorijā neskaidrības, tas arī izskaidro, kāpēc parasti cilvēki ļoti precīzi risina šādas neskaidrības." (Metjū V. Krokers, "Rational Models of Comprehension: Addressing the Performance Paradox". Divdesmit pirmā gadsimta psiholingvistika: četri stūrakmeņi, red. autors Anne Katlere. Lorenss Erlbaums, 2005)