A Computational-Empirical Approach to Language Comprehension: Monotonicity, Complexity, and Compositionality
Person photo Dr Jakub Szymanik
Theoretical Philosophy (Department of Philosophy)

Funding source: Swedish Research Council - Vetenskapsr├ądet (VR)
Period: 1/1/10 - 12/31/11
Funding: 1404000 SEK
Description:
Den mänskliga förmågan att kommunicera språkligt är fascinerande. Trots många decenniers ansträngningar har vi ännu inte lyckats förstå hur det är möjligt för talare att språkligt förmedla så mycket information, och för mottagare att uppfatta den med sådan lätthet. Situationen blir än mer slående när vi försöker simulera dessa förmågor. Artificiella aktörer, som robotar och dataprogram, når fortfarande bara svaga resultat i språkliga uppgifter, trots att de väl kan klara andra mänskliga uppgifter, som att spela schack eller köra bil. Man skulle kunna tro att de språkliga uppgifterna är enklare för de artificiella aktörerna, eftersom dessa konstrueras med språklig kompetens inbyggd, medan människor måste lära sig språket själva. Inlärningen är mycket lång och försvåras dels av brist på data (få yttranden i förhållande till språket som helhet), dels av bristfälliga data (ogrammatiska yttranden). Likafullt lyckas barnet lära sig ett språk som innehåller oändligt många välbildade uttryck. Det kan förstå och själv bilda satser det aldrig tidigare hört. Robotar, å andra sidan, kan i bästa fall använda endast mycket begränsade fragment av naturliga språk, speciellt analyserade och kodade. Det är av största vikt både från ett teoretiskt och ett praktiskt perspektiv att förstå de egenskaper hos mänsklig språkbehandling som dessa imponerande resultat beror på. Dels kommer det att förbättra vår kunskap om språk och mänsklig psykologi. Dels förefaller det som om framsteg inom datorbaserad språkbehandling i mycket hög grad beror på en bättre förståelse av mänskliga förmågor. Vi hoppas därför att vår forskning kommer att både öka vår teoretiska kunskap och bidra till utvecklingen av teknologiska tillämpningar. Forskningsprojektet syftar till att konstruera en filosofiskt, psykologiskt och beräkningsmässigt rimlig modell för förståelse av yttranden i naturliga språk. Vi kommer i synnerhet att uppmärksamma följande tre frågor: 1. Varför är det enklare för människor att förstå positiv information, som t.ex. "Alla pojkar kan simma", än negativ information, som t.ex. "Ingen pojke kan simma"? 2. Varför är vissa typer av satser svårare att förstå än andra? T.ex. är det lättare att avgöra sanningsvärdet hos hos satsen "Alla pojkar kan simma" än hos satsen "De flesta av pojkarna kan simma". 3. Varför är det rimligt att tro att talare förstår meningen hos ett sammansatt uttryck så som bestämd av meningen hos dess delar och sammansättningsformen? Den första frågan rör skillnaderna mellan positiv och negativ information i naturliga språk. Denna distinktion inom logik och lingvistik kan delvis fångas genom det matematiska begreppet monotonicitet (en funktion är monoton om dess värde är större när dess argument är större). Den andra frågan fokuserar på beräkningskomplexitet och dess relation till upplevd och verklig svårighet för människor i kognitiva uppgifter. Den tredje frågan rör rättfärdigandet av kompositionalitetsprincipen: Meningen hos ett sammansatt språkligt uttryck är bestämt av meningen hos dess delar och sammansättningsformen. Denna princip har motiverats med hänvisning just till förmågan att lära sig ett oändligt språk, liksom den besläktade förmågan att kunna förstå nya satser. Ett problemet med dessa motiveringar är att principen att semantiken är rekursiv räcker för att förklara detta. Frågan är då varför kompositionalitet behövs. Ett svar på den frågan som nyligen givits är att standardformer av kompositionell semantik är korrelerade med en minimering av av beräkningskomplexitet, medan rekursivitet är förenlig med en vilken grad av komplexitet som helst. Motiveringen är därmed att kompositionalitet behövs för kognitiv enkelhet. Denna idé behöver utforskas närmare. För att studera dessa sammansatt fenomen kommer vi att anlägga ett flerdisciplinärt perspektiv. Språkfilosofi kommer att ge en teoretisk och begreppslig grundval, medan logik och datalogi kommer att bidra med den huvudsakliga verktygslådan. Lingvistik kommer erbjuda den allmänna bryggan mellan abstrakta överväganden och naturliga språk. Kognitionsvetenskap och psykologi, slutligen, kommer att bidra med metoder för att utforma och utvärdera de experiment som krävs för att testa teoretiskt motiverade hypoteser. Förhoppningsvis kommer resultaten kasta ljus över den roll som monotonicitet, komplexitet och kompositionalitet spelar för kognitiva fenomen inom språkanvändning, och därmed också besvara några av de frågor som ställts.
  
Research fields (1)
  
Philosophy