Talk:Skanwiki/Skanwikiprojekt MT
Kommentarar
edittil Danmark Statistikk. ( < Danmarks Statistikk), til-possessiven er for omrattande. Trondtr (talk) 19:46, 31 December 2015 (UTC).
- retta, takk; og takk for tillegg i ordbøkene =D --Unhammer (talk) 15:31, 2 January 2016 (UTC)
Svensk
editHur mycket ord- och textmaterial har du för svenska? Ordlistor? Korrekta översättningar att kontrollera mot?
Kommer din parser att kunna tolka äldre stavning/skrivemåder? Svenska hade ju pluralformer av verb: jag är, vi äro; jag arbetar, vi arbeta. Kommer parsern att veta att "äro" är en synonym till "är" och att "arbeta" kan vara både infinitiv och en synonym till presensformen arbetar? Svenska har också haft några stavningsreformer, så att man i äldre texter kan hitta "hvad/hvem/af" där vi idag skriver "vad/vem/av". I en översättning från danska eller norska till svenska, behöver Apertium aldrig generera dessa äldre former, men det kunde ju vara bra om den förstår de äldre formerna när den ska översätta från svenska. --LA2 (talk) 03:36, 6 February 2016 (UTC)
- Grunnlaget for svensk-morfologien i apertium-swe er SALDO, så me har nesten 100.000 oppslagsord/lemma (kvart med full bøyning). Av korrektomsetjingar har eg brukt det som finst på http://opus.lingfil.uu.se/ til no. Me vil prioritera å handtera moderne svensk. Med det sagt, viss det ikkje gir problem med disambiguering så ser eg ingenting i vegen for å ta med eldre former i den moderne analysatoren. Så «äro, hvad, hvem, af» kan me godt ha med, men «arbeta» som presens vil skapa problem, sidan ein tilfeldig valt «arbeta» i Wikipedia mest sannsynleg er infinitiv. Det finst òg måtar å markera variantar i ordbøkene, sånn at XML-fila genererer to analysatorar, ein med berre moderne analysar, og ein med dei eldre inkludert (sånn kunne ein inkludert farlege formar som «arbeta» òg), men eg kjem ikkje til å bruka tid på dette sjølv før eg ser at det speler ei viktig rolle i omsetjing av Wikipedia-artiklar frå svensk :-) --Unhammer (talk) 07:50, 6 February 2016 (UTC)
- Det finns tillräckligt många fria e-texter, som kan vara bra testmaterial, som har modern stavning (efter stavningsreformen 1906) av av/vad/vem men som använder pluralformer av verben, där de starka och oregelbundna verben skiljer ut sig genom ändelsen -o i pluralis imperfekt: voro = var, blevo = blev, bröto = bröt, gingo = gick, lupo = löpte. De vanligaste finns i den här listan från 1919, där spalt 3 och 4 skiljer sig åt (bådo = bad, begrovo = begravde, beskuro = beskar, etc.). --LA2 (talk) 20:32, 6 February 2016 (UTC)
Interesse for variantar?
editEr det interesse for andre stave-/stilvariantar enn dei me har no? Eg har hovudsakleg prøvd å halda meg til det som ligg nærmast opp mot http://i18n.skulelinux.no/retningslinjer.html ved Apertium-utvikling, men viss det er noko Folk Flest synest bør endrast så vurderer me sjølvsagt det, og viss det teiknar seg fleire tydelege gruppar, så kan me kanskje laga ulike variantar av omsetjarane (me har alt laga variantar av bokmål→nynorsk for e-infinitiv vs a-infinitiv).