Francis, I'm interested, but I don't know how I can help you. I'm not a linguist, and understand the paradigms in french/catalan had been hard. (points 1, 2, 3). May be the people who worked in the project.
I could work in the 1500 sentences. (point 1) But no in 2-3 days! :) Well, we can meet up on IRC (I never used it). If you explain me how to enter, it's possible this evening. Another day...after Christmas. If you can explain how to enter (off this list).... I have looked at the last version of the tale. Apparently there are many errors, but some are repeated. I don't know the original text, but I you attach file with comments. Joan 2015-12-22 22:09 GMT+01:00 Francis Tyers <[email protected]>: > A 2015-12-22 19:12, Joan escrigué: > > Francis,and all > > > > I've recently found out that pairs can be enabled without a real > > "release". FANTASTIC!! > > > > Can you give me a list of what improvements you expect to see ? Is it > > just the vocabulary? YES. BESIDES THE FILE _DOCUMENT.__TXT_ THAT > > I ATTACH YOU, THERE ARE SOME WORDS AS BIOGRAPHIE, FILMOGRAPHIE, > > NEVEU, PETIT-FILS... I didn't understand what you meant by "strange > > characters". THEY ARE MAINLY CREATED WHEN ORIGINALLY IT FIND "<REF > > NAME="XX">. THE “STRANGE CHARACTERS ARE: >SPAN, ABBR CLAS, > > CONTENDITABLE...YOU CAN SEE FOR EXEMPLE IN > > HTTPS://CA.WIKIPEDIA.ORG/W/INDEX.PHP?TITLE=BOB_RAFELSON&ACTION=EDIT > > [9] VERSUS > > HTTPS://FR.WIKIPEDIA.ORG/W/INDEX.PHP?TITLE=BOB_RAFELSON&ACTION=EDIT > > [10] > > This is a problem for the ContentTranslation team. It seems like the > problem > has to do with templates. > > > Would anyone be against me converting fr-ca to: > > > > * three-letter codes > > * monolingual language packages > > * adding lexical selection support > > On our part, NO PROBLEM > > ? > > Ok. Here are the problems I find: > > * Using the large French lexicon from either br-fr or fr-es causes a > substantial decrease > in translation quality. > * The tagger is really bad. > > Here is a comparison of before/after. > > http://paste2.org/9GhW8LKe > > I can fix the testvoc errors, it will probably take around 2-3 days. I > can also expand the lexicon > from crossing fr-es and es-ca. However, I will need help with: > > 1) Fixing the tagging. You can write constraint grammar rules, or you > can manually annotate texts. If you > manually annotate texts, we will need around 1500 sentences annotated > to make a substantial improvement > > 2) Proofreading the dictionary. > > 3) Writing lexical selection rules. > > If you would be interested in working on this, I think we can get > something releasable in 2-3 full days of > work. Let me know if you would be interested and we can pick the days to > meet up on IRC. > > Fran > > > ------------------------------------------------------------------------------ > _______________________________________________ > Apertium-stuff mailing list > [email protected] > https://lists.sourceforge.net/lists/listinfo/apertium-stuff >
1. $ cat texts/cuento.fra.txt | apertium -d . fra-cat 2. 1 ON ÉS JEAN ? 3. 2 Jean i Maria Casa són en el jardí. Fa bo bonic avui, fa molta calor calent. Però ahir, feia molt fred ! No han pogut pogudes jugar fora. Jean i Casa adoren jugar, juguen sempre #junts (its ok) en el jardí davant la gran casa. 4. 3 Jean és un petit #noi noiet i té sis anys. La petita filla noieta és #el seu germana, té cinc anys. Jean té un petit gos, el gos és també en el jardí en aquest moment. El gos estima li agrada jugar amb els dos #nen nens. El gos és molt content ara a present. 5. 4 Què Casa ha té també un gos ? No, Casa no ha gos, té un gat. Però el gat és en la casa, el gat dorm. 6. 5 #El seu La seva mare és en la casa amb el gat, mira per la finestra i veu Jean i Casa #que (it’s ok) juguen. Jean corre ràpidament cap al gros arbre verd, s'amaga de Casa. Sabeu-us perquè ? Casa s’ha assegut i té les mans davant els seus ulls. No pot res veure i compta. Perquè s’amaga fa #encobrir ? I #que (it’s ok) fa Jean prop de l'arbre ? 7. 6 És un joc. #Quan (ok) Casa ha acabat de comptar, mira al voltant d'ella. #Buscar Busca Jean : on ha anat ? El veus vegeu-vos ? 8. 7 Casa no sap #pas on és Jean. Demana al gos : "Has Tens vist Jean ?" Però el gos no pot #pas parlar, ben segur ! Llavors Casa no obté cap resposta a #el seu qüestió la seva pregunta. La gent no obté obtenen mai de resposta #quan parla parlen als gossos ! 9. 8 Casa mira #el seu la seva mare darrere de la finestra, la seva #el seu mare riu. Casa pensa #que ha vist on Jean ha anat : "#Dir Digues on està !", diu dita-ella a #el seu la seva mare. "No, Casa, no puc pugues dir-t’ho et dir-ho", respon. Encara que #saber sap probablement on és, no vol dir-ho. 10. 9 Casa camina lentament #a través de el pel jardí. Busca encara #Buscar sempre a trobar Jean. Mira sota la taula i sota les cadires, però Jean no hi és #pas. Mira per tot arreu però no pot trobar Jean. 11. 10 Sent llavors un soroll, ve de darrere el gros arbre verd. Què (potser?) és Jean ? Encara aquest soroll ! Escolta atentament. Aquest no és #pas un ocell o on un altre animal. Ho La sent bé ben ara. Aquest deu ser estar Jean ! 12. 11 Veu llavors una petita mà i #quan s’apropa es #apropar, veu també el seu cap ! Riu i diu dita : "T'he trobat !" Estan Són contents, tots els dos, i entren a la casa, és l'hora de menjar alguna cosa i de beure de l'aigua ! Marie: trad x Casa (It’s a name, Maria!!, not a form of verb “marier” fille: on peut traduire x noia ou x filla Apertium a un problème avec le changement de genre pour elision Normalement, on n’utilise pas le « pas » dans la forme « no hi és (pas)» Ici on trouve le probleme entre « ser » i « estar ». le français a seulement une forme (être)
------------------------------------------------------------------------------
_______________________________________________ Apertium-stuff mailing list [email protected] https://lists.sourceforge.net/lists/listinfo/apertium-stuff
