> Date: Sun, 19 Feb 2017 23:02:48 +0300 > From: Hèctor Alòs i Font <[email protected]> > To: "[apertium-stuff]" <[email protected]> > Reply-To: [email protected] > Subject: Re: [Apertium-stuff] apertium-fra > Pièce(s) jointes(s) probable(s)> > Merci, Bernard, pour ta longue réponse qui touche beaucoup de thèmes. > > (.......................) > > Je ne comprends pas très bien ceci: > > > Une autre chose (facile à prendre en compte) si on fait des metadix de > > référence est, pour les paradigmes dont l'analyse donne le genre mf, > > d'accepter aussi les genre m et f en génération. > > Idem entre sp, sg et pl. > > C'est déjà fait (au moins pour les paradigmes les plus courants) dans la > > paire epo-fra et ce sera fait dans fra-por. Ça simplifie beaucoup > > l'écriture > > des règles de transfert. > > > Ne serait-il pas question de faire cela dans le dictionnaire bilingue? Je > comprends qu'il y a du travail quand on doit générer un GD (ou un ND) parce > que dans la langue source il y a mf (ou sp), mais je ne vois pas un grand > problème à générer de mf ou des sp, si le genre et/ou le nombre > sont écrits > dans le dictionnaire bilingue. > > (...................) > > Hèctor >
Transformer quelques paradigmes de cette manière : Avant : <pardef n="académique__adj"> <e><p><l></l> <r><s n="adj"/><s n="mf"/><s n="sg"/></r></p></e> <e><p><l>s</l> <r><s n="adj"/><s n="mf"/><s n="pl"/></r></p></e> </pardef> Après <pardef n="académique__adj"> <e><p><l></l> <r><s n="adj"/><s n="mf"/><s n="sg"/></r></p></e> <e><p><l>s</l> <r><s n="adj"/><s n="mf"/><s n="pl"/></r></p></e> <e r="RL"><p><l></l> <r><s n="adj"/><s n="m"/><s n="sg"/></r></p></e> <e r="RL"><p><l>s</l> <r><s n="adj"/><s n="m"/><s n="pl"/></r></p></e> <e r="RL"><p><l></l> <r><s n="adj"/><s n="f"/><s n="sg"/></r></p></e> <e r="RL"><p><l>s</l> <r><s n="adj"/><s n="f"/><s n="pl"/></r></p></e> </pardef> n'est pas très contraignant et peut simplifier pas mal à la fois les dictionnaires bilingues et les règles de transfert. Pour le dictionnaire bilingue, je considère qu'il doit le plus possible se limiter à une correspondance de lemmes entre 2 langues. Il faut bien sûr la catégorie du mot qui, pour des raisons d'homogénéité gauche droite sera précisée 2 fois et il peut y avoir une restriction dans le sens de traduction. Comme l'étape 1 du transfert n'accède pas au dictionnaire morphologique de la langue cible, lorsque : - le genre est masculin dans une langue et féminin dans l'autre ou - le genre n'existe que dans l'une des 2 langues ou - un même lemme a dans une langue 2 significations différentes selon son genre il faudra dans ces 3 cas préciser le(s) genre(s) dans le dictionnaire bilingue. Il ne faudrait pas être obligé d'en faire plus. Exemples : Un logiciel technique analyse + désambiguisation ^Un<det><ind><m><sg>$ ^logiciel<n><m><sg>$ ^technique<adj><mf><sg>$ génération ^Um<det><ind><m><sg>$ ^software<n><m><sg>$ ^técnico<adj><m><sg>$ Um software técnico Une traduction automatique analyse + désambiguisation ^Un<det><ind><f><sg>$ ^traduction<n><f><sg>$ ^automatique<adj><mf><sg>$ génération ^Um<det><ind><f><sg>$ ^tradução<n><f><sg>$ ^automático<adj><f><sg>$ Uma tradução automática La règle grammaticale qui semble commune à toutes les langues romanes est d'accorder en genre et en nombre l'adjectif (et le déterminant) au nom. On prend donc les genres de software et tradução pour générer la phrase portugaise et le fait que dans une autre langue, l'adjectif correspondant est analysé avec le genre mf n'est pas un motif valable pour compliquer ce processus. Dans l'autre sens : Um software técnico analyse + désambiguisation ^Um<det><ind><m><sg>$ ^software<n><m><sg>$ ^técnico<adj><m><sg>$ génération ^Un<det><ind><m><sg>$ ^logiciel<n><m><sg>$ ^technique<adj><m><sg>$ Un logiciel technique Uma tradução automática analyse + désambiguisation ^Um<det><ind><f><sg>$ ^tradução<n><f><sg>$ ^automático<adj><f><sg>$ génération ^Un<det><ind><f><sg>$ ^traduction<n><f><sg>$ ^automatique<adj><f><sg>$ Une traduction automatique Même règle de grammaire, l'adjectif prend le genre du nom dans la langue cible. Si le paradigme commun aux deux adjectifs a été modifié plus haut comme indiqué, la génération fonctionne et on n'a pas eu besoin de traiter un cas particulier dans les règles de trabsfert. Avec l'espéranto et pour le nombre maintenant. Principe de choix du nombre : - depuis l'espéranto, on prend le nombre du nom dans la langue source - depuis une langue romane, on prend le nombre du déterminant Dans les 2 cas, la détermination du nombre marche toujours. Le chat mange la souris ^Le<det><def><m><sg>$ ^chat<n><m><sg>$ ^manger<vblex><pri><p3><sg>$ ^le<det><def><f><sg>$ ^souris<n><f><sp>$ ^La<det><def><sg><nom>$ ^kato<n><m><sg><nom>$ ^manĝi<vbtr><pres>$ ^la<det><def><sg><acc>$ ^muso<n><sg><acc>$ La kato manĝas la muson Les chats mangent les souris ^Le<det><def><mf><pl>$ ^chat<n><m><pl>$ ^manger<vblex><pri><p3><pl>$ ^le<det><def><mf><pl>$ ^souris<n><f><sp>$ ^La<det><def><pl><nom>$ ^kato<n><m><pl><nom>$ ^manĝi<vbtr><pres>$ ^la<det><def><pl><acc>$ ^muso<n><pl><acc>$ La katoj manĝas la musojn Dans l'autre sens La kato manĝas la muson ^La<det><def><sp>$ ^kato<n><m><sg><nom>$ ^manĝi<vbtr><pres>$ ^la<det><def><sp>$ ^muso<n><sg><acc>$ ^Le<det><def><m><sg>$ ^chat<n><m><sg>$ ^manger<vblex><pri><p3><sg>$ ^le<det><def><f><sg>$ ^souris<n><f><sg>$ Le chat mange la souris La katoj manĝas la musojn ^La<det><def><sp>$ ^kato<n><m><pl><nom>$ ^manĝi<vbtr><pres>$ ^la<det><def><sp>$ ^muso<n><pl><acc>$ ^Le<det><def><m><pl>$ ^chat<n><m><pl>$ ^manger<vblex><pri><p3><pl>$ ^le<det><def><f><pl>$ ^souris<n><f><pl>$ Les chats mangent les souris Si pour "souris", on utilise le paradigme : <pardef n="fois__n"> <e> <p><l></l> <r><s n="n"/><s n="f"/><s n="sp"/></r></p></e> <e r="RL"><p><l></l> <r><s n="n"/><s n="f"/><s n="sg"/></r></p></e> <e r="RL"><p><l></l> <r><s n="n"/><s n="f"/><s n="pl"/></r></p></e> </pardef> ça marchera dans les 2 sens. Pour ma part, je considère que l'existence des attributs GD et ND n'est pas indispensables pour réaliser l'étape de de tranfert et qu'en fait, les contraintes qu'entraine leur utilisation répond à la devise shadock : "Pourquoi faire simple quand on peut faire compliqué ?". http://parisbanlieue.blog.lemonde.fr/files/2007/07/shadok-devise-simple.1185217332.jpg Mais de toutes façon, rajouter des lignes avec la restriction directionnelle RL dans certains paradigmes des dictionnaires morphologiques n'empêchera pas le fonctionnement des paires de langues qui n'utilisaient pas cette possibilité. -------------------------------- Bernard Chardonneau (France) Phone : [33] 9 72 36 32 90 GSM phone : [33] 7 69 46 16 31 Multilingual websites for my free softwares : http://libremail.free.fr and http://libremail.tuxfamily.org http://cyloop.tuxfamily.org (mainly translated with Apertium) My general website (in french only) http://bech.free.fr ------------------------------------------------------------------------------ Check out the vibrant tech community on one of the world's most engaging tech sites, SlashDot.org! http://sdm.link/slashdot _______________________________________________ Apertium-stuff mailing list [email protected] https://lists.sourceforge.net/lists/listinfo/apertium-stuff
