> Date: Sun, 19 Feb 2017 23:02:48 +0300
> From: Hèctor Alòs i Font <[email protected]>
> To: "[apertium-stuff]" <[email protected]>
> Reply-To: [email protected]
> Subject: Re: [Apertium-stuff] apertium-fra
> Pièce(s) jointes(s) probable(s)>
> Merci, Bernard, pour ta longue réponse qui touche beaucoup de thèmes.
>
> (.......................)
>
> Je ne comprends pas très bien ceci:
>
> > Une autre chose (facile à prendre en compte) si on fait des metadix de
> > référence est, pour les paradigmes dont l'analyse donne le genre mf,
> > d'accepter aussi les genre m et f en génération.
> > Idem entre sp, sg et pl.
> > C'est déjà fait (au moins pour les paradigmes les plus courants) dans la
> > paire epo-fra et ce sera fait dans fra-por. Ça simplifie beaucoup
> > l'écriture
> > des règles de transfert.
> >
> Ne serait-il pas question de faire cela dans le dictionnaire bilingue? Je
> comprends qu'il y a du travail quand on doit générer un GD (ou un ND) parce
> que dans la langue source il y a mf (ou sp), mais je ne vois pas un grand
> problème à générer de mf ou des sp, si le genre et/ou le nombre
> sont écrits
> dans le dictionnaire bilingue.
>
> (...................)
>
> Hèctor
>

Transformer quelques paradigmes de cette manière :

Avant :
<pardef n="académique__adj">
  <e><p><l></l>          <r><s n="adj"/><s n="mf"/><s n="sg"/></r></p></e>
  <e><p><l>s</l>         <r><s n="adj"/><s n="mf"/><s n="pl"/></r></p></e>
</pardef>

Après
<pardef n="académique__adj">
  <e><p><l></l>          <r><s n="adj"/><s n="mf"/><s n="sg"/></r></p></e>
  <e><p><l>s</l>         <r><s n="adj"/><s n="mf"/><s n="pl"/></r></p></e>
  <e r="RL"><p><l></l>   <r><s n="adj"/><s n="m"/><s n="sg"/></r></p></e>
  <e r="RL"><p><l>s</l>  <r><s n="adj"/><s n="m"/><s n="pl"/></r></p></e>
  <e r="RL"><p><l></l>   <r><s n="adj"/><s n="f"/><s n="sg"/></r></p></e>
  <e r="RL"><p><l>s</l>  <r><s n="adj"/><s n="f"/><s n="pl"/></r></p></e>
</pardef>

n'est pas très contraignant et peut simplifier pas mal à la fois les
dictionnaires bilingues et les règles de transfert.

Pour le dictionnaire bilingue, je considère qu'il doit le plus possible se
limiter à une correspondance de lemmes entre 2 langues. Il faut bien sûr
la catégorie du mot qui, pour des raisons d'homogénéité gauche droite sera
précisée 2 fois et il peut y avoir une restriction dans le sens de traduction.

Comme l'étape 1 du transfert n'accède pas au dictionnaire morphologique de
la langue cible, lorsque :
- le genre est masculin dans une langue et féminin dans l'autre
ou
- le genre n'existe que dans l'une des 2 langues
ou
- un même lemme a dans une langue 2 significations différentes selon son genre

il faudra dans ces 3 cas préciser le(s) genre(s) dans le dictionnaire bilingue.

Il ne faudrait pas être obligé d'en faire plus.

Exemples :

Un logiciel technique
analyse + désambiguisation
^Un<det><ind><m><sg>$ ^logiciel<n><m><sg>$ ^technique<adj><mf><sg>$
génération
^Um<det><ind><m><sg>$ ^software<n><m><sg>$ ^técnico<adj><m><sg>$
Um software técnico

Une traduction automatique
analyse + désambiguisation
^Un<det><ind><f><sg>$ ^traduction<n><f><sg>$ ^automatique<adj><mf><sg>$
génération
^Um<det><ind><f><sg>$ ^tradução<n><f><sg>$ ^automático<adj><f><sg>$
Uma tradução automática

La règle grammaticale qui semble commune à toutes les langues romanes est
d'accorder en genre et en nombre l'adjectif (et le déterminant) au nom.

On prend donc les genres de software et tradução pour générer la phrase
portugaise et le fait que dans une autre langue, l'adjectif correspondant
est analysé avec le genre mf n'est pas un motif valable pour compliquer
ce processus.

Dans l'autre sens :

Um software técnico
analyse + désambiguisation
^Um<det><ind><m><sg>$ ^software<n><m><sg>$ ^técnico<adj><m><sg>$
génération
^Un<det><ind><m><sg>$ ^logiciel<n><m><sg>$ ^technique<adj><m><sg>$
Un logiciel technique

Uma tradução automática
analyse + désambiguisation
^Um<det><ind><f><sg>$ ^tradução<n><f><sg>$ ^automático<adj><f><sg>$
génération
^Un<det><ind><f><sg>$ ^traduction<n><f><sg>$ ^automatique<adj><f><sg>$
Une traduction automatique

Même règle de grammaire, l'adjectif prend le genre du nom dans la langue
cible.
Si le paradigme commun aux deux adjectifs a été modifié plus haut comme
indiqué, la génération fonctionne et on n'a pas eu besoin de traiter un
cas particulier dans les règles de trabsfert.

Avec l'espéranto et pour le nombre maintenant.
Principe de choix du nombre :
- depuis l'espéranto, on prend le nombre du nom dans la langue source
- depuis une langue romane, on prend le nombre du déterminant

Dans les 2 cas, la détermination du nombre marche toujours.

Le chat mange la souris
^Le<det><def><m><sg>$ ^chat<n><m><sg>$ ^manger<vblex><pri><p3><sg>$ 
^le<det><def><f><sg>$ ^souris<n><f><sp>$
^La<det><def><sg><nom>$ ^kato<n><m><sg><nom>$ ^manĝi<vbtr><pres>$ 
^la<det><def><sg><acc>$ ^muso<n><sg><acc>$
La kato manĝas la muson

Les chats mangent les souris
^Le<det><def><mf><pl>$ ^chat<n><m><pl>$ ^manger<vblex><pri><p3><pl>$ 
^le<det><def><mf><pl>$ ^souris<n><f><sp>$
^La<det><def><pl><nom>$ ^kato<n><m><pl><nom>$ ^manĝi<vbtr><pres>$ 
^la<det><def><pl><acc>$ ^muso<n><pl><acc>$
La katoj manĝas la musojn

Dans l'autre sens

La kato manĝas la muson
^La<det><def><sp>$ ^kato<n><m><sg><nom>$ ^manĝi<vbtr><pres>$ ^la<det><def><sp>$ 
^muso<n><sg><acc>$
^Le<det><def><m><sg>$ ^chat<n><m><sg>$ ^manger<vblex><pri><p3><sg>$ 
^le<det><def><f><sg>$ ^souris<n><f><sg>$
Le chat mange la souris

La katoj manĝas la musojn
^La<det><def><sp>$ ^kato<n><m><pl><nom>$ ^manĝi<vbtr><pres>$ ^la<det><def><sp>$ 
^muso<n><pl><acc>$
^Le<det><def><m><pl>$ ^chat<n><m><pl>$ ^manger<vblex><pri><p3><pl>$ 
^le<det><def><f><pl>$ ^souris<n><f><pl>$
Les chats mangent les souris

Si pour "souris", on utilise le paradigme :

<pardef n="fois__n">
  <e>       <p><l></l>     <r><s n="n"/><s n="f"/><s n="sp"/></r></p></e>
  <e r="RL"><p><l></l>     <r><s n="n"/><s n="f"/><s n="sg"/></r></p></e>
  <e r="RL"><p><l></l>     <r><s n="n"/><s n="f"/><s n="pl"/></r></p></e>
</pardef>

ça marchera dans les 2 sens.

Pour ma part, je considère que l'existence des attributs GD et ND n'est pas
indispensables pour réaliser l'étape de de tranfert et qu'en fait, les
contraintes qu'entraine leur utilisation répond à la devise shadock :
"Pourquoi faire simple quand on peut faire compliqué ?".

http://parisbanlieue.blog.lemonde.fr/files/2007/07/shadok-devise-simple.1185217332.jpg

Mais de toutes façon, rajouter des lignes avec la restriction directionnelle
RL dans certains paradigmes des dictionnaires morphologiques n'empêchera pas
le fonctionnement des paires de langues qui n'utilisaient pas cette possibilité.


--------------------------------
Bernard Chardonneau (France)
Phone : [33] 9 72 36 32 90
GSM phone : [33] 7 69 46 16 31

Multilingual websites for my free softwares :
http://libremail.free.fr and http://libremail.tuxfamily.org
http://cyloop.tuxfamily.org (mainly translated with Apertium)

My general website (in french only)
http://bech.free.fr

------------------------------------------------------------------------------
Check out the vibrant tech community on one of the world's most
engaging tech sites, SlashDot.org! http://sdm.link/slashdot
_______________________________________________
Apertium-stuff mailing list
[email protected]
https://lists.sourceforge.net/lists/listinfo/apertium-stuff

Reply via email to