IdentifiantMot de passe
Loading...
Mot de passe oubli� ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les r�ponses en temps r�el, voter pour les messages, poser vos propres questions et recevoir la newsletter

Modules Perl Discussion :

Utilisation d'une table de hachage - Transformation XML avec Twig


Sujet :

Modules Perl

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut [r�solu] Utilisation d'une table de hachage - Transformation XML avec Twig
    Bonjour,

    Je travaille sur des ressources lexicales cod�es en XML. L'objectif est de transformer ces ressources en un m�me balisage XML (pour les fusionner ensuite).

    Pour cela, j'ai un programme pour chaque ressource (ils fonctionnent tous). Mais je me suis demand� s'il n'�tait pas possible de programmer une sorte de "Transformation universelle" puisque le r�sultat doit �tre le m�me.

    J'ai donc pens� �tablir une table de hachage au d�but de mon programme. Les clefs sont les balises que l'on aura en sortie, les valeurs les balises de la source.

    Cependant, le r�sultat est quelque peu probl�matique, d'o� ce sujet.

    -- PROLOGUE : --

    FAQ sur les hash tables
    Introduction � la programmation en Perl de S. Lhullier
    Divers sujets d�j� cr��s, dont celui-ci (probl�me valeurs/clefs)

    Pas de solution trouv�e.


    -- SOURCE (extrait d'une des sources � traiter) : source_test.xml --

    Code xml : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <!-- ?xml:stylesheet type="text/css" href="fravie.css"? -->
    <!-- DOCTYPE dictionary SYSTEM "fravie.dtd" -->
    <volume name="ThuyDict_fra" source-language="fra" target-language="vie" creation-date="18/01/2002">
    <entry id=""><headword>a</headword>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    <example><fra>a majuscule (A)</fra><vie>xxx</vie></example>
    <example><fra>a minuscule (a)</fra><vie>xxx</vie></example>
    </syntactic-sense>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    <translation lang="vie">xxx</translation>
    <translation lang="vie">xxx</translation>
    <translation lang="vie">xxx</translation>
    </syntactic-sense>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    </syntactic-sense>
    </entry>
    <entry id=""><headword>abaca</headword>
    <syntactic-sense><pos>xxx</pos>
    <translation lang="vie">xxx</translation>
    </syntactic-sense>
    </entry>
    </volume>

    les 'xxx' sont en r�alit� des termes en vietnamiens (mais l'affichage pose probl�me sur le forum).

    -- CODE (j'ai supprim� le superflu - gestion des arguments de la commande - et simplifi� au maximum pour plus de clart�) : TRANSFO.pl --
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
     
    #!/usr/bin/perl
    #
    ###------###
    #
    use strict;
    use warnings;
    use locale;
    use utf8;
    use XML::Twig; 
    use XML::Twig::Xpath;
    #
    ###------###
    # [1] Table de hachage
    #
    my %balises = (   "entry"         => "entry",
                            "head"          => "",
    		        "headword"      => "headword",
    		        "pronunciation" => "",
    		        "pos"           => "syntactic-sense",
    		        "sense"         => "",
    		        "definition"    => "",
    		        "label"         => "",
    	   	        "formula"       => "",
    	  	        "gloss"         => "",
    		        "translations"  => "",
    		        "translation"   => "translation",
    		        "examples"      => "",
    		        "example"       => "example/vie",
    		        "idioms"        => "",
    		        "idiom"         => "",
                            "else"          => "example/fra", );
    #
    # [2] Autres variables :
    #
    my ($FichierXML,    # le fichier source
      $FichierResultat, # le fichier en sortie
      $FiRe,            # descripteur pour le fichier en sortie
      $erreur,          # message d'erreur
      $encoding,        # format d'encodage par défaut 
      $twig,            # variable pour le parsing
      $CountEntry,      # comptage des entrées
      $TwigEntry,       # le twig pour la balise <entry>
      $date) = 0;    # la date
    #
    ##------##
    #
    $erreur = "|ERROR| : problem opening the file :"; 
    $encoding = "UTF-8"; 
    $date = localtime;
    $CountEntry = 0;
    #
    ##------##
    # Input
    $FichierXML = 'source_test.xml';
    # Output
    $FichierResultat = 'out_test.xml';
    open ($FiRe, ">:encoding($encoding)",$FichierResultat)
      or die ("$erreur $!\n");
    #
    #
    print {$FiRe} 
    "<?xml version=\"1.0\" encoding=\"UTF-8\" standalone=\"yes\"?>\n", 
    "<m:volume name=\"VD_Mam\" creation-date=\"$date\">\n";
    #
    ###------###
    #
    #
    $twig = new XML::Twig (Twig_handlers => {'entry' => \&entry,},);
    $twig -> parsefile($FichierXML);
    #
    print {$FiRe} "</m:volume>";
    close($FiRe);
    #
    ###------###
    #
    sub entry 
    {
    ($twig, $TwigEntry) = @_;
    $CountEntry++;
    #
    my $path_headword = $TwigEntry->get_xpath($balises{'headword'});
    print {$FiRe} "<m:entry", ' ', 'id="fra.', $path_headword,'">';
    print {$FiRe} "<m:head>";
    print {$FiRe} "<m:headword>", $path_headword, "</m:headword>";
    print {$FiRe} "<m:pronunciation></m:pronunciation>";
    print {$FiRe} "<m:pos>", "</m:pos>"; 
    print {$FiRe} "</m:head>";
    print {$FiRe} "</m:entry>", "\n";
    #
    $twig->purge;
    return;
    }
    ##------##
    1 ;
    J'ai choisi pour l'exemple de ne travailler que sur <headword>, je suppose que si une solution est trouv�e pour cette �l�ment, je pourrais l'appliquer au reste. J'utilise les pointeurs xpath, la seul possibilit� pour une transformation commune aux sources selon moi.

    -- R�SULTAT (de l'extrait indiqu�) out_test.xml --
    Code xml : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
     
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <m:volume name="VD_Mam" creation-date="Sat May 29 12:07:57 2010">
    <m:entry id="fra.1"><m:head><m:headword>1</m:headword><m:pronunciation></m:pronunciation><m:pos></m:pos></m:head></m:entry>
    <m:entry id="fra.1"><m:head><m:headword>1</m:headword><m:pronunciation></m:pronunciation><m:pos></m:pos></m:head></m:entry>
    </m:volume>

    Ainsi donc au lieu d'afficher le PCDATA de l'�l�ment <headword>, je me retrouve avec un 1 (s�rement pour me dire TRUE non ?!). J'en suis arriv� l�.


    -- CONCLUSION --


    Si vous avez connu ce genre de probl�me, ou encore si vous avez un avis sur le programme en g�n�ral, merci de me r�pondre !

    Bon weekend � tous (m�me si vous ne me r�pondez pas )

  2. #2
    Expert confirm�

    Homme Profil pro
    Ing�nieur d�veloppement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 59
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activit� : Ing�nieur d�veloppement logiciels
    Secteur : A�ronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Par d�faut
    La m�thode get_xpath retourne une liste d'�l�ments. Affecter le retour de cette fonction � un scalaire fourni un contexte de scalaire � l'affectation, qui converti alors automatiquement la liste en sa taille. Dans ton cas, il y a 1 �l�ment qui correspond au path.

    Pour r�cup�rer le premier �l�ment de cette liste, il faut �crire l'affectation dans un contexte de liste, ainsi :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    my ($path_headword) = $TwigEntry->get_xpath($balises{'headword'});

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut
    Merci beaucoup pour ta r�ponse Philou67430.

    Je ne connaissais pas ce point de d�tail, qui va grandement acc�l�rer mes p'tits programmes !!

    Je teste, je l'applique au "vrai" programme (au cas o�).

    Dois-je inscrire le nouveau code ensuite ? Pour aider les petites gens comme moi .

  4. #4
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut
    Je viens de tester, j'ai toujours le m�me probl�me. Tu avais fait un test de ton c�t� ? On sait jamais, l'erreur est peut �tre ailleurs.

    Sinon tu m'as donn� une id�e, et j'ai trouv� une solution en rempla�ant par :

    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    my ($path_headword) = $TwigEntry->first_child($balises{headword})->text;
    Mais malheureusement, en mettant �a je ne traiterai que le premier fils, comment passer aux suivants ? Il va falloir que j'y r�fl�chisse, je pense que c'est faisable sans grosse difficult� (enfin j'esp�re).

    Merci du coup de main, qui m'a quand m�me permis d'avancer.

  5. #5
    Expert confirm�

    Homme Profil pro
    Ing�nieur d�veloppement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 59
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activit� : Ing�nieur d�veloppement logiciels
    Secteur : A�ronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Par d�faut
    Non, je n'ai pas test�, car je n'ai pas d'exemple complet � tester, et je ne connais pas ces modules.
    J'ai simplement constat� que la m�thode get_xpath retournait une liste, et que par cons�quent, pour r�cup�rer une liste et non la taille de cette liste, il faut l'affecter � une autre liste.

    Quand tu dis que tu as toujours le m�me probl�me, tu veux dire que tu vois "1" au lieu de ce que tu attends dans $path_headword ?

  6. #6
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par d�faut
    Voici ton fichier XML indent� :
    Code xml : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <!-- ?xml:stylesheet type="text/css" href="fravie.css"? -->
    <!-- DOCTYPE dictionary SYSTEM "fravie.dtd" -->
    <volume creation-date="18/01/2002" name="ThuyDict_fra" source-language="fra" target-language="vie">
      <entry id="">
        <headword>a</headword>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
          <example>
            <fra>a majuscule (A)</fra>
            <vie>xxx</vie>
          </example>
          <example>
            <fra>a minuscule (a)</fra>
            <vie>xxx</vie>
          </example>
        </syntactic-sense>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
          <translation lang="vie">xxx</translation>
          <translation lang="vie">xxx</translation>
          <translation lang="vie">xxx</translation>
        </syntactic-sense>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
        </syntactic-sense>
      </entry>
      <entry id="">
        <headword>abaca</headword>
        <syntactic-sense>
          <pos>xxx</pos>
          <translation lang="vie">xxx</translation>
        </syntactic-sense>
      </entry>
    </volume>

    Peux tu expliquer de novo ce que tu souhaites en sortie. Je n'ai pas compris l'histoire des balises headword.

  7. #7
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut
    Philou,

    Autant pour moi, il y a toujours une erreur avec ta solution, mais qui est diff�rente du "1" pr�c�dent.

    Voici le r�sultat (excusez moi s'il n'est pas indent�, il l'est normalement, masi pas sur le site. S'il y a une m�thode, je suis preneur) :

    Code xml : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <m:volume name="VD_Mam" creation-date="Wed Jun  2 14:05:29 2010">
    <m:entry id="fra.XML::Twig::Elt=HASH(0x36bac6c)">
    <m:head>
    <m:headword>XML::Twig::Elt=HASH(0x36bac6c)</m:headword><m:pronunciation></m:pronunciation>
    <m:pos></m:pos>
    </m:head>
    </m:entry>
    <m:entry id="fra.XML::Twig::Elt=HASH(0x37bac84)">
    <m:head>
    <m:headword>XML::Twig::Elt=HASH(0x37bac84)</m:headword><m:pronunciation></m:pronunciation>
    <m:pos></m:pos>
    </m:head>
    </m:entry>
    </m:volume>

    Concernant ta question Djibrill, l'objectif est de transformer plusieurs sources xml (ce sont des dictionnaires) en un m�me format xml (pour les fusionner). Par exemple, avec les fichiers de tests que j'ai indiqu�, le texte contenu dans <headword> sera copi� dans l'�l�ment <m:headword>.

    J'aimerais pouvoir traiter le plus de cas possibles. On pourrait ainsi avoir un attribut au lieu d'avoir du texte, ou alors la structure serait diff�rente. C'est pour �a que je consid�re le Xpath comme la meilleure solution. Ici le cas est assez simple, il s'agit d'abord d'avoir quelque chose qui marche et ensuite de l'am�liorer.

  8. #8
    Expert confirm�

    Homme Profil pro
    Ing�nieur d�veloppement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    �ge : 59
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activit� : Ing�nieur d�veloppement logiciels
    Secteur : A�ronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Par d�faut
    OK, donc � pr�sent, tu r�cup�res bien un �l�ment, mais c'est un objet, pas un texte. Il faut que tu consultes la doc de l'objet pour trouver la m�thode ou la propri�t� � utiliser pour faire ton affichage. Ne connaissant pas le module, ni ton application, je ne vais pas pouvoir t'aider beaucoup plus � trouver ce que tu souhaites afficher.

  9. #9
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    D�tails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par d�faut
    Bon voici un code, essaye de t'en inspirer
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    #!/usr/bin/perl
    use strict;
    use warnings;
     
    use XML::Twig;
    use XML::Writer;
    use IO::File;
     
    my $date = localtime;
     
    # Input / output
    my $FichierXML      = 'source_test.xml';
    my $FichierResultat = 'out_test.xml';
     
    my $output = new IO::File(">$FichierResultat");
    my $writer = new XML::Writer(
      OUTPUT      => $output,
      DATA_INDENT => 3,         # indentation, 3 espace
      DATA_MODE   => 1,         # changement ligne.
      ENCODING    => 'utf-8',
    );
    $writer->xmlDecl("UTF-8");
     
    my $twig = new XML::Twig;
    $twig->parsefile($FichierXML);
     
    my $balise_root = 'entry';
    my %balises     = (
      "head"            => undef,
      "headword"        => "headword",
      "pronunciation"   => undef,
      "syntactic-sense" => "syntactic-sense/pos",
      "sense"           => undef,
      "definition"      => undef,
      "label"           => undef,
      "formula"         => undef,
      "gloss"           => undef,
      "translations"    => undef,
      "translation"     => "syntactic-sense/translation",
      "examples"        => undef,
      "example"         => "example/vie",
      "idioms"          => undef,
      "idiom"           => undef,
      "else"            => "example/fra",
    );
     
    my $root = $twig->root;
    $writer->startTag(
      "m:$balise_root",
      'name'          => $root->{'att'}->{'name'},
      'creation-date' => $date,
    );
     
    foreach my $twig_entry ( $root->children($balise_root) ) {
      entry( $writer, $twig_entry, \%balises );
    }
    $writer->endTag("m:$balise_root");
    $output->close();
     
    sub entry {
      my ( $writer, $TwigEntry, $ref_balise_a_traier ) = @_;
      my $entry = $TwigEntry->name;
     
      $writer->startTag( "m:$entry", 'id' => 'fra.' . $TwigEntry->pos . $TwigEntry->field($entry), );
     
      $writer->startTag('m:head');
     
      foreach my $balise ( grep { $ref_balise_a_traier->{$_} } sort keys %{$ref_balise_a_traier} ) {
        foreach $twig ( $TwigEntry->findnodes( $ref_balise_a_traier->{$balise} ) ) {
          $writer->startTag( 'm:' . $balise );
          $writer->characters( $twig->text );
          $writer->endTag( 'm:' . $balise );
     
        }
      }
      $writer->endTag('m:head');
     
      $writer->endTag("m:$entry");
     
      return;
    }
    Voici le fichier r�sultant :
    Code xml : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    <?xml version="1.0" encoding="UTF-8"?>
     
    <m:entry name="ThuyDict_fra" creation-date="Wed Jun  2 14:52:48 2010">
       <m:entry id="fra.1">
          <m:head>
             <m:headword>a</m:headword>
             <m:syntactic-sense>xxx</m:syntactic-sense>
             <m:syntactic-sense>xxx</m:syntactic-sense>
             <m:syntactic-sense>xxx</m:syntactic-sense>
             <m:translation>xxx</m:translation>
             <m:translation>xxx</m:translation>
             <m:translation>xxx</m:translation>
             <m:translation>xxx</m:translation>
             <m:translation>xxx</m:translation>
             <m:translation>xxx</m:translation>
          </m:head>
       </m:entry>
       <m:entry id="fra.2">
          <m:head>
             <m:headword>abaca</m:headword>
             <m:syntactic-sense>xxx</m:syntactic-sense>
             <m:translation>xxx</m:translation>
          </m:head>
       </m:entry>
    </m:entry>

  10. #10
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut
    Merci pour vos indications � tous les deux.

    Je vais utiliser ce que tu m'as donn� djibrill, et d'ici mercredi j'indiquerai si mon probl�me est r�solu, ou, si j'ai encore un souci, qu'elle en est sa nature.

    D�sol� de ne pas avoir r�pondu pus t�t, le temps passe vite face � un �cran !!

  11. #11
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut
    Ok j'ai utilis� ton code Djibrill, �a me permet de traiter la question. Je n'ajoute rien, ton code est clair et tu as un r�sultat. Je l'ai juste adapt� par rapport � mes sources et aux r�sultats attendus.

    Merci encore !

  12. #12
    Membre averti
    Profil pro
    Inscrit en
    Mai 2010
    Messages
    25
    D�tails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2010
    Messages : 25
    Par d�faut
    Voici deux autres exemples de code, cette fois-ci en utilisant le twig-handler.

    Le premier est directement tir� de la m�thode juste au-dessus �labor�e par Djibril.

    Le second (que j'utilise maintenant, parce que d�cid�ment, les tables de hachage et moi, c'est le divorce assur�), remplace la table de hachage par une simple liste de variables scalaires.
    Celui-ci est tr�s simple, pour chaque entr�e (�l�ment entry) il va utiliser les variables scalaires d�finies au d�part pour �crire le nouveau fichier XML.

    Je recommande celui-ci pour les d�butants comme moi, et je recommande une am�lioration du premier pour les experts .

    Code n�1 :
    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    #!/usr/bin/perl
    # -------------------------------------------------------------------
    use strict;
    use warnings;
    use utf8;
    use IO::File;
    use XML::Twig;
    use XML::Writer;
     
    # -------------------------------------------------------------------
    my $date = localtime;
    my $count_entry = 0;
    my $balise_root = 'volume';
     
    # -------------------------------------------------------------------
    # Input / output
    my $FichierXML      = 'source_test.xml';
    my $FichierResultat = 'out_test.xml';
     
    my $output = new IO::File(">$FichierResultat");
    my $writer = new XML::Writer(
      OUTPUT      => $output,
      DATA_INDENT => 3,         # indentation, 3 espace
      DATA_MODE   => 1,         # changement ligne.
      ENCODING    => 'utf-8',
    );
    $writer->xmlDecl("UTF-8");
     
    # -------------------------------------------------------------------
    # Début de l'écriture
     
    # my $root = $twig->root; Ici le parsing n'a pas encore début, il n'est plus possible
    # de récupérer la racine de la source. On remplace cette variable par un $name
    # Que l'utilisateur pourra par exemple indiquer en argument (pas dans cette version).
    my $name = 'Source_test';
    $writer->startTag(
      "m:$balise_root",
      'name'          => $name, # c'est ici qu'a lieu le changement.
      'creation-date' => $date,
    );
     
    # -------------------------------------------------------------------
    # Twig 
    my $twig = XML::Twig->new
    (Twig_handlers   => {'entry' => \&entry,},); 
    # on définit le handler sur l'élément 'entry'
     
    $twig->parsefile($FichierXML);
    my $root = $twig->root; 
     
    # -------------------------------------------------------------------
    # Subroutine 
    sub entry {
    my ($twig, $TwigEntry) = @_;
    my $entry = $TwigEntry->name;
    my $balise_entry = 'entry';
     
    my %balises = 
    (
      "word"        => "headword",
    );
     
    my $headword = $TwigEntry->field("headword");
    $writer->startTag( "m:$balise_entry", 'id' => 'fra.' . $headword);
    $writer->startTag('m:head');
     
    while (my ($k,$v) = each(%balises))
    	{
        $writer->startTag ($k);
        $writer->characters($TwigEntry->field($v));
        $writer->endTag ($k);
        }
    $writer->endTag('m:head');
    $writer->endTag("m:$balise_entry");
    $twig->purge;
    return;
    }
     
    # -------------------------------------------------------------------
    # Fin du fichier
    $writer->endTag("m:$balise_root");
    $output->close();
    R�sultat :

    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    <?xml version="1.0" encoding="UTF-8"?>
     
    <m:volume name="Source_test" creation-date="Wed Jun  9 15:18:13 2010">
       <m:entry id="fra.a">
          <m:head>
             <word>a</word>
          </m:head>
       </m:entry>
       <m:entry id="fra.abaca">
          <m:head>
             <word>abaca</word>
          </m:head>
       </m:entry>
    </m:volume>
    Code n�2 :

    Usage : perl test2.pl -v -from source_test.xml -to out_test.xml

    (j'ai laiss� les arguments cette fois-ci).

    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    208
    209
    210
    211
    212
    213
    214
    215
    #!/usr/bin/perl
     
    # =======================================================================================================================================
    ###--- METADIRECTIVES ---###
     
    use strict;
    use warnings;
    use utf8;
    use IO::File; 
    use Getopt::Long; # pour gérer les arguments.
     
    use XML::Twig; # (non inclus dans le core de Perl)
    use XML::Writer; # (non inclus dans le core de Perl)
     
     
    # =======================================================================================================================================
    ###--- PROLOGUE ---###
     
    # ------------------------------------------------------------------------
    ##-- Les balises de la source/de la sortie (MAM) --##
     
    # ------------------------------------------------
    # MODIFIEZ CES VARIABLES SELON LE TRAITEMENT VOULU
    # ------------------------------------------------
    # les valeurs de ces variables correspondent aux éléments de la source.
     
    my $ref_root = 'volume'; # la racine
    my $ref_entry = 'entry' ; 
     
    my  $in_root 		   = 'volume'; 
    my  $in_entry 		   = 'entry'; 		
    my	$in_headword 	   = 'headword';  	
    my	$in_pronunciation  = 'notag'; # lorsqu'il n'y a pas de correspondance.
    my	$in_pos 		   = 'notag'; 		    
     
     
    # ------------------------------------------------------------------------
    ##-- Gestion des options --##
     
    my ($date, $FichierXML, $FichierResultat, $erreur, $encoding) = ();
    my ($verbeux, $help, $total_entry) = ();
    GetOptions( 
      'date|time|t=s'        	  => \$date, # flag de type -date ou --date, ou -time ou --time, ou -t ou --t (=s : string)
      'source|in|from|i=s'        => \$FichierXML, 
      'sortie|out|to|o=s'         => \$FichierResultat, 
      'erreur|error|e=s'     	  => \$erreur, 
      'encodage|encoding|enc|f=s' => \$encoding, 
      'help|h'                	  => \$help, 
      'verbeux|v'             	  => \$verbeux, 
      'max|total|m=s'			  => \$total_entry,
      );
     
    if (!( defined $date ))
    	{
    	$date = localtime;
    	};
    if (!( defined $FichierXML ))
    	{
    	&help ; # si le fichier source n'est pas spécifié, affichage de l'aide.
    	};
    if (!( defined $FichierResultat ))
    	{
    	$FichierResultat = "toto.xml" ;
    	};
    if (!( defined $erreur ))
    	{
    	$erreur = "|ERROR| : problem opening file :";
    	};
    if (!( defined $encoding ))
    	{
    	$encoding = "UTF-8"; 
    	};
    if ( defined $help )
    	{
    	&help;
    	};
     
     
    # ------------------------------------------------------------------------
    ##-- Configuration de l'output --##
     
    my $output = new IO::File(">$FichierResultat");
    my $writer = new XML::Writer(
      OUTPUT      => $output,
      DATA_INDENT => 3,         # indentation, 3 espaces
      DATA_MODE   => 1,         # changement ligne.
      ENCODING    => $encoding,
    );
    $writer->xmlDecl($encoding);
     
    # ------------------------------------------------------------------------
     
    if ( defined $verbeux )
    	{
    	&info('a'); 
    	};
    # message dans le STDERR (voir subroutine 'info') indiquant le démarrage du programme.
     
     
    # =======================================================================================================================================
    ###--- TWIG ---###
     
    my $name = "Nom_de_la_Source";
     
    # Début du fichier en sortie :
    $writer->startTag
    	(
      "m:$ref_root",
      'name'          => $name,
      'creation-date' => $date,
    	);
     
    my $twig = XML::Twig->new
    (
    output_encoding => $encoding, # on reste en utf8
    Twig_handlers   => {
    			$in_entry => \&entry,
    					}, 
    );
    $twig->parsefile($FichierXML);
    my $root = $twig->root; 
     
    # ------------------------------------------------------------------------
     
    if ( defined $verbeux )
    	{
    	&info('b'); 
    	};
     
     
    # ------------------------------------------------------------------------	
     
    # Fin du fichier en sortie :
    $writer->endTag("m:$ref_root");
    $output->close();
     
     
    # ------------------------------------------------------------------------
     
    if ( defined $verbeux )
    	{
    	&info('c'); 
    	};
     
     
    # =======================================================================================================================================
    ###--- SUBROUTINES ---###
     
    sub entry 
    {
    my ($twig, $twig_entry) = @_;
    my $entry = $twig_entry->name;
    my $count = 0;
     
    $writer->startTag( "m:entry", 'id' => $twig_entry->field($in_headword), );
    	$writer->startTag("m:head");
    		$writer->startTag("m:headword");
    		$writer->characters($twig_entry->field($in_headword));
    		$writer->endTag("m:headword");
     
    		$writer->startTag("m:pronunciation");
    		$writer->characters($twig_entry->field($in_pronunciation));
    		$writer->endTag("m:pronunciation");
     
    		$writer->startTag("m:pos");
    		$writer->characters($twig_entry->field($in_pos));
    		$writer->endTag("m:pos");
    	$writer->endTag("m:head");	
     
    $writer->endTag("m:entry");
    $twig->purge;
    return;
    }
     
     
    sub info
    {
    my $info = shift @_;
    if ($info =~ 'a')
    	{
    	print (STDERR "================================================================================\n");
    	print (STDERR "\t~~~~ $0 : START ~~~~\n");
    	print (STDERR "================================================================================\n");
    	}
    elsif ($info=~ 'b')
    	{
    	print (STDERR "================================================================================\n");
    	print (STDERR "Processing\n");
    	print (STDERR "--------------------------------------------------------------------------------\n");
    	}
    elsif ($info =~ 'c')
    	{
    	print (STDERR "~~~~ $0 : END ~~~~\n");
    	print (STDERR "================================================================================\n");
    	}
    }
     
     
    sub help 
    {
    print (STDERR "================================================================================\n");  
    print (STDERR "HELP\n");
    print (STDERR "================================================================================\n");
    print (STDERR "usage : $0 -i <sourcefile.xml> -o <outfile.xml>\n\n") ;
    print (STDERR "options : -h affichage de l'aide\n") ;
    print (STDERR "          -e le message d'erreur (ouverture de fichiers)\n") ;
    print (STDERR "          -f le format d'encodage\n");
    print (STDERR "          -v mode verbeux (STDERR et LOG)\n");
    print (STDERR "          -t pour la gestion de la date (initialement : localtime)\n");
    print (STDERR "================================================================================\n");
    }
     
     
    # =======================================================================================================================================
    1 ;
    R�sultat :

    Code : S�lectionner tout - Visualiser dans une fen�tre � part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    <?xml version="1.0" encoding="UTF-8"?>
     
    <m:volume name="Nom_de_la_Source" creation-date="Wed Jun  9 15:29:40 2010">
       <m:entry id="a">
          <m:head>
             <m:headword>a</m:headword>
             <m:pronunciation></m:pronunciation>
             <m:pos></m:pos>
          </m:head>
       </m:entry>
       <m:entry id="abaca">
          <m:head>
             <m:headword>abaca</m:headword>
             <m:pronunciation></m:pronunciation>
             <m:pos></m:pos>
          </m:head>
       </m:entry>
    </m:volume>
    Si jamais un des utilisateurs experts, Djibril, Philou, ou autres (je ne me souviens plus de tous les noms d�sol�), consid�re qu'il faut retravailler les codes, dites-le moi !

+ R�pondre � la discussion
Cette discussion est r�solue.

Discussions similaires

  1. R�ponses: 6
    Dernier message: 08/08/2018, 12h49
  2. R�ponses: 2
    Dernier message: 19/06/2008, 16h46
  3. R�ponses: 2
    Dernier message: 21/06/2006, 09h23
  4. recherche utilisation d'une table
    Par xmanu dans le forum Access
    R�ponses: 2
    Dernier message: 21/09/2005, 09h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo