Grammalecte  Diff

Differences From Artifact [7056f0f808]:

To Artifact [7c022e831d]:


   703    703           <<- -1>> " »|”"                                                                             && Guillemets typographiques fermants.
   704    704   
   705    705   TEST: {{"}}Le grand homme.”                                                 ->> « |“
   706    706   TEST: “Le grand homme.{{"}}                                                 ->> " »|”"
   707    707   
   708    708   
   709    709   __<s>/typo(typo_guillemets_typographiques_simples_doubles_ouvrants)__
   710         -    (?:^|[ –—-])(['’]['’])(?=\w)  @@*
          710  +    (?:^|[ –—-])(['’‘]['’‘])(?=\w)  @@*
   711    711           <<- -1>> « |“                                                                               && Guillemets typographiques ouvrants.
   712    712   __<s>/typo(typo_guillemets_typographiques_simples_doubles_fermants)__
   713    713       [\w.?!…,](['’]['’])(?![\w'’])  @@*
   714    714           <<- -1>> " »|”"                                                                             && Guillemets typographiques fermants.
   715    715   
   716    716   TEST: {{''}}Ça{{”}} recommence.                                                 ->> « |“|||
   717    717   TEST: Le {{''}}grand{{”}} homme.                                                ->> « |“|||
   718    718   TEST: Le {{“}}grand{{''}} homme.                                                ->> ||| »|”
          719  +TEST: Le {{‘‘}}barbare{{’’}} dont il faut se défendre à tout prix               ->> « |“||| »|”
   719    720   
   720    721   
   721    722   __<s>/typo(typo_guillemets_typographiques_simples_ouvrants)__
   722    723       (?:^|[ –—-])(['’])(?=\w)  @@*
   723    724           <<- -1>> “|‘|‹                                                                              && Guillemets typographiques ouvrants.
   724    725   __<s>/typo(typo_guillemets_typographiques_simples_fermants)__
   725    726       [\w.?!](')(?:[   ]|$)  @@*
................................................................................
  1468   1469   __[i]/ocr(ocr_le_la_les_regex)__
  1469   1470       [1[\]][easrnxiocuwàéè]
  1470   1471           <<- \0.endswith("e") ->> le                                                                 && Erreur de numérisation ?
  1471   1472           <<- __else__ and \0.endswith("a") ->> la                                                    && Erreur de numérisation ?
  1472   1473           <<- __else__ and \0.endswith("à") ->> la|là                                                 && Erreur de numérisation ?
  1473   1474           <<- __else__ ->> le|la                                                                      && Erreur de numérisation ?
  1474   1475   
  1475         -TEST: __ocr__ avec {{1e}} chien du policier
  1476         -TEST: __ocr__ il le jura sur {{1a}} tête de sa mère
  1477         -TEST: __ocr__ {{1c}} chat du voinsin est idiot
  1478         -TEST: __ocr__ {{[e}} chien a faim
         1476  +TEST: __ocr__ avec {{1e}} chien du policier                                                 ->> le
         1477  +TEST: __ocr__ il le jura sur {{1a}} tête de sa mère                                         ->> la
         1478  +TEST: __ocr__ {{]à}}                                                                        ->> la|là
         1479  +TEST: __ocr__ {{1c}} chat du voinsin est idiot                                              ->> le|la
         1480  +TEST: __ocr__ oui, {{[e}} chien a faim                                                      ->> le
  1479   1481   
  1480   1482   
  1481   1483   __[i]/conf(conf_1e_1a_1es)__
  1482   1484       [1[\]][ea]s?
  1483   1485           <<- \0.endswith("e") and (morph(word(1), ":(?:[NA].*:[me]:[si]|V)", ":G") or morph(word(-1), ">ne/")) ->> le       && Erreur de frappe ?
  1484   1486           <<- \0.endswith("a") and (morph(word(1), ":(?:[NA].*:[fe]:[si]|V)", ":G") or morph(word(-1), ">ne/")) ->> la       && Erreur de frappe ?
  1485   1487           <<- \0.endswith("es") and (morph(word(1), ":(?:[NA].*:[pi]|V)", ":G") or morph(word(-1), ">ne/")) ->> les          && Erreur de frappe ?
  1486   1488   
  1487   1489   TEST: {{1e}} marginal                                           ->> le
  1488   1490   TEST: {{1a}} venue des problèmes                                ->> la
  1489   1491   TEST: {{1es}} enfants sont au lit                               ->> les
  1490         -TEST: Je… ne {{1e}}… crois pas…
         1492  +TEST: Je… ne {{1e}}… crois pas…                                 ->> le
  1491   1493   
  1492   1494   
  1493   1495   __[i]/ocr(ocr_les)__
  1494   1496       [1[\]][ea]s
  1495   1497           <<- ->> les                                                                                 && Erreur de numérisation ?
  1496   1498   
  1497   1499   TEST: __ocr__ {{1es}} jours clairs
................................................................................
  2348   2350       La Bruyère
  2349   2351       La Fayette
  2350   2352       La Fontaine
  2351   2353           <<- ~>> ␣
  2352   2354           <<- =>> define(\1, ":M2:e:i")
  2353   2355   
  2354   2356       cac  40
         2357  +    Rio grande
  2355   2358           <<- ~>> ␣
         2359  +        <<- =>> define(\1, ":N:m:i")
  2356   2360   
  2357   2361       France [2|3|4|5|0|O]
  2358   2362           <<- ~>> ␣
         2363  +        <<- =>> define(\1, ":MP:e:i")
  2359   2364   
  2360   2365       Peugeot  ~^\d0\d\d?$
  2361   2366           <<- ~>> ␣
  2362   2367           <<- =>> define(\1, ":N:e:i")
  2363   2368   
  2364   2369       Mai 68
  2365   2370           <<- ~>> ␣
................................................................................
  2945   2950   
  2946   2951   # avec / aven / arec
  2947   2952   __ocr_avec__
  2948   2953       [arec|aven]
  2949   2954           <<- /ocr/ ->> avec                                                                          && Erreur de numérisation ?
  2950   2955   
  2951   2956   TEST: __ocr__ Elle s’en alla {{arec}} eux sans un regard en arrière.
         2957  +
  2952   2958   
  2953   2959   # avaient / avalent
  2954   2960   __ocr_avaient__
  2955   2961       avalent
  2956   2962           <<- /ocr/ ->> avaient                                                                       && Erreur de numérisation ?
  2957   2963   
  2958   2964   TEST: __ocr__ Ils {{avalent}} très faim.
................................................................................
  3794   3800   !!!! Élisions & euphonie                                                                          !!
  3795   3801   !!
  3796   3802   !!
  3797   3803   
  3798   3804   # élisions
  3799   3805   __eleu_élisions_manquantes__
  3800   3806       [le|la|de]  ~^[aâeéèêiîoôuûyœæh].
  3801         -        <<- /eleu/ space_after(\1, 1, 1) and not re.search("(?i)^(?:onz[ei]|énième|iourte|oui|ouï-dire|ouistiti|ouate|one-?step|ouf|yacht|Ouagadougou|I(?:I|V|X|er|ᵉʳ|ʳᵉ|è?re))", \2) and morph(\2, ":", ":G|;é")
         3807  +        <<- /eleu/ space_after(\1, 1, 1) and not re.search("(?i)^(?:I(?:I|V|X|er|ᵉʳ|ʳᵉ|è?re))", \2) and morph(\2, ":", ":G|;é")
  3802   3808           -1:.2>> =\1[0:1]+"’"                                                && Élision de l’article devant un mot commençant par une voyelle.|http://fr.wikipedia.org/wiki/Élision
  3803   3809   
  3804   3810       si [il|ils]
  3805   3811           <<- /eleu/ space_after(\1, 1, 1) -1:.2>> s’                         && Il faut élider “si” et l’accoler au pronom.|http://fr.wikipedia.org/wiki/Élision
  3806   3812   
  3807   3813       que [il|ils|elle|elles|on|iel|iels]
  3808   3814           <<- /eleu/ space_after(\1, 1, 1) -1:.2>> qu’                        && Il faut élider “que” et l’accoler au pronom.|http://fr.wikipedia.org/wiki/Élision
................................................................................
  3842   3848   TEST: {{l’}}hulotte                                                         ->> la
  3843   3849   TEST: combien {{d’}}iourtes                                                 ->> de
  3844   3850   
  3845   3851   
  3846   3852   # ce -> cet
  3847   3853   __eleu_euphonie_cet__
  3848   3854       ce  ~^[aâeéèêiîoôuûyœæ]
  3849         -        <<- /eleu/ not re.search("(?i)^(?:onz|énième|ouf|énième|ouistiti|yacht|one-?step|I(?:I|V|X|er|ᵉʳ))", \2) and morph(\2, ":[NA].*:[me]")
         3855  +        <<- /eleu/ not re.search("(?i)^(?:I(?:I|V|X|er|ᵉʳ))", \2) and morph(\2, ":[NA].*:[me]", ":G|;é")
  3850   3856           -1>> cet                                                                && Euphonie : “ce” devient “cet” devant un mot commençant par une voyelle.|https://fr.wikipedia.org/wiki/Euphonie
  3851   3857   
  3852   3858   TEST: {{ce}} animal est dangereux
  3853   3859   TEST: ce yacht
  3854   3860   
  3855   3861   
  3856   3862   # Verbe 1ʳᵉ personne du singulier, interrogatif… xxxé-je
................................................................................
  3863   3869   TEST: pensé-je
  3864   3870   TEST: souhaitè-je
  3865   3871   
  3866   3872   
  3867   3873   # ma, ta, sa / mon, ton, son
  3868   3874   __eleu_euphonie_ma_ta_sa__
  3869   3875       [ma|ta]  ~^[aâeéèêiîoôuûyœæ].
  3870         -        <<- /eleu/ morph(\2, ":[NA]") and not re.search("(?i)^(?:onz|énième|ouf|énième|I(?:I|V|X|i?[eè]?re|ʳᵉ))", \2)
         3876  +        <<- /eleu/ morph(\2, ":[NA]", ":G|;é") and not re.search("(?i)^(?:I(?:I|V|X|i?[eè]?re|ʳᵉ))", \2)
  3871   3877           -1>> =\1[0:1]+"on"                                                      && Euphonie : lorsque le déterminant “\1” est suivi d’un nom ou d’un adjectif commençant par une voyelle, il est d’usage d’utiliser le pronom  “mon”, “ton” ou “son” pour respecter l’euphonie. Exemple : mon étoile (féminin).|https://fr.wikipedia.org/wiki/Euphonie
  3872   3878   
  3873   3879       sa  ~^[aâeéèêiîoôuûyœæ].
  3874         -        <<- /eleu/ not \1.isupper() and morph(\2, ":[NA]") and not re.search("(?i)^(?:onz|énième|ouf|énième|I(?:I|V|X|i?[eè]?re|ʳᵉ))", \2) >>>
         3880  +        <<- /eleu/ not \1.isupper() and morph(\2, ":[NA]", ":G|;é") and not re.search("(?i)^(?:I(?:I|V|X|i?[eè]?re|ʳᵉ))", \2) >>>
  3875   3881           <<- /eleu/ morph(\2, ":[123][sp]") -1>> =\1[0:1]+"on|ça"                && Euphonie : lorsque le déterminant “\1” est suivi d’un nom ou d’un adjectif commençant par une voyelle, il est d’usage d’utiliser le pronom  “mon”, “ton” ou “son” pour respecter l’euphonie. (À moins que vous ne confondiez “sa” et “ça”.) Exemple : son étoile (féminin), ça existe.|https://fr.wikipedia.org/wiki/Euphonie
  3876   3882           <<- /eleu/ __else__ -1>> =\1[0:1]+"on"                                  && Euphonie : lorsque le déterminant “\1” est suivi d’un nom ou d’un adjectif commençant par une voyelle, il est d’usage d’utiliser le pronom  “mon”, “ton” ou “son” pour respecter l’euphonie. Exemple : son étoile (féminin).|https://fr.wikipedia.org/wiki/Euphonie
  3877   3883   
  3878   3884   TEST: {{ta}} aimée                                              ->> ton
  3879   3885   TEST: {{ma}} obligée                                            ->> mon
  3880   3886   TEST: {{sa}} œuvre                                              ->> son|ça
  3881   3887   TEST: {{sa}} existence                                          ->> son
................................................................................
 14449  14455   
 14450  14456       in anima vili
 14451  14457       in cauda venenum
 14452  14458       in vino veritas
 14453  14459       sursum corda
 14454  14460       sic transit gloria mundi
 14455  14461           <<- ~>> ␣
 14456         -        <<- =>> =define(\1, ":LP")
        14462  +        <<- =>> define(\1, ":LP")
 14457  14463   
 14458  14464   
 14459  14465   __purge_locutions_incises__
 14460  14466       [<start>|,|(] [oui|non] [<end>|,|)]
 14461  14467       [<start>|,|(] ?oui¿ ou non [<end>|,|)]
 14462  14468       [<start>|,|(] et non l’ inverse [<end>|,|)]
 14463  14469       [<start>|,|(] fait remarquable [<end>|,|)]
 14464  14470       [<start>|,|(] entre autres ?choses¿ [<end>|,|)]
 14465  14471       [<start>|,|(] mieux encore [<end>|,|)]
 14466  14472       [<start>|,|(] n’ est-ce pas [<end>|)]
 14467         -        <<- ~2:-2>>*
        14473  +        <<- ~2:-2>> *
 14468  14474   
 14469  14475   
 14470  14476   __purge_locutions_distance__
 14471  14477       à ?seulement¿ [*NUM|$:B:e:p|quelques|plusieurs] [nanomètres|millimètres|centimètres|décamètres|pas|mètres|kilomètres|verstes|lieues|UA|parsecs|années-lumière] [de|d’] [distance|ici]
 14472  14478       à ?seulement¿ [*NUM|$:B:e:p|quelques|plusieurs] [nanomètres|millimètres|centimètres|décamètres|pas|mètres|kilomètres|verstes|lieues|UA|parsecs|années-lumière] en [amont|aval]
 14473  14479       à ?seulement¿ [*NUM|$:B:e:p|quelques|plusieurs] [nanomètres|millimètres|centimètres|décamètres|pas|mètres|kilomètres|verstes|lieues|UA|parsecs|années-lumière] plus loin
 14474  14480       à ?seulement¿ [*NUM|$:B:e:p|quelques|plusieurs] [nanomètres|millimètres|centimètres|décamètres|pas|mètres|kilomètres|verstes|lieues|UA|parsecs|années-lumière] à la ronde
................................................................................
 17362  17368   
 17363  17369   
 17364  17370   
 17365  17371   @@@@
 17366  17372   @@@@
 17367  17373   @@@@
 17368  17374   @@@@
 17369         -@@@@GRAPH: purge_passe2|pp2                                                                        _
        17375  +@@@@GRAPH: intergraphe12a|ig12a                                                                    _
 17370  17376   @@@@
 17371  17377   @@@@
 17372  17378   @@@@
 17373  17379   @@@@
 17374  17380   
 17375  17381   __da_le_montre__
 17376  17382       le  montre  $:D
................................................................................
 17718  17724           <<- morph(\1, ":[123]p") or (\1 == "fait" and value(<1, "|on|")) ~2>> *
 17719  17725   
 17720  17726   
 17721  17727   # tous / tout / toute / toutes
 17722  17728   __purge_tout_tout_tous_toutes__
 17723  17729       tout                    [le|ce|cet|mon|ton|son]
 17724  17730       toute                   [la|cette|ma|ta|sa]
 17725         -    [tous|toutes|tout_e_s]  [les|des|mes|tes|ses|ces|nos|vos|leurs]
        17731  +    [tous|toutes|tout·e·s]  [les|des|mes|tes|ses|ces|nos|vos|leurs]
 17726  17732           <<- ~1>> *
 17727  17733   
 17728  17734       /-on        [tous|toutes]
 17729  17735       /-nous      [tous|toutes]
 17730  17736       /-vous      [tous|toutes]
 17731  17737       /-ils       [tous|toutes]
 17732  17738       /-elles     [tous|toutes]
 17733         -    /-iel       [tous|toutes|tout_e_s]
 17734         -    /-iels      [tous|toutes|tout_e_s]
        17739  +    /-iel       [tous|toutes|tout·e·s]
        17740  +    /-iels      [tous|toutes|tout·e·s]
 17735  17741           <<- ~2>> *
 17736  17742   
 17737         -    *WORD       [tous|toutes|tout_e_s]
        17743  +    *WORD       [tous|toutes|tout·e·s]
 17738  17744           <<- morph(\1, ":[123]p") ~2>> *
 17739  17745   
 17740         -    on  ?[ne|n’]¿  ?[le|la|l’|les|me|m’|te|t’|se|s’|nous|vous|lui|leur|y]¿  ?[le|la|l’|les|en|y|lui|leur]¿  *WORD  [tous|toutes|tout_e_s]
        17746  +    on  ?[ne|n’]¿  ?[le|la|l’|les|me|m’|te|t’|se|s’|nous|vous|lui|leur|y]¿  ?[le|la|l’|les|en|y|lui|leur]¿  *WORD  [tous|toutes|tout·e·s]
 17741  17747           <<- morph(\-2, ":[123]s") ~-1>> *
 17742  17748   
 17743  17749       [tous|toutes] , sans >exception ,
 17744  17750           <<- ~2:0>> *
 17745  17751   
 17746  17752   
 17747  17753   @@@@
 17748  17754   @@@@
 17749  17755   @@@@
 17750  17756   @@@@
 17751         -@@@@GRAPH: purge_passe3|pp3                                                                        _
        17757  +@@@@GRAPH: intergraphe12b|ig12b                                                                    _
 17752  17758   @@@@
 17753  17759   @@@@
 17754  17760   @@@@
 17755  17761   @@@@
 17756  17762   
 17757  17763   
 17758  17764   __fusions_enum_noms_communs__
................................................................................
 24646  24652       iels            [seuls|seules]
 24647  24653           <<- ~2>> *
 24648  24654   
 24649  24655       nous    [tous|toutes]   qui
 24650  24656       vous    [tous|toutes]   qui
 24651  24657       eux     tous            qui
 24652  24658       elles   toutes          qui
 24653         -    iels    tout_e_s        qui
        24659  +    iels    tout·e·s        qui
 24654  24660           <<- ~2>> *
 24655  24661   
 24656  24662   TODO: comme
 24657  24663   
 24658  24664   
 24659  24665   __purge_pronoms_après_sujet_verbe__
 24660  24666       [j’|je]     ?[ne|n’]¿   >avoir      moi-même
................................................................................
 25095  25101   
 25096  25102   
 25097  25103   
 25098  25104   @@@@
 25099  25105   @@@@
 25100  25106   @@@@
 25101  25107   @@@@
 25102         -@@@@GRAPH: purge_ponctuations2|ppc2                                                                _
        25108  +@@@@GRAPH: prégraphe_gv1|pg_gv1                                                                    _
 25103  25109   @@@@
 25104  25110   @@@@
 25105  25111   @@@@
 25106  25112   @@@@
 25107  25113   
 25108  25114   __da_été2__
 25109  25115       >avoir été