Grammalecte  Check-in [4c8b7d95bc]

Overview
Comment:[fr] ajustements et faux positif
Downloads: Tarball | ZIP archive | SQL archive
Timelines: family | ancestors | descendants | both | trunk | fr
Files: files | file ages | folders
SHA3-256: 4c8b7d95bcf13d4fe156a3665b0eb00cbfdfea499772962945bc8bb0186d7e7a
User & Date: olr on 2020-03-28 15:51:56
Other Links: manifest | tags
Context
2020-03-28
18:52
[fx] observePage: makes Twitter crash when hitting on backspace (Why?) -> disable it for now check-in: 4fad50f750 user: olr tags: fx, trunk
15:51
[fr] ajustements et faux positif check-in: 4c8b7d95bc user: olr tags: fr, trunk
15:14
[fx] gc panel: fix text truncation due to the new underlining method check-in: 33a93940c6 user: olr tags: fx, trunk
Changes

Modified gc_lang/fr/rules.grx from [90ebb5255c] to [68b977015f].

1473
1474
1475
1476
1477
1478
1479
1480
1481
1482
1483
1484
1485
1486
1487
1488

1489
1490
1491
1492
1493
1494
1495
....
2503
2504
2505
2506
2507
2508
2509
2510
2511
2512
2513
2514
2515
2516
2517
.....
16016
16017
16018
16019
16020
16021
16022
16023
16024
16025
16026
16027
16028
16029
16030
16031
16032
16033
16034
16035
16036
16037
16038
16039
16040
16041
16042
16043
16044
16045
16046
16047
16048
16049

16050
16051
16052
16053
16054
16055
16056
16057
16058
16059
16060
    <<- ->> \1\2|\1-\2                                                                              # Trait d’union conditionnel. Erreur de numérisation ?

TEST: __ocr__ c’est {{anti‑américain}}


## Caractères rares
__<s>/ocr(ocr_caractères_rares)__
    \w*[{}<>&*#£]+\w*
    <<- \0 != "<" and \0 != ">" ->> _                                                               # Erreur de numérisation ? Cette chaîne contient un caractère de fréquence rare.

__<s>/ocr(ocr_doublons_caractères_rares)__
    [\]\[({}][\]\[({}]+
        <<- ->> _                                                                                   # Erreur de numérisation ? Succession douteuse de caractères.

TEST: __ocr__ trouve {{l£}} temps
TEST: __ocr__ elle s’{{avance*}} sur le seuil

TEST: __ocr__ par beaucoup d’argent ? {{{Il}} débouche le Jack Daniels
TEST: __ocr__ {{[[}}voyons celà].
TEST: __ocr__ {{((}}voyons ceci).


## Mélange chiffres/lettres
__[i]/ocr(ocr_le_la_les_regex)__
................................................................................

TEST: __ocr__ {{J }}arrive demain


# Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
__ocr_lettres_isolées2!2__
    [á|â|ä|b|c|ç|d|e|é|è|ê|ë|f|g|h|i|í|ì|î|ï|j|k|l|m|n|o|ó|ò|ô|ö|p|q|r|s|t|u|ú|ù|û|ü|v|w|x|z]
        <<- not before("\\d[   ]+$") and not (\1.isupper() and value(>1, "|.|<end>|"))
        ->> _           # Lettre isolée : erreur de numérisation ?

TEST: __ocr__ des verres luisent sur {{i}} le bureau blanc.
TEST: __ocr__ la voix, {{e}} est celle de…
TEST: __ocr__ ressemble {{h}} une fenêtre de serre.
TEST: __ocr__ Ça a duré 3 h.
TEST: __ocr__ c’est alors que je suis fort.
................................................................................
TEST: {{Quelques}} deux cents hommes.                         ->> Quelque
TEST: les quelque 2,5 millions d’habitants
TEST: les quelque 12 000 stations-service


## Celui, celle, ceux, celles
__gn_celui__
    celui  @:¬:(?:G|W|m:[si])
        <<- /gn/ morph(\-1, ":A.*:f") --1>> =suggMasSing(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au masculin singulier.
        <<- /gn/ __else__ and morph(\-1, ":A.*:p") -2>> =suggMasSing(\-1)                   # Accord avec “\1” : cet adjectif devrait être au masculin singulier.

TEST: celui {{envoyés}} là-bas tombera dans un piège
TEST: celui {{perdue}} aura une pénalité
TEST: celui pris par surprise sera abattu


__gn_celle__
    celle  @:¬:(?:G|W|f:[si])
        <<- /gn/ morph(\-1, ":A.*:m") --1>> =suggFemSing(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au féminin singulier.
        <<- /gn/ __else__ and morph(\-1, ":A.*:p") -2>> =suggFemSing(\-1)                   # Accord avec “\1” : cet adjectif devrait être au féminin singulier.

TEST: celle {{envoyés}} là-bas tombera dans un piège
TEST: celle {{perdues}} aura une pénalité
TEST: celle prise par surprise sera abattue


__gn_ceux__
    ceux  @:¬:(?:G|W|m:[pi])
        <<- /gn/ morph(\-1, ":A.*:f") --1>> =suggMasPlur(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au masculin pluriel.
        <<- /gn/ __else__ and morph(\-1, ":A.*:s") -2>> =suggMasPlur(\-1)                   # Accord avec “\1” : cet adjectif devrait être au masculin pluriel.

TEST: ceux {{envoyé}} là-bas tombera dans un piège
TEST: ceux {{perdues}} auront une pénalité
TEST: ceux perdus dans la neige



__gn_celles__
    celles  @:¬:(?:G|W|f:[pi])
        <<- /gn/ morph(\-1, ":A.*:m") --1>> =suggFemPlur(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au féminin pluriel.
        <<- /gn/ __else__ and morph(\-1, ":A.*:s") -2>> =suggFemPlur(\-1)                   # Accord avec “\1” : cet adjectif devrait être au féminin pluriel.

TEST: celles {{envoyés}} là-bas tombera dans un piège
TEST: celles {{perdue}} aura une pénalité
TEST: celles venues chanter doivent se rendre là-bas.








|
|







>







 







|







 







|









|









|






>



|







1473
1474
1475
1476
1477
1478
1479
1480
1481
1482
1483
1484
1485
1486
1487
1488
1489
1490
1491
1492
1493
1494
1495
1496
....
2504
2505
2506
2507
2508
2509
2510
2511
2512
2513
2514
2515
2516
2517
2518
.....
16017
16018
16019
16020
16021
16022
16023
16024
16025
16026
16027
16028
16029
16030
16031
16032
16033
16034
16035
16036
16037
16038
16039
16040
16041
16042
16043
16044
16045
16046
16047
16048
16049
16050
16051
16052
16053
16054
16055
16056
16057
16058
16059
16060
16061
16062
    <<- ->> \1\2|\1-\2                                                                              # Trait d’union conditionnel. Erreur de numérisation ?

TEST: __ocr__ c’est {{anti‑américain}}


## Caractères rares
__<s>/ocr(ocr_caractères_rares)__
    \w*[{}<>&*#£^|]+\w*
        <<- \0 != "<" and \0 != ">" ->> _                                                           # Erreur de numérisation ? Cette chaîne contient un caractère de fréquence rare.

__<s>/ocr(ocr_doublons_caractères_rares)__
    [\]\[({}][\]\[({}]+
        <<- ->> _                                                                                   # Erreur de numérisation ? Succession douteuse de caractères.

TEST: __ocr__ trouve {{l£}} temps
TEST: __ocr__ elle s’{{avance*}} sur le seuil
TEST: __ocr__ {{e||e}} vient
TEST: __ocr__ par beaucoup d’argent ? {{{Il}} débouche le Jack Daniels
TEST: __ocr__ {{[[}}voyons celà].
TEST: __ocr__ {{((}}voyons ceci).


## Mélange chiffres/lettres
__[i]/ocr(ocr_le_la_les_regex)__
................................................................................

TEST: __ocr__ {{J }}arrive demain


# Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
__ocr_lettres_isolées2!2__
    [á|â|ä|b|c|ç|d|e|é|è|ê|ë|f|g|h|i|í|ì|î|ï|j|k|l|m|n|o|ó|ò|ô|ö|p|q|r|s|t|u|ú|ù|û|ü|v|w|x|z]
        <<- /ocr/ not before("\\d[   ]+$") and not (\1.isupper() and value(>1, "|.|<end>|"))
        ->> _           # Lettre isolée : erreur de numérisation ?

TEST: __ocr__ des verres luisent sur {{i}} le bureau blanc.
TEST: __ocr__ la voix, {{e}} est celle de…
TEST: __ocr__ ressemble {{h}} une fenêtre de serre.
TEST: __ocr__ Ça a duré 3 h.
TEST: __ocr__ c’est alors que je suis fort.
................................................................................
TEST: {{Quelques}} deux cents hommes.                         ->> Quelque
TEST: les quelque 2,5 millions d’habitants
TEST: les quelque 12 000 stations-service


## Celui, celle, ceux, celles
__gn_celui__
    celui  @:¬:(?:G|W|P|m:[si])
        <<- /gn/ morph(\-1, ":A.*:f") --1>> =suggMasSing(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au masculin singulier.
        <<- /gn/ __else__ and morph(\-1, ":A.*:p") -2>> =suggMasSing(\-1)                   # Accord avec “\1” : cet adjectif devrait être au masculin singulier.

TEST: celui {{envoyés}} là-bas tombera dans un piège
TEST: celui {{perdue}} aura une pénalité
TEST: celui pris par surprise sera abattu


__gn_celle__
    celle  @:¬:(?:G|W|P|f:[si])
        <<- /gn/ morph(\-1, ":A.*:m") --1>> =suggFemSing(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au féminin singulier.
        <<- /gn/ __else__ and morph(\-1, ":A.*:p") -2>> =suggFemSing(\-1)                   # Accord avec “\1” : cet adjectif devrait être au féminin singulier.

TEST: celle {{envoyés}} là-bas tombera dans un piège
TEST: celle {{perdues}} aura une pénalité
TEST: celle prise par surprise sera abattue


__gn_ceux__
    ceux  @:¬:(?:G|W|P|m:[pi])
        <<- /gn/ morph(\-1, ":A.*:f") --1>> =suggMasPlur(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au masculin pluriel.
        <<- /gn/ __else__ and morph(\-1, ":A.*:s") -2>> =suggMasPlur(\-1)                   # Accord avec “\1” : cet adjectif devrait être au masculin pluriel.

TEST: ceux {{envoyé}} là-bas tombera dans un piège
TEST: ceux {{perdues}} auront une pénalité
TEST: ceux perdus dans la neige
TEST: l’approche conseillée, c’est-à-dire celle consistant à réaliser un diagnostic


__gn_celles__
    celles  @:¬:(?:G|W|P|f:[pi])
        <<- /gn/ morph(\-1, ":A.*:m") --1>> =suggFemPlur(\-1, True)                         # Accord avec “\1” : cet adjectif devrait être au féminin pluriel.
        <<- /gn/ __else__ and morph(\-1, ":A.*:s") -2>> =suggFemPlur(\-1)                   # Accord avec “\1” : cet adjectif devrait être au féminin pluriel.

TEST: celles {{envoyés}} là-bas tombera dans un piège
TEST: celles {{perdue}} aura une pénalité
TEST: celles venues chanter doivent se rendre là-bas.