Many hyperlinks are disabled.
Use anonymous login
to enable hyperlinks.
Overview
Comment: | [fr] ocr màj |
---|---|
Downloads: | Tarball | ZIP archive | SQL archive |
Timelines: | family | ancestors | descendants | both | trunk | fr |
Files: | files | file ages | folders |
SHA3-256: | 96bd19f3b60e0d6fac69373c739cddf9 |
User & Date: | olr 2019-05-19 19:03:40 |
Context
2019-05-19
| ||
19:12 | [fx] gc panel: use SVG pictures for move buttons (CSS) [thanks to Naheulf] check-in: faea47f825 user: olr tags: fx, trunk | |
19:03 | [fr] ocr màj check-in: 96bd19f3b6 user: olr tags: fr, trunk | |
14:56 | [fr] nr: ocr màj check-in: a25c41d88b user: olr tags: fr, trunk | |
Changes
Changes to gc_lang/fr/rules.grx.
1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
1405
....
1540
1541
1542
1543
1544
1545
1546
1547
1548
1549
1550
1551
1552
1553
1554
1555
1556
1557
|
->> _ # Erreur de numérisation ? Mot composé inconnu du dictionnaire.
TEST: __ocr__ c’est du {{base-bal}}]
TEST: __ocr__ cet homme-là est corrompu.
TEST: __ocr__ cette femme-là est revenue nous dire ce qu’elle pensait de nous.
TEST: __ocr__ Est-ce le bon moment pour nous ennuyer avec ça ?
## Lettres isolées
# Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
__[s]/ocr(ocr_lettres_isolées)!2__
\w(?!’)
<<- not re.search("[0-9aàAÀyYdlnmtsjcçDLNMTSJCÇ_]", \0) and not before("\\d[ ]+$") and not (\0.isupper() and after0(r"^\."))
->> _ # Lettre isolée : erreur de numérisation ?
................................................................................
->> \1 # Doublon.
TEST: Il y a un {{doublon doublon}}.
### Traits d’union douteux
__[i]/tu(tu_trait_union_douteux)__
({w1})(?:--|—|–)({w1}) @@0,$
<<- spell(\1+"-"+\2) and analyse(\1+"-"+\2, ":") ->> \1-\2 # Trait d’union : un tiret simple suffit.
TEST: Nous préparons une {{contre–attaque}}.
!!!! Nombres: typographie !!
#(\d\d\d\d)-(\d\d\d\d) <<- ->> \1–\2 # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin.
__[s]/num(num_lettre_O_zéro1)__ [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ».
|
>
>
>
>
>
>
>
>
|
>
>
|
1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
1405
1406
1407
1408
1409
1410
1411
1412
1413
....
1548
1549
1550
1551
1552
1553
1554
1555
1556
1557
1558
1559
1560
1561
1562
1563
1564
1565
1566
1567
|
->> _ # Erreur de numérisation ? Mot composé inconnu du dictionnaire. TEST: __ocr__ c’est du {{base-bal}}] TEST: __ocr__ cet homme-là est corrompu. TEST: __ocr__ cette femme-là est revenue nous dire ce qu’elle pensait de nous. TEST: __ocr__ Est-ce le bon moment pour nous ennuyer avec ça ? ## Trait d’union conditionnel __[i]/ocr(tu_trait_union_conditionnel)__ ({w1})‑({w1}) @@0,$ <<- ->> \1\2|\1-\2 # Trait d’union conditionnel. Erreur de numérisation ? TEST: __ocr__ c’est {{anti-américain}} ## Lettres isolées # Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç __[s]/ocr(ocr_lettres_isolées)!2__ \w(?!’) <<- not re.search("[0-9aàAÀyYdlnmtsjcçDLNMTSJCÇ_]", \0) and not before("\\d[ ]+$") and not (\0.isupper() and after0(r"^\.")) ->> _ # Lettre isolée : erreur de numérisation ? ................................................................................ ->> \1 # Doublon. TEST: Il y a un {{doublon doublon}}. ### Traits d’union douteux __[i]/tu(tu_trait_union_douteux)__ ({w1})(?:--|—|–|−|⁃)({w1}) @@0,$ <<- spell(\1+"-"+\2) and analyse(\1+"-"+\2, ":") ->> \1-\2 # Trait d’union : un tiret simple suffit. TEST: Nous préparons une {{contre–attaque}}. TEST: Nous préparons une {{contre−attaque}}. !!!! Nombres: typographie !! #(\d\d\d\d)-(\d\d\d\d) <<- ->> \1–\2 # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin. __[s]/num(num_lettre_O_zéro1)__ [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0") # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ». |