Grammalecte  Check-in [96bd19f3b6]

Overview
Comment:[fr] ocr màj
Downloads: Tarball | ZIP archive | SQL archive
Timelines: family | ancestors | descendants | both | trunk | fr
Files: files | file ages | folders
SHA3-256: 96bd19f3b60e0d6fac69373c739cddf91e712fb2e00172e60c94baf580ade415
User & Date: olr on 2019-05-19 19:03:40
Other Links: manifest | tags
Context
2019-05-19
19:12
[fx] gc panel: use SVG pictures for move buttons (CSS) [thanks to Naheulf] check-in: faea47f825 user: olr tags: fx, trunk
19:03
[fr] ocr màj check-in: 96bd19f3b6 user: olr tags: fr, trunk
14:56
[fr] nr: ocr màj check-in: a25c41d88b user: olr tags: fr, trunk
Changes

Modified gc_lang/fr/rules.grx from [4346e51f05] to [32fda60f67].

  1392   1392           ->> _                                                                                       # Erreur de numérisation ? Mot composé inconnu du dictionnaire.
  1393   1393   
  1394   1394   TEST: __ocr__ c’est du {{base-bal}}]
  1395   1395   TEST: __ocr__ cet homme-là est corrompu.
  1396   1396   TEST: __ocr__ cette femme-là est revenue nous dire ce qu’elle pensait de nous.
  1397   1397   TEST: __ocr__ Est-ce le bon moment pour nous ennuyer avec ça ?
  1398   1398   
         1399  +
         1400  +## Trait d’union conditionnel
         1401  +__[i]/ocr(tu_trait_union_conditionnel)__
         1402  +    ({w1})‑({w1})  @@0,$
         1403  +    <<- ->> \1\2|\1-\2                                                                              # Trait d’union conditionnel. Erreur de numérisation ?
         1404  +
         1405  +TEST: __ocr__ c’est {{anti-américain}}
         1406  +
  1399   1407   
  1400   1408   ## Lettres isolées
  1401   1409   # Note: l’option “mapos” cherche les apostrophes manquantes après les lettres l, d, n, m, t, s, j, c, ç
  1402   1410   __[s]/ocr(ocr_lettres_isolées)!2__
  1403   1411       \w(?!’)
  1404   1412       <<- not re.search("[0-9aàAÀyYdlnmtsjcçDLNMTSJCÇ_]", \0) and not before("\\d[   ]+$") and not (\0.isupper() and after0(r"^\."))
  1405   1413       ->> _           # Lettre isolée : erreur de numérisation ?
................................................................................
  1540   1548       ->> \1   # Doublon.
  1541   1549   
  1542   1550   TEST: Il y a un {{doublon doublon}}.
  1543   1551   
  1544   1552   
  1545   1553   ### Traits d’union douteux
  1546   1554   __[i]/tu(tu_trait_union_douteux)__
  1547         -    ({w1})(?:--|—|–)({w1})  @@0,$
         1555  +    ({w1})(?:--|—|–|−|⁃)({w1})  @@0,$
  1548   1556       <<- spell(\1+"-"+\2) and analyse(\1+"-"+\2, ":") ->> \1-\2                                      # Trait d’union : un tiret simple suffit.
  1549   1557   
  1550   1558   TEST: Nous préparons une {{contre–attaque}}.
         1559  +TEST: Nous préparons une {{contre−attaque}}.
         1560  +
  1551   1561   
  1552   1562   
  1553   1563   !!!! Nombres: typographie                                                                         !!
  1554   1564   
  1555   1565   #(\d\d\d\d)-(\d\d\d\d)   <<- ->> \1–\2                              # Ne pas séparer deux dates par un trait d’union, mais par un tiret demi-cadratin.
  1556   1566   
  1557   1567   __[s]/num(num_lettre_O_zéro1)__  [\dO]+[O][\dO]+ <<- not option("ocr") ->> =\0.replace("O", "0")    # S’il s’agit d’un nombre, utilisez le chiffre « 0 » plutôt que la lettre « O ».