Grammalecte  Hex Artifact Content

Artifact 79b36913b6d121c03d2c5883b7b1535737edd8b644d9aa79baa8ba367d16fb03:


0000: 23 21 70 79 74 68 6f 6e 33 0a 0a 23 20 46 52 45  #!python3..# FRE
0010: 4e 43 48 20 44 41 54 41 20 42 55 49 4c 44 45 52  NCH DATA BUILDER
0020: 0a 23 0a 23 20 62 79 20 4f 6c 69 76 69 65 72 20  .#.# by Olivier 
0030: 52 2e 0a 23 20 4c 69 63 65 6e 73 65 3a 20 4d 50  R..# License: MP
0040: 4c 20 32 0a 0a 69 6d 70 6f 72 74 20 6a 73 6f 6e  L 2..import json
0050: 0a 69 6d 70 6f 72 74 20 6f 73 0a 0a 69 6d 70 6f  .import os..impo
0060: 72 74 20 67 72 61 6d 6d 61 6c 65 63 74 65 2e 69  rt grammalecte.i
0070: 62 64 61 77 67 20 61 73 20 69 62 64 61 77 67 0a  bdawg as ibdawg.
0080: 66 72 6f 6d 20 67 72 61 6d 6d 61 6c 65 63 74 65  from grammalecte
0090: 2e 65 63 68 6f 20 69 6d 70 6f 72 74 20 65 63 68  .echo import ech
00a0: 6f 0a 66 72 6f 6d 20 67 72 61 6d 6d 61 6c 65 63  o.from grammalec
00b0: 74 65 2e 73 74 72 5f 74 72 61 6e 73 66 6f 72 6d  te.str_transform
00c0: 20 69 6d 70 6f 72 74 20 64 65 66 69 6e 65 53 75   import defineSu
00d0: 66 66 69 78 43 6f 64 65 0a 69 6d 70 6f 72 74 20  ffixCode.import 
00e0: 67 72 61 6d 6d 61 6c 65 63 74 65 2e 66 72 2e 63  grammalecte.fr.c
00f0: 6f 6e 6a 20 61 73 20 63 6f 6e 6a 0a 0a 0a 63 6c  onj as conj...cl
0100: 61 73 73 20 63 64 3a 0a 20 20 20 20 22 22 22 43  ass cd:.    """C
0110: 6f 6e 74 65 78 74 20 6d 61 6e 61 67 65 72 20 66  ontext manager f
0120: 6f 72 20 63 68 61 6e 67 69 6e 67 20 74 68 65 20  or changing the 
0130: 63 75 72 72 65 6e 74 20 77 6f 72 6b 69 6e 67 20  current working 
0140: 64 69 72 65 63 74 6f 72 79 22 22 22 0a 20 20 20  directory""".   
0150: 20 64 65 66 20 5f 5f 69 6e 69 74 5f 5f 20 28 73   def __init__ (s
0160: 65 6c 66 2c 20 6e 65 77 50 61 74 68 29 3a 0a 20  elf, newPath):. 
0170: 20 20 20 20 20 20 20 73 65 6c 66 2e 6e 65 77 50         self.newP
0180: 61 74 68 20 3d 20 6f 73 2e 70 61 74 68 2e 65 78  ath = os.path.ex
0190: 70 61 6e 64 75 73 65 72 28 6e 65 77 50 61 74 68  panduser(newPath
01a0: 29 0a 0a 20 20 20 20 64 65 66 20 5f 5f 65 6e 74  )..    def __ent
01b0: 65 72 5f 5f 20 28 73 65 6c 66 29 3a 0a 20 20 20  er__ (self):.   
01c0: 20 20 20 20 20 73 65 6c 66 2e 73 61 76 65 64 50       self.savedP
01d0: 61 74 68 20 3d 20 6f 73 2e 67 65 74 63 77 64 28  ath = os.getcwd(
01e0: 29 0a 20 20 20 20 20 20 20 20 6f 73 2e 63 68 64  ).        os.chd
01f0: 69 72 28 73 65 6c 66 2e 6e 65 77 50 61 74 68 29  ir(self.newPath)
0200: 0a 0a 20 20 20 20 64 65 66 20 5f 5f 65 78 69 74  ..    def __exit
0210: 5f 5f 20 28 73 65 6c 66 2c 20 65 74 79 70 65 2c  __ (self, etype,
0220: 20 76 61 6c 75 65 2c 20 74 72 61 63 65 62 61 63   value, tracebac
0230: 6b 29 3a 0a 20 20 20 20 20 20 20 20 6f 73 2e 63  k):.        os.c
0240: 68 64 69 72 28 73 65 6c 66 2e 73 61 76 65 64 50  hdir(self.savedP
0250: 61 74 68 29 0a 0a 0a 64 65 66 20 6d 61 6b 65 44  ath)...def makeD
0260: 69 63 74 69 6f 6e 61 72 69 65 73 20 28 73 70 2c  ictionaries (sp,
0270: 20 73 56 65 72 73 69 6f 6e 29 3a 0a 20 20 20 20   sVersion):.    
0280: 77 69 74 68 20 63 64 28 73 70 2b 22 2f 64 69 63  with cd(sp+"/dic
0290: 74 69 6f 6e 6e 61 69 72 65 22 29 3a 0a 20 20 20  tionnaire"):.   
02a0: 20 20 20 20 20 6f 73 2e 73 79 73 74 65 6d 28 22       os.system("
02b0: 67 65 6e 66 72 64 69 63 2e 70 79 20 2d 73 20 2d  genfrdic.py -s -
02c0: 67 6c 20 2d 76 20 22 2b 73 56 65 72 73 69 6f 6e  gl -v "+sVersion
02d0: 29 0a 0a 0a 64 65 66 20 6d 61 6b 65 43 6f 6e 6a  )...def makeConj
02e0: 20 28 73 70 2c 20 62 4a 53 3d 46 61 6c 73 65 29   (sp, bJS=False)
02f0: 3a 0a 20 20 20 20 70 72 69 6e 74 28 22 3e 20 43  :.    print("> C
0300: 6f 6e 6a 75 67 61 69 73 6f 6e 73 20 22 2c 20 65  onjugaisons ", e
0310: 6e 64 3d 22 22 29 0a 20 20 20 20 70 72 69 6e 74  nd="").    print
0320: 28 22 28 50 79 74 68 6f 6e 20 65 74 20 4a 61 76  ("(Python et Jav
0330: 61 53 63 72 69 70 74 29 22 20 20 69 66 20 62 4a  aScript)"  if bJ
0340: 53 20 20 65 6c 73 65 20 22 28 50 79 74 68 6f 6e  S  else "(Python
0350: 20 73 65 75 6c 65 6d 65 6e 74 29 22 29 0a 20 20   seulement)").  
0360: 20 20 64 56 65 72 62 20 3d 20 7b 7d 0a 20 20 20    dVerb = {}.   
0370: 20 6c 56 74 79 70 20 3d 20 5b 5d 3b 20 64 56 74   lVtyp = []; dVt
0380: 79 70 20 3d 20 7b 7d 3b 20 6e 56 74 79 70 20 3d  yp = {}; nVtyp =
0390: 20 30 0a 20 20 20 20 6c 54 61 67 73 20 3d 20 5b   0.    lTags = [
03a0: 5d 3b 20 64 54 61 67 73 20 3d 20 7b 7d 3b 20 6e  ]; dTags = {}; n
03b0: 54 61 67 73 20 3d 20 30 0a 0a 20 20 20 20 64 50  Tags = 0..    dP
03c0: 61 74 74 65 72 6e 4c 69 73 74 20 3d 20 7b 20 22  atternList = { "
03d0: 3a 50 51 22 3a 20 5b 5d 2c 20 22 3a 49 70 22 3a  :PQ": [], ":Ip":
03e0: 20 5b 5d 2c 20 22 3a 49 71 22 3a 20 5b 5d 2c 20   [], ":Iq": [], 
03f0: 22 3a 49 73 22 3a 20 5b 5d 2c 20 22 3a 49 66 22  ":Is": [], ":If"
0400: 3a 20 5b 5d 2c 20 22 3a 4b 22 3a 20 5b 5d 2c 20  : [], ":K": [], 
0410: 22 3a 53 70 22 3a 20 5b 5d 2c 20 22 3a 53 71 22  ":Sp": [], ":Sq"
0420: 3a 20 5b 5d 2c 20 22 3a 45 22 3a 20 5b 5d 20 7d  : [], ":E": [] }
0430: 0a 20 20 20 20 64 54 72 61 64 20 3d 20 7b 20 20  .    dTrad = {  
0440: 20 22 69 6e 66 69 22 3a 20 22 3a 59 22 2c 20 22   "infi": ":Y", "
0450: 70 70 72 65 22 3a 20 22 3a 50 51 22 2c 20 22 70  ppre": ":PQ", "p
0460: 70 61 73 22 3a 20 22 3a 50 51 22 2c 0a 20 20 20  pas": ":PQ",.   
0470: 20 20 20 20 20 20 20 20 20 20 20 20 20 22 69 70               "ip
0480: 72 65 22 3a 20 22 3a 49 70 22 2c 20 22 69 69 6d  re": ":Ip", "iim
0490: 70 22 3a 20 22 3a 49 71 22 2c 20 22 69 70 73 69  p": ":Iq", "ipsi
04a0: 22 3a 20 22 3a 49 73 22 2c 20 22 69 66 75 74 22  ": ":Is", "ifut"
04b0: 3a 20 22 3a 49 66 22 2c 0a 20 20 20 20 20 20 20  : ":If",.       
04c0: 20 20 20 20 20 20 20 20 20 22 73 70 72 65 22 3a           "spre":
04d0: 20 22 3a 53 70 22 2c 20 22 73 69 6d 70 22 3a 20   ":Sp", "simp": 
04e0: 22 3a 53 71 22 2c 0a 20 20 20 20 20 20 20 20 20  ":Sq",.         
04f0: 20 20 20 20 20 20 20 22 63 6f 6e 64 22 3a 20 22         "cond": "
0500: 3a 4b 22 2c 20 22 69 6d 70 65 22 3a 20 22 3a 45  :K", "impe": ":E
0510: 22 2c 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  ",.             
0520: 20 20 20 22 31 73 67 22 3a 20 22 3a 31 73 22 2c     "1sg": ":1s",
0530: 20 22 32 73 67 22 3a 20 22 3a 32 73 22 2c 20 22   "2sg": ":2s", "
0540: 33 73 67 22 3a 20 22 3a 33 73 22 2c 20 22 31 70  3sg": ":3s", "1p
0550: 6c 22 3a 20 22 3a 31 70 22 2c 20 22 32 70 6c 22  l": ":1p", "2pl"
0560: 3a 20 22 3a 32 70 22 2c 20 22 33 70 6c 22 3a 20  : ":2p", "3pl": 
0570: 22 3a 33 70 22 2c 20 22 31 69 73 67 22 3a 20 22  ":3p", "1isg": "
0580: 3a 31 c5 9b 22 2c 0a 20 20 20 20 20 20 20 20 20  :1..",.         
0590: 20 20 20 20 20 20 20 22 6d 61 73 20 73 67 22 3a         "mas sg":
05a0: 20 22 3a 51 31 22 2c 20 22 6d 61 73 20 70 6c 22   ":Q1", "mas pl"
05b0: 3a 20 22 3a 51 32 22 2c 20 22 6d 61 73 20 69 6e  : ":Q2", "mas in
05c0: 76 22 3a 20 22 3a 51 31 22 2c 20 22 66 65 6d 20  v": ":Q1", "fem 
05d0: 73 67 22 3a 20 22 3a 51 33 22 2c 20 22 66 65 6d  sg": ":Q3", "fem
05e0: 20 70 6c 22 3a 20 22 3a 51 34 22 2c 20 22 65 70   pl": ":Q4", "ep
05f0: 69 20 69 6e 76 22 3a 20 22 3a 51 31 22 0a 20 20  i inv": ":Q1".  
0600: 20 20 20 20 20 20 20 20 20 20 7d 0a 0a 20 20 20            }..   
0610: 20 23 20 72 65 61 64 20 6c 65 78 69 63 6f 6e 0a   # read lexicon.
0620: 20 20 20 20 77 69 74 68 20 6f 70 65 6e 28 73 70      with open(sp
0630: 2b 22 2f 64 61 74 61 2f 64 69 63 74 43 6f 6e 6a  +"/data/dictConj
0640: 2e 74 78 74 22 2c 20 27 72 27 2c 20 65 6e 63 6f  .txt", 'r', enco
0650: 64 69 6e 67 3d 27 75 74 66 2d 38 27 29 20 61 73  ding='utf-8') as
0660: 20 68 53 72 63 3a 0a 20 20 20 20 20 20 20 20 6e   hSrc:.        n
0670: 53 74 6f 70 20 3d 20 30 0a 20 20 20 20 20 20 20  Stop = 0.       
0680: 20 66 6f 72 20 6e 2c 20 6c 69 6e 65 20 69 6e 20   for n, line in 
0690: 65 6e 75 6d 65 72 61 74 65 28 68 53 72 63 2e 72  enumerate(hSrc.r
06a0: 65 61 64 6c 69 6e 65 73 28 29 29 3a 0a 20 20 20  eadlines()):.   
06b0: 20 20 20 20 20 20 20 20 20 6c 69 6e 65 20 3d 20           line = 
06c0: 6c 69 6e 65 2e 73 74 72 69 70 28 29 0a 20 20 20  line.strip().   
06d0: 20 20 20 20 20 20 20 20 20 6e 54 61 62 20 3d 20           nTab = 
06e0: 6c 69 6e 65 2e 63 6f 75 6e 74 28 22 5c 74 22 29  line.count("\t")
06f0: 0a 20 20 20 20 20 20 20 20 20 20 20 20 69 66 20  .            if 
0700: 6e 54 61 62 20 3d 3d 20 31 3a 0a 20 20 20 20 20  nTab == 1:.     
0710: 20 20 20 20 20 20 20 20 20 20 20 23 20 6e 65 77             # new
0720: 20 65 6e 74 72 79 0a 20 20 20 20 20 20 20 20 20   entry.         
0730: 20 20 20 20 20 20 20 73 4c 65 6d 6d 61 2c 20 73         sLemma, s
0740: 56 74 79 70 20 3d 20 6c 69 6e 65 2e 73 70 6c 69  Vtyp = line.spli
0750: 74 28 22 5c 74 22 29 0a 20 20 20 20 20 20 20 20  t("\t").        
0760: 20 20 20 20 20 20 20 20 64 43 6f 6e 6a 20 3d 20          dConj = 
0770: 7b 20 20 20 22 3a 50 51 22 3a 20 7b 20 22 3a 50  {   ":PQ": { ":P
0780: 22 3a 20 22 22 2c 20 22 3a 51 31 22 3a 20 22 22  ": "", ":Q1": ""
0790: 2c 20 22 3a 51 32 22 3a 20 22 22 2c 20 22 3a 51  , ":Q2": "", ":Q
07a0: 33 22 3a 20 22 22 2c 20 22 3a 51 34 22 3a 20 22  3": "", ":Q4": "
07b0: 22 7d 2c 0a 20 20 20 20 20 20 20 20 20 20 20 20  "},.            
07c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
07d0: 22 3a 49 70 22 3a 20 7b 20 22 3a 31 73 22 3a 20  ":Ip": { ":1s": 
07e0: 22 22 2c 20 22 3a 32 73 22 3a 20 22 22 2c 20 22  "", ":2s": "", "
07f0: 3a 33 73 22 3a 20 22 22 2c 20 22 3a 31 70 22 3a  :3s": "", ":1p":
0800: 20 22 22 2c 20 22 3a 32 70 22 3a 20 22 22 2c 20   "", ":2p": "", 
0810: 22 3a 33 70 22 3a 20 22 22 2c 20 22 3a 31 c5 9b  ":3p": "", ":1..
0820: 22 3a 20 22 22 20 7d 2c 0a 20 20 20 20 20 20 20  ": "" },.       
0830: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0840: 20 20 20 20 20 22 3a 49 71 22 3a 20 7b 20 22 3a       ":Iq": { ":
0850: 31 73 22 3a 20 22 22 2c 20 22 3a 32 73 22 3a 20  1s": "", ":2s": 
0860: 22 22 2c 20 22 3a 33 73 22 3a 20 22 22 2c 20 22  "", ":3s": "", "
0870: 3a 31 70 22 3a 20 22 22 2c 20 22 3a 32 70 22 3a  :1p": "", ":2p":
0880: 20 22 22 2c 20 22 3a 33 70 22 3a 20 22 22 20 7d   "", ":3p": "" }
0890: 2c 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ,.              
08a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 22 3a                ":
08b0: 49 73 22 3a 20 7b 20 22 3a 31 73 22 3a 20 22 22  Is": { ":1s": ""
08c0: 2c 20 22 3a 32 73 22 3a 20 22 22 2c 20 22 3a 33  , ":2s": "", ":3
08d0: 73 22 3a 20 22 22 2c 20 22 3a 31 70 22 3a 20 22  s": "", ":1p": "
08e0: 22 2c 20 22 3a 32 70 22 3a 20 22 22 2c 20 22 3a  ", ":2p": "", ":
08f0: 33 70 22 3a 20 22 22 20 7d 2c 0a 20 20 20 20 20  3p": "" },.     
0900: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0910: 20 20 20 20 20 20 20 22 3a 49 66 22 3a 20 7b 20         ":If": { 
0920: 22 3a 31 73 22 3a 20 22 22 2c 20 22 3a 32 73 22  ":1s": "", ":2s"
0930: 3a 20 22 22 2c 20 22 3a 33 73 22 3a 20 22 22 2c  : "", ":3s": "",
0940: 20 22 3a 31 70 22 3a 20 22 22 2c 20 22 3a 32 70   ":1p": "", ":2p
0950: 22 3a 20 22 22 2c 20 22 3a 33 70 22 3a 20 22 22  ": "", ":3p": ""
0960: 20 7d 2c 0a 20 20 20 20 20 20 20 20 20 20 20 20   },.            
0970: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0980: 22 3a 4b 22 3a 20 7b 20 22 3a 31 73 22 3a 20 22  ":K": { ":1s": "
0990: 22 2c 20 22 3a 32 73 22 3a 20 22 22 2c 20 22 3a  ", ":2s": "", ":
09a0: 33 73 22 3a 20 22 22 2c 20 22 3a 31 70 22 3a 20  3s": "", ":1p": 
09b0: 22 22 2c 20 22 3a 32 70 22 3a 20 22 22 2c 20 22  "", ":2p": "", "
09c0: 3a 33 70 22 3a 20 22 22 20 7d 2c 0a 20 20 20 20  :3p": "" },.    
09d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
09e0: 20 20 20 20 20 20 20 20 22 3a 53 70 22 3a 20 7b          ":Sp": {
09f0: 20 22 3a 31 73 22 3a 20 22 22 2c 20 22 3a 32 73   ":1s": "", ":2s
0a00: 22 3a 20 22 22 2c 20 22 3a 33 73 22 3a 20 22 22  ": "", ":3s": ""
0a10: 2c 20 22 3a 31 70 22 3a 20 22 22 2c 20 22 3a 32  , ":1p": "", ":2
0a20: 70 22 3a 20 22 22 2c 20 22 3a 33 70 22 3a 20 22  p": "", ":3p": "
0a30: 22 2c 20 22 3a 31 c5 9b 22 3a 20 22 22 20 7d 2c  ", ":1..": "" },
0a40: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
0a50: 20 20 20 20 20 20 20 20 20 20 20 20 20 22 3a 53               ":S
0a60: 71 22 3a 20 7b 20 22 3a 31 73 22 3a 20 22 22 2c  q": { ":1s": "",
0a70: 20 22 3a 32 73 22 3a 20 22 22 2c 20 22 3a 33 73   ":2s": "", ":3s
0a80: 22 3a 20 22 22 2c 20 22 3a 31 70 22 3a 20 22 22  ": "", ":1p": ""
0a90: 2c 20 22 3a 32 70 22 3a 20 22 22 2c 20 22 3a 33  , ":2p": "", ":3
0aa0: 70 22 3a 20 22 22 2c 20 22 3a 31 c5 9b 22 3a 20  p": "", ":1..": 
0ab0: 22 22 20 7d 2c 0a 20 20 20 20 20 20 20 20 20 20  "" },.          
0ac0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ad0: 20 20 22 3a 45 22 3a 20 7b 20 22 3a 32 73 22 3a    ":E": { ":2s":
0ae0: 20 22 22 2c 20 22 3a 31 70 22 3a 20 22 22 2c 20   "", ":1p": "", 
0af0: 22 3a 32 70 22 3a 20 22 22 20 7d 0a 20 20 20 20  ":2p": "" }.    
0b00: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0b10: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 20 20      }.          
0b20: 20 20 20 20 20 20 69 66 20 73 56 74 79 70 20 6e        if sVtyp n
0b30: 6f 74 20 69 6e 20 6c 56 74 79 70 3a 0a 20 20 20  ot in lVtyp:.   
0b40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0b50: 20 64 56 74 79 70 5b 73 56 74 79 70 5d 20 3d 20   dVtyp[sVtyp] = 
0b60: 6e 56 74 79 70 0a 20 20 20 20 20 20 20 20 20 20  nVtyp.          
0b70: 20 20 20 20 20 20 20 20 20 20 6c 56 74 79 70 2e            lVtyp.
0b80: 61 70 70 65 6e 64 28 73 56 74 79 70 29 0a 20 20  append(sVtyp).  
0b90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0ba0: 20 20 6e 56 74 79 70 20 2b 3d 20 31 0a 20 20 20    nVtyp += 1.   
0bb0: 20 20 20 20 20 20 20 20 20 65 6c 69 66 20 6e 54           elif nT
0bc0: 61 62 20 3d 3d 20 32 3a 0a 20 20 20 20 20 20 20  ab == 2:.       
0bd0: 20 20 20 20 20 20 20 20 20 23 20 66 6c 65 78 69           # flexi
0be0: 6f 6e 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  on.             
0bf0: 20 20 20 5f 2c 20 73 54 61 67 2c 20 73 46 6c 65     _, sTag, sFle
0c00: 78 20 3d 20 6c 69 6e 65 2e 73 70 6c 69 74 28 22  x = line.split("
0c10: 5c 74 22 29 0a 20 20 20 20 20 20 20 20 20 20 20  \t").           
0c20: 20 20 20 20 20 69 66 20 73 54 61 67 2e 63 6f 75       if sTag.cou
0c30: 6e 74 28 22 20 22 29 20 3d 3d 20 30 3a 0a 20 20  nt(" ") == 0:.  
0c40: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0c50: 20 20 69 66 20 73 54 61 67 20 3d 3d 20 22 70 70    if sTag == "pp
0c60: 72 65 22 3a 0a 20 20 20 20 20 20 20 20 20 20 20  re":.           
0c70: 20 20 20 20 20 20 20 20 20 20 20 20 20 64 43 6f               dCo
0c80: 6e 6a 5b 22 3a 50 51 22 5d 5b 22 3a 50 22 5d 20  nj[":PQ"][":P"] 
0c90: 3d 20 64 65 66 69 6e 65 53 75 66 66 69 78 43 6f  = defineSuffixCo
0ca0: 64 65 28 73 4c 65 6d 6d 61 2c 20 73 46 6c 65 78  de(sLemma, sFlex
0cb0: 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  ).              
0cc0: 20 20 65 6c 73 65 3a 0a 20 20 20 20 20 20 20 20    else:.        
0cd0: 20 20 20 20 20 20 20 20 20 20 20 20 74 72 79 3a              try:
0ce0: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
0cf0: 20 20 20 20 20 20 20 20 20 6d 6f 64 65 2c 20 67           mode, g
0d00: 20 3d 20 73 54 61 67 2e 73 70 6c 69 74 28 6d 61   = sTag.split(ma
0d10: 78 73 70 6c 69 74 3d 31 29 0a 20 20 20 20 20 20  xsplit=1).      
0d20: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0d30: 20 20 6d 6f 64 65 20 3d 20 64 54 72 61 64 5b 6d    mode = dTrad[m
0d40: 6f 64 65 5d 0a 20 20 20 20 20 20 20 20 20 20 20  ode].           
0d50: 20 20 20 20 20 20 20 20 20 20 20 20 20 67 20 3d               g =
0d60: 20 64 54 72 61 64 5b 67 5d 0a 20 20 20 20 20 20   dTrad[g].      
0d70: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0d80: 20 20 69 66 20 64 43 6f 6e 6a 5b 6d 6f 64 65 5d    if dConj[mode]
0d90: 5b 67 5d 20 3d 3d 20 22 22 3a 0a 20 20 20 20 20  [g] == "":.     
0da0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0db0: 20 20 20 20 20 20 20 64 43 6f 6e 6a 5b 6d 6f 64         dConj[mod
0dc0: 65 5d 5b 67 5d 20 3d 20 64 65 66 69 6e 65 53 75  e][g] = defineSu
0dd0: 66 66 69 78 43 6f 64 65 28 73 4c 65 6d 6d 61 2c  ffixCode(sLemma,
0de0: 20 73 46 6c 65 78 29 0a 20 20 20 20 20 20 20 20   sFlex).        
0df0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e00: 65 6c 73 65 3a 0a 20 20 20 20 20 20 20 20 20 20  else:.          
0e10: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e20: 20 20 23 20 63 6f 6d 6d 65 6e 74 20 67 c3 a9 72    # comment g..r
0e30: 65 72 20 6c 65 73 20 61 75 74 72 65 73 20 67 72  er les autres gr
0e40: 61 70 68 69 65 73 20 3f 0a 20 20 20 20 20 20 20  aphies ?.       
0e50: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0e60: 20 20 20 20 20 70 61 73 73 0a 20 20 20 20 20 20       pass.      
0e70: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 65 78                ex
0e80: 63 65 70 74 3a 0a 20 20 20 20 20 20 20 20 20 20  cept:.          
0e90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 70 72                pr
0ea0: 69 6e 74 28 73 4c 65 6d 6d 61 2e 65 6e 63 6f 64  int(sLemma.encod
0eb0: 65 28 22 75 74 66 2d 38 22 29 2e 64 65 63 6f 64  e("utf-8").decod
0ec0: 65 28 22 61 73 63 69 69 22 29 2c 20 22 20 2d 20  e("ascii"), " - 
0ed0: 22 2c 20 73 54 61 67 2c 20 22 20 2d 20 6e 6f 6e  ", sTag, " - non
0ee0: 20 67 c3 a9 72 c3 a9 3a 20 22 2c 20 6d 6f 64 65   g..r..: ", mode
0ef0: 2c 20 22 20 2f 20 22 2c 20 67 29 0a 20 20 20 20  , " / ", g).    
0f00: 20 20 20 20 20 20 20 20 65 6c 69 66 20 6c 69 6e          elif lin
0f10: 65 20 3d 3d 20 22 24 22 3a 0a 20 20 20 20 20 20  e == "$":.      
0f20: 20 20 20 20 20 20 20 20 20 20 23 20 77 65 20 73            # we s
0f30: 74 6f 72 65 20 74 68 65 20 64 69 63 74 69 6f 6e  tore the diction
0f40: 61 72 79 20 6f 66 20 72 75 6c 65 73 20 66 6f 72  ary of rules for
0f50: 20 74 68 69 73 20 6c 65 6d 6d 61 0a 20 20 20 20   this lemma.    
0f60: 20 20 20 20 20 20 20 20 20 20 20 20 69 66 20 64              if d
0f70: 43 6f 6e 6a 5b 22 3a 49 70 22 5d 5b 22 3a 31 c5  Conj[":Ip"][":1.
0f80: 9b 22 5d 20 3d 3d 20 22 32 c3 a8 22 3a 0a 20 20  ."] == "2..":.  
0f90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
0fa0: 20 20 64 43 6f 6e 6a 5b 22 3a 49 70 22 5d 5b 22    dConj[":Ip"]["
0fb0: 3a 31 c5 9b 22 5d 20 3d 20 22 32 c3 a9 22 0a 20  :1.."] = "2..". 
0fc0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 65                 e
0fd0: 6c 69 66 20 73 4c 65 6d 6d 61 20 3d 3d 20 22 70  lif sLemma == "p
0fe0: 6f 75 76 6f 69 72 22 3a 0a 20 20 20 20 20 20 20  ouvoir":.       
0ff0: 20 20 20 20 20 20 20 20 20 20 20 20 20 64 43 6f               dCo
1000: 6e 6a 5b 22 3a 49 70 22 5d 5b 22 3a 31 c5 9b 22  nj[":Ip"][":1.."
1010: 5d 20 3d 20 22 36 75 69 73 22 0a 20 20 20 20 20  ] = "6uis".     
1020: 20 20 20 20 20 20 20 20 20 20 20 6c 43 6f 6e 6a             lConj
1030: 54 61 67 73 20 3d 20 5b 5d 0a 20 20 20 20 20 20  Tags = [].      
1040: 20 20 20 20 20 20 20 20 20 20 66 6f 72 20 6b 65            for ke
1050: 79 20 69 6e 20 5b 22 3a 50 51 22 2c 20 22 3a 49  y in [":PQ", ":I
1060: 70 22 2c 20 22 3a 49 71 22 2c 20 22 3a 49 73 22  p", ":Iq", ":Is"
1070: 2c 20 22 3a 49 66 22 2c 20 22 3a 4b 22 2c 20 22  , ":If", ":K", "
1080: 3a 53 70 22 2c 20 22 3a 53 71 22 2c 20 22 3a 45  :Sp", ":Sq", ":E
1090: 22 5d 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20  "]:.            
10a0: 20 20 20 20 20 20 20 20 62 46 6f 75 6e 64 20 3d          bFound =
10b0: 20 46 61 6c 73 65 0a 20 20 20 20 20 20 20 20 20   False.         
10c0: 20 20 20 20 20 20 20 20 20 20 20 66 6f 72 20 69             for i
10d0: 2c 20 64 20 69 6e 20 65 6e 75 6d 65 72 61 74 65  , d in enumerate
10e0: 28 64 50 61 74 74 65 72 6e 4c 69 73 74 5b 6b 65  (dPatternList[ke
10f0: 79 5d 29 3a 0a 20 20 20 20 20 20 20 20 20 20 20  y]):.           
1100: 20 20 20 20 20 20 20 20 20 20 20 20 20 69 66 20               if 
1110: 64 43 6f 6e 6a 5b 6b 65 79 5d 20 3d 3d 20 64 3a  dConj[key] == d:
1120: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
1130: 20 20 20 20 20 20 20 20 20 20 20 20 20 62 46 6f               bFo
1140: 75 6e 64 20 3d 20 54 72 75 65 0a 20 20 20 20 20  und = True.     
1150: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1160: 20 20 20 20 20 20 20 6c 43 6f 6e 6a 54 61 67 73         lConjTags
1170: 2e 61 70 70 65 6e 64 28 69 29 0a 20 20 20 20 20  .append(i).     
1180: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1190: 20 20 20 20 20 20 20 62 72 65 61 6b 0a 20 20 20         break.   
11a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
11b0: 20 69 66 20 6e 6f 74 20 62 46 6f 75 6e 64 3a 0a   if not bFound:.
11c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
11d0: 20 20 20 20 20 20 20 20 6c 43 6f 6e 6a 54 61 67          lConjTag
11e0: 73 2e 61 70 70 65 6e 64 28 6c 65 6e 28 64 50 61  s.append(len(dPa
11f0: 74 74 65 72 6e 4c 69 73 74 5b 6b 65 79 5d 29 29  tternList[key]))
1200: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
1210: 20 20 20 20 20 20 20 20 20 64 50 61 74 74 65 72           dPatter
1220: 6e 4c 69 73 74 5b 6b 65 79 5d 2e 61 70 70 65 6e  nList[key].appen
1230: 64 28 64 43 6f 6e 6a 5b 6b 65 79 5d 29 0a 20 20  d(dConj[key]).  
1240: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 74 43                tC
1250: 6f 6e 6a 54 61 67 73 20 3d 20 74 75 70 6c 65 28  onjTags = tuple(
1260: 6c 43 6f 6e 6a 54 61 67 73 29 0a 20 20 20 20 20  lConjTags).     
1270: 20 20 20 20 20 20 20 20 20 20 20 69 66 20 74 43             if tC
1280: 6f 6e 6a 54 61 67 73 20 6e 6f 74 20 69 6e 20 6c  onjTags not in l
1290: 54 61 67 73 3a 0a 20 20 20 20 20 20 20 20 20 20  Tags:.          
12a0: 20 20 20 20 20 20 20 20 20 20 64 54 61 67 73 5b            dTags[
12b0: 74 43 6f 6e 6a 54 61 67 73 5d 20 3d 20 6e 54 61  tConjTags] = nTa
12c0: 67 73 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  gs.             
12d0: 20 20 20 20 20 20 20 6c 54 61 67 73 2e 61 70 70         lTags.app
12e0: 65 6e 64 28 74 43 6f 6e 6a 54 61 67 73 29 0a 20  end(tConjTags). 
12f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1300: 20 20 20 6e 54 61 67 73 20 2b 3d 20 31 0a 20 20     nTags += 1.  
1310: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 64 56                dV
1320: 65 72 62 5b 73 4c 65 6d 6d 61 5d 20 3d 20 28 64  erb[sLemma] = (d
1330: 56 74 79 70 5b 73 56 74 79 70 5d 2c 20 64 54 61  Vtyp[sVtyp], dTa
1340: 67 73 5b 74 43 6f 6e 6a 54 61 67 73 5d 29 0a 20  gs[tConjTags]). 
1350: 20 20 20 20 20 20 20 20 20 20 20 65 6c 73 65 3a             else:
1360: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
1370: 20 70 72 69 6e 74 28 22 23 20 45 72 72 6f 72 20   print("# Error 
1380: 2d 20 75 6e 6b 6e 6f 77 6e 20 6c 69 6e 65 20 23  - unknown line #
1390: 22 2c 20 6e 29 0a 0a 20 20 20 20 23 20 63 6f 6e  ", n)..    # con
13a0: 76 65 72 74 20 74 75 70 6c 65 73 20 74 6f 20 62  vert tuples to b
13b0: 79 74 65 73 20 73 74 72 69 6e 67 0a 20 20 20 20  ytes string.    
13c0: 23 20 73 69 20 c3 a7 61 20 6d 65 72 64 65 2c 20  # si ..a merde, 
13d0: 74 6f 75 74 65 20 6c 61 20 70 61 72 74 69 65 20  toute la partie 
13e0: 63 6f 6e 76 65 72 73 69 6f 6e 20 70 65 75 74 20  conversion peut 
13f0: c3 aa 74 72 65 20 73 75 70 70 72 69 6d c3 a9 65  ..tre supprim..e
1400: 0a 20 20 20 20 23 20 6c 42 79 74 65 73 54 61 67  .    # lBytesTag
1410: 73 20 3d 20 5b 5d 0a 20 20 20 20 23 20 66 6f 72  s = [].    # for
1420: 20 74 20 69 6e 20 6c 54 61 67 73 3a 0a 20 20 20   t in lTags:.   
1430: 20 23 20 20 20 20 20 62 20 3d 20 62 22 22 0a 20   #     b = b"". 
1440: 20 20 20 23 20 20 20 20 20 66 6f 72 20 6e 20 69     #     for n i
1450: 6e 20 74 3a 0a 20 20 20 20 23 20 20 20 20 20 20  n t:.    #      
1460: 20 20 20 69 66 20 6e 20 3e 20 32 35 35 3a 0a 20     if n > 255:. 
1470: 20 20 20 23 20 20 20 20 20 20 20 20 20 20 20 20     #            
1480: 20 70 72 69 6e 74 28 22 45 72 72 65 75 72 20 3a   print("Erreur :
1490: 20 6c 27 69 6e 64 69 63 65 20 6e 65 20 70 65 75   l'indice ne peu
14a0: 74 20 c3 aa 74 72 65 20 73 75 70 c3 a9 72 69 65  t ..tre sup..rie
14b0: 75 72 20 c3 a0 20 32 35 36 20 70 6f 75 72 20 75  ur .. 256 pour u
14c0: 74 69 6c 69 73 65 72 20 64 65 73 20 63 68 61 c3  tiliser des cha.
14d0: ae 6e 65 73 20 64 27 6f 63 74 65 74 73 20 28 62  .nes d'octets (b
14e0: 79 74 65 73 20 73 74 72 69 6e 67 73 29 22 29 0a  ytes strings)").
14f0: 20 20 20 20 23 20 20 20 20 20 20 20 20 20 20 20      #           
1500: 20 20 65 78 69 74 28 29 0a 20 20 20 20 23 20 20    exit().    #  
1510: 20 20 20 20 20 20 20 62 20 2b 3d 20 6e 2e 74 6f         b += n.to
1520: 5f 62 79 74 65 73 28 31 2c 20 62 79 74 65 6f 72  _bytes(1, byteor
1530: 64 65 72 3d 22 62 69 67 22 29 0a 20 20 20 20 23  der="big").    #
1540: 20 20 20 20 20 6c 42 79 74 65 73 54 61 67 73 2e       lBytesTags.
1550: 61 70 70 65 6e 64 28 62 29 0a 20 20 20 20 23 20  append(b).    # 
1560: 6c 54 61 67 73 20 3d 20 6c 42 79 74 65 73 54 61  lTags = lBytesTa
1570: 67 73 0a 0a 20 20 20 20 23 20 66 6f 72 20 6b 65  gs..    # for ke
1580: 79 20 69 6e 20 64 56 65 72 62 2e 6b 65 79 73 28  y in dVerb.keys(
1590: 29 3a 0a 20 20 20 20 23 20 20 20 20 20 62 20 3d  ):.    #     b =
15a0: 20 62 22 22 0a 20 20 20 20 23 20 20 20 20 20 66   b"".    #     f
15b0: 6f 72 20 6e 20 69 6e 20 64 56 65 72 62 5b 6b 65  or n in dVerb[ke
15c0: 79 5d 3a 0a 20 20 20 20 23 20 20 20 20 20 20 20  y]:.    #       
15d0: 20 20 69 66 20 6e 20 3e 20 32 35 35 3a 0a 20 20    if n > 255:.  
15e0: 20 20 23 20 20 20 20 20 20 20 20 20 20 20 20 20    #             
15f0: 70 72 69 6e 74 28 22 45 72 72 65 75 72 20 3a 20  print("Erreur : 
1600: 6c 27 69 6e 64 69 63 65 20 6e 65 20 70 65 75 74  l'indice ne peut
1610: 20 c3 aa 74 72 65 20 73 75 70 c3 a9 72 69 65 75   ..tre sup..rieu
1620: 72 20 c3 a0 20 32 35 36 20 70 6f 75 72 20 75 74  r .. 256 pour ut
1630: 69 6c 69 73 65 72 20 64 65 73 20 63 68 61 c3 ae  iliser des cha..
1640: 6e 65 73 20 64 27 6f 63 74 65 74 73 20 28 62 79  nes d'octets (by
1650: 74 65 73 20 73 74 72 69 6e 67 73 29 22 29 0a 20  tes strings)"). 
1660: 20 20 20 23 20 20 20 20 20 20 20 20 20 20 20 20     #            
1670: 20 65 78 69 74 28 29 0a 20 20 20 20 23 20 20 20   exit().    #   
1680: 20 20 20 20 20 20 62 20 2b 3d 20 6e 2e 74 6f 5f        b += n.to_
1690: 62 79 74 65 73 28 31 2c 20 62 79 74 65 6f 72 64  bytes(1, byteord
16a0: 65 72 3d 22 62 69 67 22 29 0a 20 20 20 20 23 20  er="big").    # 
16b0: 20 20 20 20 64 56 65 72 62 5b 6b 65 79 5d 20 3d      dVerb[key] =
16c0: 20 62 0a 20 20 20 20 23 20 65 6e 64 20 63 6f 6e   b.    # end con
16d0: 76 65 72 73 69 6f 6e 0a 0a 0a 20 20 20 20 23 23  version...    ##
16e0: 20 77 72 69 74 65 20 66 69 6c 65 20 66 6f 72 20   write file for 
16f0: 50 79 74 68 6f 6e 0a 20 20 20 20 73 43 6f 64 65  Python.    sCode
1700: 20 3d 20 22 23 23 20 67 65 6e 65 72 61 74 65 64   = "## generated
1710: 20 64 61 74 61 20 28 64 6f 20 6e 6f 74 20 65 64   data (do not ed
1720: 69 74 29 5c 6e 5c 6e 22 20 2b 20 5c 0a 20 20 20  it)\n\n" + \.   
1730: 20 20 20 20 20 20 20 20 20 22 23 20 49 6e 66 6f           "# Info
1740: 72 6d 61 74 69 6f 6e 73 20 61 62 6f 75 74 20 76  rmations about v
1750: 65 72 62 73 5c 6e 22 20 2b 20 5c 0a 20 20 20 20  erbs\n" + \.    
1760: 20 20 20 20 20 20 20 20 22 6c 56 74 79 70 20 3d          "lVtyp =
1770: 20 22 20 2b 20 73 74 72 28 6c 56 74 79 70 29 20   " + str(lVtyp) 
1780: 2b 20 22 5c 6e 5c 6e 22 20 2b 20 5c 0a 20 20 20  + "\n\n" + \.   
1790: 20 20 20 20 20 20 20 20 20 22 23 20 69 6e 64 65           "# inde
17a0: 78 65 73 20 6f 66 20 74 65 6e 73 65 73 20 69 6e  xes of tenses in
17b0: 20 5f 64 50 61 74 74 65 72 6e 43 6f 6e 6a 5c 6e   _dPatternConj\n
17c0: 22 20 2b 20 5c 0a 20 20 20 20 20 20 20 20 20 20  " + \.          
17d0: 20 20 22 6c 54 61 67 73 20 3d 20 22 20 2b 20 73    "lTags = " + s
17e0: 74 72 28 6c 54 61 67 73 29 20 2b 20 22 5c 6e 5c  tr(lTags) + "\n\
17f0: 6e 22 20 2b 20 5c 0a 20 20 20 20 20 20 20 20 20  n" + \.         
1800: 20 20 20 22 23 20 6c 69 73 74 73 20 6f 66 20 61     "# lists of a
1810: 66 66 69 78 20 63 6f 64 65 73 20 74 6f 20 67 65  ffix codes to ge
1820: 6e 65 72 61 74 65 20 69 6e 66 6c 65 63 74 65 64  nerate inflected
1830: 20 66 6f 72 6d 73 5c 6e 22 20 2b 20 5c 0a 20 20   forms\n" + \.  
1840: 20 20 20 20 20 20 20 20 20 20 22 64 50 61 74 74            "dPatt
1850: 65 72 6e 43 6f 6e 6a 20 3d 20 22 20 2b 20 73 74  ernConj = " + st
1860: 72 28 64 50 61 74 74 65 72 6e 4c 69 73 74 29 20  r(dPatternList) 
1870: 2b 20 22 5c 6e 5c 6e 22 20 2b 20 5c 0a 20 20 20  + "\n\n" + \.   
1880: 20 20 20 20 20 20 20 20 20 22 23 20 64 69 63 74           "# dict
1890: 69 6f 6e 61 72 79 20 6f 66 20 76 65 72 62 73 20  ionary of verbs 
18a0: 3a 20 28 69 6e 64 65 78 20 6f 66 20 56 74 79 70  : (index of Vtyp
18b0: 2c 20 69 6e 64 65 78 20 6f 66 20 54 61 67 73 29  , index of Tags)
18c0: 5c 6e 22 20 2b 20 5c 0a 20 20 20 20 20 20 20 20  \n" + \.        
18d0: 20 20 20 20 22 64 56 65 72 62 20 3d 20 22 20 2b      "dVerb = " +
18e0: 20 73 74 72 28 64 56 65 72 62 29 20 2b 20 22 5c   str(dVerb) + "\
18f0: 6e 22 0a 20 20 20 20 6f 70 65 6e 28 73 70 2b 22  n".    open(sp+"
1900: 2f 6d 6f 64 75 6c 65 73 2f 63 6f 6e 6a 5f 64 61  /modules/conj_da
1910: 74 61 2e 70 79 22 2c 20 22 77 22 2c 20 65 6e 63  ta.py", "w", enc
1920: 6f 64 69 6e 67 3d 22 75 74 66 2d 38 22 2c 20 6e  oding="utf-8", n
1930: 65 77 6c 69 6e 65 3d 22 5c 6e 22 29 2e 77 72 69  ewline="\n").wri
1940: 74 65 28 73 43 6f 64 65 29 0a 0a 20 20 20 20 69  te(sCode)..    i
1950: 66 20 62 4a 53 3a 0a 20 20 20 20 20 20 20 20 23  f bJS:.        #
1960: 23 20 77 72 69 74 65 20 66 69 6c 65 20 66 6f 72  # write file for
1970: 20 4a 61 76 61 53 63 72 69 70 74 0a 20 20 20 20   JavaScript.    
1980: 20 20 20 20 77 69 74 68 20 6f 70 65 6e 28 73 70      with open(sp
1990: 2b 22 2f 6d 6f 64 75 6c 65 73 2d 6a 73 2f 63 6f  +"/modules-js/co
19a0: 6e 6a 5f 64 61 74 61 2e 6a 73 6f 6e 22 2c 20 22  nj_data.json", "
19b0: 77 22 2c 20 65 6e 63 6f 64 69 6e 67 3d 22 75 74  w", encoding="ut
19c0: 66 2d 38 22 2c 20 6e 65 77 6c 69 6e 65 3d 22 5c  f-8", newline="\
19d0: 6e 22 29 20 61 73 20 68 44 73 74 3a 0a 20 20 20  n") as hDst:.   
19e0: 20 20 20 20 20 20 20 20 20 68 44 73 74 2e 77 72           hDst.wr
19f0: 69 74 65 28 22 7b 5c 6e 22 29 0a 20 20 20 20 20  ite("{\n").     
1a00: 20 20 20 20 20 20 20 68 44 73 74 2e 77 72 69 74         hDst.writ
1a10: 65 28 27 20 20 20 20 22 6c 56 74 79 70 22 3a 20  e('    "lVtyp": 
1a20: 27 20 2b 20 6a 73 6f 6e 2e 64 75 6d 70 73 28 6c  ' + json.dumps(l
1a30: 56 74 79 70 2c 20 65 6e 73 75 72 65 5f 61 73 63  Vtyp, ensure_asc
1a40: 69 69 3d 46 61 6c 73 65 29 20 2b 20 22 2c 5c 6e  ii=False) + ",\n
1a50: 22 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 68  ").            h
1a60: 44 73 74 2e 77 72 69 74 65 28 27 20 20 20 20 22  Dst.write('    "
1a70: 6c 54 61 67 73 22 3a 20 27 20 2b 20 6a 73 6f 6e  lTags": ' + json
1a80: 2e 64 75 6d 70 73 28 6c 54 61 67 73 2c 20 65 6e  .dumps(lTags, en
1a90: 73 75 72 65 5f 61 73 63 69 69 3d 46 61 6c 73 65  sure_ascii=False
1aa0: 29 20 2b 20 22 2c 5c 6e 22 29 0a 20 20 20 20 20  ) + ",\n").     
1ab0: 20 20 20 20 20 20 20 68 44 73 74 2e 77 72 69 74         hDst.writ
1ac0: 65 28 27 20 20 20 20 22 64 50 61 74 74 65 72 6e  e('    "dPattern
1ad0: 43 6f 6e 6a 22 3a 20 27 20 2b 20 6a 73 6f 6e 2e  Conj": ' + json.
1ae0: 64 75 6d 70 73 28 64 50 61 74 74 65 72 6e 4c 69  dumps(dPatternLi
1af0: 73 74 2c 20 65 6e 73 75 72 65 5f 61 73 63 69 69  st, ensure_ascii
1b00: 3d 46 61 6c 73 65 29 20 2b 20 22 2c 5c 6e 22 29  =False) + ",\n")
1b10: 0a 20 20 20 20 20 20 20 20 20 20 20 20 68 44 73  .            hDs
1b20: 74 2e 77 72 69 74 65 28 27 20 20 20 20 22 64 56  t.write('    "dV
1b30: 65 72 62 22 3a 20 27 20 2b 20 6a 73 6f 6e 2e 64  erb": ' + json.d
1b40: 75 6d 70 73 28 64 56 65 72 62 2c 20 65 6e 73 75  umps(dVerb, ensu
1b50: 72 65 5f 61 73 63 69 69 3d 46 61 6c 73 65 29 20  re_ascii=False) 
1b60: 2b 20 22 5c 6e 22 29 0a 20 20 20 20 20 20 20 20  + "\n").        
1b70: 20 20 20 20 68 44 73 74 2e 77 72 69 74 65 28 22      hDst.write("
1b80: 7d 5c 6e 22 29 0a 0a 0a 64 65 66 20 6d 61 6b 65  }\n")...def make
1b90: 4d 66 73 70 20 28 73 70 2c 20 62 4a 53 3d 46 61  Mfsp (sp, bJS=Fa
1ba0: 6c 73 65 29 3a 0a 20 20 20 20 70 72 69 6e 74 28  lse):.    print(
1bb0: 22 3e 20 50 6c 75 72 69 65 6c 2f 73 69 6e 67 75  "> Pluriel/singu
1bc0: 6c 69 65 72 2f 6d 61 73 63 75 6c 69 6e 2f 66 c3  lier/masculin/f.
1bd0: a9 6d 69 6e 69 6e 20 22 2c 20 65 6e 64 3d 22 22  .minin ", end=""
1be0: 29 0a 20 20 20 20 70 72 69 6e 74 28 22 28 50 79  ).    print("(Py
1bf0: 74 68 6f 6e 20 65 74 20 4a 61 76 61 53 63 72 69  thon et JavaScri
1c00: 70 74 29 22 20 20 69 66 20 62 4a 53 20 20 65 6c  pt)"  if bJS  el
1c10: 73 65 20 22 28 50 79 74 68 6f 6e 20 73 65 75 6c  se "(Python seul
1c20: 65 6d 65 6e 74 29 22 29 0a 20 20 20 20 61 50 6c  ement)").    aPl
1c30: 75 72 53 20 3d 20 73 65 74 28 29 0a 20 20 20 20  urS = set().    
1c40: 64 54 61 67 20 3d 20 7b 7d 0a 20 20 20 20 6c 54  dTag = {}.    lT
1c50: 61 67 4d 61 73 46 6f 72 6d 20 3d 20 5b 5d 0a 20  agMasForm = []. 
1c60: 20 20 20 6c 54 61 67 4d 69 73 63 50 6c 75 72 20     lTagMiscPlur 
1c70: 3d 20 5b 5d 0a 20 20 20 20 64 4d 69 73 63 50 6c  = [].    dMiscPl
1c80: 75 72 20 3d 20 7b 7d 0a 20 20 20 20 64 4d 61 73  ur = {}.    dMas
1c90: 46 6f 72 6d 20 3d 20 7b 7d 0a 20 20 20 20 23 20  Form = {}.    # 
1ca0: 72 65 61 64 20 6c 65 78 69 63 6f 6e 0a 20 20 20  read lexicon.   
1cb0: 20 77 69 74 68 20 6f 70 65 6e 28 73 70 2b 22 2f   with open(sp+"/
1cc0: 64 61 74 61 2f 64 69 63 74 44 65 63 6c 2e 74 78  data/dictDecl.tx
1cd0: 74 22 2c 20 27 72 27 2c 20 65 6e 63 6f 64 69 6e  t", 'r', encodin
1ce0: 67 3d 27 75 74 66 2d 38 27 29 20 61 73 20 68 53  g='utf-8') as hS
1cf0: 72 63 3a 0a 20 20 20 20 20 20 20 20 6c 54 61 67  rc:.        lTag
1d00: 20 3d 20 5b 5d 0a 20 20 20 20 20 20 20 20 6c 54   = [].        lT
1d10: 61 67 4d 61 73 50 6c 20 3d 20 5b 5d 0a 20 20 20  agMasPl = [].   
1d20: 20 20 20 20 20 66 6f 72 20 6e 2c 20 6c 69 6e 65       for n, line
1d30: 20 69 6e 20 65 6e 75 6d 65 72 61 74 65 28 68 53   in enumerate(hS
1d40: 72 63 2e 72 65 61 64 6c 69 6e 65 73 28 29 29 3a  rc.readlines()):
1d50: 0a 20 20 20 20 20 20 20 20 20 20 20 20 6c 69 6e  .            lin
1d60: 65 20 3d 20 6c 69 6e 65 2e 73 74 72 69 70 28 29  e = line.strip()
1d70: 0a 20 20 20 20 20 20 20 20 20 20 20 20 6e 54 61  .            nTa
1d80: 62 20 3d 20 6c 69 6e 65 2e 63 6f 75 6e 74 28 22  b = line.count("
1d90: 5c 74 22 29 0a 20 20 20 20 20 20 20 20 20 20 20  \t").           
1da0: 20 69 66 20 6e 54 61 62 20 3d 3d 20 31 3a 0a 20   if nTab == 1:. 
1db0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 23                 #
1dc0: 20 6e 65 77 20 65 6e 74 72 79 0a 20 20 20 20 20   new entry.     
1dd0: 20 20 20 20 20 20 20 20 20 20 20 6c 54 61 67 2e             lTag.
1de0: 63 6c 65 61 72 28 29 0a 20 20 20 20 20 20 20 20  clear().        
1df0: 20 20 20 20 20 20 20 20 6c 54 61 67 4d 61 73 50          lTagMasP
1e00: 6c 2e 63 6c 65 61 72 28 29 0a 20 20 20 20 20 20  l.clear().      
1e10: 20 20 20 20 20 20 20 20 20 20 73 4c 65 6d 6d 61            sLemma
1e20: 2c 20 73 46 6c 61 67 73 20 3d 20 6c 69 6e 65 2e  , sFlags = line.
1e30: 73 70 6c 69 74 28 22 5c 74 22 29 0a 20 20 20 20  split("\t").    
1e40: 20 20 20 20 20 20 20 20 20 20 20 20 69 66 20 73              if s
1e50: 46 6c 61 67 73 2e 73 74 61 72 74 73 77 69 74 68  Flags.startswith
1e60: 28 22 53 22 29 3a 0a 20 20 20 20 20 20 20 20 20  ("S"):.         
1e70: 20 20 20 20 20 20 20 20 20 20 20 63 54 79 70 65             cType
1e80: 20 3d 20 22 73 22 0a 20 20 20 20 20 20 20 20 20   = "s".         
1e90: 20 20 20 20 20 20 20 65 6c 69 66 20 73 46 6c 61         elif sFla
1ea0: 67 73 2e 73 74 61 72 74 73 77 69 74 68 28 22 58  gs.startswith("X
1eb0: 22 29 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20  "):.            
1ec0: 20 20 20 20 20 20 20 20 63 54 79 70 65 20 3d 20          cType = 
1ed0: 22 70 22 0a 20 20 20 20 20 20 20 20 20 20 20 20  "p".            
1ee0: 20 20 20 20 65 6c 69 66 20 73 46 6c 61 67 73 2e      elif sFlags.
1ef0: 73 74 61 72 74 73 77 69 74 68 28 22 41 22 29 3a  startswith("A"):
1f00: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
1f10: 20 20 20 20 20 63 54 79 70 65 20 3d 20 22 70 22       cType = "p"
1f20: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
1f30: 20 65 6c 69 66 20 73 46 6c 61 67 73 2e 73 74 61   elif sFlags.sta
1f40: 72 74 73 77 69 74 68 28 22 49 22 29 3a 0a 20 20  rtswith("I"):.  
1f50: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
1f60: 20 20 63 54 79 70 65 20 3d 20 22 70 22 0a 20 20    cType = "p".  
1f70: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 65 6c                el
1f80: 69 66 20 73 46 6c 61 67 73 2e 73 74 61 72 74 73  if sFlags.starts
1f90: 77 69 74 68 28 22 46 22 29 3a 0a 20 20 20 20 20  with("F"):.     
1fa0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 63                 c
1fb0: 54 79 70 65 20 3d 20 22 6d 22 0a 20 20 20 20 20  Type = "m".     
1fc0: 20 20 20 20 20 20 20 20 20 20 20 65 6c 69 66 20             elif 
1fd0: 73 46 6c 61 67 73 2e 73 74 61 72 74 73 77 69 74  sFlags.startswit
1fe0: 68 28 22 57 22 29 3a 0a 20 20 20 20 20 20 20 20  h("W"):.        
1ff0: 20 20 20 20 20 20 20 20 20 20 20 20 63 54 79 70              cTyp
2000: 65 20 3d 20 22 6d 22 0a 20 20 20 20 20 20 20 20  e = "m".        
2010: 20 20 20 20 20 20 20 20 65 6c 73 65 3a 0a 20 20          else:.  
2020: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2030: 20 20 63 54 79 70 65 20 3d 20 22 3f 22 0a 20 20    cType = "?".  
2040: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2050: 20 20 70 72 69 6e 74 28 22 20 3e 20 69 6e 63 6f    print(" > inco
2060: 6e 6e 75 20 3a 20 22 20 2b 20 73 46 6c 61 67 73  nnu : " + sFlags
2070: 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 65 6c  ).            el
2080: 69 66 20 6e 54 61 62 20 3d 3d 20 32 3a 0a 20 20  if nTab == 2:.  
2090: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 69 66                if
20a0: 20 63 54 79 70 65 20 3d 3d 20 22 73 22 3a 0a 20   cType == "s":. 
20b0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
20c0: 20 20 20 63 6f 6e 74 69 6e 75 65 0a 20 20 20 20     continue.    
20d0: 20 20 20 20 20 20 20 20 20 20 20 20 5f 2c 20 73              _, s
20e0: 46 6c 65 78 54 61 67 73 2c 20 73 46 6c 65 78 20  FlexTags, sFlex 
20f0: 3d 20 6c 69 6e 65 2e 73 70 6c 69 74 28 22 5c 74  = line.split("\t
2100: 22 29 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  ").             
2110: 20 20 20 69 66 20 63 54 79 70 65 20 3d 3d 20 22     if cType == "
2120: 70 22 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20  p":.            
2130: 20 20 20 20 20 20 20 20 69 66 20 73 46 6c 65 78          if sFlex
2140: 54 61 67 73 2e 65 6e 64 73 77 69 74 68 28 22 70  Tags.endswith("p
2150: 6c 22 29 3a 0a 20 20 20 20 20 20 20 20 20 20 20  l"):.           
2160: 20 20 20 20 20 20 20 20 20 20 20 20 20 6c 54 61               lTa
2170: 67 2e 61 70 70 65 6e 64 28 64 65 66 69 6e 65 53  g.append(defineS
2180: 75 66 66 69 78 43 6f 64 65 28 73 4c 65 6d 6d 61  uffixCode(sLemma
2190: 2c 20 73 46 6c 65 78 29 29 0a 20 20 20 20 20 20  , sFlex)).      
21a0: 20 20 20 20 20 20 20 20 20 20 65 6c 69 66 20 63            elif c
21b0: 54 79 70 65 20 3d 3d 20 22 6d 22 3a 0a 20 20 20  Type == "m":.   
21c0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
21d0: 20 69 66 20 73 46 6c 65 78 54 61 67 73 2e 65 6e   if sFlexTags.en
21e0: 64 73 77 69 74 68 28 22 6d 61 73 20 73 67 22 29  dswith("mas sg")
21f0: 20 6f 72 20 73 46 6c 65 78 54 61 67 73 2e 65 6e   or sFlexTags.en
2200: 64 73 77 69 74 68 28 22 6d 61 73 20 69 6e 76 22  dswith("mas inv"
2210: 29 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  ):.             
2220: 20 20 20 20 20 20 20 20 20 20 20 6c 54 61 67 2e             lTag.
2230: 61 70 70 65 6e 64 28 64 65 66 69 6e 65 53 75 66  append(defineSuf
2240: 66 69 78 43 6f 64 65 28 73 4c 65 6d 6d 61 2c 20  fixCode(sLemma, 
2250: 73 46 6c 65 78 29 29 0a 20 20 20 20 20 20 20 20  sFlex)).        
2260: 20 20 20 20 20 20 20 20 20 20 20 20 69 66 20 73              if s
2270: 46 6c 65 78 54 61 67 73 2e 65 6e 64 73 77 69 74  FlexTags.endswit
2280: 68 28 22 6d 61 73 20 70 6c 22 29 3a 0a 20 20 20  h("mas pl"):.   
2290: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
22a0: 20 20 20 20 20 6c 54 61 67 4d 61 73 50 6c 2e 61       lTagMasPl.a
22b0: 70 70 65 6e 64 28 64 65 66 69 6e 65 53 75 66 66  ppend(defineSuff
22c0: 69 78 43 6f 64 65 28 73 4c 65 6d 6d 61 2c 20 73  ixCode(sLemma, s
22d0: 46 6c 65 78 29 29 0a 20 20 20 20 20 20 20 20 20  Flex)).         
22e0: 20 20 20 20 20 20 20 65 6c 73 65 3a 0a 20 20 20         else:.   
22f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2300: 20 70 72 69 6e 74 28 22 65 72 72 65 75 72 3a 20   print("erreur: 
2310: 22 20 2b 20 63 54 79 70 65 29 0a 20 20 20 20 20  " + cType).     
2320: 20 20 20 20 20 20 20 65 6c 69 66 20 6c 69 6e 65         elif line
2330: 20 3d 3d 20 22 24 22 3a 0a 20 20 20 20 20 20 20   == "$":.       
2340: 20 20 20 20 20 20 20 20 20 69 66 20 63 54 79 70           if cTyp
2350: 65 20 3d 3d 20 22 73 22 3a 0a 20 20 20 20 20 20  e == "s":.      
2360: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 61 50                aP
2370: 6c 75 72 53 2e 61 64 64 28 73 4c 65 6d 6d 61 29  lurS.add(sLemma)
2380: 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20  .               
2390: 20 65 6c 69 66 20 63 54 79 70 65 20 3d 3d 20 22   elif cType == "
23a0: 70 22 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20  p":.            
23b0: 20 20 20 20 20 20 20 20 73 54 61 67 20 3d 20 22          sTag = "
23c0: 7c 22 2e 6a 6f 69 6e 28 6c 54 61 67 29 0a 20 20  |".join(lTag).  
23d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
23e0: 20 20 69 66 20 73 54 61 67 20 6e 6f 74 20 69 6e    if sTag not in
23f0: 20 64 54 61 67 3a 0a 20 20 20 20 20 20 20 20 20   dTag:.         
2400: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 64                 d
2410: 54 61 67 5b 73 54 61 67 5d 20 3d 20 6c 65 6e 28  Tag[sTag] = len(
2420: 6c 54 61 67 4d 69 73 63 50 6c 75 72 29 0a 20 20  lTagMiscPlur).  
2430: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2440: 20 20 20 20 20 20 6c 54 61 67 4d 69 73 63 50 6c        lTagMiscPl
2450: 75 72 2e 61 70 70 65 6e 64 28 73 54 61 67 29 0a  ur.append(sTag).
2460: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2470: 20 20 20 20 64 4d 69 73 63 50 6c 75 72 5b 73 4c      dMiscPlur[sL
2480: 65 6d 6d 61 5d 20 3d 20 64 54 61 67 5b 73 54 61  emma] = dTag[sTa
2490: 67 5d 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  g].             
24a0: 20 20 20 65 6c 69 66 20 63 54 79 70 65 20 3d 3d     elif cType ==
24b0: 20 22 6d 22 3a 0a 20 20 20 20 20 20 20 20 20 20   "m":.          
24c0: 20 20 20 20 20 20 20 20 20 20 73 54 61 67 20 3d            sTag =
24d0: 20 22 7c 22 2e 6a 6f 69 6e 28 6c 54 61 67 29 0a   "|".join(lTag).
24e0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
24f0: 20 20 20 20 69 66 20 6c 54 61 67 4d 61 73 50 6c      if lTagMasPl
2500: 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  :.              
2510: 20 20 20 20 20 20 20 20 20 20 73 54 61 67 20 2b            sTag +
2520: 3d 20 22 2f 22 20 2b 20 22 7c 22 2e 6a 6f 69 6e  = "/" + "|".join
2530: 28 6c 54 61 67 4d 61 73 50 6c 29 0a 20 20 20 20  (lTagMasPl).    
2540: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2550: 69 66 20 73 54 61 67 20 6e 6f 74 20 69 6e 20 64  if sTag not in d
2560: 54 61 67 3a 0a 20 20 20 20 20 20 20 20 20 20 20  Tag:.           
2570: 20 20 20 20 20 20 20 20 20 20 20 20 20 64 54 61               dTa
2580: 67 5b 73 54 61 67 5d 20 3d 20 6c 65 6e 28 6c 54  g[sTag] = len(lT
2590: 61 67 4d 61 73 46 6f 72 6d 29 0a 20 20 20 20 20  agMasForm).     
25a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
25b0: 20 20 20 6c 54 61 67 4d 61 73 46 6f 72 6d 2e 61     lTagMasForm.a
25c0: 70 70 65 6e 64 28 73 54 61 67 29 0a 20 20 20 20  ppend(sTag).    
25d0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
25e0: 64 4d 61 73 46 6f 72 6d 5b 73 4c 65 6d 6d 61 5d  dMasForm[sLemma]
25f0: 20 3d 20 64 54 61 67 5b 73 54 61 67 5d 0a 20 20   = dTag[sTag].  
2600: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 65 6c                el
2610: 73 65 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20  se:.            
2620: 20 20 20 20 20 20 20 20 70 72 69 6e 74 28 22 75          print("u
2630: 6e 6b 6e 6f 77 6e 20 74 61 67 3a 20 22 20 2b 20  nknown tag: " + 
2640: 63 74 79 70 65 29 0a 20 20 20 20 20 20 20 20 20  ctype).         
2650: 20 20 20 65 6c 73 65 3a 0a 20 20 20 20 20 20 20     else:.       
2660: 20 20 20 20 20 20 20 20 20 70 72 69 6e 74 28 22           print("
2670: 23 20 45 72 72 6f 72 20 2d 20 75 6e 6b 6e 6f 77  # Error - unknow
2680: 6e 20 6c 69 6e 65 20 23 22 2c 20 6e 29 0a 0a 20  n line #", n).. 
2690: 20 20 20 23 23 20 77 72 69 74 65 20 66 69 6c 65     ## write file
26a0: 20 66 6f 72 20 50 79 74 68 6f 6e 0a 20 20 20 20   for Python.    
26b0: 73 43 6f 64 65 20 3d 20 22 23 20 67 65 6e 65 72  sCode = "# gener
26c0: 61 74 65 64 20 64 61 74 61 20 28 64 6f 20 6e 6f  ated data (do no
26d0: 74 20 65 64 69 74 29 5c 6e 5c 6e 22 20 2b 20 5c  t edit)\n\n" + \
26e0: 0a 20 20 20 20 20 20 20 20 20 20 20 20 22 23 20  .            "# 
26f0: 6c 69 73 74 20 6f 66 20 61 66 66 69 78 20 63 6f  list of affix co
2700: 64 65 73 5c 6e 22 20 2b 20 5c 0a 20 20 20 20 20  des\n" + \.     
2710: 20 20 20 20 20 20 20 22 6c 54 61 67 4d 69 73 63         "lTagMisc
2720: 50 6c 75 72 20 3d 20 22 20 2b 20 73 74 72 28 6c  Plur = " + str(l
2730: 54 61 67 4d 69 73 63 50 6c 75 72 29 20 2b 20 22  TagMiscPlur) + "
2740: 5c 6e 22 20 2b 20 5c 0a 20 20 20 20 20 20 20 20  \n" + \.        
2750: 20 20 20 20 22 6c 54 61 67 4d 61 73 46 6f 72 6d      "lTagMasForm
2760: 20 3d 20 22 20 2b 20 73 74 72 28 6c 54 61 67 4d   = " + str(lTagM
2770: 61 73 46 6f 72 6d 29 20 2b 20 22 5c 6e 5c 6e 22  asForm) + "\n\n"
2780: 20 2b 20 5c 0a 20 20 20 20 20 20 20 20 20 20 20   + \.           
2790: 20 22 23 20 64 69 63 74 69 6f 6e 61 72 79 20 6f   "# dictionary o
27a0: 66 20 77 6f 72 64 73 20 77 69 74 68 20 75 6e 63  f words with unc
27b0: 6f 6d 6d 6f 6e 20 70 6c 75 72 61 6c 73 20 28 2d  ommon plurals (-
27c0: 78 2c 20 2d 75 78 2c 20 65 6e 67 6c 69 73 68 2c  x, -ux, english,
27d0: 20 6c 61 74 69 6e 20 61 6e 64 20 69 74 61 6c 69   latin and itali
27e0: 61 6e 20 70 6c 75 72 61 6c 73 29 20 61 6e 64 20  an plurals) and 
27f0: 74 61 67 73 20 74 6f 20 67 65 6e 65 72 61 74 65  tags to generate
2800: 20 74 68 65 6d 5c 6e 22 20 2b 20 5c 0a 20 20 20   them\n" + \.   
2810: 20 20 20 20 20 20 20 20 20 22 64 4d 69 73 63 50           "dMiscP
2820: 6c 75 72 20 3d 20 22 20 2b 20 73 74 72 28 64 4d  lur = " + str(dM
2830: 69 73 63 50 6c 75 72 29 20 2b 20 22 5c 6e 5c 6e  iscPlur) + "\n\n
2840: 22 20 2b 20 5c 0a 20 20 20 20 20 20 20 20 20 20  " + \.          
2850: 20 20 22 23 20 64 69 63 74 69 6f 6e 61 72 79 20    "# dictionary 
2860: 6f 66 20 66 65 6d 69 6e 69 6e 65 20 66 6f 72 6d  of feminine form
2870: 73 20 61 6e 64 20 74 61 67 73 20 74 6f 20 67 65  s and tags to ge
2880: 6e 65 72 61 74 65 20 6d 61 73 63 75 6c 69 6e 65  nerate masculine
2890: 20 66 6f 72 6d 73 20 28 73 69 6e 67 75 6c 61 72   forms (singular
28a0: 20 61 6e 64 20 70 6c 75 72 61 6c 29 5c 6e 22 20   and plural)\n" 
28b0: 2b 20 5c 0a 20 20 20 20 20 20 20 20 20 20 20 20  + \.            
28c0: 22 64 4d 61 73 46 6f 72 6d 20 3d 20 22 20 2b 20  "dMasForm = " + 
28d0: 73 74 72 28 64 4d 61 73 46 6f 72 6d 29 20 2b 20  str(dMasForm) + 
28e0: 22 5c 6e 22 0a 20 20 20 20 6f 70 65 6e 28 73 70  "\n".    open(sp
28f0: 2b 22 2f 6d 6f 64 75 6c 65 73 2f 6d 66 73 70 5f  +"/modules/mfsp_
2900: 64 61 74 61 2e 70 79 22 2c 20 22 77 22 2c 20 65  data.py", "w", e
2910: 6e 63 6f 64 69 6e 67 3d 22 75 74 66 2d 38 22 2c  ncoding="utf-8",
2920: 20 6e 65 77 6c 69 6e 65 3d 22 5c 6e 22 29 2e 77   newline="\n").w
2930: 72 69 74 65 28 73 43 6f 64 65 29 0a 0a 20 20 20  rite(sCode)..   
2940: 20 69 66 20 62 4a 53 3a 0a 20 20 20 20 20 20 20   if bJS:.       
2950: 20 23 23 20 77 72 69 74 65 20 66 69 6c 65 20 66   ## write file f
2960: 6f 72 20 4a 61 76 61 53 63 72 69 70 74 0a 20 20  or JavaScript.  
2970: 20 20 20 20 20 20 73 43 6f 64 65 20 3d 20 27 7b        sCode = '{
2980: 5c 6e 27 20 2b 20 5c 0a 20 20 20 20 20 20 20 20  \n' + \.        
2990: 20 20 20 20 20 20 20 20 27 20 20 20 20 22 6c 54          '    "lT
29a0: 61 67 4d 69 73 63 50 6c 75 72 22 3a 20 27 20 2b  agMiscPlur": ' +
29b0: 20 20 6a 73 6f 6e 2e 64 75 6d 70 73 28 6c 54 61    json.dumps(lTa
29c0: 67 4d 69 73 63 50 6c 75 72 2c 20 65 6e 73 75 72  gMiscPlur, ensur
29d0: 65 5f 61 73 63 69 69 3d 46 61 6c 73 65 29 20 2b  e_ascii=False) +
29e0: 20 22 2c 5c 6e 22 20 2b 20 5c 0a 20 20 20 20 20   ",\n" + \.     
29f0: 20 20 20 20 20 20 20 20 20 20 20 27 20 20 20 20             '    
2a00: 22 6c 54 61 67 4d 61 73 46 6f 72 6d 22 3a 20 27  "lTagMasForm": '
2a10: 20 2b 20 20 6a 73 6f 6e 2e 64 75 6d 70 73 28 6c   +  json.dumps(l
2a20: 54 61 67 4d 61 73 46 6f 72 6d 2c 20 65 6e 73 75  TagMasForm, ensu
2a30: 72 65 5f 61 73 63 69 69 3d 46 61 6c 73 65 29 20  re_ascii=False) 
2a40: 2b 20 22 2c 5c 6e 22 20 2b 20 5c 0a 20 20 20 20  + ",\n" + \.    
2a50: 20 20 20 20 20 20 20 20 20 20 20 20 27 20 20 20              '   
2a60: 20 22 64 4d 69 73 63 50 6c 75 72 22 3a 20 27 20   "dMiscPlur": ' 
2a70: 2b 20 20 6a 73 6f 6e 2e 64 75 6d 70 73 28 64 4d  +  json.dumps(dM
2a80: 69 73 63 50 6c 75 72 2c 20 65 6e 73 75 72 65 5f  iscPlur, ensure_
2a90: 61 73 63 69 69 3d 46 61 6c 73 65 29 20 2b 20 22  ascii=False) + "
2aa0: 2c 5c 6e 22 20 2b 20 5c 0a 20 20 20 20 20 20 20  ,\n" + \.       
2ab0: 20 20 20 20 20 20 20 20 20 27 20 20 20 20 22 64           '    "d
2ac0: 4d 61 73 46 6f 72 6d 22 3a 20 27 20 2b 20 20 6a  MasForm": ' +  j
2ad0: 73 6f 6e 2e 64 75 6d 70 73 28 64 4d 61 73 46 6f  son.dumps(dMasFo
2ae0: 72 6d 2c 20 65 6e 73 75 72 65 5f 61 73 63 69 69  rm, ensure_ascii
2af0: 3d 46 61 6c 73 65 29 20 2b 20 22 5c 6e 7d 22 0a  =False) + "\n}".
2b00: 20 20 20 20 20 20 20 20 6f 70 65 6e 28 73 70 2b          open(sp+
2b10: 22 2f 6d 6f 64 75 6c 65 73 2d 6a 73 2f 6d 66 73  "/modules-js/mfs
2b20: 70 5f 64 61 74 61 2e 6a 73 6f 6e 22 2c 20 22 77  p_data.json", "w
2b30: 22 2c 20 65 6e 63 6f 64 69 6e 67 3d 22 75 74 66  ", encoding="utf
2b40: 2d 38 22 2c 20 6e 65 77 6c 69 6e 65 3d 22 5c 6e  -8", newline="\n
2b50: 22 29 2e 77 72 69 74 65 28 73 43 6f 64 65 29 0a  ").write(sCode).
2b60: 0a 0a 64 65 66 20 6d 61 6b 65 50 68 6f 6e 65 74  ..def makePhonet
2b70: 54 61 62 6c 65 20 28 73 70 2c 20 62 4a 53 3d 46  Table (sp, bJS=F
2b80: 61 6c 73 65 29 3a 0a 20 20 20 20 70 72 69 6e 74  alse):.    print
2b90: 28 22 3e 20 43 6f 72 72 65 73 70 6f 6e 64 61 6e  ("> Correspondan
2ba0: 63 65 73 20 70 68 6f 6e c3 a9 74 69 71 75 65 73  ces phon..tiques
2bb0: 20 22 2c 20 65 6e 64 3d 22 22 29 0a 20 20 20 20   ", end="").    
2bc0: 70 72 69 6e 74 28 22 28 50 79 74 68 6f 6e 20 65  print("(Python e
2bd0: 74 20 4a 61 76 61 53 63 72 69 70 74 29 22 20 20  t JavaScript)"  
2be0: 69 66 20 62 4a 53 20 20 65 6c 73 65 20 22 28 50  if bJS  else "(P
2bf0: 79 74 68 6f 6e 20 73 65 75 6c 65 6d 65 6e 74 29  ython seulement)
2c00: 22 29 0a 20 20 20 20 0a 20 20 20 20 74 72 79 3a  ").    .    try:
2c10: 0a 20 20 20 20 20 20 20 20 6f 44 69 63 74 20 3d  .        oDict =
2c20: 20 69 62 64 61 77 67 2e 49 42 44 41 57 47 28 22   ibdawg.IBDAWG("
2c30: 46 72 65 6e 63 68 2e 62 64 69 63 22 29 0a 20 20  French.bdic").  
2c40: 20 20 65 78 63 65 70 74 3a 0a 20 20 20 20 20 20    except:.      
2c50: 20 20 74 72 61 63 65 62 61 63 6b 2e 70 72 69 6e    traceback.prin
2c60: 74 5f 65 78 63 28 29 0a 20 20 20 20 20 20 20 20  t_exc().        
2c70: 72 65 74 75 72 6e 0a 0a 20 20 20 20 77 69 74 68  return..    with
2c80: 20 6f 70 65 6e 28 73 70 2b 22 2f 64 61 74 61 2f   open(sp+"/data/
2c90: 70 68 6f 6e 65 74 5f 73 69 6d 69 6c 2e 74 78 74  phonet_simil.txt
2ca0: 22 2c 20 27 72 27 2c 20 65 6e 63 6f 64 69 6e 67  ", 'r', encoding
2cb0: 3d 27 75 74 66 2d 38 27 29 20 61 73 20 68 53 72  ='utf-8') as hSr
2cc0: 63 3a 0a 20 20 20 20 20 20 20 20 23 20 73 65 74  c:.        # set
2cd0: 20 6f 66 20 68 6f 6d 6f 70 68 6f 6e 69 63 20 77   of homophonic w
2ce0: 6f 72 64 73 0a 20 20 20 20 20 20 20 20 6c 53 65  ords.        lSe
2cf0: 74 20 3d 20 5b 5d 0a 20 20 20 20 20 20 20 20 66  t = [].        f
2d00: 6f 72 20 73 4c 69 6e 65 20 69 6e 20 68 53 72 63  or sLine in hSrc
2d10: 2e 72 65 61 64 6c 69 6e 65 73 28 29 3a 0a 20 20  .readlines():.  
2d20: 20 20 20 20 20 20 20 20 20 20 69 66 20 6e 6f 74            if not
2d30: 20 73 4c 69 6e 65 2e 73 74 61 72 74 73 77 69 74   sLine.startswit
2d40: 68 28 22 23 22 29 20 61 6e 64 20 73 4c 69 6e 65  h("#") and sLine
2d50: 2e 73 74 72 69 70 28 29 3a 0a 20 20 20 20 20 20  .strip():.      
2d60: 20 20 20 20 20 20 20 20 20 20 61 57 6f 72 64 20            aWord 
2d70: 3d 20 73 65 74 28 73 4c 69 6e 65 2e 73 74 72 69  = set(sLine.stri
2d80: 70 28 29 2e 73 70 6c 69 74 28 29 29 0a 20 20 20  p().split()).   
2d90: 20 20 20 20 20 20 20 20 20 20 20 20 20 61 4d 6f               aMo
2da0: 72 65 20 3d 20 73 65 74 28 29 0a 20 20 20 20 20  re = set().     
2db0: 20 20 20 20 20 20 20 20 20 20 20 66 6f 72 20 73             for s
2dc0: 57 6f 72 64 20 69 6e 20 61 57 6f 72 64 3a 0a 20  Word in aWord:. 
2dd0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2de0: 20 20 20 69 66 20 73 57 6f 72 64 2e 65 6e 64 73     if sWord.ends
2df0: 77 69 74 68 28 22 65 72 22 29 20 61 6e 64 20 63  with("er") and c
2e00: 6f 6e 6a 2e 69 73 56 65 72 62 28 73 57 6f 72 64  onj.isVerb(sWord
2e10: 29 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20 20  ):.             
2e20: 20 20 20 20 20 20 20 20 20 20 20 61 4d 6f 72 65             aMore
2e30: 20 3d 20 61 4d 6f 72 65 2e 75 6e 69 6f 6e 28 63   = aMore.union(c
2e40: 6f 6e 6a 2e 67 65 74 43 6f 6e 6a 53 69 6d 69 6c  onj.getConjSimil
2e50: 49 6e 66 69 56 31 28 73 57 6f 72 64 29 29 0a 20  InfiV1(sWord)). 
2e60: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 61                 a
2e70: 57 6f 72 64 20 3d 20 61 57 6f 72 64 2e 75 6e 69  Word = aWord.uni
2e80: 6f 6e 28 61 4d 6f 72 65 29 0a 20 20 20 20 20 20  on(aMore).      
2e90: 20 20 20 20 20 20 20 20 20 20 6c 53 65 74 2e 61            lSet.a
2ea0: 70 70 65 6e 64 28 61 57 6f 72 64 29 0a 20 20 20  ppend(aWord).   
2eb0: 20 20 20 20 20 23 20 64 69 63 74 69 6f 6e 61 72       # dictionar
2ec0: 79 20 6f 66 20 77 6f 72 64 73 0a 20 20 20 20 20  y of words.     
2ed0: 20 20 20 64 57 6f 72 64 20 3d 20 7b 7d 0a 20 20     dWord = {}.  
2ee0: 20 20 20 20 20 20 66 6f 72 20 69 2c 20 61 53 65        for i, aSe
2ef0: 74 20 69 6e 20 65 6e 75 6d 65 72 61 74 65 28 6c  t in enumerate(l
2f00: 53 65 74 29 3a 0a 20 20 20 20 20 20 20 20 20 20  Set):.          
2f10: 20 20 66 6f 72 20 73 57 6f 72 64 20 69 6e 20 61    for sWord in a
2f20: 53 65 74 3a 0a 20 20 20 20 20 20 20 20 20 20 20  Set:.           
2f30: 20 20 20 20 20 69 66 20 6f 44 69 63 74 2e 6c 6f       if oDict.lo
2f40: 6f 6b 75 70 28 73 57 6f 72 64 29 3a 0a 20 20 20  okup(sWord):.   
2f50: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2f60: 20 64 57 6f 72 64 5b 73 57 6f 72 64 5d 20 3d 20   dWord[sWord] = 
2f70: 69 20 20 23 20 77 61 72 6e 69 6e 67 2c 20 77 68  i  # warning, wh
2f80: 61 74 20 69 66 20 77 6f 72 64 20 69 6e 20 73 65  at if word in se
2f90: 76 65 72 61 6c 20 73 65 74 73 3f 0a 20 20 20 20  veral sets?.    
2fa0: 20 20 20 20 20 20 20 20 20 20 20 20 65 6c 73 65              else
2fb0: 3a 0a 20 20 20 20 20 20 20 20 20 20 20 20 20 20  :.              
2fc0: 20 20 20 20 20 20 65 63 68 6f 28 22 4d 6f 74 20        echo("Mot 
2fd0: 69 6e 63 6f 6e 6e 75 20 3a 20 22 20 2b 20 73 57  inconnu : " + sW
2fe0: 6f 72 64 29 0a 20 20 20 20 20 20 20 20 23 20 64  ord).        # d
2ff0: 69 63 74 69 6f 6e 61 72 79 20 6f 66 20 6d 6f 72  ictionary of mor
3000: 70 68 6f 6c 6f 67 69 65 73 0a 20 20 20 20 20 20  phologies.      
3010: 20 20 64 4d 6f 72 70 68 20 3d 20 7b 7d 0a 20 20    dMorph = {}.  
3020: 20 20 20 20 20 20 66 6f 72 20 73 57 6f 72 64 20        for sWord 
3030: 69 6e 20 64 57 6f 72 64 3a 0a 20 20 20 20 20 20  in dWord:.      
3040: 20 20 20 20 20 20 64 4d 6f 72 70 68 5b 73 57 6f        dMorph[sWo
3050: 72 64 5d 20 3d 20 6f 44 69 63 74 2e 67 65 74 4d  rd] = oDict.getM
3060: 6f 72 70 68 28 73 57 6f 72 64 29 0a 0a 20 20 20  orph(sWord)..   
3070: 20 23 20 77 72 69 74 65 20 66 69 6c 65 20 66 6f   # write file fo
3080: 72 20 50 79 74 68 6f 6e 0a 20 20 20 20 73 43 6f  r Python.    sCo
3090: 64 65 20 3d 20 22 23 20 67 65 6e 65 72 61 74 65  de = "# generate
30a0: 64 20 64 61 74 61 20 28 64 6f 20 6e 6f 74 20 65  d data (do not e
30b0: 64 69 74 29 5c 6e 5c 6e 22 20 2b 20 5c 0a 20 20  dit)\n\n" + \.  
30c0: 20 20 20 20 20 20 20 20 20 20 22 64 57 6f 72 64            "dWord
30d0: 20 3d 20 22 20 2b 20 73 74 72 28 64 57 6f 72 64   = " + str(dWord
30e0: 29 20 2b 20 22 5c 6e 5c 6e 22 20 2b 20 5c 0a 20  ) + "\n\n" + \. 
30f0: 20 20 20 20 20 20 20 20 20 20 20 22 6c 53 65 74             "lSet
3100: 20 3d 20 22 20 2b 20 73 74 72 28 6c 53 65 74 29   = " + str(lSet)
3110: 20 2b 20 22 5c 6e 5c 6e 22 20 2b 20 5c 0a 20 20   + "\n\n" + \.  
3120: 20 20 20 20 20 20 20 20 20 20 22 64 4d 6f 72 70            "dMorp
3130: 68 20 3d 20 22 20 2b 20 73 74 72 28 64 4d 6f 72  h = " + str(dMor
3140: 70 68 29 20 2b 20 22 5c 6e 22 0a 20 20 20 20 6f  ph) + "\n".    o
3150: 70 65 6e 28 73 70 2b 22 2f 6d 6f 64 75 6c 65 73  pen(sp+"/modules
3160: 2f 70 68 6f 6e 65 74 5f 64 61 74 61 2e 70 79 22  /phonet_data.py"
3170: 2c 20 22 77 22 2c 20 65 6e 63 6f 64 69 6e 67 3d  , "w", encoding=
3180: 22 75 74 66 2d 38 22 2c 20 6e 65 77 6c 69 6e 65  "utf-8", newline
3190: 3d 22 5c 6e 22 29 2e 77 72 69 74 65 28 73 43 6f  ="\n").write(sCo
31a0: 64 65 29 0a 0a 20 20 20 20 69 66 20 62 4a 53 3a  de)..    if bJS:
31b0: 0a 20 20 20 20 20 20 20 20 23 23 20 77 72 69 74  .        ## writ
31c0: 65 20 66 69 6c 65 20 66 6f 72 20 4a 61 76 61 53  e file for JavaS
31d0: 63 72 69 70 74 0a 20 20 20 20 20 20 20 20 73 43  cript.        sC
31e0: 6f 64 65 20 3d 20 22 7b 5c 6e 22 20 2b 20 5c 0a  ode = "{\n" + \.
31f0: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
3200: 27 20 20 20 20 22 64 57 6f 72 64 22 3a 20 27 20  '    "dWord": ' 
3210: 2b 20 6a 73 6f 6e 2e 64 75 6d 70 73 28 64 57 6f  + json.dumps(dWo
3220: 72 64 2c 20 65 6e 73 75 72 65 5f 61 73 63 69 69  rd, ensure_ascii
3230: 3d 46 61 6c 73 65 29 20 2b 20 22 2c 5c 6e 22 20  =False) + ",\n" 
3240: 2b 20 5c 0a 20 20 20 20 20 20 20 20 20 20 20 20  + \.            
3250: 20 20 20 20 27 20 20 20 20 22 6c 53 65 74 22 3a      '    "lSet":
3260: 20 27 20 2b 20 6a 73 6f 6e 2e 64 75 6d 70 73 28   ' + json.dumps(
3270: 6c 53 65 74 2c 20 65 6e 73 75 72 65 5f 61 73 63  lSet, ensure_asc
3280: 69 69 3d 46 61 6c 73 65 29 20 2b 20 22 2c 5c 6e  ii=False) + ",\n
3290: 22 20 2b 20 5c 0a 20 20 20 20 20 20 20 20 20 20  " + \.          
32a0: 20 20 20 20 20 20 27 20 20 20 20 22 64 4d 6f 72        '    "dMor
32b0: 70 68 22 3a 20 27 20 2b 20 6a 73 6f 6e 2e 64 75  ph": ' + json.du
32c0: 6d 70 73 28 64 4d 6f 72 70 68 2c 20 65 6e 73 75  mps(dMorph, ensu
32d0: 72 65 5f 61 73 63 69 69 3d 46 61 6c 73 65 29 20  re_ascii=False) 
32e0: 2b 20 22 5c 6e 7d 22 0a 20 20 20 20 20 20 20 20  + "\n}".        
32f0: 6f 70 65 6e 28 73 70 2b 22 2f 6d 6f 64 75 6c 65  open(sp+"/module
3300: 73 2d 6a 73 2f 70 68 6f 6e 65 74 5f 64 61 74 61  s-js/phonet_data
3310: 2e 6a 73 6f 6e 22 2c 20 22 77 22 2c 20 65 6e 63  .json", "w", enc
3320: 6f 64 69 6e 67 3d 22 75 74 66 2d 38 22 2c 20 6e  oding="utf-8", n
3330: 65 77 6c 69 6e 65 3d 22 5c 6e 22 29 2e 77 72 69  ewline="\n").wri
3340: 74 65 28 73 43 6f 64 65 29 0a 0a 0a 64 65 66 20  te(sCode)...def 
3350: 62 65 66 6f 72 65 20 28 73 70 4c 61 75 6e 63 68  before (spLaunch
3360: 2c 20 64 56 61 72 73 2c 20 62 4a 53 3d 46 61 6c  , dVars, bJS=Fal
3370: 73 65 29 3a 0a 20 20 20 20 70 72 69 6e 74 28 22  se):.    print("
3380: 3d 3d 3d 3d 3d 3d 3d 3d 3d 3d 20 42 75 69 6c 64  ========== Build
3390: 20 48 75 6e 73 70 65 6c 6c 20 64 69 63 74 69 6f   Hunspell dictio
33a0: 6e 61 72 69 65 73 20 3d 3d 3d 3d 3d 3d 3d 3d 3d  naries =========
33b0: 3d 22 29 0a 20 20 20 20 6d 61 6b 65 44 69 63 74  =").    makeDict
33c0: 69 6f 6e 61 72 69 65 73 28 73 70 4c 61 75 6e 63  ionaries(spLaunc
33d0: 68 2c 20 64 56 61 72 73 5b 27 6f 78 74 5f 76 65  h, dVars['oxt_ve
33e0: 72 73 69 6f 6e 27 5d 29 0a 0a 0a 64 65 66 20 61  rsion'])...def a
33f0: 66 74 65 72 20 28 73 70 4c 61 75 6e 63 68 2c 20  fter (spLaunch, 
3400: 64 56 61 72 73 2c 20 62 4a 53 3d 46 61 6c 73 65  dVars, bJS=False
3410: 29 3a 0a 20 20 20 20 70 72 69 6e 74 28 22 3d 3d  ):.    print("==
3420: 3d 3d 3d 3d 3d 3d 3d 3d 20 42 75 69 6c 64 20 46  ======== Build F
3430: 72 65 6e 63 68 20 64 61 74 61 20 3d 3d 3d 3d 3d  rench data =====
3440: 3d 3d 3d 3d 3d 22 29 0a 20 20 20 20 6d 61 6b 65  =====").    make
3450: 4d 66 73 70 28 73 70 4c 61 75 6e 63 68 2c 20 62  Mfsp(spLaunch, b
3460: 4a 53 29 0a 20 20 20 20 6d 61 6b 65 43 6f 6e 6a  JS).    makeConj
3470: 28 73 70 4c 61 75 6e 63 68 2c 20 62 4a 53 29 0a  (spLaunch, bJS).
3480: 20 20 20 20 6d 61 6b 65 50 68 6f 6e 65 74 54 61      makePhonetTa
3490: 62 6c 65 28 73 70 4c 61 75 6e 63 68 2c 20 62 4a  ble(spLaunch, bJ
34a0: 53 29 0a                                         S).