Grammalecte  Hex Artifact Content

Artifact 17cde37b09df50593254c4a119d93b904e815c2ad1ba11ca5c5b6982501a5b44:


0000: 23 21 70 79 74 68 6f 6e 33 0a 0a 23 20 4c 65 78  #!python3..# Lex
0010: 69 63 6f 6e 20 62 75 69 6c 64 65 72 0a 0a 66 72  icon builder..fr
0020: 6f 6d 20 64 69 73 74 75 74 69 6c 73 20 69 6d 70  om distutils imp
0030: 6f 72 74 20 64 69 72 5f 75 74 69 6c 0a 0a 69 6d  ort dir_util..im
0040: 70 6f 72 74 20 67 72 61 6d 6d 61 6c 65 63 74 65  port grammalecte
0050: 2e 64 61 77 67 20 61 73 20 66 73 61 0a 66 72 6f  .dawg as fsa.fro
0060: 6d 20 67 72 61 6d 6d 61 6c 65 63 74 65 2e 69 62  m grammalecte.ib
0070: 64 61 77 67 20 69 6d 70 6f 72 74 20 49 42 44 41  dawg import IBDA
0080: 57 47 0a 0a 0a 64 65 66 20 62 75 69 6c 64 20 28  WG...def build (
0090: 73 70 66 53 72 63 2c 20 73 4c 61 6e 67 4e 61 6d  spfSrc, sLangNam
00a0: 65 2c 20 73 44 69 63 4e 61 6d 65 2c 20 62 4a 53  e, sDicName, bJS
00b0: 4f 4e 3d 46 61 6c 73 65 2c 20 63 53 74 65 6d 6d  ON=False, cStemm
00c0: 69 6e 67 4d 65 74 68 6f 64 3d 22 53 22 2c 20 6e  ingMethod="S", n
00d0: 43 6f 6d 70 72 65 73 73 4d 65 74 68 6f 64 3d 31  CompressMethod=1
00e0: 29 3a 0a 20 20 20 20 22 74 72 61 6e 73 66 6f 72  ):.    "transfor
00f0: 6d 20 61 20 74 65 78 74 20 6c 65 78 69 63 6f 6e  m a text lexicon
0100: 20 61 73 20 61 20 62 69 6e 61 72 79 20 69 6e 64   as a binary ind
0110: 65 78 61 62 6c 65 20 64 69 63 74 69 6f 6e 61 72  exable dictionar
0120: 79 22 0a 20 20 20 20 6f 44 41 57 47 20 3d 20 66  y".    oDAWG = f
0130: 73 61 2e 44 41 57 47 28 73 70 66 53 72 63 2c 20  sa.DAWG(spfSrc, 
0140: 73 4c 61 6e 67 4e 61 6d 65 2c 20 63 53 74 65 6d  sLangName, cStem
0150: 6d 69 6e 67 4d 65 74 68 6f 64 29 0a 20 20 20 20  mingMethod).    
0160: 64 69 72 5f 75 74 69 6c 2e 6d 6b 70 61 74 68 28  dir_util.mkpath(
0170: 22 67 72 61 6d 6d 61 6c 65 63 74 65 2f 5f 64 69  "grammalecte/_di
0180: 63 74 69 6f 6e 61 72 69 65 73 22 29 0a 20 20 20  ctionaries").   
0190: 20 6f 44 41 57 47 2e 77 72 69 74 65 49 6e 66 6f   oDAWG.writeInfo
01a0: 28 22 67 72 61 6d 6d 61 6c 65 63 74 65 2f 5f 64  ("grammalecte/_d
01b0: 69 63 74 69 6f 6e 61 72 69 65 73 2f 22 20 2b 20  ictionaries/" + 
01c0: 73 44 69 63 4e 61 6d 65 20 2b 20 22 2e 69 6e 66  sDicName + ".inf
01d0: 6f 2e 74 78 74 22 29 0a 20 20 20 20 6f 44 41 57  o.txt").    oDAW
01e0: 47 2e 63 72 65 61 74 65 42 69 6e 61 72 79 28 22  G.createBinary("
01f0: 67 72 61 6d 6d 61 6c 65 63 74 65 2f 5f 64 69 63  grammalecte/_dic
0200: 74 69 6f 6e 61 72 69 65 73 2f 22 20 2b 20 73 44  tionaries/" + sD
0210: 69 63 4e 61 6d 65 20 2b 20 22 2e 62 64 69 63 22  icName + ".bdic"
0220: 2c 20 69 6e 74 28 6e 43 6f 6d 70 72 65 73 73 4d  , int(nCompressM
0230: 65 74 68 6f 64 29 29 0a 20 20 20 20 69 66 20 62  ethod)).    if b
0240: 4a 53 4f 4e 3a 0a 20 20 20 20 20 20 20 20 64 69  JSON:.        di
0250: 72 5f 75 74 69 6c 2e 6d 6b 70 61 74 68 28 22 67  r_util.mkpath("g
0260: 72 61 6d 6d 61 6c 65 63 74 65 2d 6a 73 2f 5f 64  rammalecte-js/_d
0270: 69 63 74 69 6f 6e 61 72 69 65 73 22 29 0a 20 20  ictionaries").  
0280: 20 20 20 20 20 20 6f 44 69 63 20 3d 20 49 42 44        oDic = IBD
0290: 41 57 47 28 73 44 69 63 4e 61 6d 65 20 2b 20 22  AWG(sDicName + "
02a0: 2e 62 64 69 63 22 29 0a 20 20 20 20 20 20 20 20  .bdic").        
02b0: 23 6f 44 69 63 2e 77 72 69 74 65 41 73 4a 53 4f  #oDic.writeAsJSO
02c0: 62 6a 65 63 74 28 22 67 63 5f 6c 61 6e 67 2f 22  bject("gc_lang/"
02d0: 2b 73 4c 61 6e 67 2b 22 2f 6d 6f 64 75 6c 65 73  +sLang+"/modules
02e0: 2d 6a 73 2f 64 69 63 74 69 6f 6e 61 72 79 2e 6a  -js/dictionary.j
02f0: 73 22 29 0a 20 20 20 20 20 20 20 20 6f 44 69 63  s").        oDic
0300: 2e 77 72 69 74 65 41 73 4a 53 4f 62 6a 65 63 74  .writeAsJSObject
0310: 28 22 67 72 61 6d 6d 61 6c 65 63 74 65 2d 6a 73  ("grammalecte-js
0320: 2f 5f 64 69 63 74 69 6f 6e 61 72 69 65 73 2f 22  /_dictionaries/"
0330: 20 2b 20 73 44 69 63 4e 61 6d 65 20 2b 20 22 2e   + sDicName + ".
0340: 6a 73 6f 6e 22 29 0a 0a 0a 64 65 66 20 6d 61 69  json")...def mai
0350: 6e 20 28 29 3a 0a 20 20 20 20 70 72 69 6e 74 28  n ():.    print(
0360: 22 74 6f 64 6f 22 29 0a 0a 0a 69 66 20 5f 5f 6e  "todo")...if __n
0370: 61 6d 65 5f 5f 20 3d 3d 20 27 5f 5f 6d 61 69 6e  ame__ == '__main
0380: 5f 5f 27 3a 0a 20 20 20 20 6d 61 69 6e 28 29 0a  __':.    main().