Coverage for src/wiktextract/extractor/el/section_titles.py: 100%
27 statements
« prev ^ index » next coverage.py v7.9.2, created at 2025-07-04 10:58 +0000
« prev ^ index » next coverage.py v7.9.2, created at 2025-07-04 10:58 +0000
1# https://simple.wiktionary.org/wiki/Category:Part_of_speech_templates
2import re
3from enum import Enum, auto
4from typing import TypedDict
7class Heading(Enum):
8 Err = auto()
9 Ignored = auto()
10 POS = auto()
11 Etym = auto()
12 Pron = auto()
13 Infl = auto()
14 Related = auto()
15 Transliterations = auto()
16 Synonyms = auto()
17 Homonyms = auto()
18 Antonyms = auto()
19 Translations = auto()
20 Derived = auto()
21 Ref = auto()
22 Notes = auto()
25Tags = list[str]
26POSName = str
27POSMap = TypedDict(
28 "POSMap",
29 {
30 "pos": POSName,
31 # "debug" is legacy from [en], might be implemented
32 "debug": str,
33 "tags": Tags,
34 },
35 total=False,
36)
38# Main entries for different kinds of POS headings; no aliases
39# XXX translate these
40POS_HEADINGS: dict[str, POSMap] = {
41 # "": {"pos": "", "tags": [""],
42 # άρθρο: article // article // article of a charter, law, contract etc.
43 # // limb
44 "άρθρο": {"pos": "article"},
45 # έκφραση - πολυλεκτικός όρος: έκφραση: expression '' ???,
46 # πολυλεκτικός: polylectic όρος: term (word, phrase; limitation,
47 # restriction) // definition, stipulation // clause // article όρος:
48 # mount, mountain
49 "έκφραση - πολυλεκτικός όρος": {"pos": "phrase"},
50 # έκφραση και επίρρημα (επιρρηματική έκφραση): έκφραση: expression
51 # και: and // also // plus, and // past (time) επίρρημα: adverb (lexical
52 # category) επιρρηματική: [επιρρηματικός: adverbial, relating to an
53 # adverb] // Nominative feminine singular form of επιρρηματικός
54 # (epirrimatikós). // Accusative feminine singular form of επιρρηματικός
55 # (epirrimatikós). // Vocative feminine singular form of επιρρηματικός
56 # (epirrimatikós). έκφραση: expression
57 "έκφραση και επίρρημα (επιρρηματική έκφραση)": {"pos": "adv_phrase"},
58 # έκφραση του bask: έκφραση: expression του: [ο: the definite
59 # masculine singular article. the] // genitive masculine singular of ο
60 # (o) (the) // genitive neuter singular of ο (o) (the) του: him, it //
61 # his, its 'bask' ???,
62 ## "bask in something"
63 ## "EXPRESSING 'BASK'" -> phrases?
64 ## No special handling
65 "έκφραση του": {"pos": "phrase"},
66 # έκφραση: expression
67 "έκφραση": {"pos": "phrase"},
68 # ένθημα: ένθημα: infix, interfix
69 "ένθημα": {"pos": "infix"},
70 # αμετάβατο ρήμα: αμετάβατο: [αμετάβατος: intransitive] // Accusative
71 # masculine singular form of αμετάβατος (ametávatos). // Nominative,
72 # accusative and vocative neuter singular form of αμετάβατος
73 # (ametávatos). ρήμα: verb
74 "αμετάβατο ρήμα": {"pos": "verb", "tags": ["intransitive"]},
75 "απαρέμφατο": {"pos": "verb", "tags": ["infinitive"]},
76 # αντωνυμία: αντωνυμία: pronoun // antonymy
77 "αντωνυμία": {"pos": "pron"},
78 # αριθμητικό: αριθμητικό: numeral αριθμητικό: [αριθμητικός:
79 # arithmetical, numerical] // Accusative masculine singular form of
80 # αριθμητικός (arithmitikós). // Nominative, accusative and vocative
81 # neuter singular form of αριθμητικός (arithmitikós).
82 "αριθμητικό": {"pos": "num", "tags": ["number"]},
83 # βαθμός επιθέτου: βαθμός: grade (of job, exams, position in
84 # employment) // rank // degree (unit of temperature) // (plural) marks,
85 # grades // degree (severity of burns) // degree (of an adjective)
86 # επιθέτου: [επίθετο: adjective // surname] // genitive singular of
87 # επίθετο (epítheto)
88 "βαθμός επιθέτου": {"pos": "adj", "tags": ["comparative"]},
89 # βιβλίο φράσεων: βιβλίο: book 'φράσεων' ???,
90 "βιβλίο φράσεων": {"pos": "phrase"},
91 # γερουνδιακό: 'γερουνδιακό' ???,
92 "γερουνδιακό": {"pos": "verb", "tags": ["participle", "gerund"]},
93 # γερούνδιο: γερούνδιο: gerund
94 "γερούνδιο": {"pos": "verb", "tags": ["participle", "gerund"]},
95 # γνωμικά: 'γνωμικά' ???,
96 "γνωμικά": {"pos": "phrase"},
97 # γραμματικό στοιχείο: γραμματικό: [γραμματικός: grammatical (relating
98 # to grammar) // grammatical (using correct grammar)] // [γραμματικός:
99 # grammarian // scribe, secretary] // Accusative masculine singular form
100 # of γραμματικός (grammatikós). // Nominative, accusative and vocative
101 # neuter singular form of γραμματικός (grammatikós). γραμματικό:
102 # [γραμματικός: grammatical (relating to grammar) // grammatical (using
103 # correct grammar)] // [γραμματικός: grammarian // scribe, secretary] //
104 # Accusative singular form of γραμματικός (grammatikós). στοιχείο: unit,
105 # element, cell (a portion of a whole) // element // unit, element, cell
106 # (a portion of a whole) // item of data, piece of information // unit,
107 # element, cell (a portion of a whole) // letter, piece of type // unit,
108 # element, cell (a portion of a whole) // cell, battery // unit,
109 # element, cell (a portion of a whole) // subset of a population
110 "γραμματικό στοιχείο": {"pos": "particle"},
111 # διλεκτικό ουσιαστικό: 'διλεκτικό' ???, ουσιαστικό: noun,
112 # substantive
113 # two-word noun
114 "διλεκτικό ουσιαστικό": {"pos": "noun"},
115 # επίθετο - έκφραση: επίθετο: adjective // surname '' ???, έκφραση:
116 # expression
117 "επίθετο - έκφραση": {"pos": "adj"},
118 # επίθετο - ουσιαστικό: επίθετο: adjective // surname '' ???,
119 # ουσιαστικό: noun, substantive
120 "επίθετο - ουσιαστικό": {"pos": "adj"},
121 # επίθετο ή ουσιαστικό: επίθετο: adjective // surname ή: or // either
122 # … or ουσιαστικό: noun, substantive
123 "επίθετο ή ουσιαστικό": {"pos": "adj", "tags": ["adjective", "noun"]},
124 # επίθετο και επίρρημα: επίθετο: adjective // surname και: and // also
125 # // plus, and // past (time) επίρρημα: adverb (lexical category)
126 "επίθετο και επίρρημα": {"pos": "adj", "tags": ["adjective", "adverb"]},
127 # επίθετο και ουσιαστικό: επίθετο: adjective // surname και: and //
128 # also // plus, and // past (time) ουσιαστικό: noun, substantive
129 "επίθετο και ουσιαστικό": {"pos": "adj", "tags": ["adjective", "noun"]},
130 # επίθετο, επιφώνημα, επίρρημα: επίθετο: adjective // surname
131 # επιφώνημα: interjection, exclamation επίρρημα: adverb (lexical
132 # category)
133 "επίθετο, επιφώνημα, επίρρημα": {"pos": "adj"},
134 # επίθετο, ουσιαστικό, ρήμα: επίθετο: adjective // surname ουσιαστικό:
135 # noun, substantive ρήμα: verb
136 "επίθετο, ουσιαστικό, ρήμα": {"pos": "adj"},
137 # επίθετο, ουσιαστικό: επίθετο: adjective // surname ουσιαστικό: noun,
138 # substantive
139 "επίθετο, ουσιαστικό": {"pos": "adj"},
140 # επίθετο: επίθετο: adjective // surname
141 "επίθετο": {"pos": "adj"},
142 # επίθημα για το σχηματισμό ουδέτερων ουσιαστικών: επίθημα: suffix
143 # για: for // for // for, by // for // about το: [ο: the definite
144 # masculine singular article. the] // nominative neuter singular of ο
145 # (o) (the) // accusative neuter singular of ο (o) (the) το: it (3rd
146 # person neuter singular, nominative) // it (3rd person neuter singular,
147 # accusative) 'σχηματισμό' ???, ουδέτερων: [ουδέτερος: neuter, sexless
148 # // neutral, non-aligned // the gender: neuter // neutral] // Genitive
149 # masculine plural form of ουδέτερος (oudéteros). // Genitive feminine
150 # plural form of ουδέτερος (oudéteros). // Genitive neuter plural form
151 # of ουδέτερος (oudéteros). 'ουσιαστικών' ???,
152 "επίθημα για το σχηματισμό ουδέτερων ουσιαστικών": {"pos": "suffix"},
153 # επίθημα: επίθημα: suffix
154 "επίθημα": {"pos": "suffix"},
155 # επίρρημα - επιφώνημα: επίρρημα: adverb (lexical category) '' ???,
156 # επιφώνημα: interjection, exclamation
157 "επίρρημα - επιφώνημα": {"pos": "adv_phrase"},
158 # επίρρημα, επίθετο: επίρρημα: adverb (lexical category) επίθετο:
159 # adjective // surname
160 "επίρρημα, επίθετο": {"pos": "adv"},
161 # επίρρημα, κλιτικός τύπος επιθέτου: επίρρημα: adverb (lexical
162 # category) 'κλιτικός' ???, τύπος: sort, type, mould, stamp (of a
163 # person character) // model, type (of car, etc) // shape, form // the
164 # press, the newspapers collectively // formality, convention // formula
165 # // a man, a guy, a chap επιθέτου: [επίθετο: adjective // surname] //
166 # genitive singular of επίθετο (epítheto)
167 "επίρρημα, κλιτικός τύπος επιθέτου": {"pos": "adv"},
168 # επίρρημα, ουσιαστικό: επίρρημα: adverb (lexical category)
169 # ουσιαστικό: noun, substantive
170 "επίρρημα, ουσιαστικό": {"pos": "adv"},
171 # επίρρημα: επίρρημα: adverb (lexical category)
172 "επίρρημα": {"pos": "adv"},
173 # επιθετικό συνθετικό: 'επιθετικό' ???, συνθετικό: combining form
174 # συνθετικό: [συνθετικός: synthetic // composite, component] //
175 # Accusative masculine singular form of συνθετικός (synthetikós). //
176 # Nominative, accusative and vocative neuter singular form of συνθετικός
177 # (synthetikós).
178 "επιθετικό συνθετικό": {"pos": "adj"},
179 # επιρρηματική έκφραση: επιρρηματική: [επιρρηματικός: adverbial,
180 # relating to an adverb] // Nominative feminine singular form of
181 # επιρρηματικός (epirrimatikós). // Accusative feminine singular form of
182 # επιρρηματικός (epirrimatikós). // Vocative feminine singular form of
183 # επιρρηματικός (epirrimatikós). έκφραση: expression
184 "επιρρηματική έκφραση": {"pos": "adv_phrase"},
185 # επιφώνημα - ουσιαστικό: επιφώνημα: interjection, exclamation '' ???,
186 # ουσιαστικό: noun, substantive
187 "επιφώνημα - ουσιαστικό": {"pos": "intj"},
188 # επιφώνημα και ουσιαστικό: επιφώνημα: interjection, exclamation και:
189 # and // also // plus, and // past (time) ουσιαστικό: noun, substantive
190 "επιφώνημα και ουσιαστικό": {"pos": "intj"},
191 # επιφώνημα: επιφώνημα: interjection, exclamation
192 "επιφώνημα": {"pos": "intj"},
193 # θηλυκό: θηλυκό: woman, female θηλυκό: [θηλυκός: female (feminine
194 # gender) // feminine (female person or animal)] // Accusative masculine
195 # singular form of θηλυκός (thilykós). // Nominative, accusative and
196 # vocative neuter singular form of θηλυκός (thilykós).
197 "θηλυκό": {"pos": "noun", "tags": ["feminine"]},
198 # κάντζι: 'κάντζι' ???,
199 "κάντζι": {"pos": "character", "tags": ["kanji"]},
200 # κατάληξη αρσενικών επιθέτων: κατάληξη: ending, termination // result
201 # or outcome // ending, suffix αρσενικών: [αρσενικός: masculine] //
202 # Genitive masculine plural form of αρσενικός (arsenikós). // Genitive
203 # feminine plural form of αρσενικός (arsenikós). // Genitive neuter
204 # plural form of αρσενικός (arsenikós). επιθέτων: [επίθετο: adjective //
205 # surname] // genitive plural of επίθετο (epítheto)
206 "κατάληξη αρσενικών επιθέτων": {
207 "pos": "suffix",
208 "tags": ["masculine", "adjective"],
209 },
210 # κατάληξη αρσενικών ουσιαστικών: κατάληξη: ending, termination //
211 # result or outcome // ending, suffix αρσενικών: [αρσενικός: masculine]
212 # // Genitive masculine plural form of αρσενικός (arsenikós). //
213 # Genitive feminine plural form of αρσενικός (arsenikós). // Genitive
214 # neuter plural form of αρσενικός (arsenikós). 'ουσιαστικών' ???,
215 "κατάληξη αρσενικών ουσιαστικών": {
216 "pos": "suffix",
217 "tags": ["masculine", "noun"],
218 },
219 # κατάληξη επιρρημάτων: κατάληξη: ending, termination // result or
220 # outcome // ending, suffix επιρρημάτων: [επίρρημα: adverb (lexical
221 # category)] // Genitive plural form of επίρρημα (epírrima).
222 "κατάληξη επιρρημάτων": {"pos": "suffix", "tags": ["adverbial"]},
223 # κατάληξη θηλυκών ουσιαστικών: κατάληξη: ending, termination //
224 # result or outcome // ending, suffix θηλυκών: [θηλυκός: female
225 # (feminine gender) // feminine (female person or animal)] // Genitive
226 # masculine plural form of θηλυκός (thilykós). // Genitive feminine
227 # plural form of θηλυκός (thilykós). // Genitive neuter plural form of
228 # θηλυκός (thilykós). θηλυκών: [θηλυκό: woman, female] // [θηλυκό:
229 # [θηλυκός: female (feminine gender) // feminine (female person or
230 # animal)] // Accusative masculine singular form of θηλυκός (thilykós).
231 # // Nominative, accusative and vocative neuter singular form of θηλυκός
232 # (thilykós).] // Genitive plural form of θηλυκό (thilykó).
233 # 'ουσιαστικών' ???,
234 "κατάληξη θηλυκών ουσιαστικών": {
235 "pos": "suffix",
236 "tags": ["feminine", "noun"],
237 },
238 # κατάληξη ουδέτερων ουσιαστικών: κατάληξη: ending, termination //
239 # result or outcome // ending, suffix ουδέτερων: [ουδέτερος: neuter,
240 # sexless // neutral, non-aligned // the gender: neuter // neutral] //
241 # Genitive masculine plural form of ουδέτερος (oudéteros). // Genitive
242 # feminine plural form of ουδέτερος (oudéteros). // Genitive neuter
243 # plural form of ουδέτερος (oudéteros). 'ουσιαστικών' ???,
244 "κατάληξη ουδέτερων ουσιαστικών": {
245 "pos": "suffix",
246 "tags": ["neuter", "noun"],
247 },
248 # κατάληξη ρημάτων: κατάληξη: ending, termination // result or outcome
249 # // ending, suffix ρημάτων: [ρήμα: verb] // Genitive plural form of
250 # ρήμα (ríma).
251 "κατάληξη ρημάτων": {"pos": "suffix", "tags": ["verb"]},
252 # κατάληξη: κατάληξη: ending, termination // result or outcome //
253 # ending, suffix
254 "κατάληξη": {"pos": "suffix"},
255 # κλιτικός τύπος άρθρου: 'κλιτικός' ???, τύπος: sort, type, mould,
256 # stamp (of a person character) // model, type (of car, etc) // shape,
257 # form // the press, the newspapers collectively // formality,
258 # convention // formula // a man, a guy, a chap άρθρου: [άρθρο: article
259 # // article // article of a charter, law, contract etc. // limb] //
260 # Genitive singular form of άρθρο (árthro).
261 "κλιτικός τύπος άρθρου": {"pos": "article", "tags": ["form-of"]},
262 # κλιτικός τύπος αντωνυμίας: 'κλιτικός' ???, τύπος: sort, type,
263 # mould, stamp (of a person character) // model, type (of car, etc) //
264 # shape, form // the press, the newspapers collectively // formality,
265 # convention // formula // a man, a guy, a chap αντωνυμίας: [αντωνυμία:
266 # pronoun // antonymy] // Genitive singular form of αντωνυμία
267 # (antonymía).
268 "κλιτικός τύπος αντωνυμίας": {"pos": "pron", "tags": ["form-of"]},
269 # κλιτικός τύπος αριθμητικού: 'κλιτικός' ???, τύπος: sort, type,
270 # mould, stamp (of a person character) // model, type (of car, etc) //
271 # shape, form // the press, the newspapers collectively // formality,
272 # convention // formula // a man, a guy, a chap αριθμητικού:
273 # [αριθμητικός: arithmetical, numerical] // Genitive masculine and
274 # neuter singular form of αριθμητικός (arithmitikós). αριθμητικού:
275 # [αριθμητικό: numeral] // [αριθμητικό: [αριθμητικός: arithmetical,
276 # numerical] // Accusative masculine singular form of αριθμητικός
277 # (arithmitikós). // Nominative, accusative and vocative neuter singular
278 # form of αριθμητικός (arithmitikós).] // Genitive singular form of
279 # αριθμητικό (arithmitikó).
280 "κλιτικός τύπος αριθμητικού": {"pos": "num", "tags": ["number", "form-of"]},
281 # κλιτικός τύπος γερουνδιακού: 'κλιτικός' ???, τύπος: sort, type,
282 # mould, stamp (of a person character) // model, type (of car, etc) //
283 # shape, form // the press, the newspapers collectively // formality,
284 # convention // formula // a man, a guy, a chap 'γερουνδιακού' ???,
285 "κλιτικός τύπος γερουνδιακού": {
286 "pos": "verb",
287 "tags": ["participle", "gerund", "form-of"],
288 },
289 # κλιτικός τύπος επιθέτου: 'κλιτικός' ???, τύπος: sort, type, mould,
290 # stamp (of a person character) // model, type (of car, etc) // shape,
291 # form // the press, the newspapers collectively // formality,
292 # convention // formula // a man, a guy, a chap επιθέτου: [επίθετο:
293 # adjective // surname] // genitive singular of επίθετο (epítheto)
294 "κλιτικός τύπος επιθέτου": {"pos": "adj", "tags": ["form-of"]},
295 "κλιτικός τύπος επιθήματος": {"pos": "suffix"},
296 # κλιτικός τύπος επιρρήματος: 'κλιτικός' ???, τύπος: sort, type,
297 # mould, stamp (of a person character) // model, type (of car, etc) //
298 # shape, form // the press, the newspapers collectively // formality,
299 # convention // formula // a man, a guy, a chap επιρρήματος: [επίρρημα:
300 # adverb (lexical category)] // Genitive singular form of επίρρημα
301 # (epírrima).
302 "κλιτικός τύπος επιρρήματος": {"pos": "adv", "tags": ["form-of"]},
303 # κλιτικός τύπος κυρίου ονόματος: 'κλιτικός' ???, τύπος: sort, type,
304 # mould, stamp (of a person character) // model, type (of car, etc) //
305 # shape, form // the press, the newspapers collectively // formality,
306 # convention // formula // a man, a guy, a chap κυρίου: [κύριος: mister
307 # (title conferred on an adult male) // master (someone who has control
308 # over something or someone) // sir (an address to any male)] //
309 # [κύριος: main, principal, most important] // Genitive singular form of
310 # κύριος (kýrios). ονόματος: [όνομα: name // name, reputation // noun
311 # (sensu lato), a word class including substantives (nouns, sensu
312 # stricto) and adjectives] // Genitive singular form of όνομα (ónoma).
313 "κλιτικός τύπος κυρίου ονόματος": {"pos": "name", "tags": ["form-of"]},
314 # κλιτικός τύπος μετοχής: 'κλιτικός' ???, τύπος: sort, type, mould,
315 # stamp (of a person character) // model, type (of car, etc) // shape,
316 # form // the press, the newspapers collectively // formality,
317 # convention // formula // a man, a guy, a chap μετοχής: [μετοχή:
318 # participle // share, stock] // Genitive singular form of μετοχή
319 # (metochí).
320 "κλιτικός τύπος μετοχής": {
321 "pos": "verb",
322 "tags": ["participle", "form-of"],
323 },
324 # κλιτικός τύπος ουσιαστικού (διλεκτικό ουσιαστικό): 'κλιτικός' ???,
325 # τύπος: sort, type, mould, stamp (of a person character) // model, type
326 # (of car, etc) // shape, form // the press, the newspapers collectively
327 # // formality, convention // formula // a man, a guy, a chap
328 # 'ουσιαστικού' ???, 'διλεκτικό' ???, ουσιαστικό: noun, substantive
329 "κλιτικός τύπος ουσιαστικού (διλεκτικό ουσιαστικό)": {
330 "pos": "noun",
331 "tags": ["form-of"],
332 },
333 # κλιτικός τύπος ουσιαστικού, ουδέτερο, πληθυντικός: 'κλιτικός' ???,
334 # τύπος: sort, type, mould, stamp (of a person character) // model, type
335 # (of car, etc) // shape, form // the press, the newspapers collectively
336 # // formality, convention // formula // a man, a guy, a chap
337 # 'ουσιαστικού' ???, ουδέτερο: neuter ουδέτερο: [ουδέτερος: neuter,
338 # sexless // neutral, non-aligned // the gender: neuter // neutral] //
339 # Accusative masculine singular form of ουδέτερος (oudéteros). //
340 # Nominative, accusative and vocative neuter singular form of ουδέτερος
341 # (oudéteros). πληθυντικός: plural
342 "κλιτικός τύπος ουσιαστικού, ουδέτερο, πληθυντικός": {
343 "pos": "noun",
344 "tags": ["form-of"],
345 },
346 # κλιτικός τύπος ουσιαστικού: 'κλιτικός' ???, τύπος: sort, type,
347 # mould, stamp (of a person character) // model, type (of car, etc) //
348 # shape, form // the press, the newspapers collectively // formality,
349 # convention // formula // a man, a guy, a chap 'ουσιαστικού' ???,
350 "κλιτικός τύπος ουσιαστικού": {"pos": "noun", "tags": ["form-of"]},
351 # κλιτικός τύπος πολυλεκτικού όρου: 'κλιτικός' ???, τύπος: sort,
352 # type, mould, stamp (of a person character) // model, type (of car,
353 # etc) // shape, form // the press, the newspapers collectively //
354 # formality, convention // formula // a man, a guy, a chap
355 # 'πολυλεκτικού' ???, 'όρου' ???,
356 "κλιτικός τύπος πολυλεκτικού όρου": {"pos": "name"},
357 # κορεατικό αλφάβητο: 'κορεατικό' ???, αλφάβητο: alphabet, a series
358 # of letters or graphics representing particular sounds or phonemes //
359 # the ABCs of a subject matter; the basics; the most basic fundamentals
360 # of a certain sphere of knowledge // [αλφάβητος: Rare form of αλφάβητο
361 # (alfávito).] // Accusative singular form of αλφάβητος (alfávitos).
362 "κορεατικό αλφάβητο": {"pos": "character", "tags": ["hangeul"]},
363 # κύριο όνομα: κύριο: [κύριος: mister (title conferred on an adult
364 # male) // master (someone who has control over something or someone) //
365 # sir (an address to any male)] // [κύριος: main, principal, most
366 # important] // Accusative masculine singular form of κύριος (kýrios).
367 # // Nominative, accusative and vocative neuter singular form of κύριος
368 # (kýrios). κύριο: [κύριος: mister (title conferred on an adult male) //
369 # master (someone who has control over something or someone) // sir (an
370 # address to any male)] // [κύριος: main, principal, most important] //
371 # Accusative singular form of κύριος (kýrios). όνομα: name // name,
372 # reputation // noun (sensu lato), a word class including substantives
373 # (nouns, sensu stricto) and adjectives
374 "κύριο όνομα": {"pos": "name"},
375 # μετοχή του βαρυφορτώνω, βαρυφορτώνομαι: μετοχή: participle // share,
376 # stock του: [ο: the definite masculine singular article. the] //
377 # genitive masculine singular of ο (o) (the) // genitive neuter singular
378 # of ο (o) (the) του: him, it // his, its 'βαρυφορτώνω' ???,
379 # 'βαρυφορτώνομαι' ???,
380 "μετοχή του": {
381 "pos": "verb",
382 "tags": ["participle"],
383 },
384 "μετοχή": {"pos": "verb", "tags": ["participle"]},
385 # μετοχικό επίθετο: 'μετοχικό' ???, επίθετο: adjective // surname
386 "μετοχικό επίθετο": {"pos": "adj", "tags": ["possessive"]},
387 # μονολεκτικό ουσιαστικό: 'μονολεκτικό' ???, ουσιαστικό: noun,
388 # substantive
389 "μονολεκτικό ουσιαστικό": {"pos": "noun"},
390 # μόριο (καθαρεύουσα): μόριο: molecule // particle, speck (a very
391 # small piece of matter) // part (of the body) // part (of the body) //
392 # genitalia, parts // particle // point (in an evaluative scale)
393 # καθαρεύουσα: Katharevousa (purist variant of Modern Greek)
394 "μόριο (καθαρεύουσα)": {"pos": "particle", "tags": ["Katharevousa"]},
395 # μόριο: μόριο: molecule // particle, speck (a very small piece of
396 # matter) // part (of the body) // part (of the body) // genitalia,
397 # parts // particle // point (in an evaluative scale)
398 "μόριο": {"pos": "particle"},
399 # ουσιαστικό (καθαρεύουσα): ουσιαστικό: noun, substantive καθαρεύουσα:
400 # Katharevousa (purist variant of Modern Greek)
401 "ουσιαστικό (καθαρεύουσα)": {"pos": "noun", "tags": ["Katharevousa"]},
402 # ουσιαστικό - επίθετο: ουσιαστικό: noun, substantive '' ???,
403 # επίθετο: adjective // surname
404 "ουσιαστικό - επίθετο": {"pos": "noun", "tags": ["adjective", "noun"]},
405 # ουσιαστικό - επιφώνημα: ουσιαστικό: noun, substantive '' ???,
406 # επιφώνημα: interjection, exclamation
407 "ουσιαστικό - επιφώνημα": {"pos": "noun", "tags": ["interjection", "noun"]},
408 # ουσιαστικό - κύριο όνομα: ουσιαστικό: noun, substantive '' ???,
409 # κύριο: [κύριος: mister (title conferred on an adult male) // master
410 # (someone who has control over something or someone) // sir (an address
411 # to any male)] // [κύριος: main, principal, most important] //
412 # Accusative masculine singular form of κύριος (kýrios). // Nominative,
413 # accusative and vocative neuter singular form of κύριος (kýrios).
414 # κύριο: [κύριος: mister (title conferred on an adult male) // master
415 # (someone who has control over something or someone) // sir (an address
416 # to any male)] // [κύριος: main, principal, most important] //
417 # Accusative singular form of κύριος (kýrios). όνομα: name // name,
418 # reputation // noun (sensu lato), a word class including substantives
419 # (nouns, sensu stricto) and adjectives
420 "ουσιαστικό - κύριο όνομα": {"pos": "name"},
421 # ουσιαστικό - πολυλεκτικός όρος: ουσιαστικό: noun, substantive ''
422 # ???, πολυλεκτικός: polylectic όρος: term (word, phrase; limitation,
423 # restriction) // definition, stipulation // clause // article όρος:
424 # mount, mountain
425 "ουσιαστικό - πολυλεκτικός όρος": {"pos": "noun"},
426 # ουσιαστικό /ˈkɒndʌkt/: ουσιαστικό: noun, substantive '/ˈkɒndʌkt/'
427 # ???,
428 "ουσιαστικό": {"pos": "noun"},
429 # ουσιαστικό αρσενικό: ουσιαστικό: noun, substantive αρσενικό:
430 # [αρσενικός: masculine] // inflection of αρσενικός (arsenikós): //
431 # masculine accusative singular // inflection of αρσενικός (arsenikós):
432 # // neuter nominative/accusative/vocative singular αρσενικό: arsenic
433 "ουσιαστικό αρσενικό": {"pos": "noun", "tags": ["masculine"]},
434 # ουσιαστικό επίρρημα: ουσιαστικό: noun, substantive επίρρημα: adverb
435 # (lexical category)
436 "ουσιαστικό επίρρημα": {"pos": "adv", "tags": ["adverb", "noun"]},
437 # ουσιαστικό θηλυκό: ουσιαστικό: noun, substantive θηλυκό: woman,
438 # female θηλυκό: [θηλυκός: female (feminine gender) // feminine (female
439 # person or animal)] // Accusative masculine singular form of θηλυκός
440 # (thilykós). // Nominative, accusative and vocative neuter singular
441 # form of θηλυκός (thilykós).
442 "ουσιαστικό θηλυκό": {"pos": "noun", "tags": ["feminine"]},
443 # ουσιαστικό και επίθετο: ουσιαστικό: noun, substantive και: and //
444 # also // plus, and // past (time) επίθετο: adjective // surname
445 "ουσιαστικό και επίθετο": {"pos": "noun", "tags": ["adjective", "noun"]},
446 # ουσιαστικό και επιφώνημα: ουσιαστικό: noun, substantive και: and //
447 # also // plus, and // past (time) επιφώνημα: interjection, exclamation
448 "ουσιαστικό και επιφώνημα": {
449 "pos": "noun",
450 "tags": ["interjection", "noun"],
451 },
452 # ουσιαστικό και κλιτικός τύπος ουσιαστικού: ουσιαστικό: noun,
453 # substantive και: and // also // plus, and // past (time) 'κλιτικός'
454 # ???, τύπος: sort, type, mould, stamp (of a person character) //
455 # model, type (of car, etc) // shape, form // the press, the newspapers
456 # collectively // formality, convention // formula // a man, a guy, a
457 # chap 'ουσιαστικού' ???,
458 "ουσιαστικό και κλιτικός τύπος ουσιαστικού": {"pos": "noun"},
459 # ουσιαστικό και κύριο όνομα: ουσιαστικό: noun, substantive και: and
460 # // also // plus, and // past (time) κύριο: [κύριος: mister (title
461 # conferred on an adult male) // master (someone who has control over
462 # something or someone) // sir (an address to any male)] // [κύριος:
463 # main, principal, most important] // Accusative masculine singular form
464 # of κύριος (kýrios). // Nominative, accusative and vocative neuter
465 # singular form of κύριος (kýrios). κύριο: [κύριος: mister (title
466 # conferred on an adult male) // master (someone who has control over
467 # something or someone) // sir (an address to any male)] // [κύριος:
468 # main, principal, most important] // Accusative singular form of κύριος
469 # (kýrios). όνομα: name // name, reputation // noun (sensu lato), a word
470 # class including substantives (nouns, sensu stricto) and adjectives
471 "ουσιαστικό και κύριο όνομα": {
472 "pos": "noun",
473 "tags": ["proper-noun", "noun"],
474 },
475 # ουσιαστικό, επίθετο: ουσιαστικό: noun, substantive επίθετο:
476 # adjective // surname
477 "ουσιαστικό, επίθετο": {"pos": "noun", "tags": ["adjective", "noun"]},
478 # ουσιαστικό, πολυλεκτικός όρος: ουσιαστικό: noun, substantive
479 # πολυλεκτικός: polylectic όρος: term (word, phrase; limitation,
480 # restriction) // definition, stipulation // clause // article όρος:
481 # mount, mountain
482 "ουσιαστικό, πολυλεκτικός όρος": {"pos": "noun"},
483 # ουσιαστικό, ρήμα: ουσιαστικό: noun, substantive ρήμα: verb
484 "ουσιαστικό, ρήμα": {"pos": "noun", "tags": ["noun", "verb"]},
485 # πoλυλεκτικό ουσιαστικό: 'πoλυλεκτικό' ???, ουσιαστικό: noun,
486 # substantive
487 "πoλυλεκτικό ουσιαστικό": {"pos": "noun"},
488 # παθητική μετοχή του μυώ: 'παθητική' ???, μετοχή: participle //
489 # share, stock του: [ο: the definite masculine singular article. the] //
490 # genitive masculine singular of ο (o) (the) // genitive neuter singular
491 # of ο (o) (the) του: him, it // his, its 'μυώ' ???,
492 "παθητική μετοχή του": {"pos": "verb", "tags": ["participle", "passive"]},
493 # παροιμία - έκφραση: παροιμία: proverb, saying, adage, maxim (phrase
494 # expressing a basic truth) '' ???, έκφραση: expression
495 "παροιμία - έκφραση": {"pos": "phrase", "tags": ["idiomatic"]},
496 # παροιμία: παροιμία: proverb, saying, adage, maxim (phrase expressing
497 # a basic truth)
498 "παροιμία": {"pos": "phrase", "tags": ["idiomatic"]},
499 # περιφραστικό ουσιαστικό: 'περιφραστικό' ???, ουσιαστικό: noun,
500 # substantive
501 "περιφραστικό ουσιαστικό": {"pos": "noun"},
502 # πολυλεκτικό επίθετο: 'πολυλεκτικό' ???, επίθετο: adjective //
503 # surname
504 "πολυλεκτικό επίθετο": {"pos": "adj"},
505 # πολυλεκτικό επίρρημα: 'πολυλεκτικό' ???, επίρρημα: adverb (lexical
506 # category)
507 "πολυλεκτικό επίρρημα": {"pos": "adv"},
508 # πολυλεκτικό ουσιαστικό: 'πολυλεκτικό' ???, ουσιαστικό: noun,
509 # substantive
510 "πολυλεκτικό ουσιαστικό": {"pos": "noun"},
511 # πολυλεκτικός όρος επίθετο: πολυλεκτικός: polylectic όρος: term
512 # (word, phrase; limitation, restriction) // definition, stipulation //
513 # clause // article όρος: mount, mountain επίθετο: adjective // surname
514 "πολυλεκτικός όρος επίθετο": {"pos": "adj"},
515 # πολυλεκτικός όρος ουσιαστικό: πολυλεκτικός: polylectic όρος: term
516 # (word, phrase; limitation, restriction) // definition, stipulation //
517 # clause // article όρος: mount, mountain ουσιαστικό: noun, substantive
518 "πολυλεκτικός όρος ουσιαστικό": {"pos": "noun"},
519 # πολυλεκτικός όρος: πολυλεκτικός: polylectic όρος: term (word,
520 # phrase; limitation, restriction) // definition, stipulation // clause
521 # // article όρος: mount, mountain
522 "πολυλεκτικός όρος": {"pos": "noun"},
523 # προσδιοριστής: 'προσδιοριστής' ???,
524 "προσδιοριστής": {"pos": "det"},
525 # πρόθεση: πρόθεση: preposition // intent, intention, purpose πρόθεση:
526 # prosthesis (an artificial replacement for a body part) // prosthetic
527 "πρόθεση": {"pos": "prep"},
528 # πρόθημα: πρόθημα: prefix
529 "πρόθημα": {"pos": "prefix"},
530 # πρόσφυμα: πρόσφυμα: affix
531 "πρόσφυμα": {"pos": "affix"},
532 # ρήμα - επιφώνημα: ρήμα: verb '' ???, επιφώνημα: interjection,
533 # exclamation
534 "ρήμα - επιφώνημα": {"pos": "verb", "tags": ["interjection", "verb"]},
535 # ρήμα μεταβατικό: ρήμα: verb μεταβατικό: [μεταβατικός: transitive //
536 # transition // transitional] // Accusative masculine singular form of
537 # μεταβατικός (metavatikós). // Nominative, accusative and vocative
538 # neuter singular form of μεταβατικός (metavatikós).
539 "ρήμα μεταβατικό": {"pos": "verb", "tags": ["transitive"]},
540 # ρήμα, αόριστος: ρήμα: verb αόριστος: vague // indefinite //
541 # preterite αόριστος: aorist, past tense, simple past, perfective past
542 "ρήμα, αόριστος": {"pos": "verb", "tags": ["aorist"]},
543 # ρήμα, μόριο, ουσιαστικό: ρήμα: verb μόριο: molecule // particle,
544 # speck (a very small piece of matter) // part (of the body) // part (of
545 # the body) // genitalia, parts // particle // point (in an evaluative
546 # scale) ουσιαστικό: noun, substantive
547 "ρήμα, μόριο, ουσιαστικό": {
548 "pos": "verb",
549 "tags": ["particle", "noun", "verb"],
550 },
551 # ρήμα, ουσιαστικό: ρήμα: verb ουσιαστικό: noun, substantive
552 "ρήμα, ουσιαστικό": {"pos": "verb", "tags": ["noun", "verb"]},
553 # ρήμα: ρήμα: verb
554 "ρήμα": {"pos": "verb"},
555 # ρίζα: ρίζα: root (of a plant) // root // root
556 "ρίζα": {"pos": "root", "tags": ["morpheme"]},
557 # ρηματική έκφραση: 'ρηματική' ???, έκφραση: expression
558 "ρηματική έκφραση": {"pos": "verb"},
559 # σουπίνο: 'σουπίνο' ???,
560 "σουπίνο": {"pos": "verb", "tags": ["supine"]},
561 # συντομομορφή - ουσιαστικό: συντομομορφή: abbreviation: initialism,
562 # acronym, etc '' ???, ουσιαστικό: noun, substantive
563 "συντομομορφή - ουσιαστικό": {
564 "pos": "abbrev",
565 "tags": ["noun", "abbreviation"],
566 },
567 # συντομομορφή, αρκτικόλεξο: συντομομορφή: abbreviation: initialism,
568 # acronym, etc αρκτικόλεξο: initialism
569 "συντομομορφή, αρκτικόλεξο": {"pos": "abbrev", "tags": ["initialism"]},
570 # συντομομορφή: συντομομορφή: abbreviation: initialism, acronym, etc
571 "συντομομορφή": {"pos": "abbrev"},
572 # σχήμα του ρήματος board: σχήμα: figure, shape του: [ο: the definite
573 # masculine singular article. the] // genitive masculine singular of ο
574 # (o) (the) // genitive neuter singular of ο (o) (the) του: him, it //
575 # his, its ρήματος: [ρήμα: verb] // Genitive singular form of ρήμα
576 # (ríma). 'board' ???,
577 "σχήμα του ρήματος": {"pos": "verb", "tags": ["form-of"]},
578 # σύμβολο: σύμβολο: symbol, character, glyph
579 "σύμβολο": {"pos": "symbol"},
580 # σύνδεσμος (καθαρεύουσα): σύνδεσμος: conjunction // ligament // HTML
581 # link // union, relationship, contact καθαρεύουσα: Katharevousa (purist
582 # variant of Modern Greek)
583 "σύνδεσμος (καθαρεύουσα)": {"pos": "conj", "tags": ["Katharevousa"]},
584 # σύνδεσμος: σύνδεσμος: conjunction // ligament // HTML link // union,
585 # relationship, contact
586 "σύνδεσμος": {"pos": "conj"},
587 # σύνθετο επίθετο: 'σύνθετο' ???, επίθετο: adjective // surname
588 "σύνθετο επίθετο": {"pos": "adj"},
589 # σύνθετο επίρρημα, έκφραση: 'σύνθετο' ???, επίρρημα: adverb (lexical
590 # category) έκφραση: expression
591 "σύνθετο επίρρημα, έκφραση": {"pos": "adv"},
592 # σύνθετο ουσιαστικό: 'σύνθετο' ???, ουσιαστικό: noun, substantive
593 "σύνθετο ουσιαστικό": {"pos": "noun"},
594 # φράση: φράση: phrase, expression
595 "φράση": {"pos": "phrase"},
596 # χαρακτήρας: χαρακτήρας: character (the qualities which identify a
597 # person) // character (a person's behaviours which identify them) //
598 # character, letter, symbol
599 "χαρακτήρας": {"pos": "symbol"},
600 "ρηματικός τύπος": {"pos": "verb"},
601 # Japanese translitteration entries
602 "μεταγραφή": {"pos": "romanization"},
603 "συγχώνευση": {"pos": "contraction"},
604 "μορφή σύνθετου όρου": {"pos": "contraction"},
605}
607POS_HEADINGS_RE = re.compile(
608 r"("
609 + r"|".join(
610 re.escape(s) for s in sorted(POS_HEADINGS.keys(), key=len, reverse=True)
611 )
612 + r")(.*)"
613)
616SubSectionMap = TypedDict(
617 "SubSectionMap",
618 {
619 "type": Heading,
620 # "debug" is legacy from [en], might be implemented
621 "debug": str,
622 "tags": Tags,
623 },
624 total=False,
625)
628SUBSECTION_HEADINGS: dict[str, SubSectionMap] = {
629 "etymology": {"type": Heading.Etym},
630 "ετυμολογία": {"type": Heading.Etym},
631 "πηγές": {"type": Heading.Ignored}, # Not etymology, but literary sources
632 "pronunciation": {"type": Heading.Pron},
633 "προφορά": {"type": Heading.Pron},
634 "αναλυτική κλίση": {"type": Heading.Infl},
635 "κλίση": {"type": Heading.Infl},
636 "references": {"type": Heading.Ref},
637 "αναφορές": {"type": Heading.Ref},
638 "άλλες γραφές": {"type": Heading.Transliterations},
639 "άλλες μορφές": {"type": Heading.Related},
640 "ανεπίσημα": {"type": Heading.Related},
641 "συγγενικά": {"type": Heading.Related},
642 "πολυλεκτικοί όροι": {"type": Heading.Related},
643 "συγγενείς": {"type": Heading.Related},
644 # Homonyms
645 "ομώνυμα / ομόηχα": {"type": Heading.Homonyms},
646 "συνώνυμα": {"type": Heading.Synonyms},
647 # Partial synonyms
648 "μερική συνωνυμία": {"type": Heading.Synonyms},
649 # Exact synonym
650 "ταυτόσημο": {"type": Heading.Synonyms},
651 "εκφράσεις": {"type": Heading.Related, "tags": ["idiomatic"]},
652 "σύνθετα": {"type": Heading.Related, "tags": ["compound"]},
653 "μεταγραφές": {"type": Heading.Transliterations},
654 # Related words in foreign languages
655 "παράγωγα": {"type": Heading.Derived},
656 # Derived words
657 "απόγονοι": {"type": Heading.Derived},
658 "υποκοριστικά": {"type": Heading.Derived, "tags": ["diminuitive"]},
659 # Anagrams
660 "αλλόγλωσσα παράγωγα": {"type": Heading.Translations},
661 "μεταφράσεις": {"type": Heading.Translations},
662 "αναγραμματισμοί": {"type": Heading.Ignored},
663 # "misspelling" as POS
664 "ανορθογραφία": {"type": Heading.Ignored},
665 # see also
666 "δείτε επίσης": {"type": Heading.Ignored},
667 # Antonyms
668 "αντώνυμα": {"type": Heading.Antonyms},
669 "αντώνυμη έκφραση": {"type": Heading.Antonyms},
670 "αρχικοί χρόνοι": {"type": Heading.Notes},
671 "σημειώσεις": {"type": Heading.Notes},
672 "υποσημειώσεις": {"type": Heading.Notes},
673 # 'answers' to a phrasebook question: see τι κάνεις
674 "απαντήσεις": {"type": Heading.Ignored},
675 # Proverbs
676 "παροιμίες": {"type": Heading.Ignored},
677 # External links
678 "εξωτερικοί σύνδεσμοι": {"type": Heading.Ignored},
679 # "": {"type": Heading.Err},
680}
682SUBSECTIONS_RE = re.compile(
683 r"([ =]*"
684 + r"|".join(
685 re.escape(s)
686 for s in sorted(SUBSECTION_HEADINGS.keys(), key=len, reverse=True)
687 )
688 + r")(.*)[ =]*"
689)