Coverage for src/wiktextract/extractor/pt/section_titles.py: 100%
4 statements
« prev ^ index » next coverage.py v7.10.3, created at 2025-08-15 05:18 +0000
« prev ^ index » next coverage.py v7.10.3, created at 2025-08-15 05:18 +0000
1POS_DATA = {
2 "artigo": {"pos": "article"},
3 "adjetivo": {"pos": "adj"},
4 "advérbio": {"pos": "adv"},
5 "caractere": {"pos": "character"},
6 "caractere hiragana": {"pos": "character", "tags": ["hiragana"]},
7 "conjunção": {"pos": "conj"},
8 "interjeição": {"pos": "intj"},
9 "numeral": {"pos": "num"},
10 "partícula": {"pos": "particle"},
11 "preposição": {"pos": "prep"},
12 "posposição": {"pos": "postp"},
13 "pronome": {"pos": "pron"},
14 "substantivo": {"pos": "noun"},
15 "verbo": {"pos": "verb"},
16 "forma de substantivo": {"pos": "noun", "tags": ["form-of"]},
17 "forma verbal": {"pos": "verb", "tags": ["form-of"]},
18 "locução": {"pos": "phrase"},
19 "locução substantiva": {"pos": "phrase", "tags": ["substantive"]},
20 "locução adjetiva": {"pos": "phrase", "tags": ["adjectival"]},
21 "locução adverbial": {"pos": "phrase", "tags": ["adverbial"]},
22 "locução prepositiva": {"pos": "phrase", "tags": ["prepositional"]},
23 "expressão": {"pos": "phrase"},
24 "abreviatura": {"pos": "abbrev", "tags": ["abbreviation"]},
25 "abreviação": {"pos": "abbrev", "tags": ["abbreviation"]},
26 "contração": {"pos": "contraction", "tags": ["contraction"]},
27 "prefixo": {"pos": "prefix", "tags": ["morpheme"]},
28 "sufixo": {"pos": "suffix", "tags": ["morpheme"]},
29 "sigla": {"pos": "abbrev", "tags": ["abbreviation"]},
30 "símbolo": {"pos": "symbol"},
31 "substantivo próprio": {"pos": "name"},
32 "adjetivo próprio": {"pos": "adj", "tags": ["name"]},
33 "forma de adjetivo": {"pos": "adj", "tags": ["form-of"]},
34 "letra": {"pos": "character", "tags": ["letter"]},
35 "transliteração": {"pos": "romanization"},
36 "numeral ordinal": {"pos": "adj"},
37 "numeral cardinal": {"pos": "adj"},
38 "ordinal equivalente": {"pos": "adj"},
39 "locução interjetiva": {"pos": "phrase", "tags": ["interjection"]},
40 "adjetivo numeral distributivo": {
41 "pos": "adj",
42 "tags": ["distributive", "numeral"],
43 },
44 "forma de pronome": {"pos": "pron", "tags": ["form-of"]},
45 "advérbio numeral": {"pos": "adv", "tags": ["numeral"]},
46 "verbo preposicionado": {"pos": "verb", "tags": ["prepositional"]},
47 "caractere han": {"pos": "character", "tags": ["han"]},
48 "hanja": {"pos": "character", "tags": ["Hanja"]},
49 "kanji": {"pos": "character", "tags": ["kanji"]},
50 "pronome pessoal": {"pos": "pron", "tags": ["person"]},
51 "pronome possessivo": {"pos": "det", "tags": ["possessive"]},
52 "antepositivo": {"pos": "prefix", "tags": ["morpheme"]},
53 "algarismo": {"pos": "num", "tags": ["number"]},
54 "expressão verbal": {"pos": "phrase", "tags": ["verb"]},
55 "forma de locução substantiva": {
56 "pos": "phrase",
57 "tags": ["noun", "form-of"],
58 },
59 "hanzi": {"pos": "character", "tags": ["hanzi"]},
60 "locução verbal": {"pos": "phrase", "tags": ["verb"]},
61 "hiragana": {"pos": "unknown", "tags": ["hiragana", "form-of"]},
62 "radical": {"pos": "root", "tags": ["morpheme"]},
63 "hantu": {"pos": "character", "tags": ["Hán-tự"]},
64 "sílaba": {"pos": "syllable"},
65 "interfixo": {"pos": "interfix", "tags": ["morpheme"]},
66 "acrônimo": {"pos": "abbrev", "tags": ["abbreviation"]},
67 "provérbio": {"pos": "proverb"},
68}
71LINKAGE_SECTIONS = {
72 "abreviações": "abbreviations",
73 "antônimos": "antonyms",
74 "antônimo": "antonyms",
75 "antónimo": "antonyms",
76 "antónimos": "antonyms",
77 "antónimos/antônimos": "antonyms",
78 "sinônimos": "synonyms",
79 "sinônimo": "synonyms",
80 "sinónimos/sinônimos": "synonyms",
81 "sinónimos": "synonyms",
82 "sinónimo": "synonyms",
83 "sinônimos e variantes": "synonyms",
84 "verbetes derivados": "derived",
85 "verbete derivado": "derived",
86 "formas alternativas": "synonyms",
87 "anagramas": "anagrams",
88 "anagrama": "anagrams",
89 "hiperônimo": "hypernyms",
90 "hiperônimos": "hypernyms",
91 "hiperónimos": "hypernyms",
92 "termos derivados": "derived",
93 "termos derivadoss": "derived",
94 "grafia antiga": "synonyms",
95 "diminutivo": "synonyms",
96 "diminutivos": "synonyms",
97 "termos relacionados": "related",
98 "variante ortográfica": "synonyms",
99 "verbetes relacionados": "related",
100 "entradas relacionadas": "related",
101 "hipônimos": "hyponyms",
102 "hiponímias": "hyponyms",
103 "hipónimos": "hyponyms",
104 "ortografias obsoletas": "synonyms",
105 "superlativo": "synonyms",
106 "outros verbetes": "related",
107 "cardinal equivalente": "synonyms",
108 "cardinais equivalentes": "synonyms",
109 "aumentativo": "synonyms",
110 "advérbios derivados": "derived",
111 "derivações": "derived",
112 "homófonos": "homophones",
113 "homófono": "homophones",
114 "homónimos/homônimos": "homonyms",
115 "homônimos": "homonyms",
116 "parônimos": "paronyms",
117 "caracteres derivados": "derived",
118 "caracteres relacionados": "related",
119 "palavras com o kanji": "related",
120 "compostos": "derived",
121 "vermos derivados": "derived",
122 "expressões": "expressions",
123 "expressão": "expressions",
124 "locuções e expressões": "expressions",
125 "exemplos de verbetes": "derived",
126 "verbo derivado": "derived",
127 "parônimo": "paronyms",
128 "palavras relacionadas": "related",
129}
131LINKAGE_TAGS = {
132 "grafia antiga": ["obsolete"],
133 "diminutivo": ["diminutive"],
134 "diminutivos": ["diminutive"],
135 "ortografias obsoletas": ["obsolete"],
136 "superlativo": ["superlative"],
137 "aumentativo": ["augmentative"],
138 "advérbios derivados": ["adverb"],
139 "verbo derivado": ["verb"],
140}
142FORM_SECTION_TAGS = {
143 "Sigla": "abbreviation",
144 "Abreviatura": "abbreviation",
145 "Símbolo": "symbol",
146 "Ordinal Equivalente": "ordinal",
147 "Forma alternativa": "alternative",
148 "Variante": "",
149 "Variantes": "",
150 "Variação": "",
151 "Grafias alternativas": "alternative",
152 "Grafia alternativa": "alternative",
153}