Coverage for src/wiktextract/extractor/pt/section_titles.py: 100%
5 statements
« prev ^ index » next coverage.py v7.14.1, created at 2026-06-03 06:55 +0000
« prev ^ index » next coverage.py v7.14.1, created at 2026-06-03 06:55 +0000
1from ...config import POSSubtitleData
3POS_DATA: dict[str, POSSubtitleData] = {
4 "artigo": {"pos": "article"},
5 "adjetivo": {"pos": "adj"},
6 "advérbio": {"pos": "adv"},
7 "caractere": {"pos": "character"},
8 "caractere hiragana": {"pos": "character", "tags": ["hiragana"]},
9 "conjunção": {"pos": "conj"},
10 "interjeição": {"pos": "intj"},
11 "numeral": {"pos": "num"},
12 "partícula": {"pos": "particle"},
13 "preposição": {"pos": "prep"},
14 "posposição": {"pos": "postp"},
15 "pronome": {"pos": "pron"},
16 "substantivo": {"pos": "noun"},
17 "verbo": {"pos": "verb"},
18 "forma de substantivo": {"pos": "noun", "tags": ["form-of"]},
19 "forma verbal": {"pos": "verb", "tags": ["form-of"]},
20 "locução": {"pos": "phrase"},
21 "locução substantiva": {"pos": "phrase", "tags": ["substantive"]},
22 "locução adjetiva": {"pos": "phrase", "tags": ["adjectival"]},
23 "locução adverbial": {"pos": "phrase", "tags": ["adverbial"]},
24 "locução prepositiva": {"pos": "phrase", "tags": ["prepositional"]},
25 "expressão": {"pos": "phrase"},
26 "abreviatura": {"pos": "abbrev", "tags": ["abbreviation"]},
27 "abreviação": {"pos": "abbrev", "tags": ["abbreviation"]},
28 "contração": {"pos": "contraction", "tags": ["contraction"]},
29 "prefixo": {"pos": "prefix", "tags": ["morpheme"]},
30 "sufixo": {"pos": "suffix", "tags": ["morpheme"]},
31 "sigla": {"pos": "abbrev", "tags": ["abbreviation"]},
32 "símbolo": {"pos": "symbol"},
33 "substantivo próprio": {"pos": "name"},
34 "adjetivo próprio": {"pos": "adj", "tags": ["name"]},
35 "forma de adjetivo": {"pos": "adj", "tags": ["form-of"]},
36 "letra": {"pos": "character", "tags": ["letter"]},
37 "transliteração": {"pos": "romanization"},
38 "numeral ordinal": {"pos": "adj"},
39 "numeral cardinal": {"pos": "adj"},
40 "ordinal equivalente": {"pos": "adj"},
41 "locução interjetiva": {"pos": "phrase", "tags": ["interjection"]},
42 "adjetivo numeral distributivo": {
43 "pos": "adj",
44 "tags": ["distributive", "numeral"],
45 },
46 "forma de pronome": {"pos": "pron", "tags": ["form-of"]},
47 "advérbio numeral": {"pos": "adv", "tags": ["numeral"]},
48 "verbo preposicionado": {"pos": "verb", "tags": ["prepositional"]},
49 "caractere han": {"pos": "character", "tags": ["han"]},
50 "hanja": {"pos": "character", "tags": ["Hanja"]},
51 "kanji": {"pos": "character", "tags": ["kanji"]},
52 "pronome pessoal": {"pos": "pron", "tags": ["person"]},
53 "pronome possessivo": {"pos": "det", "tags": ["possessive"]},
54 "antepositivo": {"pos": "prefix", "tags": ["morpheme"]},
55 "algarismo": {"pos": "num", "tags": ["number"]},
56 "expressão verbal": {"pos": "phrase", "tags": ["verb"]},
57 "forma de locução substantiva": {
58 "pos": "phrase",
59 "tags": ["noun", "form-of"],
60 },
61 "hanzi": {"pos": "character", "tags": ["hanzi"]},
62 "locução verbal": {"pos": "phrase", "tags": ["verb"]},
63 "hiragana": {"pos": "unknown", "tags": ["hiragana", "form-of"]},
64 "radical": {"pos": "root", "tags": ["morpheme"]},
65 "hantu": {"pos": "character", "tags": ["Hán-tự"]},
66 "sílaba": {"pos": "syllable"},
67 "interfixo": {"pos": "interfix", "tags": ["morpheme"]},
68 "acrônimo": {"pos": "abbrev", "tags": ["abbreviation"]},
69 "provérbio": {"pos": "proverb"},
70}
73LINKAGE_SECTIONS = {
74 "abreviações": "abbreviations",
75 "antônimos": "antonyms",
76 "antônimo": "antonyms",
77 "antónimo": "antonyms",
78 "antónimos": "antonyms",
79 "antónimos/antônimos": "antonyms",
80 "sinônimos": "synonyms",
81 "sinônimo": "synonyms",
82 "sinónimos/sinônimos": "synonyms",
83 "sinónimos": "synonyms",
84 "sinónimo": "synonyms",
85 "sinônimos e variantes": "synonyms",
86 "verbetes derivados": "derived",
87 "verbete derivado": "derived",
88 "formas alternativas": "synonyms",
89 "anagramas": "anagrams",
90 "anagrama": "anagrams",
91 "hiperônimo": "hypernyms",
92 "hiperônimos": "hypernyms",
93 "hiperónimos": "hypernyms",
94 "termos derivados": "derived",
95 "termos derivadoss": "derived",
96 "grafia antiga": "synonyms",
97 "diminutivo": "synonyms",
98 "diminutivos": "synonyms",
99 "termos relacionados": "related",
100 "variante ortográfica": "synonyms",
101 "verbetes relacionados": "related",
102 "entradas relacionadas": "related",
103 "hipônimos": "hyponyms",
104 "hiponímias": "hyponyms",
105 "hipónimos": "hyponyms",
106 "ortografias obsoletas": "synonyms",
107 "superlativo": "synonyms",
108 "outros verbetes": "related",
109 "cardinal equivalente": "synonyms",
110 "cardinais equivalentes": "synonyms",
111 "aumentativo": "synonyms",
112 "advérbios derivados": "derived",
113 "derivações": "derived",
114 "homófonos": "homophones",
115 "homófono": "homophones",
116 "homónimos/homônimos": "homonyms",
117 "homônimos": "homonyms",
118 "parônimos": "paronyms",
119 "caracteres derivados": "derived",
120 "caracteres relacionados": "related",
121 "palavras com o kanji": "related",
122 "compostos": "derived",
123 "vermos derivados": "derived",
124 "expressões": "expressions",
125 "expressão": "expressions",
126 "locuções e expressões": "expressions",
127 "exemplos de verbetes": "derived",
128 "verbo derivado": "derived",
129 "parônimo": "paronyms",
130 "palavras relacionadas": "related",
131}
133LINKAGE_TAGS = {
134 "grafia antiga": ["obsolete"],
135 "diminutivo": ["diminutive"],
136 "diminutivos": ["diminutive"],
137 "ortografias obsoletas": ["obsolete"],
138 "superlativo": ["superlative"],
139 "aumentativo": ["augmentative"],
140 "advérbios derivados": ["adverb"],
141 "verbo derivado": ["verb"],
142}
144FORM_SECTION_TAGS = {
145 "Sigla": "abbreviation",
146 "Abreviatura": "abbreviation",
147 "Símbolo": "symbol",
148 "Ordinal Equivalente": "ordinal",
149 "Forma alternativa": "alternative",
150 "Variante": "",
151 "Variantes": "",
152 "Variação": "",
153 "Grafias alternativas": "alternative",
154 "Grafia alternativa": "alternative",
155}