Coverage for src/wiktextract/extractor/pt/section_titles.py: 100%

5 statements  

« prev     ^ index     » next       coverage.py v7.14.1, created at 2026-06-03 06:55 +0000

1from ...config import POSSubtitleData 

2 

3POS_DATA: dict[str, POSSubtitleData] = { 

4 "artigo": {"pos": "article"}, 

5 "adjetivo": {"pos": "adj"}, 

6 "advérbio": {"pos": "adv"}, 

7 "caractere": {"pos": "character"}, 

8 "caractere hiragana": {"pos": "character", "tags": ["hiragana"]}, 

9 "conjunção": {"pos": "conj"}, 

10 "interjeição": {"pos": "intj"}, 

11 "numeral": {"pos": "num"}, 

12 "partícula": {"pos": "particle"}, 

13 "preposição": {"pos": "prep"}, 

14 "posposição": {"pos": "postp"}, 

15 "pronome": {"pos": "pron"}, 

16 "substantivo": {"pos": "noun"}, 

17 "verbo": {"pos": "verb"}, 

18 "forma de substantivo": {"pos": "noun", "tags": ["form-of"]}, 

19 "forma verbal": {"pos": "verb", "tags": ["form-of"]}, 

20 "locução": {"pos": "phrase"}, 

21 "locução substantiva": {"pos": "phrase", "tags": ["substantive"]}, 

22 "locução adjetiva": {"pos": "phrase", "tags": ["adjectival"]}, 

23 "locução adverbial": {"pos": "phrase", "tags": ["adverbial"]}, 

24 "locução prepositiva": {"pos": "phrase", "tags": ["prepositional"]}, 

25 "expressão": {"pos": "phrase"}, 

26 "abreviatura": {"pos": "abbrev", "tags": ["abbreviation"]}, 

27 "abreviação": {"pos": "abbrev", "tags": ["abbreviation"]}, 

28 "contração": {"pos": "contraction", "tags": ["contraction"]}, 

29 "prefixo": {"pos": "prefix", "tags": ["morpheme"]}, 

30 "sufixo": {"pos": "suffix", "tags": ["morpheme"]}, 

31 "sigla": {"pos": "abbrev", "tags": ["abbreviation"]}, 

32 "símbolo": {"pos": "symbol"}, 

33 "substantivo próprio": {"pos": "name"}, 

34 "adjetivo próprio": {"pos": "adj", "tags": ["name"]}, 

35 "forma de adjetivo": {"pos": "adj", "tags": ["form-of"]}, 

36 "letra": {"pos": "character", "tags": ["letter"]}, 

37 "transliteração": {"pos": "romanization"}, 

38 "numeral ordinal": {"pos": "adj"}, 

39 "numeral cardinal": {"pos": "adj"}, 

40 "ordinal equivalente": {"pos": "adj"}, 

41 "locução interjetiva": {"pos": "phrase", "tags": ["interjection"]}, 

42 "adjetivo numeral distributivo": { 

43 "pos": "adj", 

44 "tags": ["distributive", "numeral"], 

45 }, 

46 "forma de pronome": {"pos": "pron", "tags": ["form-of"]}, 

47 "advérbio numeral": {"pos": "adv", "tags": ["numeral"]}, 

48 "verbo preposicionado": {"pos": "verb", "tags": ["prepositional"]}, 

49 "caractere han": {"pos": "character", "tags": ["han"]}, 

50 "hanja": {"pos": "character", "tags": ["Hanja"]}, 

51 "kanji": {"pos": "character", "tags": ["kanji"]}, 

52 "pronome pessoal": {"pos": "pron", "tags": ["person"]}, 

53 "pronome possessivo": {"pos": "det", "tags": ["possessive"]}, 

54 "antepositivo": {"pos": "prefix", "tags": ["morpheme"]}, 

55 "algarismo": {"pos": "num", "tags": ["number"]}, 

56 "expressão verbal": {"pos": "phrase", "tags": ["verb"]}, 

57 "forma de locução substantiva": { 

58 "pos": "phrase", 

59 "tags": ["noun", "form-of"], 

60 }, 

61 "hanzi": {"pos": "character", "tags": ["hanzi"]}, 

62 "locução verbal": {"pos": "phrase", "tags": ["verb"]}, 

63 "hiragana": {"pos": "unknown", "tags": ["hiragana", "form-of"]}, 

64 "radical": {"pos": "root", "tags": ["morpheme"]}, 

65 "hantu": {"pos": "character", "tags": ["Hán-tự"]}, 

66 "sílaba": {"pos": "syllable"}, 

67 "interfixo": {"pos": "interfix", "tags": ["morpheme"]}, 

68 "acrônimo": {"pos": "abbrev", "tags": ["abbreviation"]}, 

69 "provérbio": {"pos": "proverb"}, 

70} 

71 

72 

73LINKAGE_SECTIONS = { 

74 "abreviações": "abbreviations", 

75 "antônimos": "antonyms", 

76 "antônimo": "antonyms", 

77 "antónimo": "antonyms", 

78 "antónimos": "antonyms", 

79 "antónimos/antônimos": "antonyms", 

80 "sinônimos": "synonyms", 

81 "sinônimo": "synonyms", 

82 "sinónimos/sinônimos": "synonyms", 

83 "sinónimos": "synonyms", 

84 "sinónimo": "synonyms", 

85 "sinônimos e variantes": "synonyms", 

86 "verbetes derivados": "derived", 

87 "verbete derivado": "derived", 

88 "formas alternativas": "synonyms", 

89 "anagramas": "anagrams", 

90 "anagrama": "anagrams", 

91 "hiperônimo": "hypernyms", 

92 "hiperônimos": "hypernyms", 

93 "hiperónimos": "hypernyms", 

94 "termos derivados": "derived", 

95 "termos derivadoss": "derived", 

96 "grafia antiga": "synonyms", 

97 "diminutivo": "synonyms", 

98 "diminutivos": "synonyms", 

99 "termos relacionados": "related", 

100 "variante ortográfica": "synonyms", 

101 "verbetes relacionados": "related", 

102 "entradas relacionadas": "related", 

103 "hipônimos": "hyponyms", 

104 "hiponímias": "hyponyms", 

105 "hipónimos": "hyponyms", 

106 "ortografias obsoletas": "synonyms", 

107 "superlativo": "synonyms", 

108 "outros verbetes": "related", 

109 "cardinal equivalente": "synonyms", 

110 "cardinais equivalentes": "synonyms", 

111 "aumentativo": "synonyms", 

112 "advérbios derivados": "derived", 

113 "derivações": "derived", 

114 "homófonos": "homophones", 

115 "homófono": "homophones", 

116 "homónimos/homônimos": "homonyms", 

117 "homônimos": "homonyms", 

118 "parônimos": "paronyms", 

119 "caracteres derivados": "derived", 

120 "caracteres relacionados": "related", 

121 "palavras com o kanji": "related", 

122 "compostos": "derived", 

123 "vermos derivados": "derived", 

124 "expressões": "expressions", 

125 "expressão": "expressions", 

126 "locuções e expressões": "expressions", 

127 "exemplos de verbetes": "derived", 

128 "verbo derivado": "derived", 

129 "parônimo": "paronyms", 

130 "palavras relacionadas": "related", 

131} 

132 

133LINKAGE_TAGS = { 

134 "grafia antiga": ["obsolete"], 

135 "diminutivo": ["diminutive"], 

136 "diminutivos": ["diminutive"], 

137 "ortografias obsoletas": ["obsolete"], 

138 "superlativo": ["superlative"], 

139 "aumentativo": ["augmentative"], 

140 "advérbios derivados": ["adverb"], 

141 "verbo derivado": ["verb"], 

142} 

143 

144FORM_SECTION_TAGS = { 

145 "Sigla": "abbreviation", 

146 "Abreviatura": "abbreviation", 

147 "Símbolo": "symbol", 

148 "Ordinal Equivalente": "ordinal", 

149 "Forma alternativa": "alternative", 

150 "Variante": "", 

151 "Variantes": "", 

152 "Variação": "", 

153 "Grafias alternativas": "alternative", 

154 "Grafia alternativa": "alternative", 

155}