Coverage for src/wiktextract/extractor/pt/section_titles.py: 100%

4 statements  

« prev     ^ index     » next       coverage.py v7.9.0, created at 2025-06-13 07:43 +0000

1POS_DATA = { 

2 "artigo": {"pos": "article"}, 

3 "adjetivo": {"pos": "adj"}, 

4 "advérbio": {"pos": "adv"}, 

5 "caractere": {"pos": "character"}, 

6 "caractere hiragana": {"pos": "character", "tags": ["hiragana"]}, 

7 "conjunção": {"pos": "conj"}, 

8 "interjeição": {"pos": "intj"}, 

9 "numeral": {"pos": "num"}, 

10 "partícula": {"pos": "particle"}, 

11 "preposição": {"pos": "prep"}, 

12 "posposição": {"pos": "postp"}, 

13 "pronome": {"pos": "pron"}, 

14 "substantivo": {"pos": "noun"}, 

15 "verbo": {"pos": "verb"}, 

16 "forma de substantivo": {"pos": "noun", "tags": ["form-of"]}, 

17 "forma verbal": {"pos": "verb", "tags": ["form-of"]}, 

18 "locução": {"pos": "phrase"}, 

19 "locução substantiva": {"pos": "phrase", "tags": ["substantive"]}, 

20 "locução adjetiva": {"pos": "phrase", "tags": ["adjectival"]}, 

21 "locução adverbial": {"pos": "phrase", "tags": ["adverbial"]}, 

22 "locução prepositiva": {"pos": "phrase", "tags": ["prepositional"]}, 

23 "expressão": {"pos": "phrase"}, 

24 "abreviatura": {"pos": "abbrev", "tags": ["abbreviation"]}, 

25 "abreviação": {"pos": "abbrev", "tags": ["abbreviation"]}, 

26 "contração": {"pos": "contraction", "tags": ["contraction"]}, 

27 "prefixo": {"pos": "prefix", "tags": ["morpheme"]}, 

28 "sufixo": {"pos": "suffix", "tags": ["morpheme"]}, 

29 "sigla": {"pos": "abbrev", "tags": ["abbreviation"]}, 

30 "símbolo": {"pos": "symbol"}, 

31 "substantivo próprio": {"pos": "name"}, 

32 "adjetivo próprio": {"pos": "adj", "tags": ["name"]}, 

33 "forma de adjetivo": {"pos": "adj", "tags": ["form-of"]}, 

34 "letra": {"pos": "character", "tags": ["letter"]}, 

35 "transliteração": {"pos": "romanization"}, 

36 "numeral ordinal": {"pos": "adj"}, 

37 "numeral cardinal": {"pos": "adj"}, 

38 "ordinal equivalente": {"pos": "adj"}, 

39 "locução interjetiva": {"pos": "phrase", "tags": ["interjection"]}, 

40 "adjetivo numeral distributivo": { 

41 "pos": "adj", 

42 "tags": ["distributive", "numeral"], 

43 }, 

44 "forma de pronome": {"pos": "pron", "tags": ["form-of"]}, 

45 "advérbio numeral": {"pos": "adv", "tags": ["numeral"]}, 

46 "verbo preposicionado": {"pos": "verb", "tags": ["prepositional"]}, 

47 "caractere han": {"pos": "character", "tags": ["han"]}, 

48 "hanja": {"pos": "character", "tags": ["Hanja"]}, 

49 "kanji": {"pos": "character", "tags": ["kanji"]}, 

50 "pronome pessoal": {"pos": "pron", "tags": ["person"]}, 

51 "pronome possessivo": {"pos": "det", "tags": ["possessive"]}, 

52 "antepositivo": {"pos": "prefix", "tags": ["morpheme"]}, 

53 "algarismo": {"pos": "num", "tags": ["number"]}, 

54 "expressão verbal": {"pos": "phrase", "tags": ["verb"]}, 

55 "forma de locução substantiva": { 

56 "pos": "phrase", 

57 "tags": ["noun", "form-of"], 

58 }, 

59 "hanzi": {"pos": "character", "tags": ["hanzi"]}, 

60 "locução verbal": {"pos": "phrase", "tags": ["verb"]}, 

61 "hiragana": {"pos": "unknown", "tags": ["hiragana", "form-of"]}, 

62 "radical": {"pos": "root", "tags": ["morpheme"]}, 

63 "hantu": {"pos": "character", "tags": ["Hán-tự"]}, 

64 "sílaba": {"pos": "syllable"}, 

65} 

66 

67 

68LINKAGE_SECTIONS = { 

69 "abreviações": "abbreviations", 

70 "antônimos": "antonyms", 

71 "antônimo": "antonyms", 

72 "antónimo": "antonyms", 

73 "antónimos": "antonyms", 

74 "antónimos/antônimos": "antonyms", 

75 "sinônimos": "synonyms", 

76 "sinônimo": "synonyms", 

77 "sinónimos/sinônimos": "synonyms", 

78 "sinónimos": "synonyms", 

79 "sinónimo": "synonyms", 

80 "sinônimos e variantes": "synonyms", 

81 "verbetes derivados": "derived", 

82 "verbete derivado": "derived", 

83 "formas alternativas": "synonyms", 

84 "anagramas": "anagrams", 

85 "anagrama": "anagrams", 

86 "hiperônimo": "hypernyms", 

87 "hiperônimos": "hypernyms", 

88 "hiperónimos": "hypernyms", 

89 "termos derivados": "derived", 

90 "termos derivadoss": "derived", 

91 "grafia antiga": "synonyms", 

92 "diminutivo": "synonyms", 

93 "diminutivos": "synonyms", 

94 "termos relacionados": "related", 

95 "variante ortográfica": "synonyms", 

96 "verbetes relacionados": "related", 

97 "entradas relacionadas": "related", 

98 "hipônimos": "hyponyms", 

99 "hiponímias": "hyponyms", 

100 "hipónimos": "hyponyms", 

101 "ortografias obsoletas": "synonyms", 

102 "superlativo": "synonyms", 

103 "outros verbetes": "related", 

104 "cardinal equivalente": "synonyms", 

105 "cardinais equivalentes": "synonyms", 

106 "aumentativo": "synonyms", 

107 "advérbios derivados": "derived", 

108 "derivações": "derived", 

109 "homófonos": "homophones", 

110 "homófono": "homophones", 

111 "homónimos/homônimos": "homonyms", 

112 "homônimos": "homonyms", 

113 "parônimos": "paronyms", 

114 "caracteres derivados": "derived", 

115 "caracteres relacionados": "related", 

116 "palavras com o kanji": "related", 

117 "compostos": "derived", 

118 "vermos derivados": "derived", 

119 "expressões": "expressions", 

120 "expressão": "expressions", 

121 "locuções e expressões": "expressions", 

122 "exemplos de verbetes": "derived", 

123 "verbo derivado": "derived", 

124 "parônimo": "paronyms", 

125 "palavras relacionadas": "related", 

126} 

127 

128LINKAGE_TAGS = { 

129 "grafia antiga": ["obsolete"], 

130 "diminutivo": ["diminutive"], 

131 "diminutivos": ["diminutive"], 

132 "ortografias obsoletas": ["obsolete"], 

133 "superlativo": ["superlative"], 

134 "aumentativo": ["augmentative"], 

135 "advérbios derivados": ["adverb"], 

136 "verbo derivado": ["verb"], 

137} 

138 

139FORM_SECTION_TAGS = { 

140 "Sigla": "abbreviation", 

141 "Abreviatura": "abbreviation", 

142 "Símbolo": "symbol", 

143 "Ordinal Equivalente": "ordinal", 

144 "Forma alternativa": "alternative", 

145 "Variante": "", 

146 "Variantes": "", 

147 "Variação": "", 

148 "Grafias alternativas": "alternative", 

149 "Grafia alternativa": "alternative", 

150}