Coverage for src/wiktextract/extractor/vi/section_titles.py: 100%

4 statements  

« prev     ^ index     » next       coverage.py v7.14.1, created at 2026-06-03 06:55 +0000

1from ...config import POSSubtitleData 

2 

3POS_DATA: dict[str, POSSubtitleData] = { 

4 "Danh từ": {"pos": "noun"}, 

5 "Động từ": {"pos": "verb"}, 

6 "Tính từ": {"pos": "adj"}, 

7 "Định nghĩa": {"pos": "unknown"}, 

8 "Yếu tố": {"pos": "unknown"}, 

9 "Phó từ": {"pos": "adv"}, 

10 "Phụ tố": {"pos": "affix"}, 

11 "Mạo từ": {"pos": "article"}, 

12 "Trợ động từ": {"pos": "verb", "tags": ["auxiliary"]}, 

13 "Phụ tố chu vi": {"pos": "circumfix", "tags": ["morpheme"]}, 

14 "Yếu tố quanh": {"pos": "circumpos"}, 

15 "Từ ghép": {"pos": "suffix", "tags": ["clitic"]}, 

16 "cmavo": {"pos": "unknown"}, 

17 "Liên từ": {"pos": "conj"}, 

18 "Từ rút gọn": {"pos": "contraction", "tags": ["contraction"]}, 

19 "Mạo từ hạn định": {"pos": "article", "tags": ["definitive"]}, 

20 "Tính từ chỉ định": {"pos": "adj", "tags": ["demonstrative"]}, 

21 "Đại từ chỉ định": {"pos": "pron", "tags": ["demonstrative"]}, 

22 "Từ hạn định": {"pos": "det"}, 

23 "Từ ghép sau": {"pos": "suffix", "tags": ["clitic"]}, 

24 "Tên người": {"pos": "name"}, 

25 "Hanja": {"pos": "character", "tags": ["Hanja"]}, 

26 "Chữ tượng hình": {"pos": "character", "tags": ["logogram"]}, 

27 "Thành ngữ": {"pos": "phrase", "tags": ["idiomatic"]}, 

28 "Động từ không ngôi": {"pos": "verb", "tags": ["impersonal"]}, 

29 "Mạo từ bất định": {"pos": "article", "tags": ["indefinite"]}, 

30 "Trung tố": {"pos": "infix", "tags": ["morpheme"]}, 

31 "Thán từ": {"pos": "intj"}, 

32 "Từ nghi vấn": {"pos": "unknown"}, 

33 "Nội động từ": {"pos": "verb", "tags": ["intransitive"]}, 

34 "Kanji": {"pos": "character", "tags": ["kanji"]}, 

35 "Tên": {"pos": "name"}, 

36 "Số từ": {"pos": "num", "tags": ["number"]}, 

37 "Trợ từ": {"pos": "particle"}, 

38 "Động tính từ": {"pos": "adj", "tags": ["particle"]}, 

39 "Mạo từ bộ phận": {"pos": "article", "tags": ["particle"]}, 

40 "Đại từ nhân xưng": {"pos": "pron", "tags": ["particle"]}, 

41 "Địa danh": {"pos": "name", "tags": ["place"]}, 

42 "Tính từ sở hữu": {"pos": "adj", "tags": ["possessive"]}, 

43 "Yếu tố sau": {"pos": "postp"}, 

44 "Tính từ riêng": {"pos": "adj"}, 

45 "Danh từ riêng": {"pos": "name"}, 

46 "Tiền tố": {"pos": "prefix", "tags": ["morpheme"]}, 

47 "Đại từ": {"pos": "pron"}, 

48 "Tục ngữ": {"pos": "proverb"}, 

49 "Dấu câu": {"pos": "punct", "tags": ["punctuation"]}, 

50 "rafsi": {"pos": "unknown"}, 

51 "Đại từ phản thân": {"pos": "pron", "tags": ["reflexive"]}, 

52 "Động từ phản thân": {"pos": "verb", "tags": ["reflexive"]}, 

53 "Đại từ quan hệ": {"pos": "pron", "tags": ["relative"]}, 

54 "Latinh hóa": {"pos": "romanization"}, 

55 "Thân từ": {"pos": "stem"}, 

56 "Hậu tố": {"pos": "suffix", "tags": ["morpheme"]}, 

57 "Ngoại động từ": {"pos": "verb", "tags": ["transitive"]}, 

58 "Chữ cái": {"pos": "character", "tags": ["letter"]}, 

59 "Ký tự": {"pos": "character"}, 

60 "Giới từ": {"pos": "prep"}, 

61 "Ký tự chữ Hán": {"pos": "character", "tags": ["han"]}, 

62 "Ký tự số": {"pos": "character", "tags": ["number"]}, 

63 "Nghĩa": {"pos": "unknown"}, 

64 "Từ viết tắt": {"pos": "abbrev", "tags": ["abbreviation"]}, 

65 "Phân từ": {"pos": "verb", "tags": ["participle"]}, 

66} 

67 

68LINKAGE_SECTIONS = { 

69 "Từ tương tự": "related", 

70 "Từ đảo chữ": "anagrams", 

71 "Trái nghĩa": "antonyms", 

72 "Từ ghép": "derived", # compound 

73 "Từ dẫn xuất": "derived", 

74 "Phương ngữ khác": "related", # other dialects 

75 "Thành ngữ": "idioms", 

76 "Từ liên hệ": "related", 

77 "Xem thêm": "related", 

78 "Đồng nghĩa": "synonyms", 

79 "Từ đồng nghĩa": "synonyms", 

80 "Từ phái sinh": "derived", 

81 "Từ có nghĩa rộng hơn": "hypernyms", 

82 "Từ có nghĩa hẹp hơn": "hyponyms", 

83 "Liên quan": "related", 

84 "Thuật ngữ liên quan": "related", 

85 "Từ cùng trường nghĩa": "coordinate_terms", 

86 "Từ láy": "reduplicatives", 

87} 

88 

89 

90TRANSLATION_SECTIONS = frozenset(["Dịch", "Bản dịch"])