Coverage for src/wiktextract/extractor/vi/section_titles.py: 100%

3 statements  

« prev     ^ index     » next       coverage.py v7.10.7, created at 2025-10-13 10:14 +0000

1POS_DATA = { 

2 "Danh từ": {"pos": "noun"}, 

3 "Động từ": {"pos": "verb"}, 

4 "Tính từ": {"pos": "adj"}, 

5 "Định nghĩa": {"pos": "unknown"}, 

6 "Yếu tố": {"pos": "unknown"}, 

7 "Phó từ": {"pos": "adv"}, 

8 "Phụ tố": {"pos": "affix"}, 

9 "Mạo từ": {"pos": "article"}, 

10 "Trợ động từ": {"pos": "verb", "tags": ["auxiliary"]}, 

11 "Phụ tố chu vi": {"pos": "circumfix", "tags": ["morpheme"]}, 

12 "Yếu tố quanh": {"pos": "circumpos"}, 

13 "Từ ghép": {"pos": "suffix", "tags": ["clitic"]}, 

14 "cmavo": {"pos": "unknown"}, 

15 "Liên từ": {"pos": "conj"}, 

16 "Từ rút gọn": {"pos": "contraction", "tags": ["contraction"]}, 

17 "Mạo từ hạn định": {"pos": "article", "tags": ["definitive"]}, 

18 "Tính từ chỉ định": {"pos": "adj", "tags": ["demonstrative"]}, 

19 "Đại từ chỉ định": {"pos": "pron", "tags": ["demonstrative"]}, 

20 "Từ hạn định": {"pos": "det"}, 

21 "Từ ghép sau": {"pos": "suffix", "tags": ["clitic"]}, 

22 "Tên người": {"pos": "name"}, 

23 "Hanja": {"pos": "character", "tags": ["Hanja"]}, 

24 "Chữ tượng hình": {"pos": "character", "tags": ["logogram"]}, 

25 "Thành ngữ": {"pos": "phrase", "tags": ["idiomatic"]}, 

26 "Động từ không ngôi": {"pos": "verb", "tags": ["impersonal"]}, 

27 "Mạo từ bất định": {"pos": "article", "tags": ["indefinite"]}, 

28 "Trung tố": {"pos": "infix", "tags": ["morpheme"]}, 

29 "Thán từ": {"pos": "intj"}, 

30 "Từ nghi vấn": {"pos": "unknown"}, 

31 "Nội động từ": {"pos": "verb", "tags": ["intransitive"]}, 

32 "Kanji": {"pos": "character", "tags": ["kanji"]}, 

33 "Tên": {"pos": "name"}, 

34 "Số từ": {"pos": "num", "tags": ["number"]}, 

35 "Trợ từ": {"pos": "particle"}, 

36 "Động tính từ": {"pos": "adj", "tags": ["particle"]}, 

37 "Mạo từ bộ phận": {"pos": "article", "tags": ["particle"]}, 

38 "Đại từ nhân xưng": {"pos": "pron", "tags": ["particle"]}, 

39 "Địa danh": {"pos": "name", "tags": ["place"]}, 

40 "Tính từ sở hữu": {"pos": "adj", "tags": ["possessive"]}, 

41 "Yếu tố sau": {"pos": "postp"}, 

42 "Tính từ riêng": {"pos": "adj"}, 

43 "Danh từ riêng": {"pos": "name"}, 

44 "Tiền tố": {"pos": "prefix", "tags": ["morpheme"]}, 

45 "Đại từ": {"pos": "pron"}, 

46 "Tục ngữ": {"pos": "proverb"}, 

47 "Dấu câu": {"pos": "punct", "tags": ["punctuation"]}, 

48 "rafsi": {"pos": "unknown"}, 

49 "Đại từ phản thân": {"pos": "pron", "tags": ["reflexive"]}, 

50 "Động từ phản thân": {"pos": "verb", "tags": ["reflexive"]}, 

51 "Đại từ quan hệ": {"pos": "pron", "tags": ["relative"]}, 

52 "Latinh hóa": {"pos": "romanization"}, 

53 "Thân từ": {"pos": "stem"}, 

54 "Hậu tố": {"pos": "suffix", "tags": ["morpheme"]}, 

55 "Ngoại động từ": {"pos": "verb", "tags": ["transitive"]}, 

56 "Chữ cái": {"pos": "character", "tags": ["letter"]}, 

57 "Ký tự": {"pos": "character"}, 

58 "Giới từ": {"pos": "prep"}, 

59 "Ký tự chữ Hán": {"pos": "character", "tags": ["han"]}, 

60 "Ký tự số": {"pos": "character", "tags": ["number"]}, 

61 "Nghĩa": {"pos": "unknown"}, 

62 "Từ viết tắt": {"pos": "abbrev", "tags": ["abbreviation"]}, 

63 "Phân từ": {"pos": "verb", "tags": ["participle"]}, 

64} 

65 

66LINKAGE_SECTIONS = { 

67 "Từ tương tự": "related", 

68 "Từ đảo chữ": "anagrams", 

69 "Trái nghĩa": "antonyms", 

70 "Từ ghép": "derived", # compound 

71 "Từ dẫn xuất": "derived", 

72 "Phương ngữ khác": "related", # other dialects 

73 "Thành ngữ": "idioms", 

74 "Từ liên hệ": "related", 

75 "Xem thêm": "related", 

76 "Đồng nghĩa": "synonyms", 

77 "Từ đồng nghĩa": "synonyms", 

78 "Từ phái sinh": "derived", 

79 "Từ có nghĩa rộng hơn": "hypernyms", 

80 "Từ có nghĩa hẹp hơn": "hyponyms", 

81 "Liên quan": "related", 

82 "Thuật ngữ liên quan": "related", 

83 "Từ cùng trường nghĩa": "coordinate_terms", 

84 "Từ láy": "reduplicatives", 

85} 

86 

87 

88TRANSLATION_SECTIONS = frozenset(["Dịch", "Bản dịch"])