Coverage for src/wiktextract/extractor/vi/section_titles.py: 100%
4 statements
« prev ^ index » next coverage.py v7.14.1, created at 2026-06-03 06:55 +0000
« prev ^ index » next coverage.py v7.14.1, created at 2026-06-03 06:55 +0000
1from ...config import POSSubtitleData
3POS_DATA: dict[str, POSSubtitleData] = {
4 "Danh từ": {"pos": "noun"},
5 "Động từ": {"pos": "verb"},
6 "Tính từ": {"pos": "adj"},
7 "Định nghĩa": {"pos": "unknown"},
8 "Yếu tố": {"pos": "unknown"},
9 "Phó từ": {"pos": "adv"},
10 "Phụ tố": {"pos": "affix"},
11 "Mạo từ": {"pos": "article"},
12 "Trợ động từ": {"pos": "verb", "tags": ["auxiliary"]},
13 "Phụ tố chu vi": {"pos": "circumfix", "tags": ["morpheme"]},
14 "Yếu tố quanh": {"pos": "circumpos"},
15 "Từ ghép": {"pos": "suffix", "tags": ["clitic"]},
16 "cmavo": {"pos": "unknown"},
17 "Liên từ": {"pos": "conj"},
18 "Từ rút gọn": {"pos": "contraction", "tags": ["contraction"]},
19 "Mạo từ hạn định": {"pos": "article", "tags": ["definitive"]},
20 "Tính từ chỉ định": {"pos": "adj", "tags": ["demonstrative"]},
21 "Đại từ chỉ định": {"pos": "pron", "tags": ["demonstrative"]},
22 "Từ hạn định": {"pos": "det"},
23 "Từ ghép sau": {"pos": "suffix", "tags": ["clitic"]},
24 "Tên người": {"pos": "name"},
25 "Hanja": {"pos": "character", "tags": ["Hanja"]},
26 "Chữ tượng hình": {"pos": "character", "tags": ["logogram"]},
27 "Thành ngữ": {"pos": "phrase", "tags": ["idiomatic"]},
28 "Động từ không ngôi": {"pos": "verb", "tags": ["impersonal"]},
29 "Mạo từ bất định": {"pos": "article", "tags": ["indefinite"]},
30 "Trung tố": {"pos": "infix", "tags": ["morpheme"]},
31 "Thán từ": {"pos": "intj"},
32 "Từ nghi vấn": {"pos": "unknown"},
33 "Nội động từ": {"pos": "verb", "tags": ["intransitive"]},
34 "Kanji": {"pos": "character", "tags": ["kanji"]},
35 "Tên": {"pos": "name"},
36 "Số từ": {"pos": "num", "tags": ["number"]},
37 "Trợ từ": {"pos": "particle"},
38 "Động tính từ": {"pos": "adj", "tags": ["particle"]},
39 "Mạo từ bộ phận": {"pos": "article", "tags": ["particle"]},
40 "Đại từ nhân xưng": {"pos": "pron", "tags": ["particle"]},
41 "Địa danh": {"pos": "name", "tags": ["place"]},
42 "Tính từ sở hữu": {"pos": "adj", "tags": ["possessive"]},
43 "Yếu tố sau": {"pos": "postp"},
44 "Tính từ riêng": {"pos": "adj"},
45 "Danh từ riêng": {"pos": "name"},
46 "Tiền tố": {"pos": "prefix", "tags": ["morpheme"]},
47 "Đại từ": {"pos": "pron"},
48 "Tục ngữ": {"pos": "proverb"},
49 "Dấu câu": {"pos": "punct", "tags": ["punctuation"]},
50 "rafsi": {"pos": "unknown"},
51 "Đại từ phản thân": {"pos": "pron", "tags": ["reflexive"]},
52 "Động từ phản thân": {"pos": "verb", "tags": ["reflexive"]},
53 "Đại từ quan hệ": {"pos": "pron", "tags": ["relative"]},
54 "Latinh hóa": {"pos": "romanization"},
55 "Thân từ": {"pos": "stem"},
56 "Hậu tố": {"pos": "suffix", "tags": ["morpheme"]},
57 "Ngoại động từ": {"pos": "verb", "tags": ["transitive"]},
58 "Chữ cái": {"pos": "character", "tags": ["letter"]},
59 "Ký tự": {"pos": "character"},
60 "Giới từ": {"pos": "prep"},
61 "Ký tự chữ Hán": {"pos": "character", "tags": ["han"]},
62 "Ký tự số": {"pos": "character", "tags": ["number"]},
63 "Nghĩa": {"pos": "unknown"},
64 "Từ viết tắt": {"pos": "abbrev", "tags": ["abbreviation"]},
65 "Phân từ": {"pos": "verb", "tags": ["participle"]},
66}
68LINKAGE_SECTIONS = {
69 "Từ tương tự": "related",
70 "Từ đảo chữ": "anagrams",
71 "Trái nghĩa": "antonyms",
72 "Từ ghép": "derived", # compound
73 "Từ dẫn xuất": "derived",
74 "Phương ngữ khác": "related", # other dialects
75 "Thành ngữ": "idioms",
76 "Từ liên hệ": "related",
77 "Xem thêm": "related",
78 "Đồng nghĩa": "synonyms",
79 "Từ đồng nghĩa": "synonyms",
80 "Từ phái sinh": "derived",
81 "Từ có nghĩa rộng hơn": "hypernyms",
82 "Từ có nghĩa hẹp hơn": "hyponyms",
83 "Liên quan": "related",
84 "Thuật ngữ liên quan": "related",
85 "Từ cùng trường nghĩa": "coordinate_terms",
86 "Từ láy": "reduplicatives",
87}
90TRANSLATION_SECTIONS = frozenset(["Dịch", "Bản dịch"])