Coverage for src/wiktextract/extractor/vi/tags.py: 88%
32 statements
« prev ^ index » next coverage.py v7.10.7, created at 2025-10-13 10:14 +0000
« prev ^ index » next coverage.py v7.10.7, created at 2025-10-13 10:14 +0000
1from .models import WordEntry
3# https://vi.wiktionary.org/wiki/Mô_đun:labels/data
4LABEL_TAGS = {
5 "viết tắt": "abbreviation",
6 "trừu tượng": "abstract-noun",
7 "acronym": "acronym",
8 "ngoại động từ, nội động từ": "ambitransitive",
9 "archaic": "archaic",
10 "thuộc ngữ": "attributive",
11 "attributively": "attributively",
12 "trợ động từ": "auxiliary",
13 "giống chung": "common",
14 "đếm được": "countable",
15 "ngoại động từ kép": "ditransitive",
16 "khiển cách": "ergative",
17 "nghĩa mở rộng": "broadly",
18 "thành ngữ tính": "idiomatic",
19 "ở dạng số nhiều": "plural",
20 "viết tắt từ chữ đầu với cách đọc ghép âm": "initialism",
21 "nội động từ": "intransitive",
22 "không so sánh được": "not-comparable",
23 "tượng thanh": "onomatopoeic",
24 "chỉ có số nhiều": "plural-only",
25 "tính từ quan hệ": "relational",
26 "động từ tĩnh": "stative",
27 "ngoại động từ": "transitive",
28 "từ láy": "reduplication",
29 "không đếm được": "uncountable",
30 "cổ xưa": "archaic",
31 "ngôn ngữ trẻ con": "childish",
32 "vietnamese chữ Nôm": "Chữ-Nôm",
33 "từ lóng có vần điệu của người Luân Đôn": ["Cockney", "slang"],
34 "thông tục": "colloquial",
35 "lỗi thời": "dated",
36 "nghĩa xấu": "derogatory",
37 "phương ngữ": "dialectal",
38 "thuộc phương ngữ": "dialectal",
39 "xúc phạm dân tộc": ["ethnic", "slang"],
40 "uyển ngữ": "euphemistic",
41 "thân mật": "familiar",
42 "nghĩa bóng": "figuratively",
43 "trang trọng": "formal",
44 "từ lóng người đồng tính": "slang",
45 "từ ngữ lịch sử": "historical",
46 "kính ngữ": "honorific",
47 "hài hước": "humorous",
48 "không trang trọng": "informal",
49 "từ lóng internet": ["Internet", "slang"],
50 "trớ trêu": "ironic",
51 "nghĩa đen": "literally",
52 "ăn chương": "literary",
53 "hoán dụ": "metonymically",
54 "từ lóng quân sự": "slang",
55 "từ mới": "neologism",
56 "không còn phát sinh từ mới": "idiomatic",
57 "từ tạo ra cho trường hợp cụ thể": "nonce-word",
58 "không tiêu chuẩn": "nonstandard",
59 "không còn dùng": "obsolete",
60 "thuật ngữ không còn dùng": "obsolete",
61 "xúc phạm": "offensive",
62 "thơ ca": "poetic",
63 "lịch sự": "polite",
64 "hiếm": "rare",
65 "từ lóng": "slang",
66 "nhắn tin": "Internet",
67 "không phổ biến": "uncommon",
68 "thô tục": "vulgar",
69 "anh": "UK",
70 "biệt ngữ": "jargon",
71 "cũ": "obsolete",
72 "cổ": "archaic",
73 "không dịch": "not-translated",
74 "khẩu ngữ": "colloquial",
75 "lóng": "slang",
76 "mỉa mai": "ironic",
77 "nghĩa rộng": "broadly",
78 "số nhiều": "plural",
79 "nói trại": "euphemistic",
80 "tục tĩu": "vulgar",
81 "ít dùng": "rare",
82 "địa phương": "regional",
83 "định ngữ": "attributive",
84 "ấn độ": "India",
85 "động từ và ngoại động từ": "ambitransitive",
86 "châu mỹ": "US",
87 "hoa kỳ": "US",
88 "phát âm mỹ": "US",
89 "hoạt hình": "animate",
90 "phương ngữ mắt": "pronunciation-spelling",
91 "hy lạp cổ đại": "Ancient-Greek",
92 "la mã cổ đại": "Ancient-Rome",
93 "luật pháp hoa kỳ": "US",
94 "luật pháp việt nam": "Vietnam",
95 "chính trị úc": "Australian",
96 "chính trị philippines": "Philippine",
97 "tu từ học": "rhetoric",
98 # Template:zh-forms
99 "phồn.": "Traditional-Chinese",
100 "giản.": "Simplified-Chinese",
101 "alternative forms": "alternative",
102 "dated abbreviation": ["dated", "abbreviation"],
103 "triều châu": "Teochew",
104 "tiếng mân": "Min",
105}
107# https://vi.wiktionary.org/wiki/Mô_đun:gender_and_number/data
108GENDER_NUMBER_TAGS = {
109 "giống đực": "masculine",
110 "giống cái": "feminine",
111 "giống trung": "neuter",
112 "giống chung": "common-gender",
113 "gender-neutral": "neuter",
114 "động vật": "animate",
115 "bất động vật": "inanimate",
116 "chỉ loài vật": "animal-not-person",
117 "từ chỉ cá nhân": "person",
118 "nonpersonal": "impersonal",
119 "virile (= masculine personal)": "virile",
120 "nonvirile (= other than masculine personal)": "nonvirile",
121 "số ít": "singular",
122 "số kép": "dual",
123 "số nhiều": "plural",
124 "thể chưa hoàn thành": "imperfective",
125 "thể hoàn thành": "perfective",
126 "không đổi": "invariable",
127}
129LOCATIONS = {
130 "hà nội": "Hà-Nội",
131 "huế": "Huế",
132 "sài gòn": "Saigon",
133 "vinh": "Vinh",
134 "thanh chương": "Thanh-Chương",
135 "hà tĩnh": "Hà-Tĩnh",
136}
138SOUND_TAGS = {
139 "phát âm giọng anh chuẩn": "Received-Pronunciation",
140 "anh mỹ thông dụng": "General-American",
141}
143ZH_X_TAGS = {
144 "tiêu chuẩn hiện đại": "Standard-Chinese",
145 "bính âm": "Pinyin",
146 "cantonese": "Cantonese",
147 "mandarin": "Mandarin",
148}
150ZH_PRON_TAGS = {
151 "quan thoại": "Mandarin",
152 "tiêu chuẩn": "Standard",
153 "bính âm hán ngữ": "Pinyin",
154 "chú âm phù hiệu": "Bopomofo",
155 "xi'an": "Xi'an",
156 "guanzhong pinyin": ["Guanzhong", "Pinyin"],
157 "đông can": "Dungan",
158 "chữ kirin": "Cyrillic",
159 "wiktionary": "Wiktionary",
160 "quảng đông": "Guanzhong",
161 "việt bính": "Jyutping",
162 "khách gia": "Hakka",
163 "sixian": "Sixian",
164 "pfs": "Phak-fa-su",
165 "mai huyện": "Meixian",
166 "mân bắc": "Min-Bei",
167 "kcr": "Kienning-Colloquial-Romanized",
168 "mân đông": "Min-Dong",
169 "buc": "Foochow-Romanized",
170 "mân nam": "Min-Nan",
171 "mân tuyền chương": "Hokkien",
172 "poj": "POJ",
173 "triều châu": "Teochew",
174 "peng'im": "Peng'im",
175 "hán ngữ tiêu chuẩn": "Standard-Chinese",
176 "bính âm thông dụng": "Tongyong-Pinyin",
177 "wade–giles": "Wade-Giles",
178 "yale": "Yale",
179 "quốc ngữ la mã tự": "Gwoyeu-Romatsyh",
180 "palladius": "Palladius",
181 "ipa hán học": "Sinological-IPA",
182 "quảng đông tiêu chuẩn": "Standard-Cantonese",
183 "quảng châu–hồng kông": ["Guangzhou", "Hong Kong"],
184 "bính âm tiếng quảng đông": ["Cantonese", "Pinyin"],
185 "latinh hóa tiếng quảng đông": "Guangdong-Romanization",
186 "miền bắc sixian": ["Northern", "Sixian"],
187 "miêu lật": "Miaoli",
188 "pha̍k-fa-sṳ": "Phak-fa-su",
189 "hệ thống la mã hóa tiếng khách gia": "Hakka-Romanization-System",
190 "bính âm tiếng khách gia": "Hagfa-Pinyim",
191 "miền nam sixian": ["Southern", "Sixian"],
192 "mỹ nùng": "Neipu",
193 "kiến âu": "Jian'ou",
194 "la mã hóa phương ngữ kiến ninh": "Kienning-Colloquial-Romanized",
195 "phúc châu": "Fuzhou",
196 "bàng-uâ-cê": "Foochow-Romanized",
197 "hạ môn": "Xiamen",
198 "chương châu": "Zhangzhou",
199 "cao hùng": "Kaohsiung",
200 "phiên âm bạch thoại": "POJ",
201 "tâi-lô": "Tai-lo",
202 "phofsit daibuun": "Phofsit-Daibuun",
203 "jinjiang": "Jinjiang",
204 "philippines": "Philippines",
205 "tuyền châu": "Quanzhou",
206 "đài bắc": "Taipei",
207 "phiên âm bạch thoại-like": "POJ",
208 "phonetic": "Phonetic",
209 "ipa": "IPA",
210 "ngô": "Wu",
211 "northern": "Northern",
212 "shanghai": "Shanghai",
213}
215ZH_DIAL_TAGS = {
216 "chính thức": "formal",
217 "bạch thoại": "Written-vernacular-Chinese",
218 "quan thoại giao-liêu": "Jiaoliao-Mandarin",
219 "yên đài": "Yantai",
220 "mưu bình": "Muping",
221 "quan thoại trung nguyên": "Central-Plains-Mandarin",
222 "lạc dươn": "Luoyang",
223 "vạn vinh": "Wanrong",
224 "tây ninh": "Xining",
225 "quan thoại lan-ngân": "Lanyin-Mandarin",
226 "ngân xuyên": "Yinchuan",
227 "quan thoại tây nam": "Southwestern-Mandarin",
228 "liễu châu": "Liuzhou",
229 "quan thoại giang hoài": "Jianghuai-Mandarin",
230 "nam kinh": "Nanjing",
231 "dương châu": "Yangzhou",
232 "quảng châu": "Guangzhou",
233 "đông hoản": "Dongguan",
234 "huy châu": "Huizhou",
235 "tích khê": "Jixi",
236 "tấn": "Jin",
237 "thái nguyên": "Taiyuan",
238 "đài nam": "Tainan",
239 "lôi châu": "Leizhou",
240 "mân phủ tiên": "Puxian-Min",
241 "bình nam": "Southern-Pinghua",
242 "nam ninh": "Nanning",
243 "đình tử": "Tingzi",
244 "thượng hải": "Shanghai",
245 "tô châu": "Suzhou",
246 "đan dương": "Danyang",
247 "hàng châu": "Hangzhou",
248 "ninh ba": "Ningbo",
249 "ôn châu": "Wenzhou",
250 "kim hoa": "Jinhua",
251 "tương": "Xiang",
252 "trường sa": "Changsha",
253 "quan thoại đông bắc": "Northeastern-Mandarin",
254 "quan thoại ký-lỗ": "Jilu-Mandarin",
255 "cám": "Cantonese",
256 "mân trung sơn": "Zhongshan-Min",
257 "trung sơn": "Zhongshan",
258 "long đô": "Longdu",
259 "sa khê": "Shaxi",
260}
262TH_PRON_TAGS = {
263 "chính tả": "orthographic",
264 "âm vị": "phonemic",
265 "chính tả/âm vị": ["orthographic", "phonemic"],
266 "chuyển tự": "romanization",
267 "paiboon": "Paiboon",
268 "viện hoàng gia": "Royal-Institute",
269}
272TAGS = {
273 **LABEL_TAGS,
274 **GENDER_NUMBER_TAGS,
275 **LOCATIONS,
276 **SOUND_TAGS,
277 **ZH_X_TAGS,
278 **ZH_PRON_TAGS,
279 **ZH_DIAL_TAGS,
280 **TH_PRON_TAGS,
281}
283# https://vi.wiktionary.org/wiki/Mô_đun:labels/data/topical
284TOPICS = {
285 "địa chấn học": "seismology",
286 "thực vật học": "botany",
287 "hóa học": "chemistry",
288 "từ lóng người đồng tính": "LGBT",
289 "từ lóng quân sự": "military",
290 "bóng chày": "baseball",
291 "bóng rổ": "basketball",
292 "băng cầu": "ice-hockey",
293 "bắn cung": "archery",
294 "chính trị": "politics",
295 "cơ khí": "mechanical",
296 "cử tạ": "weightlifting",
297 "dược học": "pharmaceuticals",
298 "giải phẫu học": "anatomy",
299 "hàng hải": "shipping",
300 "hàng không": "aviation",
301 "in ấn": "printing",
302 "khoa đo lường": "metrology",
303 "khoáng vật học": "mineralogy",
304 "khúc côn cầu": "hockey",
305 "khảo cổ học": "archeology",
306 "kinh doanh": "business",
307 "kinh tế học": "economics",
308 "kiến trúc": "architecture",
309 "kiểu cách": "manner",
310 "kế toán": "accounting",
311 "kỹ thuật": "technology",
312 "luật pháp": "law",
313 "lâm nghiệp": "forestry",
314 "lôgic": "logic",
315 "lập trình": "programming",
316 "nghệ thuật": "arts",
317 "ngoại giao": "diplomacy",
318 "ngành mỏ": "mining",
319 "nhân khẩu học": "demographics",
320 "nhãn khoa": "ophthalmology",
321 "nấu nướng": "cooking",
322 "sinh thái học": "ecology",
323 "sinh vật học": "biology",
324 "sân khấu": "theater",
325 "săn bắn": "hunting",
326 "thương nghiệp": "commerce",
327 "thần học": "theology",
328 "thần thoại": "mythology",
329 "thể dục": "exercise",
330 "thể thao": "sports",
331 "tin học": "computer-sciences",
332 "tài chính": "finance",
333 "tôn giáo": "religion",
334 "văn học": "literature",
335 "vật lý học": "physics",
336 "xã hội học": "sociology",
337 "y học": "medicine",
338 "đạo giáo": "Taoism",
339 "điện học": "electricity",
340 "điện tử học": "electronics",
341 "điện ảnh": "film",
342 "đánh bài": "gambling",
343 "đường sắt": "railways",
344 "đại số": "algebra",
345 "động vật học": "zoology",
346 "nông nghiệp": "agriculture",
347 "phi cơ": "airplane",
348 "đại số học": "algebra",
349 "bóng đá mỹ": "American-football",
350 "lưỡng cư": "amphibian",
351 "bài tập": "exercise",
352 "đấu kiếm": "fencing",
353 "âm học": "acoustics",
354 "diễn xuất": "acting",
355 "quảng cáo": "advertising",
356 "hàng không học": "aeronautics",
357 "hàng không vũ trụ": "aerospace",
358 "tình cảm": "affection",
359 "khí cụ bay": "aircraft",
360 "giả kim thuật": "alchemy",
361 "thức uống có cồn": ["alcohol", "beverages"],
362 "lạm dụng rượu bia": "alcoholism",
363 "hình học đại số": "algebraic-geometry",
364 "tô pô đại số": "algebraic-topology",
365 "y học thay thế": "alternative-medicine",
366 "phát thanh nghiệp dư": "radio",
367 "bóng bầu dục Mỹ": ["US", "football"],
368 "hình học giải tích": "geometry",
369 "hóa phân tích": "chemistry",
370 "chủ nghĩa vô trị": "anarchism",
371 "anh giáo": "Anglicanism",
372 "nhân loại học": "anthropology",
373 "toán học ứng dụng": "applied-mathematics",
374 "số học": "arithmetic",
375 "trí tuệ nhân tạo": "artificial-intelligence",
376 "chiêm tinh học": "astrology",
377 "thiên văn học": "astronomy",
378 "vật lý thiên văn": "astrophysics",
379 "điền kinh": "athletics",
380 "ô tô": "automotive",
381 "trò chơi với bóng": "ball-games",
382 "ngân hàng": "banking",
383 "bdsm": "BDSM",
384 "kinh thánh": "biblical",
385 "hóa sinh": "biochemistry",
386 "sinh học": "biology",
387 "trò chơi với bàn cờ": "board-games",
388 "quyền anh": "boxing",
389 "phát sóng": "broadcasting",
390 "rêu học": "bryology",
391 "phật giáo": "Buddhism",
392 "vi tích phân": "calculus",
393 "họ lạc đà": "camelids",
394 "trò chơi bài": "card-games",
395 "bệnh học tim": "cardiology",
396 "công giáo": "Catholicism",
397 "kỹ thuật hóa học": "chemical-engineering",
398 "cờ vua": "chess",
399 "thần thoại trung hoa": "Chinese-philosophy",
400 "kitô giáo": "Christianity",
401 "trang phục": "clothing",
402 "truyện tranh": "comics",
403 "giao tiếp": "communications",
404 "chủ nghĩa cộng sản": "communism",
405 "giải tích phức": "complex-analysis",
406 "đồ hoạ máy tính": "computer-graphics",
407 "phần cứng": "computer-hardware",
408 "khoa học máy tính": "computer-sciences",
409 "bảo mật máy tính": "computer-security",
410 "máy tính": "computing",
411 "nho giáo": "Confucianism",
412 "nấu ăn": "cooking",
413 "phân thứ bộ cua": "crabs",
414 "tội phạm": "crime",
415 "phân ngành giáp xác": "Crustaceans",
416 "điều khiển học": "cybernetics",
417 "đạp xe": "cycling",
418 "sinh học tế bào": "cytology",
419 "chế phẩm sữa": "dairy-products",
420 "nha khoa": "dentistry",
421 "món tráng miệng": "desserts",
422 "chó": "dogs",
423 "giáo dục": "education",
424 "thần thoại ai cập": "Egyptian-mythology",
425 "ai cập học": "Egyptology",
426 "kỹ thuật điện": "electrical-engineering",
427 "điện": "electricity",
428 "điện từ học": "electromagnetism",
429 "kĩ thuật": "engineering",
430 "tri thức luận": "epistemology",
431 "văn học khiêu dâm": "erotic-literature",
432 "thuyết tiến hoá": "evolutionary-theory",
433 "kì ảo": "fantasy",
434 "hư cấu": "fiction",
435 "phim": "film",
436 "súng cầm tay": "firearms",
437 "hoa": "flowery",
438 "cơ học chất lưu": "fluid-dynamics",
439 "văn hóa dân gian": "folklore",
440 "hàm toán học": "functions",
441 "giải tích hàm": "functional-analysis",
442 "đồ nội thất": "furniture",
443 "trò chơi": "games",
444 "di truyền học": "genetics",
445 "địa lí học": "geography",
446 "địa chất học": "geology",
447 "hình học": "geometry",
448 "địa mạo học": "geomorphology",
449 "chính phủ": "government",
450 "ngữ pháp": "grammar",
451 "giao diện đồ họa người dùng": "graphical-user-interface",
452 "thần thoại hy lạp": "Greek-mythology",
453 "thể dục dụng cụ": "gymnastics",
454 "huyết học": "hematology",
455 "ấn độ giáo": "Hinduism",
456 "lịch sử thời đại": "history",
457 "lịch sử": "history",
458 "vi lượng đồng căn": "homeopathy",
459 "họ người": "hominids",
460 "làm vườn": "horticulture",
461 "săn": "hunting",
462 "thủy văn học": "hydrology",
463 "khúc côn cầu trên băng": "ice-hockey",
464 "ngư học": "ichthyology",
465 "ý thức hệ": "ideology",
466 "miễn dịch học": "immunology",
467 "luật quốc tế": "law",
468 "quan hệ quốc tế": "international-relations",
469 "hồi giáo": "Islam",
470 "kỳ na giáo": "Jainism",
471 "tác phẩm giả tưởng nhật bản": "Japanese-fiction",
472 "do thái giáo": "Judaism",
473 "luật pháp hoa kỳ": "law",
474 "luật pháp việt nam": "law",
475 "từ điển học": "lexicography",
476 "lgbt": "LGBT",
477 "nguồn ánh sáng": "light-sources",
478 "đại số tuyến tính": "linear-algebra",
479 "ngôn ngữ học": "linguistics",
480 "sản xuất": "manufacturing",
481 "chủ nghĩa marx": "Marxism",
482 "giải tích toán học": "mathematical-analysis",
483 "toán học": "mathematics",
484 "cơ học": "mechanics",
485 "thần thoại lưỡng hà": "Mesopotamian-mythology",
486 "luyện kim": "metallurgy",
487 "siêu hình học": "metaphysics",
488 "khí tượng học": "meteorology",
489 "đo lường học": "metrology",
490 "vi sinh vật học": "microbiology",
491 "quân sự": "military",
492 "tiền": "money",
493 "đua xe có động cơ": "motor-racing",
494 "âm nhạc": "music",
495 "nấm học": "mycology",
496 "giải phẫu thần kinh": "neuroanatomy",
497 "thần kinh học": "neurology",
498 "khoa học thần kinh": "neuroscience",
499 "họ cà": "nightshades",
500 "hóa tệ học": "numismatics",
501 "thần bí học": "occult",
502 "hải dương học": "oceanography",
503 "hệ điều hành": "operating-systems",
504 "quang học": "optics",
505 "họ lan": "Orchids",
506 "hóa hữu cơ": "organic-chemistry",
507 "điểu học": "ornithology",
508 "chính tả": "orthography",
509 "pagan giáo": "paganism",
510 "cổ sinh vật học": "paleontology",
511 "bệnh lí học": "pathology",
512 "thổ nhưỡng học": "pedology",
513 "hóa dầu": "petrochemistry",
514 "thạch luận": "petrology",
515 "dược lý học": "pharmacology",
516 "triết học": "philosophy",
517 "ngữ âm": "phonetics",
518 "âm vị học": "phonology",
519 "nhiếp ảnh": "photography",
520 "não tướng học": "physiognomy",
521 "sinh lí học": "physiology",
522 "bộ hồ tiêu": "piperales",
523 "khoa học hành tinh": "planetology",
524 "thơ": "poetry",
525 "khoa học chính trị": "political-science",
526 "chính trị úc": "politics",
527 "chính trị philippines": "politics",
528 "khiêu dâm": "pornography",
529 "tâm thần học": "psychiatry",
530 "tâm lý học": "psychology",
531 "vận tải đường sắt": "rail-transport",
532 "tài liệu tham khảo": "reference-works",
533 "giáo hội công giáo": "Roman-Catholicism",
534 "thần thoại la mã": "Roman-mythology",
535 "xoay tròn": "rotation",
536 "khoa học viễn tưởng": "science-fiction",
537 "khoa học": "sciences",
538 "chứng khoán": "securities",
539 "ngữ nghĩa học": "semantics",
540 "lí thuyết tập hợp": "set-theory",
541 "tình dục": "sex",
542 "tình dục học": "sexology",
543 "tính dục": "sexuality",
544 "ca hát": "singing",
545 "bóng đá": "soccer",
546 "khoa học xã hội": "social-sciences",
547 "chủ nghĩa xã hội": "socialism",
548 "phương tiện truyền thông mạng xã hội": "social-media",
549 "ngôn ngữ học xã hội": "sociolinguistics",
550 "phổ học": "spectroscopy",
551 "bơi lội": "swimming",
552 "hệ thống": "systems",
553 "lý thuyết hệ thống": "systems-theory",
554 "phân loại học": "taxonomy",
555 "công nghệ": "technology",
556 "quái thai học": "teratology",
557 "dệt may": "textiles",
558 "nhiệt động học": "thermodynamics",
559 "du lịch": "tourism",
560 "đông y": "traditional-Chinese-medicine",
561 "người chuyển giới": "transgender",
562 "giao thông": "transport",
563 "lượng giác": "trigonometry",
564 "hàm lượng giác": "trigonometric-function",
565 "đơn vị đo": "units-of-measure",
566 "rau": "vegetable",
567 "phương tiện giao thông": "vehicles",
568 "thú y": "veterinary-medicine",
569 "nén video": "video-compression",
570 "núi lửa học": "volcanology",
571 "thời tiết": "weather",
572 "môn thể thao mùa đông": "winter-sports",
573 "nhân vật kinh thánh": "biblical",
574 "chòm sao": "constellation",
575 "bệnh": "disease",
576 "acid béo": "fatty-acid",
577 "tu từ học": "figure-of-speech",
578 "vị thần hy lạp": "Greek-god",
579 "huy hiệu học": "heraldic-charge",
580 "thần thánh ấn độ": "Hindu-god",
581 "hợp chất vô cơ": "inorganic-compound",
582 "địa mạo": "landforms",
583 "khoáng vật": "mineralogy",
584 "điện thoại di động": "mobile-phones",
585 "nhạc cụ": "musical-instruments",
586 "hóa học hữu cơ": "organic-compound",
587 "thực vật": "plant",
588 "bộ xương": "skeleton",
589 "tàu chiến": "warships",
590 "nước": "water",
591}
594def translate_raw_tags(data: WordEntry) -> None:
595 raw_tags = []
596 for raw_tag in data.raw_tags:
597 found_tag = False
598 if raw_tag.lower() in TAGS and hasattr(data, "tags"):
599 found_tag = True
600 tr_tag = TAGS[raw_tag.lower()]
601 if isinstance(tr_tag, str):
602 data.tags.append(tr_tag)
603 elif isinstance(tr_tag, list): 603 ↛ 605line 603 didn't jump to line 605 because the condition on line 603 was always true
604 data.tags.extend(tr_tag)
605 if raw_tag.lower() in TOPICS and hasattr(data, "topics"):
606 found_tag = True
607 topic = TOPICS[raw_tag.lower()]
608 if isinstance(topic, str): 608 ↛ 610line 608 didn't jump to line 610 because the condition on line 608 was always true
609 data.topics.append(topic)
610 elif isinstance(topic, list):
611 data.topics.extend(topic)
612 if not found_tag:
613 raw_tags.append(raw_tag)
614 data.raw_tags = raw_tags