Coverage for src/wiktextract/extractor/vi/tags.py: 88%

32 statements  

« prev     ^ index     » next       coverage.py v7.10.7, created at 2025-10-13 10:14 +0000

1from .models import WordEntry 

2 

3# https://vi.wiktionary.org/wiki/Mô_đun:labels/data 

4LABEL_TAGS = { 

5 "viết tắt": "abbreviation", 

6 "trừu tượng": "abstract-noun", 

7 "acronym": "acronym", 

8 "ngoại động từ, nội động từ": "ambitransitive", 

9 "archaic": "archaic", 

10 "thuộc ngữ": "attributive", 

11 "attributively": "attributively", 

12 "trợ động từ": "auxiliary", 

13 "giống chung": "common", 

14 "đếm được": "countable", 

15 "ngoại động từ kép": "ditransitive", 

16 "khiển cách": "ergative", 

17 "nghĩa mở rộng": "broadly", 

18 "thành ngữ tính": "idiomatic", 

19 "ở dạng số nhiều": "plural", 

20 "viết tắt từ chữ đầu với cách đọc ghép âm": "initialism", 

21 "nội động từ": "intransitive", 

22 "không so sánh được": "not-comparable", 

23 "tượng thanh": "onomatopoeic", 

24 "chỉ có số nhiều": "plural-only", 

25 "tính từ quan hệ": "relational", 

26 "động từ tĩnh": "stative", 

27 "ngoại động từ": "transitive", 

28 "từ láy": "reduplication", 

29 "không đếm được": "uncountable", 

30 "cổ xưa": "archaic", 

31 "ngôn ngữ trẻ con": "childish", 

32 "vietnamese chữ Nôm": "Chữ-Nôm", 

33 "từ lóng có vần điệu của người Luân Đôn": ["Cockney", "slang"], 

34 "thông tục": "colloquial", 

35 "lỗi thời": "dated", 

36 "nghĩa xấu": "derogatory", 

37 "phương ngữ": "dialectal", 

38 "thuộc phương ngữ": "dialectal", 

39 "xúc phạm dân tộc": ["ethnic", "slang"], 

40 "uyển ngữ": "euphemistic", 

41 "thân mật": "familiar", 

42 "nghĩa bóng": "figuratively", 

43 "trang trọng": "formal", 

44 "từ lóng người đồng tính": "slang", 

45 "từ ngữ lịch sử": "historical", 

46 "kính ngữ": "honorific", 

47 "hài hước": "humorous", 

48 "không trang trọng": "informal", 

49 "từ lóng internet": ["Internet", "slang"], 

50 "trớ trêu": "ironic", 

51 "nghĩa đen": "literally", 

52 "ăn chương": "literary", 

53 "hoán dụ": "metonymically", 

54 "từ lóng quân sự": "slang", 

55 "từ mới": "neologism", 

56 "không còn phát sinh từ mới": "idiomatic", 

57 "từ tạo ra cho trường hợp cụ thể": "nonce-word", 

58 "không tiêu chuẩn": "nonstandard", 

59 "không còn dùng": "obsolete", 

60 "thuật ngữ không còn dùng": "obsolete", 

61 "xúc phạm": "offensive", 

62 "thơ ca": "poetic", 

63 "lịch sự": "polite", 

64 "hiếm": "rare", 

65 "từ lóng": "slang", 

66 "nhắn tin": "Internet", 

67 "không phổ biến": "uncommon", 

68 "thô tục": "vulgar", 

69 "anh": "UK", 

70 "biệt ngữ": "jargon", 

71 "cũ": "obsolete", 

72 "cổ": "archaic", 

73 "không dịch": "not-translated", 

74 "khẩu ngữ": "colloquial", 

75 "lóng": "slang", 

76 "mỉa mai": "ironic", 

77 "nghĩa rộng": "broadly", 

78 "số nhiều": "plural", 

79 "nói trại": "euphemistic", 

80 "tục tĩu": "vulgar", 

81 "ít dùng": "rare", 

82 "địa phương": "regional", 

83 "định ngữ": "attributive", 

84 "ấn độ": "India", 

85 "động từ và ngoại động từ": "ambitransitive", 

86 "châu mỹ": "US", 

87 "hoa kỳ": "US", 

88 "phát âm mỹ": "US", 

89 "hoạt hình": "animate", 

90 "phương ngữ mắt": "pronunciation-spelling", 

91 "hy lạp cổ đại": "Ancient-Greek", 

92 "la mã cổ đại": "Ancient-Rome", 

93 "luật pháp hoa kỳ": "US", 

94 "luật pháp việt nam": "Vietnam", 

95 "chính trị úc": "Australian", 

96 "chính trị philippines": "Philippine", 

97 "tu từ học": "rhetoric", 

98 # Template:zh-forms 

99 "phồn.": "Traditional-Chinese", 

100 "giản.": "Simplified-Chinese", 

101 "alternative forms": "alternative", 

102 "dated abbreviation": ["dated", "abbreviation"], 

103 "triều châu": "Teochew", 

104 "tiếng mân": "Min", 

105} 

106 

107# https://vi.wiktionary.org/wiki/Mô_đun:gender_and_number/data 

108GENDER_NUMBER_TAGS = { 

109 "giống đực": "masculine", 

110 "giống cái": "feminine", 

111 "giống trung": "neuter", 

112 "giống chung": "common-gender", 

113 "gender-neutral": "neuter", 

114 "động vật": "animate", 

115 "bất động vật": "inanimate", 

116 "chỉ loài vật": "animal-not-person", 

117 "từ chỉ cá nhân": "person", 

118 "nonpersonal": "impersonal", 

119 "virile (= masculine personal)": "virile", 

120 "nonvirile (= other than masculine personal)": "nonvirile", 

121 "số ít": "singular", 

122 "số kép": "dual", 

123 "số nhiều": "plural", 

124 "thể chưa hoàn thành": "imperfective", 

125 "thể hoàn thành": "perfective", 

126 "không đổi": "invariable", 

127} 

128 

129LOCATIONS = { 

130 "hà nội": "Hà-Nội", 

131 "huế": "Huế", 

132 "sài gòn": "Saigon", 

133 "vinh": "Vinh", 

134 "thanh chương": "Thanh-Chương", 

135 "hà tĩnh": "Hà-Tĩnh", 

136} 

137 

138SOUND_TAGS = { 

139 "phát âm giọng anh chuẩn": "Received-Pronunciation", 

140 "anh mỹ thông dụng": "General-American", 

141} 

142 

143ZH_X_TAGS = { 

144 "tiêu chuẩn hiện đại": "Standard-Chinese", 

145 "bính âm": "Pinyin", 

146 "cantonese": "Cantonese", 

147 "mandarin": "Mandarin", 

148} 

149 

150ZH_PRON_TAGS = { 

151 "quan thoại": "Mandarin", 

152 "tiêu chuẩn": "Standard", 

153 "bính âm hán ngữ": "Pinyin", 

154 "chú âm phù hiệu": "Bopomofo", 

155 "xi'an": "Xi'an", 

156 "guanzhong pinyin": ["Guanzhong", "Pinyin"], 

157 "đông can": "Dungan", 

158 "chữ kirin": "Cyrillic", 

159 "wiktionary": "Wiktionary", 

160 "quảng đông": "Guanzhong", 

161 "việt bính": "Jyutping", 

162 "khách gia": "Hakka", 

163 "sixian": "Sixian", 

164 "pfs": "Phak-fa-su", 

165 "mai huyện": "Meixian", 

166 "mân bắc": "Min-Bei", 

167 "kcr": "Kienning-Colloquial-Romanized", 

168 "mân đông": "Min-Dong", 

169 "buc": "Foochow-Romanized", 

170 "mân nam": "Min-Nan", 

171 "mân tuyền chương": "Hokkien", 

172 "poj": "POJ", 

173 "triều châu": "Teochew", 

174 "peng'im": "Peng'im", 

175 "hán ngữ tiêu chuẩn": "Standard-Chinese", 

176 "bính âm thông dụng": "Tongyong-Pinyin", 

177 "wade–giles": "Wade-Giles", 

178 "yale": "Yale", 

179 "quốc ngữ la mã tự": "Gwoyeu-Romatsyh", 

180 "palladius": "Palladius", 

181 "ipa hán học": "Sinological-IPA", 

182 "quảng đông tiêu chuẩn": "Standard-Cantonese", 

183 "quảng châu–hồng kông": ["Guangzhou", "Hong Kong"], 

184 "bính âm tiếng quảng đông": ["Cantonese", "Pinyin"], 

185 "latinh hóa tiếng quảng đông": "Guangdong-Romanization", 

186 "miền bắc sixian": ["Northern", "Sixian"], 

187 "miêu lật": "Miaoli", 

188 "pha̍k-fa-sṳ": "Phak-fa-su", 

189 "hệ thống la mã hóa tiếng khách gia": "Hakka-Romanization-System", 

190 "bính âm tiếng khách gia": "Hagfa-Pinyim", 

191 "miền nam sixian": ["Southern", "Sixian"], 

192 "mỹ nùng": "Neipu", 

193 "kiến âu": "Jian'ou", 

194 "la mã hóa phương ngữ kiến ninh": "Kienning-Colloquial-Romanized", 

195 "phúc châu": "Fuzhou", 

196 "bàng-uâ-cê": "Foochow-Romanized", 

197 "hạ môn": "Xiamen", 

198 "chương châu": "Zhangzhou", 

199 "cao hùng": "Kaohsiung", 

200 "phiên âm bạch thoại": "POJ", 

201 "tâi-lô": "Tai-lo", 

202 "phofsit daibuun": "Phofsit-Daibuun", 

203 "jinjiang": "Jinjiang", 

204 "philippines": "Philippines", 

205 "tuyền châu": "Quanzhou", 

206 "đài bắc": "Taipei", 

207 "phiên âm bạch thoại-like": "POJ", 

208 "phonetic": "Phonetic", 

209 "ipa": "IPA", 

210 "ngô": "Wu", 

211 "northern": "Northern", 

212 "shanghai": "Shanghai", 

213} 

214 

215ZH_DIAL_TAGS = { 

216 "chính thức": "formal", 

217 "bạch thoại": "Written-vernacular-Chinese", 

218 "quan thoại giao-liêu": "Jiaoliao-Mandarin", 

219 "yên đài": "Yantai", 

220 "mưu bình": "Muping", 

221 "quan thoại trung nguyên": "Central-Plains-Mandarin", 

222 "lạc dươn": "Luoyang", 

223 "vạn vinh": "Wanrong", 

224 "tây ninh": "Xining", 

225 "quan thoại lan-ngân": "Lanyin-Mandarin", 

226 "ngân xuyên": "Yinchuan", 

227 "quan thoại tây nam": "Southwestern-Mandarin", 

228 "liễu châu": "Liuzhou", 

229 "quan thoại giang hoài": "Jianghuai-Mandarin", 

230 "nam kinh": "Nanjing", 

231 "dương châu": "Yangzhou", 

232 "quảng châu": "Guangzhou", 

233 "đông hoản": "Dongguan", 

234 "huy châu": "Huizhou", 

235 "tích khê": "Jixi", 

236 "tấn": "Jin", 

237 "thái nguyên": "Taiyuan", 

238 "đài nam": "Tainan", 

239 "lôi châu": "Leizhou", 

240 "mân phủ tiên": "Puxian-Min", 

241 "bình nam": "Southern-Pinghua", 

242 "nam ninh": "Nanning", 

243 "đình tử": "Tingzi", 

244 "thượng hải": "Shanghai", 

245 "tô châu": "Suzhou", 

246 "đan dương": "Danyang", 

247 "hàng châu": "Hangzhou", 

248 "ninh ba": "Ningbo", 

249 "ôn châu": "Wenzhou", 

250 "kim hoa": "Jinhua", 

251 "tương": "Xiang", 

252 "trường sa": "Changsha", 

253 "quan thoại đông bắc": "Northeastern-Mandarin", 

254 "quan thoại ký-lỗ": "Jilu-Mandarin", 

255 "cám": "Cantonese", 

256 "mân trung sơn": "Zhongshan-Min", 

257 "trung sơn": "Zhongshan", 

258 "long đô": "Longdu", 

259 "sa khê": "Shaxi", 

260} 

261 

262TH_PRON_TAGS = { 

263 "chính tả": "orthographic", 

264 "âm vị": "phonemic", 

265 "chính tả/âm vị": ["orthographic", "phonemic"], 

266 "chuyển tự": "romanization", 

267 "paiboon": "Paiboon", 

268 "viện hoàng gia": "Royal-Institute", 

269} 

270 

271 

272TAGS = { 

273 **LABEL_TAGS, 

274 **GENDER_NUMBER_TAGS, 

275 **LOCATIONS, 

276 **SOUND_TAGS, 

277 **ZH_X_TAGS, 

278 **ZH_PRON_TAGS, 

279 **ZH_DIAL_TAGS, 

280 **TH_PRON_TAGS, 

281} 

282 

283# https://vi.wiktionary.org/wiki/Mô_đun:labels/data/topical 

284TOPICS = { 

285 "địa chấn học": "seismology", 

286 "thực vật học": "botany", 

287 "hóa học": "chemistry", 

288 "từ lóng người đồng tính": "LGBT", 

289 "từ lóng quân sự": "military", 

290 "bóng chày": "baseball", 

291 "bóng rổ": "basketball", 

292 "băng cầu": "ice-hockey", 

293 "bắn cung": "archery", 

294 "chính trị": "politics", 

295 "cơ khí": "mechanical", 

296 "cử tạ": "weightlifting", 

297 "dược học": "pharmaceuticals", 

298 "giải phẫu học": "anatomy", 

299 "hàng hải": "shipping", 

300 "hàng không": "aviation", 

301 "in ấn": "printing", 

302 "khoa đo lường": "metrology", 

303 "khoáng vật học": "mineralogy", 

304 "khúc côn cầu": "hockey", 

305 "khảo cổ học": "archeology", 

306 "kinh doanh": "business", 

307 "kinh tế học": "economics", 

308 "kiến trúc": "architecture", 

309 "kiểu cách": "manner", 

310 "kế toán": "accounting", 

311 "kỹ thuật": "technology", 

312 "luật pháp": "law", 

313 "lâm nghiệp": "forestry", 

314 "lôgic": "logic", 

315 "lập trình": "programming", 

316 "nghệ thuật": "arts", 

317 "ngoại giao": "diplomacy", 

318 "ngành mỏ": "mining", 

319 "nhân khẩu học": "demographics", 

320 "nhãn khoa": "ophthalmology", 

321 "nấu nướng": "cooking", 

322 "sinh thái học": "ecology", 

323 "sinh vật học": "biology", 

324 "sân khấu": "theater", 

325 "săn bắn": "hunting", 

326 "thương nghiệp": "commerce", 

327 "thần học": "theology", 

328 "thần thoại": "mythology", 

329 "thể dục": "exercise", 

330 "thể thao": "sports", 

331 "tin học": "computer-sciences", 

332 "tài chính": "finance", 

333 "tôn giáo": "religion", 

334 "văn học": "literature", 

335 "vật lý học": "physics", 

336 "xã hội học": "sociology", 

337 "y học": "medicine", 

338 "đạo giáo": "Taoism", 

339 "điện học": "electricity", 

340 "điện tử học": "electronics", 

341 "điện ảnh": "film", 

342 "đánh bài": "gambling", 

343 "đường sắt": "railways", 

344 "đại số": "algebra", 

345 "động vật học": "zoology", 

346 "nông nghiệp": "agriculture", 

347 "phi cơ": "airplane", 

348 "đại số học": "algebra", 

349 "bóng đá mỹ": "American-football", 

350 "lưỡng cư": "amphibian", 

351 "bài tập": "exercise", 

352 "đấu kiếm": "fencing", 

353 "âm học": "acoustics", 

354 "diễn xuất": "acting", 

355 "quảng cáo": "advertising", 

356 "hàng không học": "aeronautics", 

357 "hàng không vũ trụ": "aerospace", 

358 "tình cảm": "affection", 

359 "khí cụ bay": "aircraft", 

360 "giả kim thuật": "alchemy", 

361 "thức uống có cồn": ["alcohol", "beverages"], 

362 "lạm dụng rượu bia": "alcoholism", 

363 "hình học đại số": "algebraic-geometry", 

364 "tô pô đại số": "algebraic-topology", 

365 "y học thay thế": "alternative-medicine", 

366 "phát thanh nghiệp dư": "radio", 

367 "bóng bầu dục Mỹ": ["US", "football"], 

368 "hình học giải tích": "geometry", 

369 "hóa phân tích": "chemistry", 

370 "chủ nghĩa vô trị": "anarchism", 

371 "anh giáo": "Anglicanism", 

372 "nhân loại học": "anthropology", 

373 "toán học ứng dụng": "applied-mathematics", 

374 "số học": "arithmetic", 

375 "trí tuệ nhân tạo": "artificial-intelligence", 

376 "chiêm tinh học": "astrology", 

377 "thiên văn học": "astronomy", 

378 "vật lý thiên văn": "astrophysics", 

379 "điền kinh": "athletics", 

380 "ô tô": "automotive", 

381 "trò chơi với bóng": "ball-games", 

382 "ngân hàng": "banking", 

383 "bdsm": "BDSM", 

384 "kinh thánh": "biblical", 

385 "hóa sinh": "biochemistry", 

386 "sinh học": "biology", 

387 "trò chơi với bàn cờ": "board-games", 

388 "quyền anh": "boxing", 

389 "phát sóng": "broadcasting", 

390 "rêu học": "bryology", 

391 "phật giáo": "Buddhism", 

392 "vi tích phân": "calculus", 

393 "họ lạc đà": "camelids", 

394 "trò chơi bài": "card-games", 

395 "bệnh học tim": "cardiology", 

396 "công giáo": "Catholicism", 

397 "kỹ thuật hóa học": "chemical-engineering", 

398 "cờ vua": "chess", 

399 "thần thoại trung hoa": "Chinese-philosophy", 

400 "kitô giáo": "Christianity", 

401 "trang phục": "clothing", 

402 "truyện tranh": "comics", 

403 "giao tiếp": "communications", 

404 "chủ nghĩa cộng sản": "communism", 

405 "giải tích phức": "complex-analysis", 

406 "đồ hoạ máy tính": "computer-graphics", 

407 "phần cứng": "computer-hardware", 

408 "khoa học máy tính": "computer-sciences", 

409 "bảo mật máy tính": "computer-security", 

410 "máy tính": "computing", 

411 "nho giáo": "Confucianism", 

412 "nấu ăn": "cooking", 

413 "phân thứ bộ cua": "crabs", 

414 "tội phạm": "crime", 

415 "phân ngành giáp xác": "Crustaceans", 

416 "điều khiển học": "cybernetics", 

417 "đạp xe": "cycling", 

418 "sinh học tế bào": "cytology", 

419 "chế phẩm sữa": "dairy-products", 

420 "nha khoa": "dentistry", 

421 "món tráng miệng": "desserts", 

422 "chó": "dogs", 

423 "giáo dục": "education", 

424 "thần thoại ai cập": "Egyptian-mythology", 

425 "ai cập học": "Egyptology", 

426 "kỹ thuật điện": "electrical-engineering", 

427 "điện": "electricity", 

428 "điện từ học": "electromagnetism", 

429 "kĩ thuật": "engineering", 

430 "tri thức luận": "epistemology", 

431 "văn học khiêu dâm": "erotic-literature", 

432 "thuyết tiến hoá": "evolutionary-theory", 

433 "kì ảo": "fantasy", 

434 "hư cấu": "fiction", 

435 "phim": "film", 

436 "súng cầm tay": "firearms", 

437 "hoa": "flowery", 

438 "cơ học chất lưu": "fluid-dynamics", 

439 "văn hóa dân gian": "folklore", 

440 "hàm toán học": "functions", 

441 "giải tích hàm": "functional-analysis", 

442 "đồ nội thất": "furniture", 

443 "trò chơi": "games", 

444 "di truyền học": "genetics", 

445 "địa lí học": "geography", 

446 "địa chất học": "geology", 

447 "hình học": "geometry", 

448 "địa mạo học": "geomorphology", 

449 "chính phủ": "government", 

450 "ngữ pháp": "grammar", 

451 "giao diện đồ họa người dùng": "graphical-user-interface", 

452 "thần thoại hy lạp": "Greek-mythology", 

453 "thể dục dụng cụ": "gymnastics", 

454 "huyết học": "hematology", 

455 "ấn độ giáo": "Hinduism", 

456 "lịch sử thời đại": "history", 

457 "lịch sử": "history", 

458 "vi lượng đồng căn": "homeopathy", 

459 "họ người": "hominids", 

460 "làm vườn": "horticulture", 

461 "săn": "hunting", 

462 "thủy văn học": "hydrology", 

463 "khúc côn cầu trên băng": "ice-hockey", 

464 "ngư học": "ichthyology", 

465 "ý thức hệ": "ideology", 

466 "miễn dịch học": "immunology", 

467 "luật quốc tế": "law", 

468 "quan hệ quốc tế": "international-relations", 

469 "hồi giáo": "Islam", 

470 "kỳ na giáo": "Jainism", 

471 "tác phẩm giả tưởng nhật bản": "Japanese-fiction", 

472 "do thái giáo": "Judaism", 

473 "luật pháp hoa kỳ": "law", 

474 "luật pháp việt nam": "law", 

475 "từ điển học": "lexicography", 

476 "lgbt": "LGBT", 

477 "nguồn ánh sáng": "light-sources", 

478 "đại số tuyến tính": "linear-algebra", 

479 "ngôn ngữ học": "linguistics", 

480 "sản xuất": "manufacturing", 

481 "chủ nghĩa marx": "Marxism", 

482 "giải tích toán học": "mathematical-analysis", 

483 "toán học": "mathematics", 

484 "cơ học": "mechanics", 

485 "thần thoại lưỡng hà": "Mesopotamian-mythology", 

486 "luyện kim": "metallurgy", 

487 "siêu hình học": "metaphysics", 

488 "khí tượng học": "meteorology", 

489 "đo lường học": "metrology", 

490 "vi sinh vật học": "microbiology", 

491 "quân sự": "military", 

492 "tiền": "money", 

493 "đua xe có động cơ": "motor-racing", 

494 "âm nhạc": "music", 

495 "nấm học": "mycology", 

496 "giải phẫu thần kinh": "neuroanatomy", 

497 "thần kinh học": "neurology", 

498 "khoa học thần kinh": "neuroscience", 

499 "họ cà": "nightshades", 

500 "hóa tệ học": "numismatics", 

501 "thần bí học": "occult", 

502 "hải dương học": "oceanography", 

503 "hệ điều hành": "operating-systems", 

504 "quang học": "optics", 

505 "họ lan": "Orchids", 

506 "hóa hữu cơ": "organic-chemistry", 

507 "điểu học": "ornithology", 

508 "chính tả": "orthography", 

509 "pagan giáo": "paganism", 

510 "cổ sinh vật học": "paleontology", 

511 "bệnh lí học": "pathology", 

512 "thổ nhưỡng học": "pedology", 

513 "hóa dầu": "petrochemistry", 

514 "thạch luận": "petrology", 

515 "dược lý học": "pharmacology", 

516 "triết học": "philosophy", 

517 "ngữ âm": "phonetics", 

518 "âm vị học": "phonology", 

519 "nhiếp ảnh": "photography", 

520 "não tướng học": "physiognomy", 

521 "sinh lí học": "physiology", 

522 "bộ hồ tiêu": "piperales", 

523 "khoa học hành tinh": "planetology", 

524 "thơ": "poetry", 

525 "khoa học chính trị": "political-science", 

526 "chính trị úc": "politics", 

527 "chính trị philippines": "politics", 

528 "khiêu dâm": "pornography", 

529 "tâm thần học": "psychiatry", 

530 "tâm lý học": "psychology", 

531 "vận tải đường sắt": "rail-transport", 

532 "tài liệu tham khảo": "reference-works", 

533 "giáo hội công giáo": "Roman-Catholicism", 

534 "thần thoại la mã": "Roman-mythology", 

535 "xoay tròn": "rotation", 

536 "khoa học viễn tưởng": "science-fiction", 

537 "khoa học": "sciences", 

538 "chứng khoán": "securities", 

539 "ngữ nghĩa học": "semantics", 

540 "lí thuyết tập hợp": "set-theory", 

541 "tình dục": "sex", 

542 "tình dục học": "sexology", 

543 "tính dục": "sexuality", 

544 "ca hát": "singing", 

545 "bóng đá": "soccer", 

546 "khoa học xã hội": "social-sciences", 

547 "chủ nghĩa xã hội": "socialism", 

548 "phương tiện truyền thông mạng xã hội": "social-media", 

549 "ngôn ngữ học xã hội": "sociolinguistics", 

550 "phổ học": "spectroscopy", 

551 "bơi lội": "swimming", 

552 "hệ thống": "systems", 

553 "lý thuyết hệ thống": "systems-theory", 

554 "phân loại học": "taxonomy", 

555 "công nghệ": "technology", 

556 "quái thai học": "teratology", 

557 "dệt may": "textiles", 

558 "nhiệt động học": "thermodynamics", 

559 "du lịch": "tourism", 

560 "đông y": "traditional-Chinese-medicine", 

561 "người chuyển giới": "transgender", 

562 "giao thông": "transport", 

563 "lượng giác": "trigonometry", 

564 "hàm lượng giác": "trigonometric-function", 

565 "đơn vị đo": "units-of-measure", 

566 "rau": "vegetable", 

567 "phương tiện giao thông": "vehicles", 

568 "thú y": "veterinary-medicine", 

569 "nén video": "video-compression", 

570 "núi lửa học": "volcanology", 

571 "thời tiết": "weather", 

572 "môn thể thao mùa đông": "winter-sports", 

573 "nhân vật kinh thánh": "biblical", 

574 "chòm sao": "constellation", 

575 "bệnh": "disease", 

576 "acid béo": "fatty-acid", 

577 "tu từ học": "figure-of-speech", 

578 "vị thần hy lạp": "Greek-god", 

579 "huy hiệu học": "heraldic-charge", 

580 "thần thánh ấn độ": "Hindu-god", 

581 "hợp chất vô cơ": "inorganic-compound", 

582 "địa mạo": "landforms", 

583 "khoáng vật": "mineralogy", 

584 "điện thoại di động": "mobile-phones", 

585 "nhạc cụ": "musical-instruments", 

586 "hóa học hữu cơ": "organic-compound", 

587 "thực vật": "plant", 

588 "bộ xương": "skeleton", 

589 "tàu chiến": "warships", 

590 "nước": "water", 

591} 

592 

593 

594def translate_raw_tags(data: WordEntry) -> None: 

595 raw_tags = [] 

596 for raw_tag in data.raw_tags: 

597 found_tag = False 

598 if raw_tag.lower() in TAGS and hasattr(data, "tags"): 

599 found_tag = True 

600 tr_tag = TAGS[raw_tag.lower()] 

601 if isinstance(tr_tag, str): 

602 data.tags.append(tr_tag) 

603 elif isinstance(tr_tag, list): 603 ↛ 605line 603 didn't jump to line 605 because the condition on line 603 was always true

604 data.tags.extend(tr_tag) 

605 if raw_tag.lower() in TOPICS and hasattr(data, "topics"): 

606 found_tag = True 

607 topic = TOPICS[raw_tag.lower()] 

608 if isinstance(topic, str): 608 ↛ 610line 608 didn't jump to line 610 because the condition on line 608 was always true

609 data.topics.append(topic) 

610 elif isinstance(topic, list): 

611 data.topics.extend(topic) 

612 if not found_tag: 

613 raw_tags.append(raw_tag) 

614 data.raw_tags = raw_tags