glibc/localedata/th_TH.UTF-8.in
Mike FABIAN aceda10bd5 Adapt collation in th_TH locale to use the iso14651_t1_common file and sync the collation with CLDR
I made it to agree as much as possible with the rules from CLDR (see:
https://github.com/unicode-org/cldr/blob/main/common/collation/th.xml).

It seems to be impossible to follow the CLDR rules

  &[before 1]๚<ฯ # should be "variable"

and

  &๛<ๆ # should be "variable"

exactly though. These ask for a primary difference in punctuation
characters whose primary weight should be "IGNORE". But using a
secondary differnence instead still sorts the test data correctly and
the previously used collation in th_TH used tertiary differences for
these characters.

There was old localedata/th_TH.in test data in TIS-620 encoding which
was not used (it was not in the localedata/Makefile). I converted this
to UTF-8 and moved it to localedata/th_TH.UTF-8.in and added it to
localedata/Makefile.

Using the existing collation rules in the th_TH locale did not sort that
test file completely correct, I think my new collation rules based on
iso14651_t1 are better.
2023-09-21 10:34:35 +02:00

164 lines
1.8 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

*
.
0
0000
10
๑๐
9
9999
๙๙๙๙
a
A
๎A
์a
ฯä
๚a
๛ä
ๆa
b
B
กก
กรรม
กรรม์
กราบ
กะเกณฑ์
กัก
ก้าว
กำ
กิน
กี่
กึ๋น
กุน
กูด
เก้ง
เกล้า
เกลียว
เก้า
เกาะ
เกี่ยว
เกี๊ยะ
เกือก
แกง
แกะ
โกน
โกร๋น
ใกล้
ไก่
ไกล
ข้น
ขนาบ
ขาง
ข่าง
ข้าง
ข้างๆ
ข้างกระดาน
ข้างขึ้น
ข้างควาย
ข้างๆ คูๆ
ข้างเงิน
ข้างแรม
ข้างออก
เข็ด
เขน
เข็น
เข่น
แข็ง
แข่ง
แข้ง
แข้งขวา
แข็งขัน
แข่งขัน
แขน
แขวะ
ฃวด
ครรภ-
ครรภ์
ฅอ
งาม
จุมพล
จุํพล
ฉาก
ชาย
ซาบ
ญาณ
ฎีกา
ฐาน
ฑาหะ
เฒ่า
เณร
ดนตรี
ตลาด
ถนน
ทูลเกล้า
ทูลเกล้าฯ
ทูลเกล้าทูลกระหม่อม
ธนาคาร
น้า
น้ำ
นี้
บุญญา
บุญหลง
ปา
ป่า
ป้า
ป๊า
ป๋า
ปาน
ป่าน
ป้าน
แป้ง
ผัด
ฝา
ฯพณฯ
พณิชย์
ฟาง
ภาษี
ม้า
ย่อง
รอง
ฤทธิ์
ฤษี
ฤๅษี
ลลิตา
ฦๅชา
วก
ศาล
ษมา
สกุล
หริภุญชัย
หฤทัย
หลง
แหง่
แห่ง
แหนม
แหนหวง
แหบ
แหม
อาน
ฮา
ไฮโล
ํä
ะa
ๅํ
ํๅ
ๅa
าä
าํ
ํา