mirror of
https://sourceware.org/git/glibc.git
synced 2024-11-08 14:20:07 +00:00
aceda10bd5
I made it to agree as much as possible with the rules from CLDR (see: https://github.com/unicode-org/cldr/blob/main/common/collation/th.xml). It seems to be impossible to follow the CLDR rules &[before 1]๚<ฯ # should be "variable" and &๛<ๆ # should be "variable" exactly though. These ask for a primary difference in punctuation characters whose primary weight should be "IGNORE". But using a secondary differnence instead still sorts the test data correctly and the previously used collation in th_TH used tertiary differences for these characters. There was old localedata/th_TH.in test data in TIS-620 encoding which was not used (it was not in the localedata/Makefile). I converted this to UTF-8 and moved it to localedata/th_TH.UTF-8.in and added it to localedata/Makefile. Using the existing collation rules in the th_TH locale did not sort that test file completely correct, I think my new collation rules based on iso14651_t1 are better.
164 lines
1.8 KiB
Plaintext
164 lines
1.8 KiB
Plaintext
*
|
||
.
|
||
๎
|
||
์
|
||
ฯ
|
||
๚
|
||
๛
|
||
ๆ
|
||
0
|
||
๐
|
||
0000
|
||
๐๐๐๐
|
||
10
|
||
๑๐
|
||
9
|
||
๙
|
||
9999
|
||
๙๙๙๙
|
||
a
|
||
A
|
||
๎A
|
||
์a
|
||
ฯä
|
||
๚a
|
||
๛ä
|
||
ๆa
|
||
b
|
||
B
|
||
กก
|
||
กรรม
|
||
กรรม์
|
||
กราบ
|
||
กะเกณฑ์
|
||
กัก
|
||
ก้าว
|
||
กำ
|
||
กิน
|
||
กี่
|
||
กึ๋น
|
||
กุน
|
||
กูด
|
||
เก้ง
|
||
เกล้า
|
||
เกลียว
|
||
เก้า
|
||
เกาะ
|
||
เกี่ยว
|
||
เกี๊ยะ
|
||
เกือก
|
||
แกง
|
||
แกะ
|
||
โกน
|
||
โกร๋น
|
||
ใกล้
|
||
ไก่
|
||
ไกล
|
||
ข้น
|
||
ขนาบ
|
||
ขาง
|
||
ข่าง
|
||
ข้าง
|
||
ข้างๆ
|
||
ข้างกระดาน
|
||
ข้างขึ้น
|
||
ข้างควาย
|
||
ข้างๆ คูๆ
|
||
ข้างเงิน
|
||
ข้างแรม
|
||
ข้างออก
|
||
เข็ด
|
||
เขน
|
||
เข็น
|
||
เข่น
|
||
แข็ง
|
||
แข่ง
|
||
แข้ง
|
||
แข้งขวา
|
||
แข็งขัน
|
||
แข่งขัน
|
||
แขน
|
||
แขวะ
|
||
ฃวด
|
||
ครรภ-
|
||
ครรภ์
|
||
ฅอ
|
||
งาม
|
||
จุมพล
|
||
จุํพล
|
||
ฉาก
|
||
ชาย
|
||
ซาบ
|
||
ญาณ
|
||
ฎีกา
|
||
ฐาน
|
||
ฑาหะ
|
||
เฒ่า
|
||
เณร
|
||
ดนตรี
|
||
ตลาด
|
||
ถนน
|
||
ทูลเกล้า
|
||
ทูลเกล้าฯ
|
||
ทูลเกล้าทูลกระหม่อม
|
||
ธนาคาร
|
||
น้า
|
||
น้ำ
|
||
นี้
|
||
บุญญา
|
||
บุญหลง
|
||
ปา
|
||
ป่า
|
||
ป้า
|
||
ป๊า
|
||
ป๋า
|
||
ปาน
|
||
ป่าน
|
||
ป้าน
|
||
แป้ง
|
||
ผัด
|
||
ฝา
|
||
ฯพณฯ
|
||
พณิชย์
|
||
ฟาง
|
||
ภาษี
|
||
ม้า
|
||
ย่อง
|
||
รอง
|
||
ฤทธิ์
|
||
ฤษี
|
||
ฤๅษี
|
||
ลลิตา
|
||
ฦๅชา
|
||
วก
|
||
ศาล
|
||
ษมา
|
||
สกุล
|
||
หริภุญชัย
|
||
หฤทัย
|
||
หลง
|
||
แหง่
|
||
แห่ง
|
||
แหนม
|
||
แหนหวง
|
||
แหบ
|
||
แหม
|
||
อาน
|
||
ฮา
|
||
ไฮโล
|
||
ํ
|
||
ํä
|
||
ะ
|
||
ะa
|
||
า
|
||
ๅ
|
||
ๅํ
|
||
ํๅ
|
||
ๅa
|
||
าä
|
||
าํ
|
||
ํา
|
||
ำ
|
||
ไ
|
||
ฺ
|