半形及全形字符 (Unicode區段)
半形及全形字符 是 Unicode 基本多文种平面内的最后第二个区段 ,范围包括 U+FF00..U+FFEF。本区段包含全形和半形 字符以便可以无损从旧编码系统转换至 Unicode。该区段于 Unicode 1.0 的旧称为 半形及全形变体 (Halfwidth and Fullwidth Variants)。[ 4]
U+FF01..U+FF5E 编码了 ASCII 内 21 至 7E 的全形版本。U+FF00 未对应 ASCII 20 (空格)字符,该字符已经由 U+3000 IDEOGRAPHIC SPACE 表意空格取代。
U+FF65..U+FF9F 编码了JIS X 0201 内的半形片假名 ——参见半形假名 。
U+FFA0..U+FFDC 编码了谚文 KS C 5601 1974年版 的諺文兼容字母 。其对应的字符用于 IBM 的韩文编码页 933,其中包括 Shift In 和 Shift Out 的字符以对应双字节编码。[ 5] 基于双字节编码可能包括兼容字母,本区段包含了部分半形变体以便可以无损从 KS C 5601 转码至 Unicode。[ 6] [ 7]
U+FFE0..U+FFEE 编码了全形及半形符号。
码表
半形及全形字符 Halfwidth and Fullwidth Forms[1] [2] Unicode 联盟官方码表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+FF0x
!
"
#
$
%
&
'
(
)
*
+
,
-
.
/
U+FF1x
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
U+FF2x
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
U+FF3x
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
U+FF4x
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
U+FF5x
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
⦅
U+FF6x
⦆
。
「
」
、
・
ヲ
ァ
ィ
ゥ
ェ
ォ
ャ
ュ
ョ
ッ
U+FF7x
ー
ア
イ
ウ
エ
オ
カ
キ
ク
ケ
コ
サ
シ
ス
セ
ソ
U+FF8x
タ
チ
ツ
テ
ト
ナ
ニ
ヌ
ネ
ノ
ハ
ヒ
フ
ヘ
ホ
マ
U+FF9x
ミ
ム
メ
モ
ヤ
ユ
ヨ
ラ
リ
ル
レ
ロ
ワ
ン
゙
゚
U+FFAx
HW HF
ᄀ
ᄁ
ᆪ
ᄂ
ᆬ
ᆭ
ᄃ
ᄄ
ᄅ
ᆰ
ᆱ
ᆲ
ᆳ
ᆴ
ᆵ
U+FFBx
ᄚ
ᄆ
ᄇ
ᄈ
ᄡ
ᄉ
ᄊ
ᄋ
ᄌ
ᄍ
ᄎ
ᄏ
ᄐ
ᄑ
ᄒ
U+FFCx
ᅡ
ᅢ
ᅣ
ᅤ
ᅥ
ᅦ
ᅧ
ᅨ
ᅩ
ᅪ
ᅫ
ᅬ
U+FFDx
ᅭ
ᅮ
ᅯ
ᅰ
ᅱ
ᅲ
ᅳ
ᅴ
ᅵ
U+FFEx
¢
£
¬
 ̄
¦
¥
₩
│
←
↑
→
↓
■
○
注解
1.^ 依据 Unicode 13.0
2.^ 灰色区域指未分配码位
异体字选择器
本区段包含部分标点位置的异体字选择器 ,[ 8] [ 9] 其中使用了 U+FE00 ︀ VARIATION SELECTOR-1 (VS01) 及 U+FE01 ︁ VARIATION SELECTOR-2 (VS02):
标点符号位置变体
U+
FF01
FF0C
FF0E
FF1A
FF1B
FF1F
位置
基本字符
!
,
.
:
;
?
基本字符 + VS01
!︀
,︀
.︀
:︀
;︀
?︀
左下角
基本字符 + VS02
!︁
,︁
.︁
:︁
;︁
?︁
置中
该规范也定义了 U+FF10 0 全宽数字〇 另加短斜线:U+FE00 VS1(0︀)。[ 10] [ 9]
历史
以下的Unicode相關檔案記錄了本區域中出現之字符的提議及定稿。
Unicode 版本
最終碼位[ a]
碼位數
L2 ID
WG2 ID
文檔
1.0.0
U+FF01..FF5E, FF61..FFBE, FFC2..FFC7, FFCA..FFCF, FFD2..FFD7, FFDA..FFDC, FFE0..FFE6
216
(to be determined)
N4403 (pdf , doc (页面存档备份 ,存于互联网档案馆 ))
Umamaheswaran, V. S., Resolution M61.01, Unconfirmed minutes of WG 2 meeting 61, Holiday Inn, Vilnius, Lithuania; 2013-06-10/14, 2014-01-28
L2/17-056
Lunde, Ken , Proposal to add standardized variation sequences, 2017-02-13
L2/17-436
Lunde, Ken, Proposal to add standardized variation sequences for fullwidth East Asian punctuation, 2018-01-21
L2/18-039
Anderson, Deborah; Whistler, Ken; Pournader, Roozbeh; Moore, Lisa; Liang, Hai; Cook, Richard, 24. Fullwidth East Asian Punctuation, Recommendations to UTC #154 January 2018 on Script Proposals, 2018-01-19
L2/17-362
Moore, Lisa, B.4.1 New Proposal to add standardized variation sequence for U+FF10 FULL WIDTH DIGIT ZERO, UTC #153 Minutes, 2018-02-02
L2/18-115
Moore, Lisa, Consensus 154-C17, UTC #155 Minutes, 2018-05-09, Add 16 standardized variation sequences based on L2/17-436R, for Unicode 12.0.
L2/19-055
Iancu, Laurențiu, Proposed Changes in the Segmentation Property Values for Fullwidth Digits, 2019-01-14
L2/19-008
Moore, Lisa, B.11.11.1.2 Proposed changes in the segmentation property values for fullwidth digits, UTC #158 Minutes, 2019-02-08
1.0.1
U+FFE8..FFEE
7
(to be determined)
3.2
U+FF5F..FF60
2
L2/99-052
Freytag, Asmus, The math pieces from the symbol font, 1999-02-05
L2/01-033
Karlsson, Kent; Freytag, Asmus, Disunify braces/brackets for math, computing science, and Z notation from similar-looking CJK braces/brackets, 2001-01-16
L2/01-159
N2344 (页面存档备份 ,存于互联网档案馆 )
Ad-hoc report on Mathematical Symbols, 2001-04-03
L2/01-157
N2345R (页面存档备份 ,存于互联网档案馆 )
Karlsson, Kent, Proposal to disunify certain fencing CJK punctuation marks from similar-looking Math fences, 2001-04-04
L2/01-168
Whistler, Ken, Bracket Disunification & Normalization Hell, 2001-04-10
L2/01-012R
Moore, Lisa, Disunifying Braces and Brackets, Minutes UTC #86 in Mountain View, Jan 2001, 2001-05-21
L2/01-223
Suignard, Michel, Discussion of Issues Regarding Bracket Disunification, 2001-05-23
L2/01-184R
Moore, Lisa, Motion 87-M21, Minutes from the UTC/L2 meeting, 2001-06-18, Reverse the decision made in motion 86-M6 not to disunify brackets.
L2/01-317
Suignard, Michel, Bracket Disunification & Normalization, 2001-08-14
L2/01-295R
Moore, Lisa, Bracket Disunification and Normalization, Minutes from the UTC/L2 meeting #88, 2001-11-06
L2/02-154
N2403 (页面存档备份 ,存于互联网档案馆 )
Umamaheswaran, V. S., Resolution M41.1, Draft minutes of WG 2 meeting 41, Hotel Phoenix, Singapore, 2001-10-15/19, 2002-04-22
另见
參見
区块名 码位数 已使用 编码范围 平面 统一化 包含文字
20,992
6,592
42,720
4,160
224
5,776
7,488
4,944
4,192
624
128
224
16
64
48
256
256
512
32
256
544
20,992
6,592
42,720
4,154
222
5,762
7,473
4,939
4,192
622
115
214
12
64
36
255
256
472
32
64
542
1/4
2/4
3/4
4/4
1/7
2/7
3/7
4/7
5/7
6/7
7/7
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
2 SIP
3 TIP
3 TIP
2 SIP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
0 BMP
1 SMP
2 SIP
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
已统一
未统一
未统一
未统一
未统一
未统一
未统一
未统一
12个已统一
未统一
未统一
未统一
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
汉字
通用
汉字、谚文 、通用、继承
通用
片假名 、谚文、通用
片假名、通用
汉字
通用
平假名 、通用
汉字
总计 99,424 99,108 92,865
^ 統一碼版本15.0
^ “〇”位于此区块,因而未统一化
文字
欧洲文字Ⅰ 現代文字與儀式文字 欧洲文字Ⅱ 古代文字與其它文字 中东文字Ⅰ 現代文字與儀式文字 中东文字Ⅱ 古代文字 楔形文字與象形文字 南亞和中亞文字Ⅰ 印度官方文字 南亞和中亞文字II 其它現代文字 南亞和中亞文字Ⅲ 古代文字 南亞和中亞文字Ⅳ 其它歷史文字 东南亚文字 印尼和大洋洲文字 东亚文字 非洲文字 美洲文字
符号
標記系統 标点符号 字母数字符号 技术符号 数字 数学符号 绘文字与象形 其它符號
其它