畳み込み符号 (たたみこみふごう、英 : Convolutional code )は、電気通信 における誤り訂正符号 の一種である。
1955年にマサチューセッツ工科大学 のピーター・イライアス が提案したもので、一定長さ(拘束長)のビット 列から順次新たなビット列を生成することで符号化する。対照的な方法にブロック符号 がある。
符号化の基本動作
図1. 符号化率 1/3、拘束長 3 の非再帰・非組織的畳み込み符号器
図1は最も簡易な畳み込み符号器の一例を示す。これは入力1ビットを3ビットに変換出力するもので、直近で入力された3ビットを記憶する機構を含む。
一般に、畳み込み符号では以下の用語・記号で性能を表現する。
符号化率
r
{\displaystyle r}
: 入力ビット長と出力ビット長の比。m ビットからn ビットへの変換
(
n
≥ ≥ -->
m
)
{\displaystyle (n\geq m)}
では
r
=
m
/
n
{\displaystyle r=m/n}
となる。
拘束長
k
{\displaystyle k}
: 演算に用いる直近の入力ビットの長さ (constraint length)。
自由距離
d
{\displaystyle d}
: 符号の訂正能力を表す (free distance)。 詳細は後述 。
ここでは、符号化率
r
=
1
/
3
{\displaystyle r=1/3}
、拘束長
k
=
3
{\displaystyle k=3}
となる。
符号器には、1ビットを入力保持できる k 個のメモリレジスタ を用意する。各メモリレジスタの初期値は 0 とする。また、n 対の加算器 と生成多項式があり、それぞれ2を法として演算 する。
まず、入力ビット
m
1
{\displaystyle m_{1}}
は左端のレジスタに格納される。そして、各メモリレジスタの値から生成多項式を適用して n ビットを出力する。この例では、生成多項式は
G
1
=
(
1
,
1
,
1
)
,
G
2
=
(
0
,
1
,
1
)
,
G
3
=
(
1
,
0
,
1
)
{\displaystyle G_{1}=(1,1,1),G_{2}=(0,1,1),G_{3}=(1,0,1)}
であり、出力ビットは次のように計算される(2 を法とする)。
n 1 = m 1 + m 0 + m-1
n 2 = m 0 + m -1
n 3 = m 1 + m -1
次に、全レジスタ値を右方向にビットシフト し(
m
1
{\displaystyle m_{1}}
を
m
0
{\displaystyle m_{0}}
に移し、
m
0
{\displaystyle m_{0}}
を
m
− − -->
1
{\displaystyle m_{-1}}
に移す)、次の入力ビットを待つ。
これを反復し、新たな入力ビットがない場合、全てのレジスタがゼロ状態になるまで出力を続ける。
再帰的な実装
図2. 符号化率 1/2、拘束長 4 の再帰・組織的畳み込み符号器
図1で示したものは非再帰的な符号器である。一方で、図2に示すように再帰的なものもある。
また、この図では「出力2」として符号化対象の入力がそのまま出力されている。このような符号は組織的 (systematic)であるといい、そうでない符号を非組織的 (non-systematic)であるという。
一般に、再帰的符号は組織的であり、逆に非再帰的符号は非組織的である。そうでない実装も可能であるが、そのようになっていることが多い。
数学的表現
この方式の名称の由来は、入力と符号器のインパルス応答 との畳み込み を行うことによる。符号器の応答は次の式で表される。
y
i
j
=
∑ ∑ -->
k
=
0
∞ ∞ -->
h
k
j
x
i
− − -->
k
{\displaystyle y_{i}^{j}=\sum _{k=0}^{\infty }h_{k}^{j}x_{i-k}}
ここで、
x
{\displaystyle x}
は入力列、
y
j
{\displaystyle y^{j}}
は
j
{\displaystyle j}
番目の出力列、
h
j
{\displaystyle h^{j}}
は
j
{\displaystyle j}
番目の出力のインパルス応答である。
畳み込み符号器は、離散線型時不変系 である。符号出力は固有の伝達関数 で表され、それは生成多項式と密接に関連している。インパルス応答はZ変換 により伝達関数として表現できる。
図1の非再帰的符号器の伝達関数は次の通りである。
H
1
(
z
)
=
1
+
z
− − -->
1
+
z
− − -->
2
{\displaystyle H_{1}(z)=1+z^{-1}+z^{-2}}
H
2
(
z
)
=
z
− − -->
1
+
z
− − -->
2
{\displaystyle H_{2}(z)=z^{-1}+z^{-2}}
H
3
(
z
)
=
1
+
z
− − -->
2
{\displaystyle H_{3}(z)=1+z^{-2}}
図2の再帰的符号器の伝達関数は次の通りである。
H
1
(
z
)
=
1
+
z
− − -->
1
+
z
− − -->
3
1
+
z
− − -->
2
+
z
− − -->
3
{\displaystyle H_{1}(z)={\frac {1+z^{-1}+z^{-3}}{1+z^{-2}+z^{-3}}}}
H
2
(
z
)
=
1
{\displaystyle H_{2}(z)=1}
m
{\displaystyle m}
を次のように定義する。
m
=
max
i
polydeg
-->
(
H
i
(
1
/
z
)
)
{\displaystyle m=\max _{i}\operatorname {polydeg} (H_{i}(1/z))}
ここで、任意の有理関数
f
(
z
)
=
P
(
z
)
/
Q
(
z
)
{\displaystyle f(z)=P(z)/Q(z)}
について、次が成り立つ。
polydeg
-->
(
f
)
=
max
(
deg
-->
(
P
)
,
deg
-->
(
Q
)
)
{\displaystyle \operatorname {polydeg} (f)=\max(\deg(P),\deg(Q))\,}
.
従って
m
{\displaystyle m}
は
H
i
(
1
/
z
)
{\displaystyle H_{i}(1/z)}
の最大多項式次数であり、拘束長は
k
=
m
+
1
{\displaystyle k=m+1}
と定義される。実際、図1の例では拘束長は 3、図2の例では拘束長は 4 である。
復号
方式
畳み込み符号の復号にはいくつかのアルゴリズム がある。拘束長 k が比較的小さい場合、最尤法 に基づいた高度に並列化可能なビタビ法 がよく使われる。ビタビ法はVLSI にも実装が容易であり、CPU 上でソフトウェアとして実行する場合もSIMD 命令を使うのに適している。
拘束長 k が長い場合、逐次型の復号アルゴリズムがいくつか存在しており、ファーノ法などがよく知られている。ビタビ法とは異なり、逐次復号は最尤法は用いないが、計算量は拘束長に対して若干増大するだけで、強力な長い拘束長の符号を利用可能とする。そのような符号は1970年代のパイオニア計画 (木星および土星の探査)で使われたが、短いビタビ符号を大きなリード・ソロモン符号 で連結した形であり、全体としてビットエラー率の曲線は急勾配となり、極めて低い誤り見逃し率を実現していた。
ビタビ復号も逐次復号も、根本は最もそれらしい符号語を探すものである。近似的な信頼度を各ビットに付与する方法として、軟出力ビタビ復号 がある。各ビットについての最大事後確率 (MAP)の軟判定は、BCJRアルゴリズム を使って実現される。
トレリス図
図3. 図1の符号器についてのトレリス図。実線は0入力、破線は1入力、赤線は遷移の一例
畳み込み符号化および復号は有限な状態遷移 で表現することができる。k ビットのメモリを持つ符号器は
2
k
{\displaystyle 2^{k}}
の状態が存在する。
例として図1の符号器を用いる。左のメモリ
m
0
{\displaystyle m_{0}}
に 1
, 右端のメモリ
m
− − -->
1
{\displaystyle m_{-1}}
に 0
が格納されているとする。このときの状態を 10
で表す。なお
m
1
{\displaystyle m_{1}}
は現在の入力ビットそのものであり、状態には含めない。入力ビットの値によって、次の状態は 01
か 11
になる。ここで10
状態から 10
状態への遷移はあり得ない。
図3にこの符号器における全パターンの状態遷移を示す。符号器の状態遷移を分岐で表現したものをトレリス図と呼び、実際の符号化列はこの図上での経路で表現できる。一例を赤線で示した。
上記および図に示す通り、各状態の間には必ずしも遷移が存在するわけではない。これは復号に際して重要となる。受信ビットがこの図に適合しない場合は誤りがあることがわかり、最も近い「正しい」ビット列を選ばなくてはならない。実際の復号アルゴリズムもこの考え方を定式化したものである。
自由距離とエラー分布
任意の異なる符号化列のビット差分の個数(最小ハミング距離 )を「自由距離」と呼ぶ。これは復号器の出力が連続的に誤りとなったときに許容できる最小の長さと解釈することもでき、符号設計においてはこの値が重要な指標となる。
畳み込み符号の訂正能力(correcting capability)として、訂正可能な誤りの数 t は自由距離 d を用いて次のように求められる。
t
=
⌊
d
− − -->
1
2
⌋
{\displaystyle t=\left\lfloor {\frac {d-1}{2}}\right\rfloor }
この値は比較的互いに近い位置にある誤りについての限界を示すものである。逆に、ビット列がある程度離れた位置に t 個を超える誤りを含んでいても、問題なく訂正できる。
畳み込み符号ではビット列を逐次演算しているため、ブロック符号と比較すると誤りが連続して発生すること(バーストエラー)への耐性が弱く、対策を考慮する必要がある。解決策として前述のパイオニア計画 の例のように、畳み込み符号化する前にデータをインターリーブ しておき、外側のブロック符号 (リード・ソロモン符号 など)がその種の誤り訂正をできるようにするなどの方法が採られている。
パンクチャド畳み込み符号
ビタビ復号を用いる畳み込み符号では符号化率1/2の符号が広く使われているが、これをもとに任意の符号化率のものを作ることができる。この操作をパンクチャリング (puncturing; 穴あけ)または perforated (穴あけ)と呼ぶ。
パンクチャリングでは、符号器の出力ビットを一部削除して符号を生成する。削除されるビットはパンクチャリング行列(puncturing matrix)によって決定される。主なパンクチャリング行列を以下に示す。
符号化率 r
パンクチャリング行列
自由距離 d (k = 7 の場合)
1/2 (穴あけなし)
[
1
1
]
{\displaystyle {\begin{bmatrix}1\\1\end{bmatrix}}}
10
2/3
[
1
0
1
1
]
{\displaystyle {\begin{bmatrix}1&0\\1&1\end{bmatrix}}}
6
3/4
[
1
0
1
1
1
0
]
{\displaystyle {\begin{bmatrix}1&0&1\\1&1&0\end{bmatrix}}}
5
5/6
[
1
0
1
0
1
1
1
0
1
0
]
{\displaystyle {\begin{bmatrix}1&0&1&0&1\\1&1&0&1&0\end{bmatrix}}}
4
7/8
[
1
0
0
0
1
0
1
1
1
1
1
0
1
0
]
{\displaystyle {\begin{bmatrix}1&0&0&0&1&0&1\\1&1&1&1&0&1&0\end{bmatrix}}}
3
例えば符号化率 2/3 の符号を作る場合、上表の行列を使って、第1出力の2つ目の出力ビットと第2出力の全ビットを出力とする。ビットの転送の順序は通信規格による。
この方式は通信衛星 でよく使われており、インテルサット やデジタルビデオブロードキャスティング などで使われている。
実用例
畳み込み符号は、デジタルラジオ 、携帯電話 、人工衛星 リンク、Bluetooth などの実装に用いられ、性能を向上させるためによく使われる。
拘束長が長ければそれだけ符号としても強力になるが、ビタビ法の計算量は拘束長に対して指数関数的に増大するため、宇宙探査では復号器の計算量と符号の性能のトレードオフで符号が設計されている。
ビタビ復号を用いたものでは、拘束長
k
=
7
{\displaystyle k=7}
、符号化率
r
=
1
/
2
{\displaystyle r=1/2}
の符号がある。NASA のボイジャー計画 で使われて以来、広く普及している。
マーズ・パスファインダー 、マーズ・エクスプロレーション・ローバー 、カッシーニ では、拘束長
k
=
15
{\displaystyle k=15}
、符号化率
r
=
1
/
16
{\displaystyle r=1/16}
の符号が使われている。これは従来の
k
=
7
{\displaystyle k=7}
の符号に比較して性能は 2 dB 向上しているが、復号の計算量は 256 倍となっている。
単純なビタビ復号を用いた畳み込み符号に代わり、現在ではターボ符号 が広く利用されている。ターボ符号はシャノン限界 に迫るほどの高性能を発揮しており、これと同等の誤り訂正性能を畳み込み符号だけで実現しようとすると復号計算量が非常に大きくなる。
関連項目
外部リンク