償却計算量解析で便利な手段であるポテンシャルの扱いについての簡単な部分を書きます。本稿では時間計算量についてのみを扱い、「計算量」は時間計算量を指します。

可変長配列

以下のクエリを処理する可変長配列を考えます。

$e m p t y ()$
- 空の列を作成する
$l o o k u p (i)$
- $i$ 番目の要素を取得する
$p u s h (x)$
- 末尾に $x$ を追加する

このデータ構造はメモリ領域を保持し、そのうち先頭からいくらかが実際に要素で埋まっているという構造を持ちます。保持している領域の大きさを $c a p a c i t y$ 、入っている要素の数を $s i z e$ で表します。各クエリは以下のアルゴリズムで実現されます。

$e m p t y ()$
- 何もしない
$l o o k u p (i)$
- 保持している領域の $i$ 番目の位置にアクセスする
$p u s h (x)$
- $c a p a c i t y = s i z e$ ならば $2 * c a p a c i t y$ の領域を確保し、全ての要素を移す
- 末尾の位置に $x$ を書き込む

全てのクエリが償却 $O (1)$ で実現されることを、計算量の貯金を用いて示します。

$p u s h$ で領域の拡大が起こるとき、定数倍を除くと高々 $s i z e$ の計算量が必要になります。
ここで、 $p u s h$ の度に $2$ だけ計算量を「貯金」することを考えてみます。この貯金は後で重い処理をするときに使用して計算量を均す目的で使用されます。逆に、貯金をしたクエリは貯金の分計算量が増えたとみなします。この例では $2$ は定数であるため、貯金する分はクエリ辺り $O (1)$ であり最終的なオーダーには影響しません。
領域の拡大が起こるとき、前に拡大が起きてから $2 * \frac{s i z e}{2} = s i z e$ だけ貯金が貯まっています。よってこの貯金を使うことで償却 $O (1)$ と評価することが出来ます。

ポテンシャル

ポテンシャル $Φ$ を導入することで、前述した手続きが扱いやすくなります。これはデータ構造の状態に対して数値を与える関数で、その状態のデータ構造に貯まっている貯金の量に対応しています。実際に必要となる計算量を実計算量と呼ぶことにすると、ポテンシャルによる償却計算量の表示は以下のようになります。

償却計算量
$=$ 実計算量 $+ Δ Φ$
$=$ 実計算量 $+ Φ ($ クエリ後 $) - Φ ($ クエリ前 $)$

貯金をするとき $Φ$ は増加し、償却計算量は実計算量より大きくなります。
貯金を崩す時 $Φ$ は減少し、その分償却計算量は小さくなります。

「現在貯まっている貯金量」「どのクエリでどれほど貯金を増やすか、減らすか」などの複雑な条件を、１つの関数にまとめ上げることが出来ました。このような手法を物理学者法と呼びます。

可変長配列の場合、以下のように定義すると上手く行きます。

$Φ : = 2 * s i z e - c a p a c i t y$

これを元にもう一度 $p u s h$ の計算量解析をしてみます。 $s i z e, c a p a c i t y$ はそれぞれクエリが呼ばれた瞬間の値とします。

領域拡大を伴わない場合
- 実計算量 $= 1$
- $Φ ($ クエリ後 $) = 2 * (s i z e + 1) - c a p a c i t y$
- $Φ ($ クエリ前 $) = 2 * s i z e - c a p a c i t y$
- 償却計算量 $= 1 + 2 = 3 \in O (1)$
領域拡大を伴う場合 ( $s i z e = c a p a c i t y$ )
- 実計算量 $= s i z e$
- $Φ ($ クエリ後 $) = 2 * (s i z e + 1) - 2 * s i z e$
- $Φ ($ クエリ前 $) = 2 * s i z e - s i z e$
- 償却計算量 $= s i z e + 2 - s i z e = 2 \in O (1)$

$e m p t y, l o o k u p$ は $Φ$ を変化させないため実計算量が償却計算量と等しくなり、 $O (1)$ です。

$p o p$ に対応する

可変長配列に新たなクエリを追加します。

$p o p ()$
- 末尾の要素を削除する

$p o p$ を繰り返し呼ぶと、保持している領域に対して要素数が少ししかない状況が発生します。 $p u s h$ 時の拡大と同様に、適切に縮小を行うことで空間計算量を $O (s i z e)$ に削減します。アルゴリズムは以下の通りです

$p o p ()$
- $4 * s i z e < c a p a c i t y$ の場合、新たに $2 * s i z e$ の領域を確保し、要素を全て移す
- 末尾の要素を無視する

$p o p$ も含めた解析は元のポテンシャルだと上手く行かないので、少しだけ拡張します。

$Φ : = ∣ 2 * s i z e - c a p a c i t y ∣$

$p o p$ の償却計算量を評価します。

領域の縮小を伴わない場合
- 実計算量 $= 1$
- $Φ ($ クエリ前 $) = ∣ 2 * s i z e - c a p a c i t y ∣$
- $Φ ($ クエリ後 $) = ∣ 2 * (s i z e - 1) - c a p a c i t y ∣$
- 償却計算量 $\leq 1 + 2 = 3 \in O (1)$
領域の縮小を伴う場合 ( $4 * s i z e < c a p a c i t y$ )
- 実計算量 $= s i z e$
- $Φ ($ クエリ前 $) = ∣ 2 * s i z e - c a p a c i t y ∣ = c a p a c i t y - 2 * s i z e < 2 * s i z e$
- $Φ ($ クエリ後 $) = ∣ 2 * (s i z e - 1) - 2 * s i z e ∣ = 2$
- 償却計算量 $< s i z e + 2 - 2 * s i z e = 2 - s i z e \in O (1)$

$e m p t y, l o o k u p, p u s h$ についての解析は全く同様ですので省略します。

ポテンシャルに必要な性質

償却計算量の定義に沿って考えることで、ポテンシャルに対する制限を導出します。
$N$ 回のクエリを行うとし、 $i$ 回目のクエリの実計算量を $T_{i}$ 、 $Φ_{i}$ を $i$ 回目のクエリの直前の値とします。最初は $Φ_{0}$ で全クエリの終了後には $Φ_{N}$ になっています。

実計算量の和 $= \sum T_{i}$
償却計算量の和 $= \sum (T_{i} + Φ_{i + 1} - Φ_{i}) = Φ_{N} - Φ_{0} + \sum T_{i}$

償却計算量の和は実計算量の和を下回ってはいけないので、 $Φ_{N} - Φ_{0} \geq 0$ が必要十分条件です。また、 $Φ$ は平行移動しても問題ないので $Φ_{0} = 0$ とすることにします。以上をまとめると次の条件を得ます。

$Φ_{0} = 0$
$Φ_{N} \geq 0$
(上手く解析に使える)

$Φ_{N} \geq 0$ はすなわち、貯金はよくても借金はしてはいけないことを意味しています。借金のある状態で操作を終了すると踏み倒しになってしまうと解釈できます。

Two Stack Queue

https://scrapbox.io/data-structures/Sliding_Window_Aggregation
アルゴリズム自体の説明はこちらを参照してください。
ポテンシャルを以下のように設定すると上手く行きます。

$Φ : = s i z e (b a c k_s t a c k)$

各要素の移動する回数に着目する解析も鮮やかですが、ポテンシャルもかなり分かりやすいのではないでしょうか。

解析の注意点

一つのデータ構造の解析で異なるポテンシャルを使わない

データ構造は大抵複数の種類のクエリを処理できますが、それぞれで異なるポテンシャルを用いることはできません。あるクエリを処理するとき、他のクエリで使っているポテンシャルが増加しているかもしれないためです。
そのような「計上されない不正な貯金」が発生しない場合、全ての和をポテンシャルとして定義することで上手く行くこともあります。

実計算量が抑えられていても償却計算量を確認する

たとえ実計算量が $O (1)$ のクエリがあったとしても、他のクエリの償却解析のためにポテンシャルを導入したら、そのクエリもポテンシャルの増減を考える必要があります。それによって、償却計算量が実計算量よりオーダーのレベルで大きくなる場合もあります。

解析の途中で $O$ 記法を使う時は気を付ける

ポテンシャルを $O$ で不適切に扱うと、誤った解析をしてしまう可能性があります。 $Φ$ を $x$ 増加させて償却計算量に計上した後、 $Φ = O (x)$ であるとして $2 x$ の貯金を消費すると、貯金量より多く消費しているため不正です。

まとめ

貯金を考えると償却計算量の解析ができる
ポテンシャルは貯金の便利な定式化

参考文献

Chris Okasaki. Purely Functional Data Structures
アスキードワンゴ　純粋関数型データ構造

ポテンシャルによる償却計算量解析

可変長配列

ポテンシャル

$p o p$ に対応する

ポテンシャルに必要な性質

Two Stack Queue

解析の注意点

一つのデータ構造の解析で異なるポテンシャルを使わない

実計算量が抑えられていても償却計算量を確認する

解析の途中で $O$ 記法を使う時は気を付ける

まとめ

参考文献

関連する記事

ポテンシャルによる償却計算量解析

可変長配列

ポテンシャル

pop に対応する

ポテンシャルに必要な性質

Two Stack Queue

解析の注意点

一つのデータ構造の解析で異なるポテンシャルを使わない

実計算量が抑えられていても償却計算量を確認する

解析の途中で O 記法を使う時は気を付ける

まとめ

参考文献

この記事をシェア

関連する記事

$p o p$ に対応する

解析の途中で $O$ 記法を使う時は気を付ける