メッセージ

2006年08月09日の記事

2006/08/09(水)Perlによるbase64エンコード/デコードの実装

エンコード

MIME::Base64(C実装)を使えば速いのですが、メールのタイトル程度でそこまでする必要はないし*1、かと言って日本で有名な某MIMEルーチンは、巨大変換テーブルという非効率な実装なので、自作した奴。

# テーブル
my $base64table = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/';
# 変換処理
$subject =~ s/(\e\$[\@B].*?\e\([BJ])/ '=?ISO-2022-JP?B?' . &base64encode($1) . '?=' /eg;

sub base64encode {
	my $str = shift;
	my $table = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/';
	my $ret;

	# 2 : 0000_0000 1111_1100
	# 4 : 0000_0011 1111_0000
	# 6 : 0000_1111 1100_0000
	my ($i, $j, $x, $y);
	for($i=$x=0, $j=2; $i<length($str); $i++) {
		$x    = ($x<<8) + ord(substr($str,$i,1));
		$ret .= substr($table, ($x>>$j) & 0x3f, 1);

		if ($j != 6) { $j+=2; next; }
		# j==6
		$ret .= substr($table, $x & 0x3f, 1);
		$j    = 2;
	}
	if ($j != 2)    { $ret .= substr($table, ($x<<(8-$j)) & 0x3f, 1); }
	if ($j == 4)    { $ret .= '=='; }
	elsif ($j == 6) { $ret .= '=';  }

	return $ret;
}

*1 : Perlは外部モジュールロードが速くない

デコード

# テーブル
my @base64ary = (
 0, 0, 0, 0,  0, 0, 0, 0,   0, 0, 0, 0,  0, 0, 0, 0,	# 0x00~0x1f
 0, 0, 0, 0,  0, 0, 0, 0,   0, 0, 0, 0,  0, 0, 0, 0,	# 0x10~0x1f
 0, 0, 0, 0,  0, 0, 0, 0,   0, 0, 0,62,  0, 0, 0,63,	# 0x20~0x2f
52,53,54,55, 56,57,58,59,  60,61, 0, 0,  0, 0, 0, 0,	# 0x30~0x3f
 0, 0, 1, 2,  3, 4, 5, 6,   7, 8, 9,10, 11,12,13,14,	# 0x40~0x4f
15,16,17,18, 19,20,21,22,  23,24,25, 0,  0, 0, 0, 0,	# 0x50~0x5f
 0,26,27,28, 29,30,31,32,  33,34,35,36, 37,38,39,40,	# 0x60~0x6f
41,42,43,44, 45,46,47,48,  49,50,51, 0,  0, 0, 0, 0	# 0x70~0x7f
);
# デコード処理
$subject =~ s/=\?ISO-2022-JP\?B\?([A-Za-z0-9\+\/=]*)\?=/ &base64decode($1) /eg;

sub base64decode {
	my $str  = shift;

	my $ret;
	my $buf;
	my $f;
	if (substr($str, -1) eq  '=') { $f=1; }
	if (substr($str, -2) eq '==') { $f=2; }
	for(my $i=0; $i<length($str); $i+=4) {
		$buf  = ($buf<<6) + $base64ary[ ord(substr($str,$i  ,1)) ];
		$buf  = ($buf<<6) + $base64ary[ ord(substr($str,$i+1,1)) ];
		$buf  = ($buf<<6) + $base64ary[ ord(substr($str,$i+2,1)) ];
		$buf  = ($buf<<6) + $base64ary[ ord(substr($str,$i+3,1)) ];
		$ret .= chr(($buf & 0xff0000)>>16) . chr(($buf & 0xff00)>>8) . chr($buf & 0xff);

	}
	if ($f>0) { chop($ret); }
	if ($f>1) { chop($ret); }
	return $ret;
}

ライセンス

修正BSDで。

ナップサック問題をポケコンで解く

ナップサック問題は重いらしい

手元に舞い込んできたとある資料によると

ks.gif

この問題は,14個ある荷物を入れるか入れないかで考えるので 214 = 16,384 通りの組合せとなり,すべての組合せをコンピュータに計算させると最適な組合せ(解)を見つけるのに数十分もかかってしまいます。(中略)遺伝的アルゴリズムを用いると,わずか数秒で答を求めることができます

要するにGAの優位性を訴えているのですが、この程度の問題に、どうやったら数十分もかかるのか疑問で仕方ありません。というわけで実際に試してみました。

C言語で解いてみる

Pentium3@800MHzの、今となっては決して速くないCPUとgcc3.3を使いこの問題を総当たりで解いてみました。ソースファイルはこちら

nabe~$ gcc -O2 ks.c -o ks.o
nabe~$ time ./ks.o
Best pairing : 0(A) 1(B) 2(C) 4(E) 6(G) 7(H) 9(J)
Best value   : 530

real    0m0.005s
user    0m0.001s
sys     0m0.004s

プログラムの起動時間を入れても5ms、実際に問題を解いている時間だけみれば1msです。数秒をうたっているGAよりもはるかに速い結果です。困ったことになってしまいました。どうやら実験に使った環境が速すぎたようです。

JavaScriptで解いてみる

遅いマシンをすぐに用意できればよかったのですか、今更Pentium(初代)レベルのマシンやそれ以前のマシンを用意するのも大変です。マシンを遅くする代わりに処理系を遅くしてしまうことにしました。きっとコンパイルしてマシン語に変換されたのが問題だと思うので、処理が遅い言語としてインタプリタを使用することします。

ブウラザがあればどこでも動くJavaScriptによる実装です。

14個の荷物について計算します
最大重量 = 200
組み合わせ : A B C E G H J
最的値 = 530
計算時間 = 90 ms

実行マシンはCeleronの1GHzで、gccと比べても実行環境として100倍以上遅いのですが1秒を切ってしまいました。単純計算で100MHz程度のマシンをもってきても1秒程度で答えが出るようです。どうしましょう、数十分どころか、数秒と言われるGAよりも高速です

考えが甘かった。まだまだマシンが速すぎたようです。もっと決定的に遅いマシンならいいのですが、身近に、もっと遅くてプログラマブルのコンピューターがなかなか思い当たりません。ファミコン? 携帯? あーこれがありましたっ!

ナップザック問題をポケコンで解いてみる

pc-g815.jpg

まず簡単にスペックをおさらいしておきましょう。

型番SHARP PC-G815
CPUZ80相当 3.58MHz
メモリ(RAM)32KB

3.58MHzです! 今までより格段に遅いマシンです。最近のマシンと比較すれば1000分の1のクロックで「64ビットだー!」と世間が騒がしいこのご時世に8bit。単純計算で8分の1ですが、潜在的な能力差はその数倍にも昇ります。

これだけのマシンを持ってくれば誰も速いなんて文句を付けるような無粋な人間はいないと思いますが、念には念を入れて次の選択をしました。

プログラム言語BASIC

(パソコンと比べれば)劇遅なZ80の上で動くBASICインタプリタ。もはや文句はないでしょう。

さて実際にプログラムを打ち込むのですが、たった4行の狭い画面に打ち込むのが大変な上、BASICの文法が(CやPerlに慣れた今になっては)違和感ありまくりで一苦労でした。できあがったソースはこちら

きちんと正解が出るのか走らせてみましょう。多少緊張しつつ、RUNと入力します。

pc-g815_kekka.jpg

解けました、解けました。さて気になる時間は135秒!(手動計測) 2分15秒ですから、さすがに時間掛かってます。ですが、数十分どころか、数分にすらなりません! わざわざインタプリタでこれですから、普通にCで書いたとして一体どんなマシン持ってきたら数十分になるでしょう。誰か教えてっ!!