Bitcoin - Cryptographic hash function

暗号学的ハッシュ関数は基本的な要素であり多くの暗号アルゴリズムやプロトコルで必要になります情報セキュリティの分野では非常に重要なものです中でも有名な暗号学的ハッシュ関数といえば MD5とかその前身であるMD4や SHA-256というものもありますその前身のSHA-1というものもありますね RIPEMDやBLAKE Skeinといった名前を聞いたことがある人もいるかもしれません今日暗号学的ハッシュ関数は様々に応用されていますがその歴史の最初期にあるのは電子署名での使用例でしょうデジタル署名は多くの分野で使われています Eコマースの基礎部分はもちろん Bitcoinの生成にも用います他にもメッセージ認証やランダムな数字の生成パスワードの保全やある種の暗号化に使われます Bitcoinのプロトコルの中にも様々な形で暗号学的ハッシュ関数が現れますそれではまず暗号学的ハッシュ関数とは何かをお話して 1つにはその名のとおりこれはハッシュ関数の1種ですハッシュの名のとおりこれは入力を受け付けます数学的関数ですから入力されたものを処理するわけですこの入力を「メッセージ」と呼びますメッセージの長さは任意ですハッシュ関数はこのメッセージを受け取り数学的に変形させて1つの出力を得ますこの出力を「ダイジェスト」といいますこの出力は他にもタグとかハッシュとかフィンガープリントと呼ばれますダイジェストがもっとも一般的な呼び方でしょうか実際MD5は「メッセージ・ダイジェスト・5」の省略形ですからね MD4も「メッセージ・ダイジェスト・4」の略でしたさてメッセージの長さは任意だと言いました長くても短くてもかまいませんただし出力ダイジェストあるいはタグの長さは決まっています例えばSHA-256のダイジェストの長さは 256ビットと決まっています入力の長さは任意ですが出力は固定長なのですまた暗号学的ハッシュの特徴としては決定性のアルゴリズムであることが挙げられます関数は同じ入力に対して常に同じ結果を生成します入力が同じであれば毎回同じ出力が得られるのです同じ入力が違う出力を返すことはありません毎回同じなのですハッシュ関数は計算機科学で長い間使われており様々な形で応用されています例えば「ハッシュテーブルを構成するハッシュ関数」など聞いたこともあるのではしかしハッシュテーブルで使われているものは暗号学的ハッシュ関数とは限りません暗号学的であるには条件があるのですつまり暗号学的ハッシュの設計においては欠くことのできない要件がありそれがなければ秘匿性が問題となる暗号的アプリケーションに用いることができないのですさてそれらの要件についてお話していきますが暗号学的ハッシュ関数は計算機的に効率よくなければいけません入力を処理して出力するのに時間がかかりすぎてはいけませんメッセージを加工してダイジェストを得るのに長い時間コンピューターで計算するわけにはいかないのですある程度高速である必要があります明らかなことですが大事なことなので強調しておきますと非効率なハッシュ関数を用いる暗号的アプリケーションは適格なものであるとはいえないのです 2つ目には特に電子署名においてですが同じ出力を得る2つの入力は見つけにくくなくてはいけません別々のメッセージに同じダイジェストが紐づく状態ですねこの要件を「衝突困難性」といいます衝突する2つの入力が見つけにくいという意味ですたとえばM1とM2という2つのメッセージがあるとしましょうこのメッセージからハッシュ関数で得るダイジェストは同じであってはいけません M1とM2 から得られる出力は必ず違うものなのです常に重複せず違っていなければならないのです少し戻りましょうメッセージは任意の長さですがダイジェストの長さは決まっていると言いました 2つのメッセージから得られるダイジェストが常に違っていると証明するのは数学的に不可能です現実的には同じ出力となる2つの別の入力を探すのが困難な仕組みが必要です原理上メッセージの数よりもダイジェストの数は少ないですからねそういうわけで2つのメッセージを探すのに天文学的な時間が必要なアルゴリズムにしなければいけません 3つ目にはハッシュ関数は入力に関する情報を隠せないといけません入力の内容を予想できる情報が出力されないようにする必要があります例えば入力が奇数なのか偶数なのかなどあらゆる情報ですねこれらは出力からは排除されるべきです奇数・偶数のような単純なヒントでもです 4つ目には出力の分布が広くなければいけませんまったくランダムな出力に見えなければいけませんまるでコインの裏表の分布のように予想不可能である必要がありますコインをばらまいたときの裏表の分布を考えてっましょうそれくらいのランダムさが必要ですつまり暗号学的ハッシュというのは数学的なひき肉ミキサーのようなものです入力を受け取って数学的に変形させるわけですねその際の出力はバラバラのランダムなものに見えるようになりますこれらの要件についてはそれぞれに関連があります例えば出力が入力と無関係に見えてしかもランダムであれば衝突困難性は非常に高いといえるでしょう出力から入力が予想できないのであれば同じ出力を得る2つの入力は見つけにくいといえますもちろんある要件と要件が矛盾することもありますまた数学的に完璧に見えても現実世界で常にそれが保証されるわけではありません衝突困難性において完璧なハッシュ関数を作ることはできるかもしれませんしかし例えば1年後誰かがそれを覆さないとは言えないのです総当り以外のエレガントな方法で衝突を探し出すことができるようになるかもしれないのです今のところそうした数学的テクニックは見つかっていません暗号学的ハッシュ関数の制限は今のところ回避できないのですそういうわけで今のところは「総当りでどれくらい時間がかかるか」が指標となっています最後にこれらの説明は常に数学的に厳密というわけでもないのですもっと正確に説明する方法もありますまずこの動画で暗号学的ハッシュ関数のエッセンスをつかんでください