トップページ気になる科学ニュース調査
気になる科学ニュース調査

Contents
トップページ
バックナンバー
コラム投票
メルマガ登録

Service
私の気になる科学ニュース
科学ニュースヘッドライン(英語)

Information
サイトについて
掲示板
フィードバック
生命のごとく成長するウェブの向かう先は?


---インターネットやウェブは、人の意思によって出来上がっていくはずなのに、予測できないほど複雑に成長していき、むしろ細胞や生態システムなどと同じような複雑な様相を呈し始めています。インターネットでは毎年のようにコンピュータウィルスの被害が報告されていますが、予測したり防いだりできないのでしょうか?実はその手がかりは、インターネットやウェブ、細胞、生態システムなどに共通している、ある関係から見出すことが出来ます。---



この記事では
 予想を越える複雑なネットワーク
 時代遅れのネットワークのモデル
 ロードマップvsエアラインマップ
 ネットワークのアキレス腱
 ネットワークの効率化とウィルス・パラダイス
 複雑なネットワークの展望
     という内容で構成しています。
 

予想を越える複雑なネットワーク



Lucent Technology
インターネットにしてもウェブにしても、まったくの人の意思による産物であるにもかかわらず、自動車や時計といった規則正しい人工物よりも、細胞や生態系、神経系のほうにより多くの共通点を見出すことができるのです。

 最近のインターネットやウェブは、まるで生き物のように複雑に、そしてあたかも生命をもっているかのように成長しています。

 実際に、多くの企業や政府機関によって、新しい回線やルーターがひっきりなしに付け加えられていきます。しかも、そうするために許可をもらう必要もなければ、報告する義務もありません。これは物理的なインターネットも、その産物である仮想上のウェブ(World Wide Web)でも同じことです。こういうわけで、このネットワークの成長は、誰かが操作することも全体像を把握することも、相当難しいことになっています。すると皮肉な疑問が湧いてきます。

 自分たち人間の意思で作り上げているものなのに、私たちはそれが何なのかさえ分からないのでしょうか?

 ただし、少なくともハッキリしていることがあります。それは、インターネットにしてもウェブにしても、まったくの人の意思の産物であるにもかかわらず、自動車や時計といった規則正しい人工物よりも、細胞や生態系、神経系のほうにより多くの共通点を見出すことができるということです。

 これまでインターネット業界での研究対象は、どれだけ速いネットワークをつくるとか、どれだけよいプロトコルをつくるかということが中心でした。しかし、かなり最近になってきて、ただ速いだけのネットワークをつくるだけではなく、もっとネットワークそのものの性質を知ろうという雰囲気が専門家の間で高まってきたのです。

 こうして、研究の対象としてインターネットなどのネットワークの構造や成長の方法など、そのものが持っている性質が調べられるようになってきたのです。すると見えてきたことがあります。それは、今までこの分野は、コンピュータサイエンスというものが担ってきましたが、むしろ今のネットワークの理解に必要な知識は、先ほどの細胞や生態系などと共通する科学的な知識のほうだということです。

 インターネットの理解の不充分から、これまで生じたトラブルはいくつかあげられますが、極端な例として、昨年の"I love you"ウィルス騒動などがあります。被害は全世界で7000億円近くになったと言われていますが、被害の拡大を予測することはできなかったのでしょうか?できたとしたら、なぜ防げなかったのでしょうか?ましてや一年たった今でも、このウィルスが「死滅していない」という事実など予測できていたのでしょうか?そうです、この"I love you"は、今でも感染ウィルスランキングの7位に入っているくらいなのです。


 また、経済活動の場所がどんどんとこのネットワーク上に移されていくなか、予期しないトラブルやサイバーテロに対してインターネットは安全なのかと心配をする声も高まってくるのも当然のことといえるでしょう。ネットワークそのものの姿を知ることは、私たちが思っている以上に重要なことなのです。

 そこで今回は、今研究の興味の対象となっているインターネットやウェブといったネットワークの姿がどのようなものなのか、そしてそれを知ることでどんなことが分かってくるのかということに、少しでも近づいてみることにしましょう。




時代遅れのネットワークのモデル

 これまで、ネットワークというものは、数学の外れのほうにある一分野として考えられてきました。

 インターネットなども含めて、具体的には、ほとんどのネットワークがあるモデルに基づいて考えられてきました。それは1960年にハンガリーの数学者ポール・エロドスの考え出した「ランダムグラフ(random graph)」です。
(「ランダムグラフ」のイメージ。左側"exponential"の方です。接点のリンク数は大体同じぐらいです。↓)
http://www.nature.com/nature/journal/v406/n6794/fig_tab/406378a0_F1.html

 このランダムグラフとは、いくつもの接点(node)が存在しており、そこから他の接点へまったくランダムにつながっているというものです。またそれぞれの接点につながっているリンクの数は他のものとあまり差がないと考えられています。つまり、どの接点につながっているリンクの数もみな平均的で、ずば抜けて多いものや少ないものはほとんどないというのです。

 なるほどこれに基づて考えれば、確かに接点の数が増えるにつれ非常に複雑になっていき、なにやらインターネットやウェブの姿を表わしているっように聞こえないこともありません。ところがちょっと落ち着いて考えてみれば、すぐおかしいことに気がつきます。

 まず、インターネットがいくら複雑だからといって、まったくの無秩序に成長しているわけでもないでしょう。例えばある企業が新しい回線をインターネットにつなぐ際に、どこかに適当につけるのではなく、やはり高速回線だとか、セキュリティだとかいったことを考えてつなぐはずです。ウェブの場合でもそうです。極端な話、あなたのホームページから張ってあるリンクは、興味や内容に無関係でまったくランダムなものですか?

 もし、こういったネットワークがまったくランダムに結ばれていたら、今のインターネットのような快適なものが実現しているとは思えません。

 こんなこと当たり前の話のように思えるのですが、実は比較的最近までランダムグラフ以上にネットワークの姿をマジメに研究しようとする動きは、あまりなかったのです。ネットワークに関して、細胞や生態系という複雑なものがあまり考えられてこなかったからです。


 しかし、サイバーテロやコンピュータウィルスの被害がますます大きくなるにつれ、どうも一サーバー周辺のセキュリティだけを改善するだけではうまくいかないことが分かってきたのです。こうして、インターネットやウェブの全体像がどんなものか、もっとまじめに考えられるようになってきたのです。




ロードマップvsエアラインマップ

 現在最もインターネットやウェブの姿を言い表しているとされているモデルは、「スケールフリー(scale free)」と呼ばれるものです。
(「スケールフリー(scale free)」のイメージ。右側の図。ほとんどの接点がリンクの数が1,2本だけです。↓)
http://www.nature.com/nature/journal/v406/n6794/fig_tab/406378a0_F1.html

 ランダムグラフのリンク数はまったくのランダムで平均的なリンク数であるのと対照的に、こちらのスケールフリーモデルの描くネットワークには一種の力関係があります。それは、ほとんどの接点には1つか2つのリンクしか存在していないのに対し、わずかな接点には大量のリンクが存在しているということです。これは物理的なインターネットにも仮想上のウェブのどちらにも当てはまります。

 まずインターネットの場合を考えてみましょう。政府や大企業のサーバーには何千何万というつながりが存在しているはずですが、そういったネットワークの末端にある私たちのデスクトップパソコンには、せいぜい電話回線を通してネットワークにつながっているだけです。

 またウェブの場合はどうでしょう?こちらの場合は、リンクが一方から張ってあっても、逆から張ってあるとは限らないので、少し違いはあるのですが、やはりGoogleやヤフーといった一部のビッグサイトには多くのサイトからリンクが張られているのに対して、私のつくったようなサイトは他のサイトからほとんどリンクが張られていません。


 この2つのモデルの関係は、ちょうどロードマップとエアラインマップの関係に似ています。

ランダムグラフの描くインターネットやウェブの姿は、このようなロードマップに似ています。しかし、本当にインターネットやウェブはこのような姿をしているのでしょうか?


 ロードマップの場合、存在しているほとんどの都市(node)へ、多少の差はあっても、だいたい同じくらいの数の道路がつながっています。(日本は山が多いのであまりよい例ではありません。アメリカなどを思い浮かべてください。)

 ところが、エアラインマップの場合、明らかに力関係があることが分かります。例えばアメリカの場合、ケネディー空港やニューヨーク空港はアメリカや世界中の多くの空港からエアラインがつながっているのに対し、地方の小さな空港はつながっているエアラインは一本しかありません。

 つまり、ランダムグラフとスケールフリーモデルの関係は、ロードマップとエアラインマップと似たような関係にあるといえます。

 なお、インターネットとウェブというのは、日常的にほとんど区別なく使われているのですが、それぞれには実在のものと仮想上のものという大きな違いがあります。それにリンクに関しても、一方が双方向であるのに対し、他方は一方通行です。このような大きな違いがあるにもかかわらず、一般的に両方ともスケールフリーのモデルが当てはまるとされています。ちょっと意外に思えますが、その理由は、古典的なランダムグラフのモデルにはない2つの共通したある性質の方が重要だと考えられているからです。

 一つ目は、ランダムグラフでは、接点の数は固定されているものと考えられています。しかし、スケールフリーのモデルでは、その数は常に動いています。つまりウェブなら次々と新しいページが足され古いページが消されますし、インターネットでも新しいルータやサーバー、回線が次々と増設されます。つまりネットワークの成長についてです。

Technology Research News LLC
インターネットはこの「スケールフリーモデルに近いといえるでしょう。」接点の色が黒に近づくほどリンクが集中していることを表しています。


 二つ目は、ランダムグラフは、接点から伸びるリンクの向かう先はまったくのランダムということですが、スケールフリーでは、必ずリンクの集中する接点というものがあります。こちらはリンクの数に基づく構造です。

 実在/仮想とか、リンクの方向性どうこうといったことよりも、この二点の方が重要だと考えられているのです。


 その点では、ここ2年ほどでGoogleが人気ナンバー1の検索エンジンになった理由もわかるはずです。Googleは、ウェブをリンクの数によってランク付けるという方法をとっています。これこそまさに、今ネットワークの研究で重要視されている先ほどの二点のうちの2つ目の方なのです。






ネットワークのアキレス腱

 この2つのネットワークのモデルの違いは、何かトラブルが起こったときに、明らかな違いとして現れてきます。今後、インターネット、ウェブ上で行われる経済活動の割合が大きくなることは間違いないので、ネットワークそのものがどれだけトラブルに耐性を持っているかを見極めることは重要課題となってきます。主にネットワーク上のトラブルには、サーバーなどの故障による予期しない自然のトラブルとハッカーなどによる人為的なトラブルとの二つがあります。

 これから考えることはちょっとしたパズルです。トラブルというのは、図の接点を取り外していくことだと考えます。頭をやわらかくして図を眺めていきましょう。


 まずは予期しない自然なトラブルの方を考えてみましょう。このトラブルはサーバーやルーターなどの物理的な故障が多く、起こる場所や時間はまったくのランダムのはずです。 

別ウィンドウで拡大図を見る
ネットワークにトラブルが生じたときにどのようなことが起こるか予測するのは、ちょっとしたパズルのようなものです。

 このトラブルを、まずはランダムグラフに当てはめてみましょう。トラブルによって接点がいくつか潰れていくわけですが、このモデルはリンク数が一定なので、単純に、トラブルで潰れた接点の数に比例してネットワーク全体が受けるダメージは大きくなります。(図1)

 一方、スケールフリーの場合には、多くの接点にはリンクが一つ二つしかないため、いくつか接点が潰れてもリンクの集中した接点がつぶれる可能性は非常に小さいので、ネットワーク全体の受けるダメージはたいしたことありません。これは、ちょうどエアラインマップで、ある国の小さな地方空港がいくつか閉鎖しても、世界規模での航空ネットワークにはほとんど影響がないのと同じというわけです。ある研究機関の報告では、インターネット上で全体の5%の接点が同時に潰れたとしても、ネットワークはほとんど問題なく動くとされています。(図2)

 この点では、私たちのインターネットやウェブは、うまい具合に成長してきたといえるでしょう。しかし、このことは逆に弱点にもなりうるのです。

 つまり、ハッカーなどのサイバーテロは、ネットワーク上で適当にトラブルを起こしているのではありません。当然、リンクの集中した接点をつぶそうと考えてくるわけです。その際に、スケールフリーのモデルでは、わずか2,3の接点を潰せば、ネットワーク全体の機能がほとんどストップしてしまいます。(図3)

 このように、今のネットワークには、数は少ないですがアキレス腱が存在していて、これはスケールフリーモデルのネットワークに生まれつきの弱点といえます。



ネットワークの効率化とウィルス・パラダイス

 ネットワーク上の不安要素は、ハッカーなどのトラブルだけではありません。コンピュータウィルスも、ネットワークの成長とともにその被害が大きくなってきます。

 今までの場合、コンピュータウィルスのことを研究するのに、生物学上のウィルスと同じ考え方をしていました。

 つまり、コンピュータウィルスの感染速度と、臨界点についてを中心に取り組んできたのです。一般にウィルスは社会全体に対して、ある割合の感染者を保っていないと自然に死滅していく臨界点というものを持っています。そのために、ウィルスの感染速度が大きくないと、社会全体で大流行することはありえません。

 たとえば、インフルエンザのような感染速度の速いウィルスは、その臨界点を越えてしまうので、大流行が起こります。しかし、サルモネラ菌のようなウィルス(生物学上は細菌ですが)は、感染速度が遅いため、社会全体で大流行することはなく、局部的なものです。


 しかし、このようにしてコンピュータウィルスを研究してきたにもかかわらず、全世界で7000億円の被害を与えた昨年の"I love you"ウィルスのような大流行を防ぐことは出来ませんでした。それどころか、この"I love you"は今でも生きていて、年間の感染ウィルスの7位に食い込んでいるというのが事実です。これは、感染速度や臨界点といった研究からは説明できることではありません。

 いったい、この考え方のどこが間違っていたのでしょう?それは、生物学上のウィルスが流行するネットワークというのがスケールフリーのモデルではなく、ランダムグラフに似たものだからです。

 たとえば、昨年は口蹄疫が話題になりました。これは牛の社会というネットワークで大流行が起こったわけですが、このネットワークはランダムグラフト共通することがあります。感染していない牛が感染するためには、この牛が感染した牛に物理的に近づく必要があります。そして、一匹の牛が他の牛に物理的に近づける数というのは、ある程度限られており、ほぼ一定といえます。リンクの数を一定とみなしているランダムグラフと同じというわけです。

 つまり、感染速度や臨界点といったものは、ランダムグラフのモデルに有効のようですが、スケールフリーのモデルに有効だとは限りません。そこで新しく研究しなおしてみた結果、スケールフリーのモデルでは、臨界点の値はゼロ、つまり臨界点は存在していないことがわかりました。

 コンピュータウィルス感染が流行するかどうかは、そのウィルスの感染力や感染速度に依存するのではなく、そのウィルスが中央のサーバーを感染するかどうかだけに依存していることも計算から示されました。

 そのため、いったん落ち着いたウィルスが再び流行し始めるということも十分考えられるわけです。例えば、めったにインターネットに接続しない人が、たまたまあるウィルスに感染してウィルスの保持者となります。そのウィルスの流行が終わった後で、そのウィルスの保持者が久しぶりにインターネットに接続したがために、そのウィルスをばら撒くことになり、そのウィルスが再度広まってしまう結果になります。

 情報伝達の効率を追及して成長してきたこのネットワークは、同時にウィルスの生存にとっても最適な環境といえるのです。そのため、このネットワークでコンピュータウィルスを撲滅することはほとんど不可能に近いことだと考えられています。どこかのコンピュータ会社の会長が、「○○コンピュータウィルスを撲滅した。」などと、お偉い演説をすることがありますが、むしろ、このネットワーク上ではコンピュータウィルスは死滅することはないということを理解した上で、今後の対処を考えることが必要となってくるのでしょう。




複雑なネットワークの展望


 さて、最後にこのネットワークの話を、コンピュータからサイエンス全般にうつしていきましょう。自然界に存在する複雑なネットワークを考えるときに、古典的なランダムグラフでは見えなかったことが、スケールフリーのモデルを導入することで初めて認識できるようになってくるのです。

 例えば誰でも知っている自然のネットワークに、食物連鎖というものがあります。さまざまな生物がお互いどのように関係しあっているかということを理解する上で、このスケールフリーの考え方が重要になってきます。つまり我々のような大型動物は絶対数こそ少ないですが、食のつながりというリンクの数は非常に多いはずです。地球上で数の大多数を占めている細菌などは、食のつながりでは一つか二つのリンクしか存在していません。これを考えれば、どのようなときに、生態系の破壊が起こるかということも予測できそうです。

 他にも、私たちの体の細胞のネットワークにも同じような性質が見られます。実は私たちの体は、常に酸素や紫外線にさらされて、毎日数万個の細胞のDNAが損傷しています。しかし、毎日それだけ多くの細胞のDNAが損傷しています。それにもかかわらず、それが突然変異の引き金となってガンなどになったりすることは、ほとんどありません。何事もなかったように修正されてしまいます。これは、スケールフリーモデルがランダムなトラブルに対して耐性を持っているのと同じ関係にあるように思われます。さらに、細胞内での代謝やタンパク質同士のネットワークというのも、このスケールフリーのモデルを導入することで理解しやすくなるのかもしれません。

 現段階では、個々のタンパク質の構造やはたらきについての研究が中心ですが、それが終了した後に必ず必要になってくるのが、ネットワーク全体のなかでのタンパク質の役割でしょう。やはり、このようなモデルを確立することは、今後重要なことになるはずです。

 (ちなみに、Bose-Einstein Condensationとスケールフリーのモデルの関係について論じた有名な論文があります。こちらも説明すべきなのですが、これはBECの説明自体が面倒なのでパスします。下にサイトと論文の紹介をしておきます。興味のある方はどうぞ。)

 今回紹介した内容は、結局のところ、複雑なネットワークの氷山の一角に過ぎませんが、先ほどのタンパク質の例や、地球の気候の変化などのネットワークの理解には欠かすことが出来ません。また、今回の内容は、ネットワークの、主に構造の面から考えてきましたが、成長の面も合わせて考えていく必要があるでしょう。ただし、それがどれだけ大変なことかは想像も付きません。もはや、これはコンピュータサイエンスの領域だけにとどまらず、数学者、物理学者、生物学者に気候学者などと、多くの専門家が協力して解決していく課題といえるのでしょう。



※今回は、いくつか外部のサイトのイメージを載せてありますが、このサイトでは著作権を守って利用してあります。もし、そのイメージを利用したい場合は、それぞれのサイトを参照してください。
          

ピックアップ!
記事本文には書けなかった内容ですが、面白そうな内容なので紹介しておきます。

The Small World Web(英語)
昔、「私に近い6人の他人」という映画だか小説だかミュージカルだかがありましよね。全世界60億人のなかで、ある2人を選んで、その知り合いをたどっていくと、6人目までに世界中の誰とでもつながってしまうという話です。同じ発想で、8億ページ以上ともいわれるウェブのなかから、ある2つのページを選ぶと17−19クリック目(ページ)でどんなページでもつながってしまうという話。ときどきこのクリック数がウェブの直径だともいわれることがあります。

Bose-Einstein condensation in complex networks(英語)
 BECという言葉を知らない方にはオススメできませんが、BECという物質の特殊な状態とスケールフリーモデルに共通する関係についてかかれた論文。Physical Review Letterに発表されたもの。ちなみにこのページはxxx.lanl.govのサイトから。このサイトには、よく発表済みの論文がおいてあることがあります。



関連サイト
今回は多くのページを参考にしました。参考にしたページをだいたい下に紹介しておきますので、本文の内容に興味をもたれた方は下のサイトをどうぞ。論文集団はもう一つ下を参考に。

Internet Mapping Project - Lucent Lab(英語)
ここでは、インターネットというものがどのような姿をしていて、どのような成長をしていくかということを研究しています。インターネットの地図というのを見てみたくありませんか?時間によって変化していくインターネットの姿のムービーなども有り。

Visualizing Social Networks(英語)
 「複雑なネットワークの展望」で、インターネットやウェブ以外にも複雑なネットワークの例をいくつか挙げましたが、このサイトでは主に社会の複雑なネットワークを考察しています。科学ネタは、分子のネットワークなどがあります。水分子とかDNAとか(ページの下の方)。ただし、今回のスケールフリーモデルには直接関係ないでしょうね。

「ネットワークのアキレス腱」
The missing links - nature science update(英語)


「ネットワークの効率化とウィルス・パラダイス」
Networking can be hazardous - nature science update (英語)

Net inherently virus prone - TRNews(英語)

Internet Plagues Spread Rapidly - PRL(英語)

ポール・エロドス - Britanica.com(英語)


関連論文
アクセスフリーものだけを紹介しています。

Error and attack tolerance of complex networks - Nature
On Power-Law Relationships of Internet topology
Graph structure in the web

なる_科学ニュース

もちろん他にもいろんな科学コラムがあります。
ぜひ、そちらもよんでください。
バックナンバー紹介を見てください。