IMA LIFE JAPAN

~AI~

AIとは、Artificial Intelligenceの略語で、人工知能を意味しています。では、人工知能(AI)とは何でしょうか。これは非常に大きなテーマですので、参考となるサイトを先ず紹介しておきます。

一般社団法人 人工知能学会のウェブサイトで、人工知能について分かり易くまとめたページです。ht詳細についてはこちらをご覧ください。https://www.ai-gakkai.or.jp/whatsai/

コンピューター科学では、AIは、マシン・インテリジェンスとも呼ばれ、人間や動物によって実証されている自然知能とは対照的に、機械によって実証される知能です。コンピューター科学では、AI研究を「インテリジェント・エージェント」の研究と定義しています。「インテリジェント・エージェント」とは、その環境を認識し、その目標を成功裏に達成する可能性を最大化するような行動をとる任意の装置です。口語的には、「人工知能」という用語は、「学習」や「問題解決」など、人間が他の人間の心と交わるための、各種の「認知」機能を模倣する機械を指すのに使用されています。

機械の能力が高まるにつれて、「知能」を必要とすると考えられるタスクは、しばしばAIの定義から除外されます。これはAI効果*として知られています。テスラー**の定理の中では、「AIとは未だ行われていないものである」と述べています。例えば、光学式文字認識はAIと考えられるものからしばしば除外され、日常的な技術になってしまいました。一般的にAIに分類される最新のマシン機能には、人間のスピーチの理解の成功、戦略ゲーム・システム(チェスや囲碁など)における最高レベルでの競争、自律走行車、コンテンツ配信ネットワークや軍事シミュレーションにおけるインテリジェント・ルーティング(経路決定)などがあります。

  • *【AI効果:AIが問題の解決に成功すると直ぐに、その問題はもはやAIの一部ではなくなるという現象で、多くの人は、その原理が分かってしまうと、「これは知能ではない」と思うことから生じる】
  • **テスラー:Lawrence Gordon Tesler、米国のコンピューター科学者】

AIは、分析的AI、人間に触発されたAI、そして人間化されたAIの3つの異なるタイプのシステムに分類することができます。分析的AIは、認知的知能と一致する特徴のみを有します。世界をどのように認知するのかを表現し、また過去の経験に基づいた学習をすることにより、将来に関する決定を情報として提供します。人間に触発されたAIは、認知的知能と感情的知能からの要素を持っています。認知的要素に加えて、人間の感情を理解し、それらを意思決定において考慮します。人間化されたAIは、あらゆるタイプの能力(すなわち、認知的知能、感情的知能、及び社会的知能)の特徴を示し、他人との意思の疎通においては自意識を有し、自己を認識することが可能であるのです。

人工知能の歴史は、1956年に米国で開催されたダートマス会議において、計算機による複雑な情報処理を意味する言葉として、artificial intelligenceという名称が選択されたところ始まったとされています。こうして学問分野として確立され、それ以来何年間にも渡って、楽観主義が蔓延りました。この間にコンピューターを用いて推論や探索を行うことで、特定の問題を解く研究が進みました。そしてパズルを解いたり、ゲームをしたり、英語で会話ができるプログラムが開発されたりしました。このような人工知能は少し皮肉も込めて「古き良き人工知能」と呼ばれています。この時期が第一次人工知能ブームであり、そのキーワードは「論理」でした。

しかしながら、1969年には大きな問題が発覚しました。それは、人工知能には現実で起こる問題全てには対処できないという「フレーム問題」です。フレーム問題は未だに本質的な解決されておらず、人工知能における重要な難問の一つです。人間の脳が日常的に行っている処理というのは、非常に高度かつ複雑です。人間と異なり、人工知能には、懇切丁寧に、決まった枠(フレーム)で学習させなければ、同様な処理ができないのです。有限の情報処理能力しかない人工知能には、現実に起こりうる問題全てに対処することはできません。人工知能の世界では、フレーム問題を回避するために予め人工知能が扱う状況を限定して行われることが多いのです。将棋や囲碁などの人工知能は、「知っていることだけが世界の全てである」という前提に立ち、明確なルールがあるからこそ人間に勝てるのです。こうして、「AIの冬の時代」として知られるような失望と資金の枯渇が訪れ、研究が停滞しました。それでも、今対応できる領域の処理をいかに精度高く行えるようになるのかという試みが進められ、現在でも使用され続けているプログラム言語「C」や、最初の表計算ソフトがこの時期に開発されました。

ところが、1980年代に入ると、第二次人工知能ブームと呼べる時代がやって来ました。第一次人工知能ブームのキーワードは「論理」でしたが、第二次人工知能ブームのキーワードは「知識」でした。人間が現実の問題を解決する際には、詳細で厳密な論理操作よりも、常識や体験的知識の方が遥かに大切であり、それらに基づく直感的で大局的な判断によって意思決定が行われています。そこで、人間の獲得した知識をコンピューターの記憶装置に大量に保管しておいて、それを基にして演繹*推論などの論理的操作をすれば良い、という発想が出て来ました。つまり、「論理プラス知識」の人工知能を実現しようとする試みが、第二次人工知能ブームでした。

これは「知識工学(knowledge engineering)」という名称で呼ばれ、それを具現化したのが「エキスパート・システム」と呼ばれる人工知能でした。これは、人間の専門家(エキスパート)の持つ様々な専門知識をコンピューターに記憶しておき、正確な演繹推論を行う、つまりエキスパートの意思決定能力をエミュレート(模倣)すれば、非常に有用なものになるだろうという考え方に基づくものでした。人間の専門家のように知識についての推論によって複雑な問題を解くよう設計されており、通常のプログラミングのようにソフトウェア開発者が設定した手続きに従う訳ではありません。1970年代に人工知能の研究者によって開発され、1980年代に渡って商業的に適用され、AIソフトウェアとして最初に成功を収めた形態でした。特にビジネス用のデータベースに使えるシステムが多く開発されるようになってきました。医療や金融サービスなどの現場で、実用的なシステムが数多く作られました。コンピューターがビジネスに使えるというのが動機になり、今までは諸外国に遅れを取っていた日本でも、積極的に人工知能分野の研究が始まりました。大きな投資を得た企業や開発者は、1980年代後半より様々なチャレンジを開始し始めました。目標としたのは、述語論理**で書かれた知識命題を、同時並行的に処理して演繹推論を実行する、大規模なコンピューターの開発で、超並列マシンとか、日本では第五世代コンピューター***とも呼ばれていました。関連の有る知識命題群を探索して選択する処理を並列で行うことにより速度を向上させ、知識命題を最初から述語論理の表現形式で書いておき、論理記号操作を直接ハードウェアで実行してしまえば推論の効率の向上が期待できるものでした。こうして人間の言葉を理解し、人間とコミュニケートしながら問題を解決するコンピューターを目指していました。

  • *【演繹:一般的・普遍的な前提から、より個別的・特殊的な結論を得る論理的推論の方法】
  • **【述語論理:数理論理学における記号的形式体系群を指す用語で、その特徴は、論理式に含まれる変数を量化できる点である。命題内部の論理構造である主語と述語の関係「すべての主語は…である」「ある主語は…である」などを、論理記号(全称∀・存在∃など)によって記号化するもの。対する命題論理とは、個々の命題やそれらを結合する論理的な語を記号化して、合成された命題間の関係を個々の命題の内容に立ち入らず、形式的な計算によって明らかにしようとするものである】
  • ***【第五世代コンピューター:通商産業省(現経済産業省)が1982年に立ち上げた国家プロジェクトの開発目標である。570億円を費やし、1992年に終結した。主にハードウェア論理素子の進歩に対応する言葉で、第一世代は真空管、第二世代はトランジスター、第三世代は集積回路、第四世代は(超)大規模集積回路、第五世代は並列推論マシンである】

しかし、この第五世代コンピューター開発プロジェクトは、大失敗であったと評価されています。実際のところ、並列推論マシンはその後実用的に使用されていません。自然言語で表される人間の知識を、どのように論理的な命題として表現すべきなのか、どうすれば具体的な問題の解決が図れるのか、そしてその為にはどのような条件があるのか、等々の言語学的な難問が解決できなかったのです。こうして、知識の完全な記述や管理の困難さとその限界が見えてきたことにより、失望感が広がって研究の停滞を来すことになってしまいました。

このように、人工知能研究は、隆盛を誇っては難問に直面して停滞し、そして新たなアプローチが試みられて成功し新たな資金調達が続くというように、上下する波を経験して来ました。

そして、2010年代半ばから改めて人工知能研究が盛んになって来て、現在は研究者だけでなく一般の消費者までを巻き込んで人工知能が注目され、第三次人工知能ブームとも呼ばれています。第一次及び第二次人工知能ブームのキーワードが、それぞれ「論理」と「知識」であると前述しましたが、第三次コンピューターの人工知能ブームのキーワードは、「統計」(及び「学習」)です。画像や音声を自動的に認知分類する「パターン認識」は、コンピューターには苦手な作業だったのですが、コンピューターの進化と共に、大量のデータ(ビッグ・データ)を用いた機械学習が発展しました。そして、大量のデータを統計的に処理することによって、パターンを認識し分類してしまうことが可能になりました。この飛躍的進化の要因になっているのは「ディープ・ラーニング」という手法の登場です。日本語で「深層学習」とも呼ばれるこの手法を用いることにより、画像認識や音声認識の精度が飛躍的に向上しました。ディープ・ラーニングは、これまでの人工知能の常識を破壊する技術です。今までは絶対に無理だと言われてきた複雑な処理を短時間で行える可能性を有しており、今後も更なる進化への期待が高まっています。ディープ・ラーニングによって人工知能の新しい可能性が開け、人工知能開発研究の分野に巨額の資金が投入されており、今まで以上の進化が起こることを期待されています。
ディープ・ラーニングは、人間の脳の構造を模した「人工ニューラル・ネットワーク*」というシステムを用いて特徴を獲得しています。ニューラル・ネットワークは、データを受け取る「入力層」、学習内容に応じてネットワークのつながり方を変える「隠れ層」、そして最終データを出す「出力層」から構成され、それぞれの層は「ノード」と呼ばれる仮想的な領域から成り立っています。ノードは、人間の脳で言えばニューロンに当たります。その計算の仕組みは、前のノード群から受け取った値に重みづけを行ってその和を計算し、「活性化関数**」と呼ばれる関数を経由して最終的な出力値を決定するものです。活性化関数は、入力信号の総和がどのように活性化するかを決定する役割を持ちます。これは、次の層に渡す値を整えるような役割をします。言い換えれば、これにより流れる情報の量が制御される訳です。

このニューラル・ネットワークを何層にも重ねる、つまり深層化したシステムがディープ・ラーニングです。ディープ・ラーニングに画像を読み込ませた場合、入力層に近い部分では単純な形しか判別できませんが、層を重ねることでより複雑な特徴を獲得できます。そして、最終的にコンピューターは入力画像そのものの概念を入手することが期待されました。しかしながら、実際にはその精度はなかなか上がりませんでした。それまでの機械学習では通常、人間が「特徴量」を設計してコンピューターに教え込んでおき、誤った答えを出力した場合は、正解を出力するように内部のパラメーターを調節してしていたからです。人間の不適切な特徴量設計により、パターン認識の効率が低下してしまっていたのです。

  • *【人工ニューラル・ネットワーク:人口神経回路網、脳の神経系をモデル化した超並列的な分散情報処理システム】
  • **【活性化関数:伝達関数とも呼ばれ、ニューラル・ネットワークにおいて、線形変換をした後に適用する非線形関数もしくは恒等関数である。ステップ関数、シグモイド関数、ReLU関数、ソフトマックス関数、恒等関数等、様々なものがある】

ところが、ディープ・ラーニングでは「自己符号化」技術を活用することにより、「特徴量設計の自動化」が可能になりました。自己符号化とは、得られた出力パターンを、元の入力パターンと比較し、その差異を減らすように内部パラメーター調節を行い、パターンを復元できるように学習することです。ディープ・ラーニングでは、ニューラル・ネットワークの入力層と出力層が同一になります。その中間の隠れ層では、そのノード数が入力層よりも小さく内部パラメーター数も少なくなります。つまり、少数の内部パラメーターによって、元のパターンを復元するという処理が行われるのですが、これは統計計算によるパターンの限定操作であり、すなわち特徴量の自動抽出操作となります。そして多段の層を重ねてこの処理を繰り返し、やがて高次の特徴量を表す内部パラメーター値が出現することになります。この成功をもたらしたのは、やはりコンピューターが高性能化したためであり、膨大な学習作業が可能になったからなのです。例えば、意図的にノイズを混入させて、歪んだパターンを処理する学習が有効だったのですが、そうなると桁違いに大量のデータを処理しなくてはならず、その計算量をこなすのには、クラウド・コンピューティングを始めとする、最新のコンピューター技術が不可欠でした。

ところで、人工知能研究の歴史の大部分では、互いにコミュニケーションを取れないことが多い、幾つものサブ・フィールドに分けられてきました。これらのサブ・フィールドは、技術的な検討に基づいていますが、具体的には特定の目標(例:「ロボティクス」や「機械学習」)であったり、特定のツールの使用(「ロジック」、つまり人工ニューラル・ネットワーク)であったり、或いは考え方が根本的に異なっていたり、などです。サブ・フィールドは、社会的要因(特定の機関とか特定の研究者の仕事)にも基づいています。

人工知能研究の伝統的な問題(或いは目標)には、推論、知識表現、計画、学習、自然言語処理、知覚、そして対象物を移動し操作する能力が含まれます。汎用知能はこの分野での長期目標の一つです。そのアプローチには、統計的手法、計算知能、そして伝統的なシンボリックAI*が含まれます。検索や数学的最適化の幾つものバージョン、人工ニューラル・ネットワーク、統計、確率、経済性に基づく各種の方法など、多くのツールがAIで使用されています。AI分野では、コンピューター科学、情報工学、数学、心理学、言語学、哲学、その他の多くの領域の学問を利用しています。

  • *【シンボリックAI:問題、論理、及び検索に関して、人間が読めるような高水準の「シンボリック(象徴的)」な表現に基づいた人工知能研究の、全ての方法をまとめた用語である。シンボリックAIは、1950年代半ばから1980年代後半までのAI研究の主流のパラダイムであった】

そもそもこの分野は、人間の知能は「シミュレーションする為の機械を製作できるほどにまで、正確に記述することができる」という主張に基づいたものでした。これは、古代より神話やフィクション、そして哲学によって探求されてきた問題で、精神の本質と、人間のような知性に恵まれた人工的な存在を創造することに関する倫理について、哲学的な議論を惹き起こします。今後もAIが衰えることなく進歩して行くと、人類にとって危険になると考える人もいます。また、他の人達は、以前の技術革命とは異なり、AIが大量失業のリスクを生み出すであろうと考えています。

米国防省がAIに関する研究センターを設立することになりました。目的はAIによる意思決定、国防戦略などの可能性を探ることです。AIは国防にとって「軍備の管理、環境への影響、人材教育、ネットワーク防衛、軍関係のオフィス業務の効率化、人道支援、災害救助など、あらゆる分野で役立つものになる」という考えも表明しました。現在の自動運転や民間の宇宙ロケット開発など、さまざまな先端技術を国防省が後押ししてきたという事実もあります。国防省の一部機関であるDARPA(国防高等研究計画局)が始めたロボティクス・カー競技が現在の自動運転開発に結び付いたのはもちろん、災害救助用ロボットやソーラー・カー、再生利用できる宇宙ロケットなど、様々なアイデアがここから生まれ、最終的には民間の技術開発ブームに繋がったのです。現在DARPAではAIEプログラムと呼ばれるものを募っています。これは「次世代AI」の可能性を問うものなのです。第一世代のAIは論理的なルールに基づいて機能しました。例えばAIはチェスのルールを理解し、人間に勝つ能力を身につけました。そして第二世代のAIは、統計学に基づいて解答に至る、画像認識システムなどが条件となります。そして更にその先、第三世代のAIは単に画像認識を行うだけではなく、「なぜその解答に至ったのか」を自己分析できる能力が求められます。DARPAでは、「思考とは何か」を解説できるAIの開発を募っているのです。

21世紀になると、AI技術は、コンピューターの能力、大量のデータ、それに理論的な理解が同時進行することによって復活しました。AI技術はテクノロジー産業の重要な部分となり、コンピューター工学、ソフトウェア工学、オペレーションズ・リサーチ*における多くの困難な問題を解決する手助けをしています。

  • *【オペレーションズ・リサーチ:Operations research (OR)、英国ではoperational researchとも呼ぶ。数学的・統計的モデルやアルゴリズムの利用 などの先進的な分析手法を適用することにより、様々な計画に関する最適な決定を支援する研究の分野】