# イントロダクション

## 人工知能・機械学習・ディープラーニングの違い

![img1](images/intro/01.png)

### 人工知能（AI）
人工知能が3つの概念の中で最も大枠となり、人間のように学習や推論を行わせる概念を指します。

「人工知能」と言えば、最近でこそ、収集したデータに基づいて学習させるデータ駆動型のイメージが強いですが、本来の意味はそれだけではありません。例えば、人間が学習・習得した知識・ノウハウをプログラミングすることにより形式化・再現可能にして、それをコンピューターで動かすことも「一種の人工知能」と言えます。もちろん、この後で紹介する機械学習のように、集めたデータに基づいて（データ駆動型で）コンピューター自身が学習も行って、学習した結果に基づいて推論を行う場合も「人工知能」と言えます。

このように、人工知能という言葉が指す範囲は非常に広いわけです。ですから、「AIで何かしよう！」といったプロジェクトではなく、「機械学習により電力量の需要を予測することで運用のオペレーションを改善し、1％のコスト削減を目指そう」といった具体的な目標設定が必要となります。

### 機械学習
収集したデータに基づいて、モデルの学習を行う仕組みのことを機械学習と呼びます。

「モデルの学習」という曖昧な表現でしたが、具体的には、定式化した数式のパラメーターを、収集したデータに基づいて、ある定めた評価関数（誤差など）を最小化するように決定することを指しています。先述したデータ駆動型の学習や推論を行う仕組みが機械学習です。

機械学習には、以下の3つのトピックがあります。

- 教師あり学習
- 教師なし学習
- 強化学習


入力xから出力yを予測する仕組みである教師あり学習が、ビジネスの場でよく使われているため、これから勉強される方は、まずこちらから調べてみてください。

AlphaGoが囲碁で人間に勝利して以来、強化学習も注目を浴びるようになってきていますが、ゲームやロボット系の分野以外では、まだまだ実用的な技術ではないと感じています。理由としては、強化学習の考え方や実装自体はそれほど難しくないのですが、強化学習ではシミュレーター、もしくは実機が必要となり、これらを割と手軽に準備できる業界がゲームやロボットに限られているためです。

### ディープラーニング
機械学習、例えば教師あり学習における問題設定は、「入力と出力の関係性を見つける」といったものですが、これはあくまで概念であり、具体的な手順は明らかになっていません。そこで実際にコンピューターが実行できるレベルまで具体的な手順を明確化したものを、アルゴリズムと呼びます。

そして、この機械学習アルゴリズムの一部がディープラーニングです。もちろん、ディープラーニング以外にもサポートベクターマシンやロジスティック回帰といった他の機械学習アルゴリズムも存在し、ディープラーニングは一手段であることをしっかりと覚えておきましょう。

最近では、「ディープラーニングを使って、問題を解決したいのですが」といった相談も少なくありません。しかし、その前に、その問題が本当にディープラーニングによって解決すべきか、それ以外の古典的な手法でも解決できるかを見極めておく必要があります。

　ビジネスとして相談を受ける大半の例では、ディープラーニングは不要なケースが多いと感じています。ただし、画像や時系列、自然言語処理といったメディアと結びつきの強い分野では、ディープラーニングが非常に有用なケースがあります。

## 学習と推論

人工知能を勉強すると必ず出てくるキーワードとして、先述した学習と推論があります。

「どういったことを行うのか？」という具体的なイメージ（＝推論したいこと、問題設定）を持っておくことで、実際に現場へ導入する際に、「どういった情報を集めるべきか」（＝学習すべきデータ）が明確になるため、今回はこの学習と推論に焦点を当てましょう。

### 学習
学習では、ある入力と出力に対して情報をひもづけてあげるために、「この入力を行うとこの出力が得られる」といったデータを渡して、その規則性を見つけることを行います。

具体的な例を見てみましょう。ここでは、入力用の学習データとして「吉崎」と「今西」という2人の人物写真を使うこととします。

![img2](images/intro/02.png)

今回の例では、ある画像（1人が写った顔写真）を入力として、この画像内に写っている人間が「吉崎」か「今西」かを分けたいという問題を設定するとにします。人間の目では全く難しくない問題ですが、これがコンピューターにとっては案外難しかったりします。

#### 人間の知識・ノウハウをプログラミングする方法
それでは、まず機械学習ではない人間の知識によるプログラミングの例から見てみましょう。

画像だけを見ると、「吉崎」と「今西」を分けるためには、Tシャツの色で判断する方法を採用できそうに思えますが、Tシャツを着替えると、この方法が通用しなくなります。人間であれば、「人間は色の異なる服を着替えることもある」という事前の知識・ノウハウがあるため、この方法は避けるでしょう。そして、肌の色や顔の面積などを画像処理によって取得し、例えば、「おでこの面積が○○よりも大きければ吉崎」「肌の色が○○よりも白ければ今西」といった判断を下すためのプログラムを書くことになります。

これが「人間のノウハウをプログラミングする」方法です。

#### 収集したデータに基づいて学習し、その結果から推論する方法（機械学習）
一方、機械学習では、コンピューターで扱うために、画像の情報をまず数値に変換します。

そのためには、「画像はどのような数値で表現されるのだろうか？」という情報、つまりデータの特性が分かっていないと、そもそも機械学習を使うまでに至ることができません。ちなみに、画像はRGB（Red／Green／Blue）で表される光の三原色に対する光の強さ（輝度）を定量評価することで数値に落とし込むことができます。

教科書で紹介されていることはあまりありませんが、こういったデータの特性を考えることは、機械学習を実装していく上で非常に重要なため、「身の回りの現象を定量評価するにはどうするのか？」といった観点で、物事を見る練習をしてみましょう。宿題として、「キカガク」という文字は数値でいうといくらでしょうか？ ということについて考えてみてください（※決まった正解はありません）。

話を戻すと、この数値を今度は特徴量と呼ばれる別の指標に変換します。例えば、顔の輪郭だけ抽出するとか、画像内の肌色の数をカウントしてみるとか、いろいろな方法があり得ます。この特徴量の抽出が、推論の結果、この例では「吉崎」と「今西」をうまく判別できるかを大きく左右します。

そして図に示すように、この特徴量を入力として、それに対する出力（「この画像は『吉崎』である」といった出力）も1セットで、モデルに与えます。

![img3](images/intro/yoshizaki.png)

もちろん1枚だけではコンピューターは規則性を見つけられないため、他にもいろいろな角度で撮った写真を数十枚～数百枚、多いときには数万枚ほど準備してコンピューターに学習をさせます（例えば図は「今西」を学習させるための1セットで、こういった学習を多数行っていきます）。

![img4](images/intro/imanishi.png)

そして、この学習によって学習済みモデルが完成します

### 推論
学習後に、学習済みモデルを使用して、新しい画像に対してその予測値を求めることを推論と言います。具体的には図のように、新しい画像が入ってきた際に、学習済みモデルに基づいて、「吉崎」といったような予測が行われます。

![img05](images/intro/inference.png)

AI搭載のプロダクトには、この学習済みモデルによる推論が組み込まれているわけです。

学習には時間がかかります。しかし推論には、この学習済みモデルを使用した計算のみのため、基本的にほとんど時間がかからないといったメリットがあります。


### よくある落とし穴
よく受ける相談として「過去数十年分で蓄積されているデータを使用して何か予測できるモデルを作りたい」というお題があります。こういった方の特徴として、「AIは何かデータを与えれば自動的に有用な情報を返してくれる」といった淡い期待があります。

しかし今回、学習と推論を勉強していただいた皆さんであればお分かりの通り、何かデータがあれば自動的に何かが予測できるわけではありません。まず「何（出力）を予測するのか」「そのために何（入力）が必要か」を事前に決定し、目的にあった学習データを準備しておく必要があります。

まずビジネスの課題から考えて、「何から何を予測するのか」を正しく設定すること。これが、成功する機械学習の第1ステップです。

## ディープラーニングの開発フロー

AI をビジネスにおいて導入するまでの開発フローを下の図に示します。すべての案件がこのフロー通りに進む わけではないですが、大枠は同じような流れで進みます。

![img6](images/dev_flow/1.PNG)

### 企画・ヒアリング

最初に企画側からの説明があり、どのようなシステム を実現したいかを話し合います。よくあるケースとして「ど のようなシステムを作れば良いか」といった依頼を受 け、システム構成等の設計を始めます。しかし、ここで立 ち止まってしっかり考えていただきたい。そのシステム は「なぜ必要か」そして「AI でないと解決できないのか」ということです。今までの相談では「AI で解決してほしい」というように、手段が目的化しているケー スが少なくありません。しかし、その企画を深掘りしてみると、既存のロジックベースでも実装可能なケースが多いのが現実です。このような案件に関して、仮に機械学習な どのモデルを作成した場合、うまくいかない上に中がブラックボックスであるため、問題の原因究明を行うことが困難となります。またコストもかかり、良かれと思って使用したAIが結果的に技術的負債となります。この問題を避けるためにも、技術的負債が残らず継続的に運用可能かを踏まえた上で、企画から技術に落とし込んでいく必要があります。

### 環境構築
AI エンジニアと呼ばれる人材が求められる時代となり、研究に携わっていなくても職業として AI を選択す る人が増えています。筆者の会社もそうですが、専門知識のない人に AI について教える教育業も増え始めています。この教育業者の多くは、まず機械学習に関する数学とプログラミングを教えています。そして、Kaggleなど実践的なモデル構築の練習を行い、AI エンジニアとして就職することになります。

このように機械学習のモデル構築だけをひたすら練習してきた人が実務に出た際、まず躓くのが「環境構築」 です。多くの教育業者は構築済みの環境を使って解析を行っているため、実習中にこの力が身についていない。

手元の PC（ローカル）で解析を行う場合は、クリッ ク１つでインストールできるソフトウェアが配布されている便利な時代なので問題ないですが、最近では GPU （Graphic processing unit）を使用する機会も多い。その際は、下図に示すように、リモートにある解析用サーバーを操作するスキル、例えば、UbuntuなどのLinux をコマンドで操作しながらソフトウェアをインストールするスキルが必要になる。また、環境をインストール しただけでは終わらず、ローカルで使用できるよう、リ モートとローカルの紐づけも行わなければいけない。これまでコンピュータに深く関わってこなかった人に、単 独でこれらの作業は難しく、要望に合わせて素早く環境構築できる訓練を、実務の前に経験しておく必要がある。 Pythonでは、Jupyter Notebookと呼ばれるWebブラウザベースの実行環境がある。対話側のように実行 結果を都度確認でき、コードをまとめて実行できるスクリプト型の良さも取り入れており、データ解析に好んで用いられる。さらに Jupyter Notebook が秀逸なのは、 Web ブラウザベースであるため、リモートであっても ローカルであっても、環境の差をほとんど意識すること なく解析を行うことができる点である。

![img7](images/dev_flow/2.PNG)

最近では Dockerと呼ばれる仮想化技術を取り入れるケースも増えており、ローカルで構築した環境を OS の異なるリモートでも即時に全く同じものが移植できる ようになっています。デプロイを行う際のコストを大幅に下げ ることができると同時に、コードのみならず環境ごと共有できるのです。コマンド一つではインストールができなかったり GPU の環境構築が手間取ったりしていた機械学習においても、一部ライブラリでは環境の差の問題を解消できるようになってきました。

### 前処理・構造化

環境構築が完了し、いざ機械学習に取り掛かろうとす るも、文章や画像などをどのように機械学習の入力としてベクトル化して良いかわからない問題が初学者にはあります。ライブラリの使い方は把握しても、結局そのライブラリにインプットできる入力データの形式に変換、つまり構造化ができないのです。 

そして、この構造化と同じタイミングで、外れ値除去 やスケーリングなど、問題設定に応じたデータの前処理が必要となります。画像であれば何でもディープラーニングを使えば良いというものではありません。とりあえずディープ ラーニングを使用するも思うような精度が出ず、その原因を探りながら、結果的にデータの前処理を行っていきます。AI に任せればすべてがデータに基づいて解決されると思っていたという楽観的な意見を聞くこともありますがそうではありません。現場での解析は、モデルを作りな がら、どのような原理になっているかを人間が理解し、 そのノウハウを反映することで精度が向上していくのです。

### モデル構築（機械学習）
構造化されたデータに対して、入出力間の関係性、もし くはデータ構造の把握を行う作業です。実務における モデル構築の作業では、Scikit-learnや TensorFlow, Chainerといった機械学習向けのライブラリを使用することが多くあります。理由は、モデル化がうまくいかない際に、「プログラムが間違っている」か「使用する手法やデータが悪い」かを切り分けるためです。研究では、 フルスクラッチで提案手法に関するプログラムを組むことも少なくないが、ここにはプログラムの間違いというリスクが潜んでいることを忘れてはいけません。

例えば Scikit-learn の場合、同じインターフェースで様々な手法を試すことができるため、初学者でも高度な機械学習アルゴリズムを使用することが可能です。しかし、使用可能であることと適切に使用できることは異なります。教育を通して、多くの初学者が解析を行う様子 を見てきましたが、うまくいかないときに他の手法を使うことができても、結局その手法がどのような特性か把握できておらず、ハイパーパラメータのようにチューニング すべき点も試さないままお手上げとなってしまうケースが少なくありません。デフォルトとして設定されているハイパーパラ メータの値でたまたまうまくいけば良いですが、それはデー タ解析ではなく運試しです。このように、機械学習向 けのライブラリが整備され初学者でも使いやすくなって いる一方で、数式を通してアルゴリズムを理解していな いと、結局、結果を出せない現実もあります。 

また、ビジネスの場でよく起きる問題として、予測精度何%を要件とするのかが明確でないがゆえに、いつまでも解析を終えられないことが挙げられます。例えば、精度が80%のとき、これで運用して良いのか、まだ精度を上げる努力が必要なのか。結論から言うと、データ解析側からその目標となる精度を決めることはできません。もちろん、精度 100%であれば終了できます。しかし、ほとんどの案件では精度 100%が出ることはありません。よって、ビジネス側として「精度 100%が出せない AIでどのように効率化するか」を先に考えておく必要があります。ここが AI 導入時の最も重要な点だと感じています。

精度100%が出ないということは、下図に示すように、 人間がカバーする必要があります。

![img8](images/dev_flow/3_1.PNG)

「人間が行っている単純 作業を AI ですべて代替したい」といった相談がよくありますが、これはうまくいきません。まずは手動オペレーショ ンでビジネスが回るように設計します。そのオペレーションの中で、作業手順が明確かつ費用対効果も高い作業に対して、コスト削減の手段を検討します。しかし、ここでいきなり AI を導入してはいけません。コスト削減が目的の場合、図に示すように、AI 開発を長期間かけて行 うよりも、クラウドソーシングの活用かRPA（Robotic process automation）による自動化の方が短期間で安定して成果が出やすいです。クラウドソーシングを行う中で データが蓄積されるので、これを使用して機械学習によ るモデル化を行うと、さらに多くの作業を短時間でこなせるようになります。万が一、精度が出なかったとしても、クラウドワーカーが最後の仕上げはカバーできるように設計しておけば、成果物に対する支障は出ません。また、RPA で あれば、人間側でロジックを設計し、プログラミングを 行っていきますが、画像や自然言語などロジックを言語化しにくかったり、制御構文が増えすぎてプログラミングの工数が多くなった場合に機械学習によるモデル化を検討すれば良いです。これが、AIを効果的かつ安定的に導入するための正しい手順です。「とりあえず AI」ではなく、 うまく導入するための「人間のオペレーションによる冗長化」を忘れてはいけません。

![img9](images/dev_flow/4.PNG)

### 仮運用・検証

機械学習では、手持ちのデータを訓練と検証（ときに はバリデーション）のデータセットに分割します。訓練データを使用して機械学習のモデルを学習し（バリデー ションデータを使用してハイパーパラメータの値を調整）し、学習には使用していない検証データに対して、 どの程度の性能が得られるかを確かめます。研究では一般 的にこれを「検証」と呼びますが、ビジネスの現場においては異なります。 クライアント側から見ると、うまく稼働するところを 確かめたいのは当然であり、過去の手持ちのデータセッ トを分割した検証データに対する性能では物足りません。 そのため、翌日以降に実際に使える形に落とし込む必要がでてきます。例えば、予測値の計算を定期実行できるように仕組み化したり、その結果を可視化して確認できるようなシステムの構築を行うことです。こうなると、機械学習で使用しているスキルセットとは異なり、Web のサーバーサイド技術が必要になります。

機械学習のモデルを組み込んだプロトタイプのシステム構成図を一例として挙げる。
![img10](images/dev_flow/5.PNG)
これは Webア プリケーションとしてシステムを作成した場合です。 機械学習では、プログラミング言語として Python を使用することが多いため、今回の構成も Python をベース としています。

まず、可視化を行うために HTML, CSS, Java Script を使用してフロント側を作成し、サーバーサイドとして Java, Ruby, C といった言語とそれに対応します。Web フ レームワークを使いながら実装していく。Pythonはサー バーサイドとしても使用できるため、PythonのWebフレームワーク（例えば、Djangoや Flask ）を使用し ても良いです。Python 以外の言語で Web アプリケーショ ンを作成した場合は、Python 側で別の予測モデル API サーバーを作成し、Webアプリケーション側からのリクエストに対して予測値を計算して返せる仕組みにしておくと、サーバーサイドと機械学習で使用するプログラミ ング言語が異なっても問題なくなります。また、アプリ ケーション側とデータベースを連携させて使用するが、検証を行いながらモデル構築をやり直す試行錯誤が待っているため、データ解析用のサーバーを別に立てておくことが望ましいです。Dockerで管理することで、予測モデル API用の環境とデータ解析の環境を同じにでき、解析から API までのデプロイが円滑に行えます。案件によって は Web から定期的に情報収集してデータベースに保存 することもあるが、Pythonの静的なページはBeautiful Soup、ログインやJava Scriptなど動きがあるページ は Seleniumを使用することでこれを実現できます。このように、Docker のコンテナと呼ばれる仮想的に独立した環境を機能ごとに作っておくことで、それぞれのコンテナを独立したサーバーとして割り振り、本格的運用 に移行した際にスケールアウトを容易に実現できるのです。また、プロトタイプではリソースの変動を容易にするためにクラウドコンピューティングを利用すると、 時間単位でコスト管理ができ、不必要になれば停止することもできます。

### システム統合
仮運用の際にも触れたが、システム統合を行う際はク ライアント側のシステムに合わせ、Web API として実 装して連携、もしくはデバイスへの組み込みを行うこと が多いです。

組み込み系のデバイスを使用する際には、ハードウェ ア側のスペックに注意が必要です。解析を行う場合は気にならなかった問題が浮上することがあります。例えば、 メモリ量の問題や計算速度です。近年注目を集めてい るディープラーニングでは、学習済みモデルのサイズが大きく1GBを超える場合もります。そのため、デバイス側のメモリが足りなくなります。また、GPU を搭載しないデバイスでは、学習済みモデルを使った推論時に想定よりも時間がかかることがあります。モデル構築を行う際には、 予測精度だけでなく、最終的に組み込む先のハードウェア側のスペック、モデルのサイズや GPU なしでの計算速度まで考慮して手法の選定を行わないといけません。 

一方、組み込みデバイスのスペックでカバーするので はなく、クラウド上にある GPU も含んだ高スペックな リソースで推論を行わせ、その結果をデバイス側で使用 するといったクラウドとエッジという関係で実装するた めの環境も整ってきています。この方法であれば、エッジデバイス側のスペックに依存せずにモデルの実装を行うことができます。ただし、インターネット通信できることが前提であるため、通信環境の有無に注意が必要です。