2024.09.05 エンジニアズコラム ディープラーニング AI
第9回 ディープラーニングについて
ディープラーニングの位置づけ
まず、ディープラーニングの位置づけについて説明します。ディープラーニングは機械学習で使用するアルゴリズムの一種で、特に複雑な処理を行うためのアルゴリズムです。
ディープラーニングとAIの関係は、図1のような図で表せられます。この2つの言葉は良く耳にするので、同じものだと考えがちですが、実のところAIに機械学習アルゴリズムが含まれ、機械学習アルゴリズムの一部がディープラーニングなのです。
ディープラーニングの歴史
ディープラーニングの歴史は古く、1950年代から存在していましたが、計算能力不足やデータ不足などの課題により、長らく注目を集めませんでした。
しかし、ディープラーニングにとっての転換期が2010年代に訪れました。それは、GPU(Graphics Processing Unit)の普及により高速な計算が可能になったことです。大量のデータを高速に演算できる能力を獲得したことで、ディープラーニングは画像、動画、音声、文章理解などさまざまな分野で素晴らしい成果を出すようになりました。
特に2012年に開催されたILSVRC(画像の分類精度を競う国際大会)は象徴的な出来事でした。多くのチームがディープラーニング以外の手法を用いている中、カナダのトロント大学のチームがAlexNetと呼ばれるディープラーニングモデルを使用したのです。その結果、他のチームに圧倒的な差を付けて勝利を収めたことから、その可能性が世界に再認識されました。以降、様々なディープラーニングモデルが登場し、多岐にわたる用途に使用されています。
ディープラーニングの特徴
突然ですが、図2の果物は何でしょうか?(私の絵が下手だったらすみません…)
私たち人間は画像を見ればその果物を識別できます。それは、果物の名前とその果物の特徴(色、形状、大きさなど)を私たちの脳が過去の経験から学習しているからです。
では、コンピュータが人間と同じように果物を識別できるでしょうか? その問題を解決するのが、ディープラーニングです。
ディープラーニングでは、コンピュータに大量の画像と果物の名前を入力することで、その特徴を自動的に学習します。ここで、人間が果物の違いや特徴を教えずとも識別できるようになるのがポイントです。同じリンゴでもサイズや形はわずかに異なりますが、大量の画像を入力することで、これらの差異も学習し、より正しく識別できるようになります。
例えば、「リンゴ」「梨」「バナナ」といった物体を分類したい場合、分類に最適な特徴(形状や色)とパラメータ(リンゴの場合、丸くて赤い)をディープラーニングは自動で導き出してくれます(図3)。もし仮に「トマト」も分類対象として追加となった場合も、ディープラーニングが「トマト」と「リンゴ」にはどういった特徴の違いがあるかを自動で理解して、特徴とパラメータの選択を見直します。
このように、コンピュータに画像を与えるだけで、あたかも人間のように識別できるようになるディープラーニングは非常に興味深いテクノロジーです。
外観検査におけるディープラーニングの活用
ディープラーニングは大量のデータを学習することで、人と同じような判断が可能になります。昨今の人手不足の問題もあり、外観検査の業界でもAIを用いた自動化が求められています。
ヒューテックでは日々の検査で蓄積された大量の画像データを活用した自動化を進めています。一例として、当社製品の「欠点弁別システム2」は、欠点画像の自動弁別にディープラーニングを活用しています。
今回はディープラーニングについて解説しました。一人の開発者として、これからも新しいテクノロジーを製品に取り入れて、お客さまの課題解決に貢献していきたいです。
参考文献
1.総務省統計局 統計学習の補助教材
「データサイエンス(機械学習のアルゴリズム)によるデータ解析が社会にもたらす変化」
※1 Stable Diffusionは、Stability AI Ltd.の商標または登録商標です。
※2 ChatGPTは、OpenAI OpCo, LLCの商標または登録商標です。