Article

ビジネス向けの完全版生成AI用語集

生成AIは、最も話題のビジネスイノベーションです。ビジネス界でどのように波紋を広げているのかを理解するために、最も重要な用語について、短期集中で学習いただけます。

ビジネス向けの完全版生成AI用語集

生成AIは、ビジネスとテクノロジーの世界で波紋を広げています。このため、競争環境において優位に立ちたい場合や、情報を得続けたい場合は、生成AIに関連する用語を理解することが不可欠です。

この用語集では、AIの重要な用語を紹介し、理解しやすいように3カテゴリに分類しています。各カテゴリ内では、既出の概念に基づいて理解を重ねるために、アルファベット順ではなく、最も直感的な順序で用語を提示しています。

本題に入りましょう。

AIと機械学習の基礎

Artificial Intelligence(人工知能(AI))

AIとは、問題解決、認識、推論など、通常は人間の知性を必要とするタスクを実行する機械を示す広範な概念です。

Machine Learning(機械学習(ML))

MLはAIのサブセットであり、アルゴリズムを使用してデータを解析し、そこから学習し、予測や決定を行う方法です。このタスクを実行するためにマシンを明示的にプログラミングすることはありません。

Deep Learning(ディープラーニング)

MLのサブセットであるディープラーニングは、複数の処理レイヤを使用し、それぞれが先行レイヤのデータの解釈を改良し、データの高度な抽象化をモデル化します。

例えば、画像認識では、従来のプログラムがあらかじめ定義されたパターンに焦点を当てているのに対し、ディープラーニングアルゴリズムでは、特徴(形状、色、テクスチャなど)により画像を分離し、レイヤ化してパターンを認識することを学習します。これは、脳が物体を認識する方法に少し似ています。

Neural Network(ニューラルネットワーク)

ニューラルネットワークは人間の脳の機能を再現するものであり、ディープラーニングの基礎となります。データのパターンを認識するように設計されたこれらのネットワークは、相互に接続されたノード(ニューロン)のレイヤで構成されています。データを互いに送り込み、データから学習し、データを解釈します。

Model(モデル)

MLにおけるモデルとは、何らかのMLアルゴリズムを適用することによりデータから学習された特定の表現です。あらかじめ設定された指示に応じて結果を生成する従来のソフトウェアとは異なり、MLモデルはデータから学習し、取り込んだ内容に基づいて決定を行います。 

例えば、不動産販売に関するデータを使用してモデルをトレーニングすると、特定の場所の住宅価格を予測できます。しかし、「家がこの近隣にある場合は、価格にこれだけ上乗せする」などの特定のルールをプログラムすることはありません。代わりに、トレーニングデータで見つけたパターンに基づいて、立地などの特徴が住宅価格に与える影響を学習します。

トレーニング

トレーニングとは、MLにおいてモデルがデータセットから学習するフェーズのことです。モデルで正確な予測や決定が行えるようになる知識レベルを達成することを目標とします。

Supervised Learning(教師あり学習)

教師あり学習は、MLの一種であり、モデルがラベル付きトレーニングデータを受け取ります。モデルの目的は、入出力ペアのサンプルを使用し、入力を出力にマッピングする関数を学習することです。

例えば、メールがスパムかどうかを判断するシステムの設計を考えてみましょう。教師あり学習のアプローチでは、このシステムは、すでにスパムまたはスパムではないとラベル付けされた多くのメールを使うトレーニングを受けることになります。次に、このモデルは、一般的に使用される特定のフレーズやパターンなど、スパムメールの特徴を学習します。十分なトレーニングを受けた後、システムは学習内容に基づいて、新しいメールをスパムまたはスパムではないものとして正しく分類できます。 

Unsupervised Learning(教師なし学習)

教師なし学習は、モデルが明示的なラベルのないデータセットから学習するML手法であり、入力データ内の隠れたパターンや固有構造を発見するためによく使用されます。

教師なし学習の例として、マーケティング業界における顧客のセグメンテーションがあります。ある企業が大きな顧客基盤を持ち、マーケティングチームが特定の消費者をターゲットとするマーケティング戦略を立案したいとします。ただし、自社の顧客に適用する既存のグループやラベルはありません。ここで教師なし学習が登場します。

クラスタリングなどの手法を使用することにより、マーケティングチームは顧客の購買行動データを使用して、顧客を明確なグループに分けることができます。これらのグループは、類似した行動、好み、特性を持つ顧客を表すことができ、これらのグループがどのようなものであるかをモデルが事前に把握している必要はありません。マーケティングチームは、これらの新たに特定された顧客セグメントに合わせてマーケティングキャンペーンを調整できます。

Generator(ジェネレーター)

ジェネレーターは、トレーニングデータに似た新しいデータを生成するように学習するコンポーネントです。

 

自然言語処理、生成AI、テキスト分析

Natural Language Processing(自然言語処理(NLP))

NLPは、自然言語を介したコンピューターと人間の相互作用に焦点を当てたAIの一分野です。目標は、機械がテキストや音声入力を人間のように理解し、応答できるようにすることです。

Language Model(言語モデル(LM))

LMは人間の言語を理解し生成することができるAIモデルの一種です。LMは膨大な量のテキストデータでトレーニングされ、人間の言語の統計構造を学習して理解します。

Large Language Model(大規模言語モデル(LLM))

LLMは、大量のテキストデータでトレーニングされたLMの非常に高度な拡張バージョンです。LLMは、人間の言語の微妙な違いを理解し、生成します。

LMとLLMの主な違いは、トレーニングデータの規模とモデルサイズです。通常のLMは、数百万のドキュメントでトレーニングされ、数億のパラメータから構成されます。これらは、トレーニングデータから学習されるモデルの側面です。

対照的に、LLMは数十億のドキュメントでトレーニングされ、数千億、ときには数兆のパラメータを持つことがあります。例えば、利用可能な最大の言語モデルの1つであるGPT-3には1750億個のパラメータがあります。この規模の巨大さにより、LLMは信じられないほど人間らしいテキストを生成でき、テキストデータ内のより複雑な背景を理解することができます。

Generative Pre-trained Transformer(GPT)

GPTはOpenAIが開発したLLMの一種です。これらのモデルは、テキスト内で使用されている先行する単語を与えられて、ある単語が続く可能性を予測することにより、人間のようなテキストを生成できます。

Transformer Model(トランスフォーマーモデル)

トランスフォーマーモデルはニューラルネットワークアーキテクチャの一種であり、NLPタスクで非常に成功しています。これらのモデルは、入力データを(順次ではなく)並列に処理するため、より効率的です。 

Self-Attention(自己注意)

自己注意は、トランスフォーマーモデルで使用されるメカニズムであり、モデルが出力を生成するときに、入力シーケンス内のさまざまな単語に重要度(または注意)を割り当てることができます。これにより、モデルは文内のどの単語が全体の文脈を理解するうえで重要であるかを判断できます。

例えば、次の文を考えてみましょう。「I arrived at the bank after crossing the river(川を渡り土手に着いた)」。「bank(銀行/土手)」という単語は複数の意味を持ちえますが、文内の「river(川)」が重要な文脈を提供します。自己注意メカニズムにより、モデルは「bank」の意味を理解しようとするときに「river」に注意を向けるようになり、ここでの「bank」は金融機関ではなく川の土手を指していると推測します。この機能は、翻訳、要約、センチメント分析など、言語の文脈を理解するタスクに特に役立ちます。

トークン

NLPでのトークンは、言語データの単一単位を指し、通常はテキスト文書内の単語またはサブワードを指します。

Fine-tuning(ファインチューニング)

ファインチューニングとは、事前にトレーニングされたモデルを新しいデータセットでトレーニングして、モデルのパフォーマンスを改善するプロセスです。ディープラーニングでは、これは一般的な手法です。モデルをゼロからトレーニングするよりも計算リソースが少なくて済むためです。

Generative AI(生成AI)

生成AIは、画像、音楽、音声、テキストなどの新しいコンテンツの創作に焦点を当てたAIのサブフィールドです。既存のデータから学習し、類似したコンテンツを生成しようとします。

Sentiment Analysis(センチメント分析)

センチメント分析は、テキストで表現された感情を判断するために使用されるNLP手法です。

例えば、研究者はセンチメント分析を使用して、ニュースでの最近の出来事に関するツイートを分類し、各ツイートがその出来事を好意的に見ているか、好意的に見ていないか、中立的に見ているかを判断することができます。

実践的かつ倫理的な考慮事項

AI Bias(AIバイアス)

AIバイアスは、トレーニングに使用したデータに含まれていたバイアスがシステムに反映され、増幅されることさえある場合に発生し、公平性に欠ける結果を導く可能性があります。

Explainability/interpretability(説明可能性/解釈可能性)

説明可能性/解釈可能性とは、AIシステムによる決定を理解し、解釈する能力のことです。これは、特に医療や金融のような業界において、信頼と透明性のために不可欠です。

Hallucination(ハルシネーション)

AIにおけるハルシネーションとは、モデルが入力データに基づいていない出力を生成することを指します。これは、正しいように思えて不正確な情報や無意味な情報をLLMが生成する場合など、生成AIでは一般的な懸念事項です。

例えばLLMに「ナポレオンと異星人の戦いの結果はどうなりましたか?」という歴史的な質問をしたとします。そのような出来事が発生していない場合でも、LLMは、詳細で想像力に富んだ回答を提供する可能性があります。これはハルシネーションの一種です。なぜならLLMはトレーニングデータや実際の歴史には存在しないシナリオを作り出したからです。このような生成AIシステムの傾向を認識することは、特に正確で信頼性の高い情報を生成しようとする場合に重要です。

Generalization(汎化)

汎化とは、トレーニングデータから学習した知識を、未見データに適切かつ正確に適用するAIモデルの機能のことです。

Robustness(頑健性)

頑健性とは、新たな入力の処理や敵対的な攻撃への対処など、さまざまな条件や困難な条件下でもAIシステムが効果的に動作し続ける能力のことです。

データプライバシー

AIにおけるデータプライバシーとは、データのプライバシーと保護を確保するための実践です。モデルはトレーニングに大量のデータを必要とすることが多いため、これはAIでは重要です。データには、医療記録、財務情報、知的財産などの機密情報や取扱に注意を要する情報が含まれる場合があります。適切に扱わないと、データプライバシーの侵害が発生する可能性があります。このため、AIトレーニングのためにデータを収集、保存、使用する際には、強力なデータプライバシーの実践が不可欠です。

AI Governance(AIガバナンス)

AIガバナンスは、すべてのステークホルダーの利益を最優先にして、AIシステムが倫理的かつ透過的に動作することを保証します。多くの場合、これには、AIの使用と影響に関するガイドラインやポリシーの作成が含まれます。

AI as a Service(サービスとしてのAI(AIaaS))

AIaaSは、クラウドベースのプラットフォームを介してAIの機能やサービスをアウトソーシングし、企業が多額の先行投資を行うことなくAIを活用できるようにします。

Automated Machine Learning(自動機械学習(AutoML))

AutoMLとは、機械学習の適用を自動化するために使用されるツールとテクニックを指します。これには、データ前処理、モデル選択、ハイパーパラメータチューニングなどが含まれます。

Data Augmentation(データ拡張)

データ拡張は、既存のデータをわずかに修正したコピーを追加してトレーニングデータの量を増やし、モデルのパフォーマンスを向上させる技術です。

Edge AI(エッジAI)

エッジAIは、スマートフォンやIoTデバイスなどのエンドデバイス上でAIアルゴリズムを実行することです。ソースでのデータ処理が可能になり、リアルタイム処理とプライバシーを確実なものにします。

エッジAIの優れた例は、テスラ車の自動運転機能です。これらの車両は、高度なAI機能を使用してセンサーデータを解釈し、リアルタイムで運転の判断を下します。そのためには、データを大量に処理できる必要があり、車両内で直接迅速な意思決定を行う必要があります。これは、車両が処理のためにデータをクラウドに絶えず送信しなければならないようであれば不可能です。

Reinforcement Learning(強化学習)

強化学習は、ML手法の一種です。エージェントが何らかの報酬やポジティブなフィードバックを最大化するために、環境内で行動を起こすことによって意思決定することを学習します。

チャットボット

チャットボットは、事前定義されたルールや、NLPのようなAI技術を使用して、音声ベースまたはテキストベースのいずれかで人間の会話をシミュレートするソフトウェアアプリケーションです。

TwilioのCustomerAIでビジネスを強化

生成AIを採用して顧客を引き付けたり、業務を運営したりすることは、組織に大きな変革をもたらす可能性があります。この用語集は、重要な概念を理解するための優れた出発点ですが、おそらく貴社のビジネスは次のレベルに進む準備ができています。

TwilioのCustomerAIにより、ビジネスでAIのパワーを活用できます。このAIを活用したツールは、顧客体験をパーソナライズし、カスタマーサービスの質を変革し、顧客とその行動に関する重要なインサイトを明らかにするのに役立ちます。詳細を確認して開始するには、今すぐTwilioの専門家にお問い合わせください

 

SIGNAL 2023でCustomerAIを詳しく知る

Twilioがお客様・デベロッパー様向けに年1回開催するカンファレンスの素晴らしいコンテンツをすべて無料で再視聴できます。リアルタイムの顧客データとAIのパワーを活用して、ブランドがパーソナライズされたエンゲージメントを提供する方法をご覧ください。

今すぐ見る