Twilioの留守番電話検出機能(AMD)とNode.jsで配達リマインドシステムを構築する
背景
Twilioは電話に関する機能を多岐にわたって提供しています。留守番電話検出機能(Answer Machine Detection、以下「AMD」)もその 1つです。AMDは、着信側を特定し、それに合わせて通話フローを調整できる機能です。AMDを使えば、音声APIからの着信を人間、留守番電話、ファックスのどちらが対応したかを判断できます。この情報に基づいた通話の更新処理や通話終了後の処理の分岐を実装できます。
このチュートリアルでは、AMDの基本機能や設定方法だけでなく、AMDを使った配達リマインドシステムの作成方法までを紹介します。
目標
このチュートリアルを最後まで進めると、AMDの基本機能、設定方法を実践的に学べるとともに、Node.jsを使った配達リマインドシステムを作成できます。この配達リマインドシステムでは、着信者が電話に出た場合は音声リマインドを、留守電だった場合は留守電メッセージを残したうえで以下のようなSMSメッセージを送信します。
以下の処理フローを実装します。
想定される技術知識
本稿では以下の知識を想定しています。
- JavaScriptの基礎知識
- Node.jsの基礎知識
必要なツール
- 安定バージョンのNode.jsとnpm。
- Twilioアカウント。アカウント作成方法はHelp Centerの「Twilioアカウントの作成方法」を参照してください。
- 電話とSMSが発信できるTwilioの電話番号。電話番号の取得方法はTwilio Docsの「最初のTwilio電話番号を取得」を参照してください。
- インストール、アカウント登録、AuthToken設定済みのngrok。詳しくはngrok公式サイトを参照してください。
- 留守番電話が有効になっている電話番号
AMDの基本機能
AMDはTwilio Programmable Voiceで提供される機能です。この機能は、通話が開始してから最初の数秒間に発生した音声パターンを解析します。応答者が人間の場合、発信側からの発信に対して応答者が「もしもし」などを発話し、その後、発信者の応答を待つために無音状態となる、というパターンが一般的です。
これに対し、留守番電話の場合「もしもし、こちらは…です」のように応答者の発話が継続し、無音状態はありません。AMDはこのパターンを検知し、発話の後に無音が一定期間続けば人間、音声が継続すれば留守番電話という判断をします。
基本設定
AMDの基本機能が理解できたところで、基本設定をはじめましょう。
任意のディレクトリでamd-node-delivery-reminderディレクトリを作成してください。
amd-node-delivery-reminderに移動し、ルートディレクトリにこのプログラムの核となるmake-call.js、環境変数を保存するための.env、ダミーテータを保存するdelivery-data.jsonの3つのファイルを作成してください。
次に、必要な依存パッケージをインストールします。ターミナルを開き、amd-node-delivery-reminderのルートディレクトリで以下のコマンドをで実行してください。
インストールした依存パッケージの詳細は以下のとおりです。
dotenv
: .envファイルに定義された値を環境変数として取り込むためのパッケージ。express
: Node.jsで使うウェブアプリケーションサーバーフレームワーク。twilio
: Twilio Node Helper Library。Twilio APIに対するHTTPリクエストを、Node.jsを使って書けるようにします。
これで必要なファイルとパッケージが揃いました。
配達リマインドシステムを構築する
次に、配達リマインドシステムを実際に構築します。
環境変数を設定する
最初に、環境変数の設定をします。
Twilio Node Helper Libraryを使用するには、Twilioアカウントを一意に表す識別情報であるAccount SIDと、アカウント情報をプログラムに安全に伝達するために使用されるAuth Tokenが必要です。これらのIDを安全かつ効率的に管理するために、環境変数として保管します。
作成した.envファイルをテキストエディターで開き、以下のコードをコピーして貼り付けてください。
XXXXX
の文字列は、Twilioの認証情報のプレースホールダーを表しています。これらの認証情報を取得し、.envファイルに追加する方法を以下でご紹介します。
Account SID
Twilio Consoleにログインし、ACCOUNT SIDの値をコピーします。.envファイルのTWILIO_ACCOUNT_SID
変数にペーストしてください。
Auth Token
Account SIDの下に、AUTH TOKENがあります。値をコピーし、.envファイルのTWILIO_AUTH_TOKEN
変数にペーストしてください。
Twilioの電話番号
Twilioで取得した電話番号をTWILIO_PHONE_NUMBER
変数にE.164形式でペーストしてください。
ngrok URL
本稿ではプログラムをローカルで動かす方法をご紹介します。ローカル環境で稼働するプログラムにTwilioのAPIがアクセスできるよう、ngrokを設定します。プログラムのNodeサーバーを実行するlocalhost:3000
をウェブ上に公開します。
ターミナルで新しいウィンドウを開き、以下のコマンドを実行してください。
問題なくngrokが動作すると、以下のようにウェブ上に公開されたURLが表示されます。
Forwarding
の右側にあるhttps
から始まるURLをコピーし、NGROK_URL
変数にペーストしてください。
.envファイルを保存してください。
ダミーデータを作る
本稿でご紹介する配達リマインドシステムでは、簡単な配達に関するダミーデータをJSON形式で作成し、使用します。delivery-data.jsonを開き、以下のコードをペーストしてください。
この時点で、一度サーバーが正しく実行されるかを試してみましょう。ファイルを保存し、一つ目のターミナルのウィンドウを開き、amd-node-delivery-reminderのルートディレクトリで以下を実行してください。
問題なくサーバーが実行されると「Example app listening on port 3000!」が表示されます。メッセージが表示されたら、一度サーバーを終了してください。
次に、発信処理を実装します。Twilioで電話を発信するには、Callリソースに対してPOSTリクエストを送ります。以下のコードで、Callリソースにリクエストを送信し、発信設定を行うmakeCall
関数を定義します。
グローバル変数のブロックと、app.listen
のブロックの間に、以下のコードをペーストしてください。
上記のコードを詳しく解説します。
machineDetection
machineDetection
ではAMDの処理方法を指定します。machineDetection
で指定できるAMDの処理方法はEnable
とDetectMessageEnd
の二種類があります。AMDは人間の通話もしくは留守番電話を判別すると、検知の結果をAnsweredBy
パラメータとして返します。このAnsweredBy
パラメータが返されるタイミングが、指定するAMDの処理方法により異なります。
Enable
は人間の通話もしくは留守番電話を特定したら、すぐにAnsweredBy
の値を返します。この設定は人間が電話に出た場合すぐに特定の処理を行いたい時に有効です。たとえば、人間が出た場合は直ちにエージェントに接続し、留守番電話だった場合は通話を終了するシナリオに適しています。
DetectMessageEnd
は、人間の通話を検知した場合はすぐにAnsweredBy
の値を返しますが、留守番電話を検知した場合、応答メッセージが終わってからAnsweredBy
パラメータで判別結果を返します。この設定は留守番電話にメッセージを残したい場合に有効です。このチュートリアルでは、DetectMessageEnd
を使用します。
asyncAmdとasyncAmdStatusCallback
AMDでは、検知を非同期で処理できます。asyncAmdをtrue
に設定すると、電話に人間、留守番電話、どちらが出たかに関わらず通話が継続します。これにより、人間が電話に出た場合、無音状態なしで通話を継続できます。false
の場合、TwilioがAMDが完了するまで通話の実行をブロックします。
このチュートリアルでは、asyncAmd
はtrue
に設定します。asyncAmd
をtrue
に設定する場合、AsyncAmdStatusCallback
も設定する必要があります。AsyncAmdStatusCallback
には、検知結果の送信先のコールバックURLを指定します。このチュートリアルでは、/amd-callback
というエンドポイントをプログラム内に作成し、指定します。
twiml
twiml
に、AMDの検知をしている間に行う処理をTwiMLで定義します。このチュートリアルでは、「Twilio Logisticsです。メッセージを取得しています。」のメッセージを流すTwiMLを指定します。ja-JP
で再生する言語を日本語に指定します。
statusCallbackとstatusCallbackEvent
statusCallback
を使用すると、通話のステータスを知ることができます。このチュートリアルでは、/status-callback
というエンドポイントをプログラム内に作成し、指定します。statusCallback
を使用する場合、受け取りたいステータスをstatusCallbackEvent
に指定する必要があります。このチュートリアルでは、受け取り可能なすべてのステータスである、initiated
、ringing
、answered
、completed
を配列で指定します。
通話ステータスを受け取るためのエンドポイントを作成する
次に、statusCallback
から送信される通話ステータスを受け取り、出力するエンドポイントを作ります。
makeCall
関数のブロックの下に、以下のコードをペーストしてください。
このコードでは、statusCallback
から送信される通話ステータスを受け取る /status-callback
エンドポイントを作成します。これにより、ステータスが変わる度に、initiated
、ringing
、answered
、completed
のどれかが出力されます。
留守番電話検知後の処理の設定するエンドポイントを作成する
次に、留守番電話を検知した際のプログラムの動作を設定します。/status-callback
エンドポイントのブロックの下に、以下のコードをペーストしてください。
上記のコードでは、/amd-callback
エンドポイントを作成し、エンドポイントで受け取ったAMDの検知結果をもとに処理を定義しています。電話に人間(human
)が出た場合は、配達のリマインド音声メッセージを流します。また、それ以外の場合は留守番電話に配達のリマインド音声メッセージを残し、配達IDを含むリマインドメッセージをSMSで送ります。
最後に、app.listen
ブロックの下に、以下のコードをペーストしてください。
このコードで、プログラムを実行し、発信を開始します。ファイルを保存してください。
これでプログラムが完成しました!
問題なくプログラムが動作すると、delivery-data.jsonに登録した電話番号に電話がかかってきます。
電話に出て、「もしもし」など発声してください。人間が電話に出たことが検知されると、「Twilio Logisticsです。メッセージを取得しています。」のメッセージの後に、「Twilio Logisticsよりお荷物お届けのお知らせです。本日17時から19時の間にお荷物をお届けいたします。」のメッセージが流れます。
ターミナルには、通話のステータスと、「Call picked up by human」が表示されます。
一度電話を切り、ターミナルでプログラムを終了させてください。
留守番電話だった場合の動作を検証する
再度ターミナルでnode make-call.js
を実行してください。
着信しても、今度は電話に出ず、着信が終わるまで待ってください。
留守番電話が検知されると、以下のSMSメッセージが送信されます。
留守番電話に残されたメッセージを再生すると、「Twilio Logisticsよりお荷物お届けのお知らせです。本日17時から19時の間にお荷物をお届けいたします。」が流れます。
いかがだったでしょうか?留守番電話検知機能は、電話の受信者の状況によって異なる対応をしたい時に便利な機能です。このプログラムをさらに拡張したい方は、TwiMLの<Gather>
動詞を使って、人間が電話に出た場合はキーパッドを使って、エージェントに接続するなど、顧客に希望する対応方法を指定してもらうようにしてみてはいかがでしょうか?
Twilio Blogに投稿してみたい方や、フィードバック、登壇、勉強会のお誘いなど気軽にsnakajima[at]twilio.comまでご連絡ください。開発中のプロジェクトに関してはGithub(smwilk)を覗いてみて下さい。