JavaScriptとTwilio Programmable Videoによる画面共有
Twilio Programmable Videoを用いてWebRTC規格に基づき、カスタマイズされたビデオチャットアプリケーションを構築することができます。この記事では、JavaScriptで構築されたブラウザベースのProgrammable Videoアプリケーションに、画面共有オプションを追加する方法をご紹介します。
チュートリアルの要件
このチュートリアルでは、以前の入門チュートリアルにおいてJavaScriptとPythonで構築したビデオチャットアプリケーションに、画面共有機能を追加します。このアプリケーションをお使いのコンピューターで実行するには、以下の要件を満たす必要があります。
- Python 3.6以降。お使いのオペレーティングシステムにPythonインタープリターがない場合には、python.orgから、インストーラをダウンロードしてください。
- 無料または有料のTwilioアカウント。Twilioを使用するのが初めての場合には、今すぐ無料アカウントを取得してください。このリンクを使用すると、アップグレード時に$10受け取ることができます。
- Twilio Programmable Video JavaScriptライブラリと互換性を持つWebブラウザ(以下のリストを参照)。この要件は、このアプリケーションの構築後、招待されて利用するユーザーにも適用されます。
サポートされるWebブラウザ
このプロジェクトの中心となるビデオとオーディオの機能は、Twilio Programmable Videoから提供されるため、(以下に示す)サポート対象のWebブラウザのいずれかを使用する必要があります。
- Android: Chrome、Firefox
- iOS: Safari
- Linux: Chrome、Firefox
- macOS: Chrome、Firefox、Safari、Edge
- Windows: Chrome、Firefox、Edge
ビデオ通話をサポートするブラウザのリストは非常に広範であり、すべてが画面共有トラックを表示できますが、画面共有セッションを起動する機能があるブラウザは、ごく一部に限られています。特に、モバイルブラウザでこの機能を持つものはありません。デスクトップでは、以下のバージョンが必要です。
- Chrome 72以上
- Firefox 66以上
- Safari 12.2以上
サポートされるWebブラウザの最新リストについてはProgrammable Videoのドキュメントを参照してください。特に、この機能をサポートするブラウザのバージョンについては、「Screen Capture」(スクリーンキャプチャ)ページを参照してください。
チュートリアルアプリケーションのインストールと実行
まず、サンプルアプリケーションを設定します。このアプリケーションはGitHubにあります。git
クライアントがインストールされている場合は、以下のようにダウンロードできます。
このリポジトリのmaster
ブランチには、画面共有機能をサポートするすべてのコードがすでに含まれています。このチュートリアルに従いコーディングする予定の場合には、以下のコマンドを使用し、only-video-sharing
ブランチに切り替えます。
git
クライアントがインストールされていない場合は、完全なアプリケーションをzipファイルでダウンロードできます。または、チュートリアルに従いコーディングする場合には、ビデオ通話部分のみをダウンロードします。
Python仮想環境の作成
コードのダウンロードと設定ができたら、仮想環境を作成し、そこにPython依存関係をインストールします。
UnixまたはmacOSシステムを使用している場合は、ターミナルを開き、プロジェクトディレクトリに移動し、以下のコマンドを入力します。
Windowsでチュートリアルを実行する場合には、コマンドプロンプトウィンドウに以下のコマンドを入力します。
最後のコマンドでは、pip
(Pythonパッケージインストーラ―)を使用し、このアプリケーションにより使用されるPythonパッケージ群をインストールします。パッケージは次のとおりです。
- Twilio APIと連携するためのTwilio Python Helperライブラリ
- Webアプリケーションを作成するためのFlaskフレームワーク
- .envファイルの内容を環境変数としてインポートするpython-dotenv
- アプリケーションの開発バージョンを一時的にインターネットで公開するためのpyngrok
Twilioアカウントの設定
このアプリケーションは、アカウントに関連付けられた認証情報を使用し、Twilioサービスに対して認証を行う必要があります。特に必要になるのが、Account SID、APIキーSID、対応するAPIキーシークレットです。これらの認証情報の設定取得方法が分からない場合には、ビデオ共有チュートリアルの「Twilioアカウントの設定」セクションを参照することをお勧めします。
アプリケーションには、.env.templateというファイルがあり、ここに必要な3つの構成変数が入っています。このファイルのコピーを作成し、.env(ピリオドenv)と名前を付けて、以下のように編集します。
アプリケーションの実行
これで、アプリケーションの実行準備ができました。仮想環境が有効であることを確認したら、以下のコマンドを使用してWebブラウザを起動します。
これでアプリケーションが実行されていますが、同じコンピューターを送信元とするローカル接続を受けることしかできません。一時的な公開URLを割り当てて、電話や別のコンピューターから接続できるようにするため、ngrokを使用します。これはすでに、Python仮想環境の一部としてすでにインストールされています。ngrokを起動するには、2番目のターミナルウィンドウを開き、仮想環境を有効にし(source venv/bin/activate
またはvenv\Scripts\activate
、オペレーティングシステムによる)、以下のコマンドを入力します。
2番目のターミナルに、次のような画面が表示されます。
ngrokは、サーバーに公開URLを割り当てます。「Forwarding」(転送)キーの値を探して、どのようなものか見てみます。https://で始まるURLを使用します。多くのブラウザは暗号化されていないサイトがカメラやマイクにアクセスすることを許可しないからです。上記のサンプルでは、公開URLはhttps://bbf1b72b.ngrok.ioです。皆さんの値もこれに似たものになりますが、ドメインの最初の部分はngrokを実行するたびに違うものになります。
Flaskサーバーとngrokの両方をコンピューターで実行している間は、ngrokからの公開https:// URLを使用し、別のコンピューターやスマホなどの外部ソースからサーバーに接続できます。
このアプリケーションのさまざまな側面の詳細については、最初のチュートリアルをご覧ください。
getDisplayMedia APIの紹介
ユーザー画面のビデオストリームをキャプチャするには、ブラウザのgetDisplayMedia APIを使用します。ルームがroom
変数に格納されている場合には、以下のコードスニペットを使用することにより画面共有セッションを開始し、それをルームに公開できます。
getDisplayMedia()
コールは、ユーザーに何を共有するか選択するよう求めます。この選択肢の実装は、Webブラウザにより提供されます。以下はChromeでの例です。
ここで、ユーザーが共有するものとして選択できるのは、画面全体、1つのウィンドウ、または1つのブラウザタブです。選択が行われると、ビデオトラックが作成され、通話に公開されます。この時点で、他の参加者全員が、trackSubscribed
イベントを受信します。これは、参加者のビデオトラックが公開されるときにアプリケーションに警告するイベントと同じです。
画面共有を停止するには、通話からトラックの公開を停止し、ビデオトラックを停止する必要があります。これは以下のコードで行います。
現在のレイアウトでは、各参加者はビデオトラックを1つ持ち、その下に名前が表示される設定です。ある参加者が画面共有トラックを1つ追加すると、両方のトラックまたがるように名前の幅が広がります。1参加者が1画面を共有していることを明確にするため、名前を表示する<div>エレメントに背景色を追加します。以下は、ある参加者がカメラのみを共有する場合の例です。
参加者がビデオに加え画面も共有し始めると、名前は、両方のトラックにまたがり、その中央に表示されます。背景色により、誰がどの画面トラックに対応するかが分かりやすくなります。
これらの変更を行いましょう。まず、ベースのHTMLページに画面共有ボタンを追加します。以下は、*templates/index.html*ファイルの更新バージョンです。コードのすべてを以下と交換できます。
画面共有ボタンは無効化された状態で追加することに注意してください。これは、この機能を使用するには、その前に通話に参加する必要があるためです。
新しいボタンに加え、クラスlabel
を、参加者名を含む<div>
エレメントに追加しました。こうすると、CSSファイルで背景色を追加しやすくなります。
以下は、更新されたstatic/styles.cssファイルです。新しいラベル背景色と少々のクリーンアップが行われています。
label
クラスも、static/app.jsファイルのparticipantConnected()
関数で各参加者に追加する必要があります。
画面共有セッションの開始
App.jsファイルで画面共有を実装する準備ができました。ファイルの上部で、新しいボタンのインスタンスを追加し、ローカルの画面共有トラックを保持する新しい変数を追加します。
次に、一番下の行において、ハンドラーとこのボタンのclick
イベントとを関連付けします。
次に、ファイル内の任意の場所に、画面共有ハンドラーを追加します。
screenTrack
変数を使用していますが、その目的は、ビデオトラックを保持するというだけでなく、画面共有が有効かどうかを知る方法でもあります。この変数の値がfalseと見なされる場合には、画面共有が有効ではないことが分かるため、上記で説明した方法で、新しいセッションを開始します。さらに、ボタンのラベルを「Stop sharing」(共有停止)に変更します。
また、画面共有トラックにonended
イベントも設定します。一部のブラウザは、画面共有セッションを終わらせる、独自のユーザーインターフェイスを提供しています。Chromeでは、次のような浮動型のウィジェットが表示されます。
[Hide](非表示)ボタンをクリックしてストリームを停止すると、画面共有が終了します。ただし、アプリケーションとTwilio Video APIは画面共有が終了したことを知らないため、フリーズした、すなわち黒い画像のトラックをすべての参加者に提示し続けます。onended
イベントは、ユーザーがこの方法でストリームを終了した場合に、コールバックを受け取る1つの方法です。適切なクリーンアップを行うには、ハンドラー関数にコールバックを送信だけですみます。
最後に設定する変更は、画面共有ボタンの状態です。まず、無効の状態から開始します。参加者が通話に接続したらこのボタンを有効にし、切断時に無効にします。
画面共有セッションが開始したら、ラベルを「Stop sharing」(共有の停止)に更新します。参加者の接続が切断されたら、これをリセットする必要があります。
これらの変更を終えると、基本的な画面共有機能は完成です。ngrokとともにアプリケーションを実行し、最低でも2つの異なるブラウザウィンドウ(同じデバイスまたは別のデバイスの)からビデオ通話に接続し、片方からもう片方へ画面共有を試します。
全画面機能の追加
ビデオを共有する際、大きなビデオトラックは重要な問題ではありません。ただし、画面を共有する際には、小さなサムネイルサイズのビデオトラックを表示すると、ほとんどのテキストが読めなくなります。画面共有を使用しやすくするには、クリックするだけでビデオトラックを全画面にできる拡大機能を追加できます。
ビデオトラックを拡大するには、そのトラックに、participantZoomed
という新しいCSSクラスを割り当てると同時に、他のトラックにparticipantHidden
クラスを割り当てます。以下は、これらの新しいクラスが割り当てられたstatic/styles.cssファイルです。
次に、click
イベントハンドラーをすべてのトラックに追加する必要があります。ローカルのビデオトラックについては、addLocalVideo()
関数を変更します。
他の参加者のビデオトラックについては、trackSubscribed()
関数にハンドラーを追加します。
以下は、zoomTrack()
ハンドラーです。
拡大の手続きは、container
divのすべてのエレメント(通話の参加者)で反復されます。各参加者について、そのトラックで反復されます。participantZoomed
は選択されたトラックに適用され、その他のトラックにはparticipantHidden
が適用されます。hiddenクラスも、参加者の名前を保持している<div>
エレメントに適用されます。縮小プロセスは、同じプロセスが反対の順序で行われます。
これらの変更から生じる厄介な問題は、現在全画面のトラックが、通話から公開停止された場合です。この場合には、トラックを停止する前に、縮小の手続きを行う必要があります。これはtrackUnsubscribed()
ハンドラーで実行できます。
これで画面共有機能は完成です。
まとめ
このチュートリアルでは、Twilio Programmable Videoアプリケーションに画面共有機能を追加しました。
Chrome、Firefox、Safari以外のブラウザまたはこれらのブラウザの旧バージョンによる画面共有をサポートする必要がある場合には、Phil Nashが便利なチュートリアルを書いています。
- Screen Capture in Google Chrome(Google Chromeでの画面キャプチャ)(ブラウザ拡張機能を使用)
- Screen Capture in Firefox(Firefoxでの画面キャプチャ)(ブラウザ拡張機能を使用)
- Screen Capture in Microsoft Edge(Microsoft Edgeでの画面キャプチャ)
皆さんが構築したビデオチャットアプリケーションについてお聞かせください。
Miguel Grinbergは、TwilioのTechnical Content担当Python Developerです。Twilioブログでは読者の皆様のPythonプロジェクトを紹介します。ぜひ、mgrinberg [at] twilio [dot] comまでご連絡ください。