Genspark、Twilio Voiceを活用してAIオペレーター「Call for Me」をグローバルに展開

Users with cell phone
800件以上

1日あたりの発信通話数

Call forwarding
94.3%

通話成功率

Graph points increase
3.2倍

「Call for Me」ユーザーの継続率

課題

Gensparkは急速に事業を拡大しており、グローバル展開を支える強固な通信基盤が必要でした。テレフォニーや複雑なコンプライアンスに対応し、ユーザーの代わりに電話をかけるといった実世界のタスクを確実に自動化できるAIプラットフォームが求められていました。

解決策

Gensparkは、AIオペレーター「Call for Me」をグローバルに展開するための基盤としてTwilio Programmable Voiceを採用しました。Twilioは40か国以上で明瞭かつ信頼性の高い通話を実現する通信基盤を提供し、AIがユーザーに代わって多言語で会話し行動することを可能にしています。


テキスト応答を生成するだけの多くのAIプラットフォームとは異なり、Gensparkは「知能を行動に変える」という、より野心的な目的を持って開発されました。同社のプラットフォームは、電話の発信や会話のリアルタイム翻訳から、旅行プランの管理や予約の手配に至るまで、実生活でシームレスに機能する100以上の機能を統合しており、ユーザーが複数のアプリを切り替える必要はありません。

Gensparkの最も革新的な機能の一つが、AIオペレーター「Call for Me」です。この機能は、ユーザーに代わって電話をかけ、企業や個人と直接やり取りし、その会話から得られた情報を体系的にまとめて報告します。言語の壁や長い待ち時間といった障壁を取り除くと同時に、多面的なプロセスを自動化します。つまり、「Call for Me」は、複雑な現実世界のタスクや会話さえも迅速かつ確実に処理し、人々が意図を行動に移す手助けをします。

「私たちは、言語の壁がなく、離れていても互いにつながり、誰もが高性能のコミュニケーションアシスタントを利用できる世界を築こうとしています」と、Gensparkのエンジニアリング担当バイスプレジデントGreg Sun氏は説明します。

2024年のサービス開始以来、Gensparkは40か国以上で数百万人のユーザーを獲得してきました。しかし、その成長を実現するためには、各市場におけるテレフォニーインフラストラクチャを簡素化し、複雑な国際規制へのコンプライアンス対応を効率化するとともに、通話品質と信頼性を向上させる必要がありました。

利用が拡大するにつれ、Gensparkのエンジニアたちは、テレフォニーやコンプライアンスの課題への対応に時間を取られ、イノベーションに集中できないでいました。同社はこの問題を認識し、自社の本来の強みであるAIを活用したサービスの提供に注力するためには、パートナーが必要だと考えました。

「私たちは、言語の壁がなく、離れていても互いにつながり、誰もが高性能のコミュニケーションアシスタントを利用できる世界を築こうとしています。」

Greg Sun Vice President of Engineering, Genspark

AIを活用した音声会話をリアルタイムで実現

デジタルインテリジェンスと現実のタスクとのギャップを埋めるべく、GensparkはTwilioと提携し、「Call for Me」オペレーターの基盤としてTwilio Programmable Voiceを採用しました。Twilio Programmable Voiceは、企業が独自のテレフォニーインフラストラクチャを構築することなく通話を受発信および管理できる、クラウドベースのアプリケーションプログラミングインターフェイス(API)です。このAPIを搭載したGensparkのAIは、以下のタスクをこなします。

  • 国内外への通話発信
  • リアルタイムの自然な会話
  • 多言語での対応
  • 予約や手配など各種タスクの管理
  • ユーザー向けに結果を要約

つまりユーザーは、「Call for Me」が言語や場所、複雑さに関係なく通話や会話、結果まで処理してくれると信頼し、実世界のタスクを安心してGensparkに任せることができます。かつては専門的なツールや専任スタッフなしでは扱えなかった機能を、誰もが利用できるようになったのです。今では、インターネットにさえ接続できれば、誰でもこうした画期的なサービスを利用できます。

たとえば、英語を話す旅行者が、オンライン予約に対応していない東京のブティックホテルを予約したい場合、Gensparkにホテルに電話をかけるよう依頼できます。依頼を受けたAIオペレーターは「Call for Me」を使用して電話をかけ、すべて日本語でやり取りします。ほどなくして、予約内容、レイトチェックイン、朝食の詳細をまとめた英語の要約がユーザーに届きます。

また、小規模事業者が上位50社のサプライヤーの価格更新状況を確認したいとき、そのリストを「Call for Me」にアップロードすれば、AIオペレーターが各サプライヤーへの発信と価格や在庫状況に関する情報収集を行います。さらに結果をまとめたレポートも生成してくれるため、事業者が自ら時間と労力を費やして電話をかけずに済みます。

こうした複雑なタスクや音声会話をこなすには、安定したパフォーマンスが不可欠です。1秒未満のレイテンシーと安定した通話品質こそが、リアルタイムのAI音声会話の鍵となります。Twilio Programmable Voiceは、国や言語を問わず、99.97%のアップタイム、300ミリ秒未満のレイテンシー、94.3%の通話成功率を実現し、「Call for Me」のすべてのやり取りが明瞭かつ途切れることなく行われることを保証します。

「当社はTwilioと連携し、ただチャットするだけでなく実際に行動するAIアシスタントを開発しています。電話応対、予約の確保、カスタマーサービスの提供、物流業務の調整といったタスクをこなします。私たちは『できたらいいな』を『お任せください』に変えようとしています。」

Greg Sun Vice President of Engineering, Genspark

複雑な国際通話とコンプライアンス対応をシンプルに

スタートアップ企業として急成長してきたGensparkは、40か国以上で利用されるグローバルプラットフォームへと成長していく中で、事業の拡大と成長を妨げかねない現実的なテレフォニーの障壁に直面していました。新しい市場に進出するたびに、新たな要件への対応を迫られました。地域番号のプロビジョニング、複雑な通信規制、厳格なデータレジデンシー法、不安定な通話品質やレイテンシーといった課題が次々と立ちはだかったのです。

Twilio Programmable Voiceの採用により、これらの障壁は取り除かれました。Gensparkは、市場ごとに独自のテレフォニーシステムや現地インフラストラクチャを構築することなく、単一のAPIにより国境を越えてシームレスに事業を拡大できるようになりました。Twilioの迅速な番号プロビジョニングとグローバルサポートにより、Gensparkが現地法人を置いていない国(韓国など)へも迅速に事業を展開できました。

Twilioはまた、Gensparkに代わってコンプライアンスやデータレジデンシーに関する要件を処理し、同社が複雑な国際通信規制に対応できるよう支援しました。通話データをEU域内に留めることで、EUの一般データ保護規則(GDPR)に確実に対応したこともその一例です。

さらに、Gensparkは、ユーザーエンゲージメントを高めるためのメールキャンペーンやニュースレター配信にSendGridを活用しています。また、紹介キャンペーンからの新規ユーザーを安全にオンボーディングし、不正利用を最小限に抑えるために、Twilio Verifyも導入しています。

「優れたテクノロジーとは、目立たないながらも大きなインパクトを生み出すものであるべきです。ユーザーは、WebRTCやTw/ML、音声処理を理解する必要はなく、素晴らしい体験を楽しむだけでよいのです。」

Greg Sun Vice President of Engineering, Genspark

実社会に広範な影響をもたらす

サービス開始以来、Gensparkはプラットフォーム全体で目覚ましい成長と高いエンゲージメントを実現してきました。「Call for Me」の通話件数は、当初の1日わずか10件から今や800件以上に急増しており、同機能を利用しているユニークユーザーは18万人に上ります。

通話件数が多いだけでなく、内容も充実しており、1回あたりの平均通話時間は3.8分です。ユーザーのロイヤルティを大幅に高める効果もあり、「Call for Me」を利用するユーザーの維持率は、利用しないユーザーに比べて3.2倍高くなっています。1回の通話に成功したユーザーの半数以上が、7日以内に再び利用しています。

注目すべきは、全通話の23%でリアルタイム言語翻訳が活用されている点です。これは、シームレスな多言語コミュニケーションの価値と、Gensparkが広く国際的にアピールする機能を持つことを裏付けています。

Gensparkのエンジニアは、Twilioにテレフォニー管理を任せることで、AIイノベーションの推進に注力できるようになりました。その結果、Gensparkにはより魅力的な職場環境が生まれています。

また、Twilioの従量課金モデルは迅速な実験を促進します。Gensparkは多額の資金や時間を費やすことなく、新しいアイデアのプロトタイプ作成やテストを行うことができます。このアプローチにより、音声駆動型AI機能の迅速な反復開発が可能となり、チームは単に「実現可能か否か」ではなく「何が可能か」にフォーカスできます。

同社は先を見据え、リアルタイム多言語翻訳を行うAI会議通訳、フライト遅延などのイベントをトリガーとして自動的に発信するAIコール機能、中小企業の自社AI受付システム導入をサポートする音声自動化ツールなど、新たな機能の試験的運用を進めています。

こうした進歩を遂げてきたGensparkには、これまで以上に大きな現実的影響を企業や個人にもたらす体制が整っています。その真価が発揮されるのは、まさにこれからです。

「Twilioは、AIとコミュニケーションをシームレスにつなぎ、アイデアを現実世界のインタラクションへと変えてくれます。それが、当社がTwilioを採用している理由です。ゼロから構築すれば半年を要するものでも、Twilioならわずか半日で導入できます。さらに重要な点として、当社とTwilioは共通のビジョンを抱いています。Twilioは、私たちが単に通話をルーティングしているのではなく、大規模な人間同士のつながりを実現しようとしていることを理解してくれています。自分のミッションを理解してくれるインフラパートナーを得たとき、そこに奇跡が生まれます。」

Greg Sun Vice President of Engineering, Genspark

Twilioで始めませんか?