【Challenger’s Interview】TRIBUSを通じて実装化への活路が拓けた「自然言語処理」の未来

昨今、AI技術のひとつである「自然言語処理」に注目が集まっている。自然言語とは、人間が日常的に使う言葉であり、その微妙なニュアンスや意図を機械的に分析するためには、極めて高度な技術が必要とされる。TRIBUS 2020で採択された「Studio Ousia(スタジオウーシア)」は、日本における自然言語処理技術の研究・開発をけん引するスタートアップ企業。学習データなしで文章の意味を理解できるAIモデル「Sōseki(ソーセキ)」を東北大学の研究チームと共同開発し、AI分野の世界トップカンファレンス「 Conference on Neural Information Processing Systems(NeurIPS 2020)」で開催されたコンペティション「Efficient QA( Googleで実際に検索された質問に対して回答を文字列で返して正解率を競う)」では、Microsoft Research , Facebook AI Research*に続いて上位にランクインするなど、目覚ましい活躍を見せている。

*記載されている会社名、製品名は、各社の登録商標または商標です。

TRIBUS 2020のプログラム中には、企業内検索のアップデートに注力し、ITヘルプデスクでの問い合わせ対応と営業資料の検索・作成という2つのシーンにおける有用性を検証し、システム実装化に向けたチャレンジを試みた。自然言語処理における最先端の技術開発が国際的に評価される中、さらなる高みを目指して成長を続ける株式会社Studio Ousia営業部長の谷口愉氏に、TRIBUS 2020での半年間について話を伺った。


株式会社Studio Ousia 営業部長 谷口愉氏


すべては、「企業で働く人の“悩みの種”を解消したい」から始まった


――最初に、Sōsekiの開発が始まった経緯について教えてください。

弊社は、2007年の創業以来、自然言語処理を用いた新しい実用的なアプリケーションの研究・開発を行っています。その根底には、「技術で世界に勝てるスタートアップを作りたい」という創業者2人の想いがありました。数あるAI技術の中でも、自然言語処理に特化することを決めたのは、将来を見据えた上で、技術的に発展性の高い分野であると考えたためです。現に近年、この分野での技術の発展は目覚ましく、加速度的な進化を遂げています。私たちは、その一端を担う企業として、自然言語処理における世界最先端の技術開発を行い、それらを迅速に実用化することをミッションに掲げ、研究・開発を進めてきました。現在開発中のSōsekiは、その積み重ねの中で、私たちがおのずとたどり着いた自然言語処理の最新AIモデルです。

――Sōsekiを通じて、どのような課題を解決しようとされていますか?

Sōsekiは、登録された文書を読解し、問い合わせに対して蓄積された知を活用して、返答することができるAIモデルです。事前学習済みですので、学習データの登録も不要で、多言語にも対応可能です。問い合わせに用いられたキーワードが一致しない場合も、文章の意味を適切に理解し、該当箇所を高精度で抽出することができます。例えば、リコーの複合機マニュアル閲覧時にSōsekiを立ち上げ、検索欄に「インクがきれた」と入力すると、その意味を理解して、同じキーワードを一つも含まない「トナーを交換する」という箇所を抽出し、該当ページの表示につなげることができます。



また、リコーグループ内で、診療所向けの提案をしたいと考えている営業担当の方がいたとします。提案資料を作成するにあたって、社内の過去アーカイブの中から類似する資料を探そうとした時、検索欄に「診療所への提案」と入力すると、Sōsekiは、「病院への提案」や「医師への提案」というように、入力した文章の周辺領域を抽出し、その意図により近い検索結果を提示することができます。こうした周辺の情報は、人間ならすぐに理解できることですが、通常のキーワード検索では必ずと言っていいほど出てきません。

Sōsekiを通じて私たちが解決したい課題は、まさにこの点にあります。企業内で資料やファイルを共有したり、それらの整理や管理を行うために、DropboxやSharePointなどのサービスを利用されている方が多いと思いますが、これらのサービスに搭載されているのはキーワード検索のみです。それゆえ、何か特定の資料や情報を探そうとした時、思い通りの検索結果が出てこないということが起きてきます。これは、おそらく企業で働く多くの方が、一度は経験したことがあるのではないかと思います。そうした悩みの種を解消すると共に、この最先端技術をより多くのビジネス現場で活用していただくことで、業務効率化や生産性向上の一助になれればと思い、Sōsekiをリリースさせていただくに至りました。

――TRIBUSに応募されたきっかけ、理由を教えて下さい。

どれだけ優れた技術であっても、やはり技術単体では販売することはできません。より多くの方にSōsekiを使っていただくためにも、いいパートナーを見つけることが私たちにとっての最優先課題でした。さまざまな使い方を検討している中で、文書管理のソリューションに付随するオプションのひとつとして打ち出してみたいと思いました。どこにアプローチすればいいかと考えた時、大企業向けから中小企業向け、学校や図書館など、業種向けにカスタマイズされたものまで、多様な文書管理のソリューションを展開されているリコーに目が留まりました。

パートナーシップを組むためには、その相手となる企業の方に、私たちの技術を理解していただく必要があります。近年、リコーは、デジタルサービスに舵を切り、AIなどの分野にも注力されていますので、その意味でも、きっとご理解いただけるだろうと信じて、応募するに至りました。加えて、TRIBUSという支援体制が整っていたことも、弊社のようなスタートアップ企業がエントリーする上で、背中を押していただくひとつのきっかけとなりました。


一番の学びは、ニーズを絞り込むことの重要性


――採択後のプログラム期間中に、Sōsekiを使った企業内検索のアップデートやリコーグループとの提携に注力されたそうですね。具体的な取り組みとその成果についてお聞かせください。

具体的な取り組みとしては、大きく分けて3つあります。
1つ目は、ベースとなるユーザーニーズを把握するために、リコーグループ内でアンケートを実施し、有志の方には個別ヒアリングも実施させていただきました。2つ目は、企業内検索のアップデートを図るべく、ユースケースを特定し、Sōsekiの有用性を検証することです。ITヘルプデスクでの問い合わせ対応と営業資料(テンプレート)の検索、作成という2つのシーンでの有用性を具体的に確認することができました。3つ目は、システム実装へのチャレンジです。今回は、ある部署が、社内トライアルとして開発しようとしていた社内文書の検索システムに、Sōsekiをオプションとして付帯させる実装実験を行わせていただきました。これに関しては開発を伴うので、プログラム期間中には終わらなかったのですが、一連の活動を通じて、多くを学ばせていただきました。

一番の学びは、リコーグループのような規模の大きな企業にSōsekiを使っていただくためには、「こんな方たちのこういった困りごとを、こんな風に解決できます」という風に、より具体的なニーズを絞り込むことの重要性でした。また、大企業向けにカスタマイズを含めて提供するのか、中小企業向けにパッケージで販売するのかでは、アプローチが全く異なることも判明しました。どちらで進めていくかは具体的な検討が必要ですが、とりわけ大企業向けに提供する場合は、技術的な課題をクリアすることが不可欠になってきます。やはり大企業となると、検索対象となる資料が膨大であり、現段階では弊社のモデルがそれに耐えうるかどうかが分かっていないので、まずは検証を進めていきたいと思っています。

――実際、TRIBUSに参加されてみていかがでしたか?

プログラム期間中、さまざまな部署のカタリストの方たちにサポートいただき、大変心強かったです。通常、大企業に対する営業の場で、仮説が間違っていたとしたら、取り合ってもらえないですよね。でも、TRIBUSの皆さんは、あるひとつの仮説が成り立たなかったとしても、寛大に受け止めてくださり、「じゃあ、もう一度トライしてみましょう!」と言って、新たなチャンスを何度も与えてくださいました。一時期、次の仮説を提案するために、週次ミーティングを開いていただいていたほどです(笑)。野球に例えるなら、何度でも打席に立ち、バットを振るチャンスを与えていただくような感じでした。その中で、自らの仮説を否定してみることも学びにつながると思いますし、トライアンドエラーを通じて双方の理解を深められる場を持てることは、非常に貴重な経験でした。


最先端の自然言語処理をビジネスで使えるものにする


――今年3月には、企業からのPoC(概念実証)利用受付を開始し、SXSW 2021*への出展も果たされました。今後の課題や展望についてお聞かせください。

弊社で開発中の技術の多くについては、論文として発表し、自然言語処理のコミュニティに対して貢献させていただいています。しかし、それらの技術を実装するためには、やはりいくつもの壁を乗り越えなくてはなりません。その壁を乗り越え、最先端の自然言語処理技術をビジネスできちんと使えるものにしていくこと。これが、日本では数少ない自然言語処理に特化したスタートアップ企業としての役割であると自負しています。リコーグループの2つの部署から、Sōsekiを活用できそうなシーンのご提案をいただいたので、実装に向けて進めているところなのですが、より広範に使っていただける基盤が整った際には、今回のプログラム期間中のヒアリングを通じて、ニーズを把握できた他の部署に対しても、改めてアプローチさせていただきたいと考えています。

*SXSWは毎年米国テキサス州オースティンで開催される音楽・映画・インタラクティブをテーマにした巨大ビジネスカンファレンス&フェスティバル。Sōsekiは大規模データベースからの検索性能を示すデモや任意のデータベースからの検索性能を示すデモを展開した。
参照:2020年度採択スタートアップのStudio Ousiaが、新AIモデルSōsekiを搭載したデモをSXSW2021に出展します。

――最後に、TRIBUSへの参加を考える企業の皆さんへメッセージをお願いします。

提案しようとしているものが、サービスであっても技術であっても、より具体的なニーズを絞り込み、仮説を立てておくと進めやすくなるのではないかと思います。「お客様のこんな課題に対して、私たちはこんな風に考えています。リコーグループのこのソリューションと組み合わせるといいと思うのですが、いかがでしょうか?」と自発的に投げかけることができれば、「では、担当の部署とつなげましょう」「お客様へのヒアリングを実施してみましょう」という風に、具体的な取っかかりを作りやすくなると思います。カタリストの方たちをはじめ、TRIBUSの皆さんは、根気強く、とことんまで真摯に向き合ってくださいます。リコーグループとのシナジーによって、新たなイノベーションを起こしたいというチャレンジ精神にあふれる方、ぜひエントリーされてみてください。

TEXT BY Yuriko KISHI 




Share This

Copy Link to Clipboard

Copy