人とAIが追究する「言葉」の可能性

岡崎直観教授情報理工学院×松井康真株式会社テレビ朝日報道局員（元同局アナウンサー）

身近でありながら、奥深い「言葉」の世界。人とAI（人工知能）、それぞれの側から見た「言葉」や「コミュニケーション」の在り方と、その先にある新たな社会の姿とは。言語を操るAIの研究?開発に取り組む岡崎直観教授と、元アナウンサーで、現在は記者として活躍する松井康真さん（東工大卒）が語り合った。

ニュースを迅速かつ的確に伝える「人」と「AI」のアプローチ

岡崎：私が研究しているのは、コンピュータが人の「言葉」を理解し、使いこなすための技術です。「自然言語処理」と言われるこの技術は、人の質問に答えるAIアシスタントや、文章を外国語に翻訳するWebサービスなど、暮らしの至る所で活用されています。言葉を介した、人とAIの知的コミュニケーションの実現を目指す研究と言ってもいいかもしれません。松井さんはまさに「言葉」や「コミュニケーション」の専門家ですが、なぜアナウンサーを志されたのですか？

松井：実は、小学生の頃からの夢だったんです。きっかけは、教室のテレビで流れる校内放送に、進行役として登場していた上級生の姿に憧れたこと。東工大在学中にアナウンススクールに通い、念願かなってテレビ朝日にアナウンサーとして入社しました。数々の番組を経験し、現在は報道局社会部の記者として勤務しています。岡崎先生のご研究の中で、報道に役立つような技術はありますか？

岡崎：例えば、新聞記事の見出しを生成するツールがあります。これは「機械翻訳」の技術を使って、長い文章を短い見出しにどう「翻訳」するか、何百万という実際の新聞記事と見出しのセットをAIに学習させることで実現しました。今では、見出しの文字数を指定して記事のテキストを入力すれば、瞬時に候補を作成できます。

松井：ニュース番組の上部に表示するテロップにも使えそうで、非常にいいですね。テレビや新聞は、媒体によって表現や言い回しの特徴がありますが、それも反映できるのでしょうか。

岡崎：はい、可能です。同じ新聞社の記事データを学習させると、特徴をまねて作成します。実際かなり精度は上がっており、すでに現場で導入されている例もあるんですよ。とはいえ、必ずしも毎回完璧な文章を出力できるとは限らないため、人の目で確認する作業はまだまだ必要ですが。

※1 言葉を「要約」する

新聞記事の見出しを自動生成するツールは、3～4年前にサンプルが完成。AIは多数の記事を読み込み、実際の見出しと照らし合わせながら、判断基準を確立していきます。

新聞記事の見出しを自動生成するツール

松井：確かに、そのまま使うかどうかは場合によるかもしれませんが、参考にして考えられるのは助かります。実のところ、報道番組のテロップ作成は、一筋縄ではいかない作業なんです。わずか30秒、1分のニュースで何を切り取り、どう伝えるべきか。「要約」^※1にとどまらず、視聴者にとって関心の高い情報や他局の報道との差別化を考えた「表現」が必要になります。それが難しさであり面白さなのですが、こうした観点を網羅したツールも、近い将来登場するかもしれませんね。

岡崎：AIは「要約」は得意なのですが、伺ったような人の心理を踏まえた臨機応変な判断は、まだ当面難しいかもしれません。おっしゃる通り、全てAI任せではなく、「どう使うか」を人が考えることがポイントだと言えますね。一方、こうしたツールの実用化には別の課題もあります。それが、AIの信頼性に関わる「ブラックボックス問題」。なぜその答えを出したのか、AIは理由を説明してくれません。AIに対する人々の不安を解消し、社会のさまざまな場所で運用していくために、そのロジックを研究者?開発者がしっかり説明していくことが重要だと感じています。

アナウンスにおける日本語の「正しさ」、AIが学習する日本語の「量」

岡崎：視聴者に「伝える」工夫のお話がありましたが、他にアナウンサーとしてどんなことを心掛けておられたのでしょうか。

松井：まず大前提として、正しい日本語を話し、人々に届けていくことですね。発音や鼻濁音、無声化、大和言葉、ら抜き言葉などは、小中学校などではほとんど教わりません。日本語のプロとして多くの人に情報を伝えるという役割は、アナウンサーならではのものだと自負しています。AIの世界では、どのように日本語を理解させるのですか？

岡崎：コンピュータに大量の言語データを学習させ、単語の意味や文章の構造を捉えてもらいます。手本となるデータは、現在ではWeb上の記事やブログ、SNSなどが主流です。理由は、何といっても膨大なテキストが比較的容易に収集できること。日本語の正しい文法や意味を修得するというより、数多くの事例から一般的な使い方と傾向を学ぶイメージです。

松井：なるほど、データの量が大事なんですね。ちなみに、AIが学習するような日常的な言葉の中には、人々の誤解から読みや意味が変化してしまうものも少なくありません。例えば「依存」は「いそん」と読むのが正しいのですが、次第に「いぞん」と読む人が増え、後者の読みが定着しました。逆らえない時代の流れとはいえ、私がよく言うのは「アナウンサーは最後の砦であれ」。社会の潮流をくみながらも、アナウンサーは最後に変わるべきであり、その時点での正しい日本語で伝え続けることを諦めてはいけないと思います。

岡崎：言葉がどのような変遷をたどるかを研究する分野は、自然言語処理にもありますね。「正しい」日本語で伝えるアナウンサーと、データの「量」で社会の動向を掴むAI。それぞれの役割や目的の違いが、言葉へのアプローチの違いに表れているように思います。

SNSの言説が浮き彫りにする「自ら調べ、考える」姿勢の大切さ

松井：SNSもAIの学習データとして活用されているとのことですが、Twitterなどではある種の世論^※2が形成されていたりします。そうしたSNSで交わされる「言葉」や「意見」に着目した研究はあるのでしょうか。

岡崎：東日本大震災の後、福島県産の桃に関するTwitter上の議論を分析する研究をしました。周知のように、福島の農産物は原発事故に伴う風評で多大なダメージを受けました。その実態を探るべく、「評判分析」という手法を用いて、肯定派?否定派のツイートを一定期間追い、グラフ化したのです。そこで明らかになったのは、「意見はなかなか変わらない」ということ。肯定派同士?否定派同士でリツイートし合うことはあっても、両者の間で意見交換するケースはほぼなく、主張を変える人もゼロに等しかったのです。

松井：自分と同じ意見だけを取り入れる傾向にあるわけですね。匿名性の高いTwitterでは、無責任な発言も含めて多種多様な意見が飛び交っています。報道の現場でも匿名の視聴者から抗議や苦情を受けることが多々ありますが、私はそうした意見の中にも真実はあると思っていて。氾濫する主張や情報から、自分なりに「取捨選択」することが大切だと考えています。記者として取材^※3を重ねる中でも、判断がつかなければ納得いくまで調べますし、時には培ったネットワークを生かして専門家の意見を伺うこともあります。自分で調べ、考え、適切な情報をつかみとる姿勢が、現代のネット社会においても重要ではないでしょうか。

岡崎：確かに、今回のコロナ禍では顕著にその姿勢が求められたように思います。未曾有の事態で、専門家の意見も分かれている。多様な見地から主張を聞き、理解した上で意思決定できればいいのですが、感情や周囲に流されている人も多く見受けられました。AIは肯定派?否定派の意見を分析しますが、相手を説得することはできません。そこから先はやはり人が考え、知性を身に付けるしかないと思います。

※2 SNSから見える「世論」

SNSから見える「世論」

福島県産の桃に対する否定的?肯定的なリツイートを、AIが分析して視覚的に表現。各グループで意見が固まる様子が見られますが、実際に桃を食べたことで肯定派に転じたケースも1例ありました。岡崎研究室では、こうした感情?意見分析を始め、AIを用いた多様な研究に取り組んでいます。

※3 真実に迫る「取材力」

真実に迫る「取材力」

アナウンサーとして原発問題を担当した時には、青森?六ケ所村の核燃料サイクルシステムを個人的に取材中に、現地で東日本大震災に遭遇。現在は報道局気象災害担当記者として、東京工業大学の教授とも連携を取りながら、地震や火山に関する知識を深めています。

アナウンサーとAIが共存する？言葉とテクノロジーを巡る未来予想図

岡崎：近年、機械翻訳の精度は飛躍的に向上しているため、AIが言葉や文章を紡ぐ場面は今後さらに増え、ある程度受け入れられる世の中になると考えています。前述の見出し生成ツールも不十分なところはあるにせよ、大量に情報発信する媒体等では活用されていくでしょう。現時点でAIが苦手とするクリエイティブな文章の作成も、これから研究?開発が進むはずです。

松井：そういうお話を聞くと、近い将来、アナウンサーとAIはごく自然に共存していくのではないかと思います。実は弊社にもAIアナウンサーがいるのですが、現段階ではあくまでチャレンジングな運用です。でも、じきに人とAIのどちらが話しているのか判別できなくなる日が来るのではないでしょうか。ただ「司会として場を回す」「番組の最後に感想を述べる」「ゼロから原稿をつくる」といった役割は、当面は人の仕事かもしれません。相手の感情の機微をくみ取り、定型的でない会話や表現に落とし込む……そういった行為をAIが習得するには時間がかかると思いますが、それもそう遠い未来ではないでしょうね。

岡崎：そうですね。私たち研究者としては、幅広いニーズに応えられるよう、そしてより正確なアウトプットができるよう、性能を高めていかねばなりません。一方で、ユーザーである一般の方々も、AIを盲信するのではなく、強みと弱みを理解する必要がある。その上で、うまく役割分担できればいいのではないかと思います。

松井：正しく利用するための知識、AIリテラシーを持っておくということですね。やはりどんな領域も、結局は「人」の使い方次第なのだと感じました。AIとアナウンサー。それぞれが進化と研鑽を重ねた先に、協働する未来が待っているかもしれないと思うと、とても楽しみです。

まだまだ深める知的好奇心

言語処理

昨今のAIの進化?普及により、言語処理を学びたい人が増えている。岡崎教授は、「言語処理100本ノック」と題した問題集をWeb上で無償公開。100の課題を解く中で、必要なプログラミング?データ分析のスキルを習得できる仕組みだ。数多くの人が挑戦し、解答例を発表し合うなど、オープンな知の交換が行われている。

日本語

日本語が変化していく理由の一つに、人々の思い込みがある。元々違う意味の言葉だった「よろん（輿論）」と「せろん（世論）」を「世論」の読み仮名として併用したり、慣用句を本来とは異なる意味で使ったり……。間違いだった使い方が多数派になると、新聞社や放送局のルールが改訂され、正しい読みや意味が移り変わっていくのだ。

松井康真