LINEも始めた「ニュース要約」にいち早く乗り出していた『vingow』は、どうやって自動要約を行っているのか?
今、スマートデバイス向けに「ニュース要約」を行う技術やアプリに注目が集まっている。
今年3月、米Yahoo!が自動要約アプリ『Summly』を買収し、自社アプリにも文章要約の要素技術を組み込んだほか、4月には米Googleも同様の技術を持つ『Wavii』を買収。
続いて、日本では7月18日、LINEがiPhoneおよびAndroidアプリの『LINE NEWS』をリリースして話題となった。こちらは「人力要約」とのことだが、ニュースを短いヘッドラインで表示することで、読み手がより手軽に内容を把握できるような試みが急速に浸透し出しているのは確かだ。
この流れを汲み、日本でLINE NEWSよりも早くニュース要約に着手し、自動要約機能をリリースしていたのが、JX通信社のニュースキュレーションサービス『vingow(ビンゴー)』だ。
難しい日本語記事の自動要約システムを、「速読」のメソッドで開発
vingowとは、ユーザーが設定するタグ=興味のあるジャンルに応じて、関連するニュース記事や個人ブログのエントリなどを自動収集してくれるサービス。2012年10月にWeb版、iPhoneアプリ、Windows 8アプリがそれぞれリリースされていた。
記事内容を3つの短文で自動要約する機能は、今年の6月に追加されたばかりだ。ニュース記事の文章を一切書き換えずに、要点となる重要なセンテンスを抽出することで「要約」を実現している。
iPhoneアプリをメジャーアップデートした3月から、デイリーでアクティブユーザー率が20~30%近く伸びていたというが、「自動要約機能」を搭載してからは記事が読まれる本数も上昇。
興味深いのは、情報取得の時間短縮を狙って要約表示をしたことで、逆に“ちゃんと記事を読む”ユーザーが増えたという点である。
同社代表取締役の米重克洋氏によると、「自動要約機能を搭載した後、記事を『お気に入り』保存するユーザーが約3倍に増え、vingowから元記事へのトラフィックも以前より40~50%増えた」という。ユーザーの滞在時間も増加しているそうだ。
キュレーション+内容要約をセットで提供することによって、「本当に読みたい/読むべき記事だけ精読できる」というメリットを生み出している。
この、読むべき記事の選別に一役買っているのが、同社が独自開発した自動要約機能の精度の高さだ。
文法がシンプルで、アルファベットだけを用いる英語と違って、日本語は漢字、ひらがな、カタカナが入り混じる上に主語・述語があいまい。自動要約で不可欠な自然言語処理のハードルは、英文記事のそれよりも高い。
それでも、米重氏が「現時点で70%くらいの要約成功率」と自信を見せるように、上記の数値的な変化を見ても一定の成果を挙げているといえる。
実際、vingowにキュレーションされた弊誌記事の要約を見ても、書き手側の目線だと「?」と思う要約がいくつか見受けられたものの、3つ表示される短文の要約をすべて見れば大体の記事内容は理解できた。「約70%の成功率」という言葉に偽りはない。
自然言語処理のアルゴリズム設計を担ってきた、取締役チーフエンジニアの柳佳音氏によると、【1】まずはニュースやブログ記事の「本文の部分」を指定し、【2】そこから要約ポイントを抽出するという設計ポリシーで自動要約を実現しているとのこと。
このアルゴリズム設計で参考にしたのが、「速読」のノウハウなのだという。
「細かな処理については企業秘密ですが、速読と似たような思想で要約プログラムを開発することで、米重の言う『70%くらいの成功率』を担保できるようになりました」(柳氏)
要約エンジンの他社提供などを通じて事業拡大を狙う
ただ、現状のアルゴリズムは「記事のジャンルによって精度に差が出ている状態」(米重氏)ということで、今後は「例えば経済のニュースでも、あるいは農業のニュースでも、ジャンルを問わずきちんと要点を押さえられるような要約エンジンにチューニングしていきたい」(柳氏)という。
これを行うためには膨大なテキストデータをリアルタイムに整理・解析し、記事のジャンルごとに最適なアルゴリズムで要約を行うエンジンが必要になる。ニュースの【網羅性×専門性×即時性】を担保するキュレーションメディアを目指すには、このエンジン強化が避けて通れない。
そこで同社では、柳氏を含む3名のエンジニアがデータ解析作業に取り組んでおり、この分野の開発にいっそう力を注いでいく構えだ。
さらに、米重氏はvingowを軸とした事業の発展形として、「要約エンジンの他社提供」も視野に入れていると話す。
すでに、ある専門分野での情報提供を行っている企業に対してvingowのエンジンをカスタマイズ提供しており、【1】より幅広いメディアへのエンジン提供、【2】ビジネスユースにおける有料課金などでマネタイズも進めていく。
「スマートフォンの普及を前提に考えれば、これから『小さい画面でも読みやすいニュース形式に』、『移動中のような忙しい時間でもサクサク情報を得る』という流れはもっと進んでいくはずです。その中で、vingowが定番アプリとしての地位を獲得することができるかどうか。タグのリッチ化やシステム基盤の強化など、やるべきことはたくさん残っていますが、挑戦する価値のあるビジネスだと思っています」(米重氏)
取材した時点(2013年7月18日)ではまだ従業員数14名というスタートアップながら、社名に「通信社」と入っているのが示すとおり、彼らが目指すのは次世代のニュース通信社だ。高度な技術力をベースにしたビジネスディベロップで、時代の寵児の座を狙う。
取材・文/浦野孝嗣 撮影/竹井俊晴
RELATED関連記事
RANKING人気記事ランキング
米国優位が揺らぐ?ひろゆき「CPUの進化でGPU神話って崩壊しません?」【AI研究者・今井翔太が回答】
NEW!
表面的なテクニックより「基礎基本の重要性」に気付かされた一冊【Node.js 日本ユーザーグループ代表・古川陽介】
AWS認定資格10種類を一覧で解説! 難易度や費用、おすすめの学習方法も
正論モンスター化に要注意!ぎくしゃくしない「ミスの指摘」のコツ【澤円「コミュ力おばけ」への道】
社会で成功するゲーマーに、ひろゆきが聞く「現実世界を攻略できないゲーマーに足りないものって何すか?」
JOB BOARD編集部オススメ求人特集
タグ