Googleマップに7色の飛行物体が出現 航空自衛隊のFA-18か #ldnews http://t.co/z5xqntFSjZ 「航空自衛隊のFA-18」という単語に編集の無能さを感じるが、これってロボットで自動生成した記事なんだろうか、タイトル含めて。
— JSF (@obiekt_JP) 2015, 3月 16
自動で記事を作成するロボットも学習を積み重ねることで精度がどんどん上がっていくんだろうか・・・
— JSF (@obiekt_JP) 2015, 3月 16
最近のlivedoorニュース、「ざっくり言うと」で記事を三行要約しているけど、自動アルゴリズムで抽出したように感じるのは気のせいか
— dragoner (@dragoner_JP) 2015, 3月 16
実はこれ、当方も結構前からうすうす感じていた話で、でも思い違いだろうなあということでホールドしていたネタ。相次ぎ自分以外の人からも同意見があったので、ちょいとまとめておくことにした。
内容としては指摘の通り。大手ポータルサイトでは海外の通信社のサイトと同じように、有名どころや既存メディアのサイトの記事を提携の上で転用配信したり、さらに自社独自のニュースを混ぜて、ミックスニュース的な形にしてニュースを提供している。ライブドアもその一つではあるのだけれど、そのうち自社制作配信部分となるのが「TOPICNEWS」。カテゴリ分けにしているから
時間が無くて、あるいは随筆的な雰囲気を出すために、あえて校正を最小限にとどめるという執筆スタイルはある。また執筆に慣れていない、日本語そのものが得意でない人も、こんな感じの文章を創り上げることはある。ただ色々と見渡す限り、そのような「人間的なぎこちなさ」というよりは、アルゴリズム抽出のような、ワードサラダ的な香りを覚えさせる。切り貼り・コピペにしても、鈍った刃先の包丁で切ったために寸断面がぐちゃぐちゃになっている感じ。 例えば 単なる表記の稚拙さとは違う。或いは日本語に不慣れな人かな。 Googleマップの伊豆大島上空に映り込んだ"虹色の飛行物体" http://t.co/gXEAwxvp2K で、3段落目が顕著。 この部分。空自にFA-18がいるか否か云々ってのはともかくとして、文章の区切り方、句読点の付け方に人間臭さが感じられない。漫画や小説を読んでいる時に設定の上での矛盾点に気が付いて、ふっと現実の世界に引き戻される、一歩引いた形で見てしまう、そんな雰囲気。 去年7月の記事 AP通信、決算記事作成に自動化技術導入へ - WirelessWire News(ワイヤレスワイヤーニュース) http://t.co/zlV3cAZYRi @WirelessWire_jpさんから 8か月前 Q. 実際に機械が記事を書いてる例ってもうあるんですか? - A. 「ナラティヴ・サイエンス(Narrative Science)」が実際に記事を作成しています - AP通信社、AIが人間に代わって記事を書く技術を導入 - http://t.co/ZHaoiQZloj 個人的には人力で素材用ソース(例えばツイッターのツイートとか)を放り込むとそれを基に記事そのものと三行解説部分を自動生成してくれる、そんな感じのアプリで作ったような気がする。まぁその類の記事は概して自動生成がバレてしまい、検索エンジンからはつまはじきにされるのだけれど、ばれなければそれで通ってしまうし、あとはスケールメリットを活かしてさらにネット上の影響力を強くしていく。 まぁ、当方の単なる思い過ごしで、単に執筆技術に欠けた人が手掛けている、単に間違いが重なっただけ、の可能性も多分にあるけれどね。それに仮に本当に、自動生成アプリの類でこれらの記事が書かれているのならば、それはそれで物凄い技術力に違いないし、大いに評価をしたいし、その技術をまとめて大手新聞社にレンタルなり販売をしてもビジネスとして成り立ちそうな気がする。それが良い話なのか否かは別として。
上記にある通り、ある程度パターン化が予想される状況下においては、すでに自動生成タイプの記事の構築はこっそりと行われている。上で挙げたワードサラダ的な文章やら情報商材系のスパムサイトで使われているのと、大よそ手法は同じ。だから論理的に不可能ではない。
コメントする