待ち構えるロボットライター「GPT-3」はコンテンツ制作に終末をもたらすのか?

2021.05.11

Share

本記事は、SEOButler - i2W Ltd.(https://seobutler.com/)が運営するSEOBUTLER BLOGから翻訳許可を得て掲載しています。
原文は「YOUR ROBOT WRITER AWAITS… IS GPT-3 THE DEATH OF THE CONTENT CREATOR?」です。

▼執筆者紹介
SEAN SHUTER(ショーン・シューター)
SEOButlerの編集長を務めるショーンは、20年以上にわたりEntrepreneurやVogueをはじめ、さまざまな出版物でビジネスと文化について執筆してきた。シリアルアントレプレナーでもあり、4つの大陸で企業の創業や経営に携わってきた。

コンテンツ作成を生業とする、ライター兼エディターとして、私はAIについて相反する思いを深く抱いている。片やAIなしの生活は想像できない。この4年間、私はベトナムで生活してきた。ベトナム語はほんのひと握りの単語やフレーズしか話せないし、理解できない(情けないのは重々承知だ)。おまけに方向音痴でもある。サイゴンの入り組んだ街並みや路地をさまようのは、計り知れない喜びの源だ。実際に行きたい目的地があったり、会議に遅れていたりしない限りは。

45861296937_01

(Source:VNExpress)

あるいは雨季でなければ、Google マップやGoogle 翻訳がなければ、私がここに住むという選択肢はなかったであろう。そういうわけで、AIがすでに提供してくれているサービスには大いに感謝している。その一方で、現在の暮らしを可能にしているテクノロジーそれ自体が、食卓にフォーを並べる私の職業的能力に対する現実の脅威として、ますます存在感を増してきているように思える。

言葉を生業にする者で、AIにやや怯えているのは私だけではない。ニューヨーク・タイムズのテクノロジーコラムニストであるファルハド・マンジュー氏が最近言ったように、「それほど遠くない将来、ひかえ目なライターは書き方の模倣が上手くなる機械によってお払い箱にされるかもしれない」のである。GPT-3のようなAIドリブンなテクノロジーのせいで、用なしになるかもしれないと恐れてクローゼットにこもっているコンテンツクリエイターがいる一方で、AIの可能性に期待して身震いしているビジネスオーナーやアフィリエイトマーケターが少なくとも一人はいるはずだ。

果たして、人間とは異なる機械のライターやエディターを相手にして、お金を払いたいと思う人はいるのだろうか?コンピューターがコンテンツの作成や編集を行うという夢(または悪夢)の実現までどの程度近づいているのだろうか?確認してみよう。

OpenAI、そしてGPT-3とは?

45861296937_02

OpenAIは、イーロン・マスク氏やYコンビネーターの前社長で現在OpenAIのCEOを務めるサム・アルトマン氏といった、テック業界のスーパースターの手によって2015年に設立された。

2018年には、GenerativePre-trainedTransformer(略してGPT)という言語モデルに関する最初の論文を発表した。簡単に説明すると、GPTは人が書いた大量のテキストを処理し、そういったものと区別がつかないようなテキストの生成を試みる。そして、そのすべてのプロセスで人の介入や監視は最小限に抑えられる。

NLPSaaS開発者兼ライターであるTheEdgeGroupのアレクス・スメチョフ氏にインタビューをした際、彼はGPTのことを「極端なオートコンプリート」とやや嘲笑気味に言った。それは明らかに単純化した言い回しであるが、根本的に真実である。GPT(およびその他AIドリブンのNLGモデル)は、人が自然に書いたり話したりするのと区別がつかない形で、前の言葉の後に続く言葉の予測を試みる。

GPT関連のイノベーションは、まさに息を呑むほどのペースで進んできた。2019年2月、OpenAIはGPT-2の限定版を公開した。その年の11月には、GPT-2NLGモデルの完全版がオープンソース化された。GPT-2は大いに反響を呼んだ。当初、OpenAIはあまりにも危険な可能性があったため、完全モデルの公開は先送りされた。「悪用の確たる証拠は見られなかった」と宣言した後、ようやくオープンソース化された。これは、GoogleやFacebookのような株主所有の企業が、事実上公の監視なく私たちの生活を劇的に変える可能性があるテクノロジーについて、主観的な判断を下したもうひとつの例である。NLGモデルは、少なくともある程度はエンジニアがモデルに与えるパラメータの数に応じて「より賢く」、あるいは少なくとも人の話し方や書き方の模倣が上手になる。データセットが大きく、パラメータが多くなればなるほど、モデルの精度はより高くなる。GPT-2には、850万ウェブページのデータセットでトレーニングをおこない、15億件のパラメータが存在した。これに負けまいと、Microsoftは、2020年の初めにチューリング自然言語生成(T-NLG)をリリースした。

45861296937_03

The TuringMachine –PredecessoroftheModernComputer

有名な科学者アラン・チューリングにちなんで名付けられたT-NLGのトランスフォーマーベースのモデルは、175億件のパラメータ(GPT-2の10倍以上)を使っている。2020年6月にOpenAIは、自然言語処理(NLP)および自然言語生成(NLG)APIの最新版としてGPT-3を発表した。1,750億件のパラメータ(その6か月前足らずに発表されたT-NLGの10倍)でトレーニングされ、これまでに公開された中で最も強力かつ高度なNLGテクノロジーとなったGPT-3は、鳴り物入りで登場した…正直、この一連の騒ぎは耳をつんざかんばかりである。

 

Twitterの内容を信用すると、近いうちに医者や弁護士であろうが、あるいはコードを書くことを生業としていようが、GPT-3はあなたの元へやって来る。職を失う可能性があるのは、コンテンツクリエイターだけではない。

 

45861296937_04

(Source: Gwern.net)

安泰と思われる詩の世界でさえ、窮地に追い込まれるかもしれないようだ。他のクリエイティブな活動はどうであろうか?Spotifyのプレイリストにうんざりという方もいるであろう。それならOpenAIJukeboxにお任せあれ。

45861296937_05

デヴィッド・ボウイのスタイルでAIが生成した曲がこちらだ:

https://seobutler.com/wp-content/uploads/2021/01/2020-07-07-nshepperd-openaijukebox-gpt3-theuniverseisaglitch.mp3

デヴィッド・ボウイはあまりご存知ない?Jukeboxにお任せあれ。2パックからZ・ローにいたるまで、さまざまなアーティストのスタイルで、AIが生成した約10,000「曲」が一般公開されている。

45861296937_06

45861296937_07

to Z-Ro…

45861296937_08

OpenAIは、AIの創造的な可能性を示すことを求めて、実際にあらゆる手を尽くしてDALL・Eを開発した。DALL・Eは、単純なテキストプロンプトから見事な画像を作成することができる。アボカドと椅子を掛け合わせるとどうなるか、考えたことがあるだろうか?

45861296937_09

DALL·Eにその悩みから解放してもらおう。E-A-Tを確立するために、アフィリエイト・ウェブサイトの概要ページに「著者紹介」の写真が必要だろうか?

45861296937_10

Source: YupThatExists

上の顔写真に共通していること何であろうか?実は、これらの人物は実在しないのである。OpenAIのテクノロジーがすでに混乱をもたらしているのは、コンテンツ作成だけではないことが明らかだ。だが、このテクノロジーはどのような仕組みなのだろうか?

GPT-3の仕組みとは?

自然言語生成(NLG)は、長いことAIと自然言語処理(NLP)における究極の目標の1つであった。遡ること1966年、セラピストを装った初歩的なチャットボット「Eliza」の発明により、マシンは人と意味のある会話を続けることができることを世に確信させた。ごく最近では、OpenAIのGenerativePre-trainedTransformer(GPT)モデルやMicrosoftのチューリング自然言語生成(T-NLG)といったNLGテクノロジーが、その見事な文章コンテンツを生成する能力で専門家やジャーナリストに衝撃を与えた。

ほとんどのNLGテクノロジーはニューラルネットワークを備えている。ニューラルネットワークは、機械学習の深層学習領域における重要な部分で、人の脳の働きを真似ようと試みる。AI開発の課題に対するソリューションとして、深層学習の勢いが最初につき始めたのは、スタンフォード大学の教授を務めるコンピューター科学者のアンドリュー・ン氏が、Googleブレインを共同設立した2011年であった。

45861296937_11

(Source: AndrewNg)

深層学習の背後にある基本原理は、AIモデルが学習するデータセットが大きければ大きいほど、より強力になるということだ。演算能力が進歩し、利用可能なデータセット(ワールド・ワイド・ウェブ全体など)が拡大し続けるにつれて、GPT-3といったAIモデルの能力とインテリジェンスも成長する。多くの深層学習モデルは監視されている。つまり、人がラベル付け、または「タグ付け」した大規模なデータセットでトレーニングされている。

45861296937_11

(Source: CSNI)

たとえば、人気のImageNetデータセットは、人によってラベル付けおよび分類された1,400万枚超の画像で構成されている。1,400万枚の画像は多いように思えるかもしれないが、利用可能なデータ量と比較すると大海の一滴にすぎない。人の手によってラベル付けされたデータでトレーニングされる、監視付き機械学習モデルの問題は、十分な拡張可能性がないことだ。あまりにも人の手がかかりすぎ、機械が学習する能力の妨げになる。数多くの監視付きNLPモデルがそのようなデータセットでトレーニングされており、その多くはオープンソースとなっている。

 

 

初期のNLPモデルで広く使われている、あるデータセット(またはコーパス)は、アメリカ史上最大の株主不正事件に挙げられるエンロンのEメールで構成されている。GPT-3を斬新たらしめしている大きな理由は、監視なしで大量の生データを処理できることにある。つまり、テキスト入力の分類に人を要するという重大なボトルネックが、ほとんど解消されているのだ。

OpenAIのGPTモデルは、次のようなラベル付けされていない大規模なデータセットでトレーニングされる。異なる16ジャンルの11,038冊の未出版本と、英語版ウィキペディアの文章の25億語で構成されるBookCorpusデータセット(現在はもう公開されていない)Redditの高評価記事のアウトバウンドリンクから集められた、800万件を超える文書で構成されるデータ2008年以降のウェブクロールデータで構成されるペタバイト級のオープンリソースCommonCrawl。CommonCrawlコーパスには、1兆語近くが含まれると推定されている。というわけで、大きなデータセットとなっている。

45861296937_12

(Source: Wired)

GPT-3とNLGは危険なのか?

私たちは「もうひとつの事実」と「フェイクニュース」の時代に生きている。そして、多くの識者から「ポスト真実」の時代と呼ばれている。意見、感情、陰謀論によって、共有された客観的な現実が損なわれる恐れがある環境において、GPT-3や他のNLGテクノロジーが武器として使われる可能性があることは想像に難くない。悪意のある者は、人が書いたコンテンツとほとんど区別がつかない大量の偽情報を容易に作成することができる。さらに、検証可能な事実や共有された真実から人々は引き離される。バーチャルなエリザベス女王を使ったこの動画のように、「ディープフェイク」動画の多くはAIを駆使して作られている。
※2023年4月現在動画は非公開となっています

しかし私たちは、書かれた言葉の力について危険を承知で過小評価している。社会的不和を助長し、米国ほか西側民主主義諸国の選挙に影響を与えることを目的として、敵対的な外国政府が展開したソーシャルメディアのチャットボットのようなNLGテクノロジーの役割は、しっかりと記録文書に残されている。GPTや他のNLGモデルによる人の言葉の模倣がますます巧みになるにつれて、このテクノロジーを使って悪意あるニセ情報を大掛かりに作成する可能性も飛躍的に高まる。

また、GPT-3は、前の言葉に続く言葉を説得力のある方法で推測することにたいへん優れているが、事実や話の内容の真偽に制約されないことを覚えておくことも重要だ。トム・サイモナイト氏はWiredの中で、「GPT-3は見事に流暢なテキストを生成できるが、現実からかけ離れていることがよくある」と、その欠点について説明した。

さらに、GPT-3ほか現在のすべてのNLGは、人からの「プロンプト」に依存していることを覚えておくことも重要だ。それらは高度に洗練された予測モデルではあるが、自ら思考することはできない。「GPT-3には外部世界の内部モデル、あるいは世界そのものがありません。そのため、そのようなモデルを必要とする推論を行うことはできません」と、サンタフェ研究所のメラニー・ミッチェル教授はいう。子どもの喘息を正しく「診断」するGPT-3の見事な実例がある一方で、GPT-3がバーチャルな患者に対して自殺を促すという、恐ろしい話が存在する。そのようなエピソードのひとつを見ると、会話は上々の滑り出しであった。

45861296937_13

ところがその後、会話は大いに雲行きが怪しくなる。

45861296937_14

(Source: ArtificialIntelligenceNews)

GPT-3には、倫理と偏見に関する深刻な問題も存在する。FacebookのAI担当副社長を務め、深層学習とAIに関する思慮に富んだ批評家であるジェローム・ピセンティ氏は、ユダヤ人、黒人、女性、ホロコーストという単語のプロンプトを与えた際にGPT-3が生成したツイートの例をツイートした。
45861296937_15

(Source: thoughts.sushant-kumar.com)

どうやらGPT-3は不寛容で残酷、そして大抵許されないようなことを言う能力に大いに長けているようだ。多くの人もまたそうではあるが…トランスフォーマーベースのNLP/NLGモデルが、本質的に不完全である人間が作成したオンラインコンテンツから学習することを考えると、マシンからより高い水準の会話を期待することが果たして理にかなっているのか?おそらく「ノー」であろう。しかし、GPT-3が人の監視なしにコンテンツを公開できるようにすることで、予期せぬたいへん望ましくない結果が生じる可能性がある。

45861296937_16

AIEthicistTimnitGebru(Source: TheVerge)

AIにおける偏見に関係するもうひとつの恐ろしい展開として、Googleは最近、AI倫理研究の第一人者であるティムニット・ゲブル氏を解雇した。ゲブル氏は、少なくとも原因の一部として、「二酸化炭素排出が周縁化されたコミュニティーに与える影響、さらには特定の集団を標的にした虐待的な言葉、ヘイトスピーチ、自覚なき差別、固定観念、その他人間性を否定するような言葉を永続させる傾向など、大規模な言語モデルの展開にかかわるリスク」に関する研究で解雇されたと言われている。

GoogleやOpenAIのような企業が、AIの偏見や倫理の問題という点で自らを取り締まることを任されている場合、本当に彼らがそのような懸念を商業的利益よりも優先させることを期待できるのだろうか?Googleは、すでにAI倫理研究のトップで、GoogleリサーチAI倫理チームの共同リーダー(かつてゲブル氏とともに率いる)であるマーガレット・ミッチェル氏に対して、懲罰的な措置を取っていることから、その答えはどうやら「ノー」だ。「邪悪になるな(Googleのモットー)」はこれくらいにしておこう。

45861296937_17

(Source: FastCompany)

GPT-3と気候変動

GPT-3(およびAI全般)が人と地球の両方に害を及ぼす可能性で、もうひとつ見過ごされがちなのは、どちらも膨大なコンピューティングを必要とすることだ。推計では、GPT-3の1回のトレーニングセッションに、デンマークの126世帯分の年間消費量に相当するエネルギー量が必要であり、車で70万キロ移動するのに相当する二酸化炭素排出量が発生すると結論付けられている。AIは、危険な温室効果ガスを生成する最大の要因とはほど遠い(私は石炭、牛、自動車を注視している)。

しかし、AIテクノロジーの二酸化炭素排出量は取るに足らないものとは言えない。「より多くの演算能力とデータを駆使して、より大きな問題を解決するために機械学習をスケールアップするという大きな動きがあります。その過程において、これらのヘビーコンピューティングモデルのメリットが、環境に与える影響のコストに見合うかどうかに留意する必要があります」と、スタンフォード大学の言語学責任者でコンピューターサイエンスの教授を務めるダン・ジュラフスキー氏はいう。

45861296937_18

(Source: Statista)

NLPテクノロジーの市場は、2018年から2025年までに750%以上成長すると予測されている。GPT-3(およびその後継)のようなNLGモデルが環境に与える影響は、市場の成長とともに大きくなる可能性が高い。AI研究者は、環境への潜在的な悪影響を十分に認識しており、それを測定して低減するための措置を講じている。しかし、科学者が最大限の努力を払ったとしても、気候変動がもたらす人類(および地球)の「存続にかかわる脅威」があることから、AIテクノロジーによる地球温暖化の悪化を軽視してはならない。

GPT-3とSEO

コンテンツはデジタルマーケティングの生命線である。したがって、多くのNLGスタートアップ企業がSEOをターゲットにしているのも不思議ではない。AIはすでに、ライターによるSEO主導コンテンツの作成方法に大きな影響を与えている。SurferやPageOptimizerProを想像してもらいたい。

しかし、ライターの必要性を完全に排除すると主張しているアプリはどうであろうか?あるいは、自分で作成するものと見分けがつかないEメールを作成するアプリはどうであろうか?コンテンツ作成自動化プラットフォームの魅力はよくわかる。特に、コンテンツ作成の唯一の目標がオーガニック検索トラフィックを活発にすることであり、読者に価値を提供することが問題ではないのなら。このようなアプリの多くはベータ版または順番待ちリストの段階にあるが、すでに事業化されているものもある。

私は、自動コンテンツ作成SaaSのContentyzeを創業したプルゼメック・チョゼキ氏にインタビューをおこない、NLGテクノロジーの方向性について彼の考えを聞いた。また、SEONotebook創業者のスティーブ・トス氏とNLPアプリ開発者でデータドリブン関連のライターでもあるアレクス・スメチョフ氏にも質問をして、SEOとウェブコンテンツ全般に対するNLGの潜在的な影響についての考えを聞いた。

プルゼメック・チョゼキ氏とのインタビュー

45861296937_19

 

CONTENTYZE*の創業者Contentyzeを創業したきっかけは?
私は自分でたくさん執筆しますが、最初の目的は、自分の書くプロセスをより速くスムーズにする一連のアルゴリズムを構築することでした。それが成功したので、他の人も使えるプラットフォームを作ることにしました。

理想的なターゲットユーザーは?
今のところ、ターゲットオーディエンスはマーケターとSEOの専門家です。このグループは定期的に多くのコンテンツを必要とし、Contentyzeはそのプロセスの高速化に役立ちます。しかし理想としては、学生、会社員、コンテンツクリエイターなど、文章を書く必要があるすべての人にContentyzeが役立つことを望んでいます。本当にあらゆる人です!

ユースケースの具体例を挙げてもらえますか?
現在、最も一般的なユースケースは、見出しからブログ投稿を生成したり、リンクから文章の要約を生成したりすることです。最初のユースケースは次のような仕組みです。Contentyzeに、「企業で人工知能を活用する方法」といった文や質問などのプロンプトを与えます。

45861296937_20

[生成]をクリックして1~2分待つと、テキストのドラフトが表示されます。常に理想的とは限りませんが、常に他にはないものが表示されます。同じプロンプトや見出しでこのプロセスを数回繰り返すと、より多くのテキストが得られます。その後、取捨選択すると、このようにブログにテキストを表示できます。

Contentyzeが「得意」なコンテンツは?
現段階では、Contentyzeはテキストの要約にたいへん優れています。テキストの生成も比較的得意ですが、私が望むほどの内容の整合性はありません。

Contentyzeが不得手なコンテンツは?
書き換え機能を向上させるには、まだ多くの作業が必要です。すでにテキストの書き換えができますが、現在の性能には満足していません。単純なコンテンツスピニング(シソーラスに進んで、形容詞を意味の近いものに変更する)をおこないたくない場合、優れた書き換えはかなり困難です。

現在、Contentyzeが人間のライターやエディターの仕事をやり易くしていると考えますか?それとも完全に取って代わっていると考えますか?
間違いなく、人間のライターの仕事をやり易くしています。私の最終目標は、コンセプトの考案からドラフト、編集に至るまで、執筆プロセスのあらゆる段階で執筆に役立つ完璧なアシスタントを創造することです。おそらくその過程で、コピーライターの仕事の一部は取って代わられますが、それが私の目標ではありません。

Contentyzeを使ってみて、気付いたことがいくつかあります。製品レビューなどの短いコンテンツの方が(予想どおり)優れたパフォーマンスを発揮します。近い将来、Contentyzeはより長い形式のコンテンツで性能が向上すると考えますか?またその理由は?
現在、演算能力が限られているため、短いコンテンツの扱いがより優れています。これこそまさに現在取り組んでいる技術的な問題です。テキストが長ければ長いほど、処理に必要な演算能力が高くなります。Contentyzeに、「AppleはGoogleと競合する検索エンジンを開発する可能性がある」というSEOButlerの最近の記事を「書き換える」ように指示したとき、最初の文はつじつまが合っていました。

Googleの検索エンジンは、今後数年間で新たな競合の脅威にさらされる可能性がある。

しかし、それに続く内容が以下のようなものでした。

AppleとGoogleは、Googleの検索機能をiPhone上で引き継ぐ可能性について協議している。報道によると、AppleのSamsungに対するスマートウォッチ事業売却の契約は疑わしい。Googleは、AlphabetのGoogleやMicrosoftのBingなどと競争するために、ロシアで新たな検索エンジンの立ち上げを検討していると伝えられている。Apple最新のiPhone7Plusは、GoogleのAndroidオペレーティングシステムと競合する目的で設計された、数あるハイエンドスマートフォンの中で最新のものだ。Bingは世界最大の検索エンジンであり、その検索結果は、Google、Yahoo、Microsoftなど、世界中の多くの検索エンジンで使われている。インターネットで何かを探したい場合、検索ごとに個別の検索エンジンを使用する必要はない。

さらに書き換えを進めると、元の記事とはまったく関係のない文が出てきました。

新しく聴きたい曲や購入するアルバムを探しているなら、それが見つかる場所はたくさん存在する。世界で最高の音楽を見つけたい方は、それがオンラインでできるようになった。

さらに、完全に間違った文も出てきました。

Googleの最新の検索アップデートは、MicrosoftやAppleなどのライバルに長い間遅れをとっている検索の巨人にとって、歓迎すべき改善となっている。

 

エンドユーザーがこのような結果をどのように活用すると考えますか?
申し上げたように、書き換えは現在最も性能が低い機能です。要約オプションではこのような結果にはなりません。

プロンプトを使用して新しいコンテンツを作成した場合も同様の結果が得られました。Contentyzeは、進化における現段階で、すぐに公開可能なコンテンツというよりも、人間のライター向けのブレーンストーミングツールとして使用されていると考えますか?
はい、現段階では、ユーザーが本番レベルで直接使用することは期待していません。一方、人間のエディターがテキストを確認し、質を確保するために必要な変更を加えたうえで公開できるよう、テキストをすばやく下書きするには本当に便利です。最終的にはContentyzeが執筆作業の80%を実行でき、残りを人間のライターが行うことを期待しています。

Contentyzeや他のNLGスタートアップ企業は、それぞれのSaaSアプリをSEOやアフィリエイトマーケターに直接売り込んでいます。それはなぜですか?
実のところ、これはとても自然なことです。このオーディエンスは定期的にコンテンツを必要としているため、その手助けになるツールを積極的に探しています。Contentyzeは、ほとんどマーケティングを行わず、ユーザーのほとんどをオーガニックな形で獲得し、その数は3,000超にまでなりました。

長期的には、ユーザーがContentyzeのようなアプリを大がかりに使用して、読者に価値を提供することをほとんど考慮せずに、純粋にSEOを目的とした大量のコンテンツを生成する危険性があると思いますか?そのようなこと、または同様のことが起こった場合、Googleは検索アルゴリズムを変更して、AIで生成されたコンテンツを発見し、それに対して罰を科すと思いますか?
間違いなく、GPT2/GPT3を作ったOpenAIが、アルゴリズムの使用状況を監視するための厳格なポリシーを設定しているのはこのためです。これは、GPT3とそのアプリケーションプロセス全体に特に当てはまります。この種のテクノロジーは、いかなる価値ももたらさずにインターネットを「スパム」する目的で簡単に利用できるため、今後は注意が必要だと思います。SEOを取り巻く状況は全般的に間違いなく変化します。Googleはこれまで何度も行ってきたようにアルゴリズムを調整するでしょうが、何が起こるかを予測するのは困難です。今後3〜5年で、AIが生成したコンテンツは、人が書いたコンテンツと区別がつかなくなると思っています。ですから、GoogleがAI生成コンテンツに罰を科したいのなら、彼らは別の何かを考案する必要があります。いずれにせよ、私は人の手によるコンテンツとAI生成コンテンツに区別を設けません。誰が、または何がコンテンツを作成したかではなく、そのコンテンツが価値を提供するかどうかだけを問うべきです。

他に共有したい考えはありますか?
インタビューをしていただき、ありがとうございます。ぜひ、contentyze.comにアクセスしてください。登録は無料です(クレジットカードは不要です)。一度お試しください!私たちはフィードバックをたいへん重視しており、マーケティング分野の人々が仕事をより効果的におこなえるよう、ツールを可能な限り優れたものにしたいと考えています。

スティーブ・トス氏とのインタビュー-SEONOTEBOOK*の創業者

45861296937_21

2018年の立ち上げ以来、SEONotebookはSEOに関する必読のシングルオペレーター・ニュースレターになった。有り難いことに、スティーブにはSEOButlerの直近3回のエキスパート・ラウンドアップに登場していただいた。私はここ数年、Eメールで彼と連絡を取り合っている。また、ChiangMaiSEO2019でスティーブに会うことができた。そういった経緯から、SEOクライアント向けのGPT-3で生成されたコンテンツのテストに関して、彼がAffiliateSEOMastermindFacebookグループに投稿しているのを見た際、その考えを聞いてみる必要があった。

今後数年間で、GPT-3や他のNLGテクノロジーがSEOにどのような影響を与えると思いますか?
ユーザーのGoogleに対する信頼が損なわれることになると思います。ユーザーは、これまで以上に友人にアドバイスを求めるようになると思います。

GPT-3をどのように活用してSEOのサポートコンテンツを作成していますか?
慎重に実施しています。それを望んでいるクライアントは今のところ1社です。私はそのクライアントの手引きをしていますが、このプロジェクトは将来GPT-3をどの程度使うかに影響を与えるでしょう。

GPT-3で生成されたコンテンツを使用する場合、読みやすさはどの程度優先されますか?
大いに優先します。私がGPT-3にそれほど積極的でないのはそれが理由です。GPT-3はオフページでの用途はあるかもしれませんが、コピーライティングで完全に取って代わることはありません。

近い将来、NLGが人間のライターに取って代わると思われるコンテンツの種類(たとえば、アフィリエイトサイトの製品レビューなど)はありますか?
GPT-3コンテンツを使ってアフィリエイトサイト全体を構築し、どのような結果になるかを確認した後で、コピーに磨きをかけるという可能性はあります。これが主なユースケースになると思います。

アレクス・スメチョフ氏とのインタビュー-SKRIBER.IO創業者およびNLPSAAS開発者*

45861296937_22

アレクスは、SEOButlerブログへの寄稿者やTheEdgeGroupのニュースレターコンサルタントであるだけでなく、NLPSaaSアプリのExtractorやSkriberの立ち上げ、開発に携わってきた。

近い将来、GPT-3または他のNLGテクノロジーが、特定のコンテンツタイプにおいてライターやエディターに取って代わると思いますか?
ジャーナリズムという側面に焦点を当てて話をします。事実に基づくちょっとした記事を作成している非AIソフトウェアはすでに存在します。AutomatedInsightsがその一例で、NCAAバスケットボールの記事などを書いています。NLGをテンプレートベースのテキスト生成機能と組み合わせると、いくらかより重要で長い記事を作成したり、他の記事の部分同士を統合したりできると思います。しかし、より本格的なジャーナリズムにおいては、AIはニュース編集室の仕事を円滑にするだけで、取って代わるものにはなりません。

45861296937_23

近い将来、NLGがコンテンツクリエイターの役割を強化すると思いますか?もしそうなら、どのように?
そう思います。すでに書かれた文や段落の代替案を作成したり、要約したり、またお話したように、複数のソースのコンテンツを統合したりといったことが可能です(ただし、総まとめとして、いずれにしても編集を行う必要があると思います)。

GPT-3などのNLGテクノロジーの普及に関して、最大の懸念を3つ挙げるとすれば、それは何ですか?
NLGによって次のようなものがインターネットに集まります。
・事実無根な不要データ
・過剰なSEOコンテンツ
・他と酷似しているように思えるコンテンツ。
このようなものがインターネット上にまだないわけではありませんが。

ライターとエディターは解雇されるのか?

端的な答えは「ノー」だ。AIは、世界で最も優れたチェスと囲碁のプレーヤーを倒すことから癌を検出することまで、狭い特定のタスクにおいて人と同等かそれより優れていることが証明されている。しかし、NLGは自然言語の模倣にたいへん優れている一方で、熟練した人間のライターやエディターに取って代わるまでには長い道のりがある。最も洗練されたNLGでさえ、人から与えられる「プロンプト」に依存しており、より突っ込んだ編集やファクトチェックについては言うまでもない。創造性は、特に独創的なアイデアを考え出し、まったく異なる情報とインスピレーションの源を独自に結び付けることに関係しているため、GPT-3の得意とする領域ではない。GPT-3は、世の中、感情、経験を説明するテキストを模倣することはできるが、そのいずれも持ち合わせていない。この疑問に対して、GPT-3が出す答えがこちら。

45861296937_24

いや、もう一度質問しよう。

45861296937_25

確かに、GPT-3というサイコロを転がし続け(私にはそれがロシアンルーレットのように思える)、最も優れた部分のいいとこ取りをし、それらを縫い合わせてフランケンシュタインまがいのコンテンツよりもマシなものにすることはできる。実際にオーディエンスを引き付ける、一貫した視点を持つパッチワークができると好ましい。

45861296937_25

その後、フランケンシュタインには徹底的なファクトチェックが必要となる。2例目の最初の文でさえ、意味として破綻していることにお気づきだろうか?

45861296937_26

アラン・チューリングが亡くなって66年が経つ。彼が「ウェブライティングのスタートアップ企業」を買収しているとは疑わしい。それとも、これはMicrosoftのチューリングNLGのことなのか?いずれにせよ、企業を買収した事実もなければ、それによってGPT-3が脚光を浴びた事実もない。せいぜいこんなものである。あるいはライターを雇うこともできる。GPT-3とその後継(または他のNLGモデル)がライターやエディターに取って代わるには、はるかに賢くなる必要がある。そして、はるかに人間らしくなる必要がある。

45861296937_27

(Source:TheTyrellCorporation)

汎用人工知能(AGI)-人以上の人間らしさ

NLPとNLGは、汎用人工知能(AGI)に至る過程の重要なステップとなるかもしれない(またはそうでないかもしれない)。長いことAIにおける究極の目的と見なされてきたAGIマシンは、人ができることすべてを同じように、またはそれ以上にできる、映画に出てくるような「ロボット」である。OpenAIは確実に、AGIの開発を真っ向から視野に入れている。

MicrosoftがOpenAIに対する10億ドルの投資を発表した際、同社はAGIを次のように定義した。「AGIは、キュリー、チューリング、バッハのスキルを組み合わせたツールのように、世界の専門家の水準まで研究分野を習得し、誰よりも多くの分野を習得できるシステムになる。問題解決に取り組むAGIは、人には不可能な分野横断的なつながりを把握することができる。気候変動、負担が少なく質の高い医療、パーソナライズされた教育といった世界的な課題を含む、現在は解決困難な多くの専門分野にわたる問題を解決するために、AGIが人間の力になることを望んでいる。その効果は、私たちのあらゆる生活に今日では想像もできない新しい機会を創造し、最も充実を感じることを追求するための経済的自由をあらゆる人に与ることだと考えている。」

まるでユートピアだ。しかし、それは果たして良いことなのか?代々、ユートピアはまったく成功しなかった。

45861296937_28

AGIの実現について、GPT-3が出した答えがこちら。

45861296937_29

この答えは単なる希望的観測かもしれないが、今回はGPT-3に同意したいと思う。

45861296937_30

ライターの力に–ライターに取って代わるのではなく

上記例の最後の文で、GPT-3がまたしても間違っていることに議論の余地はない。NLP、NLG、さらにはAGIの探求ということにおいては、かなり進歩してきた。そして、イノベーションのペースが近いうちに遅くなることはないだろう。

2021年から1か月も経たないうちに、Googleブレインチームは、パラメータ数で比較するとGPT-3が見劣りする新たなトランスフォーマーベースのAI言語モデルを発表した。GoogleのSwitchTransformerは、GPT-3の約6倍の1兆パラメータでトレーニングされている。これを執筆しているタイミングで、SwitchTransformerモデルの考えられる用途はほとんど分かっていないが、NLPの拡張競争は衰える兆しを見せていない。おそらく、マシンが人間のライターやエディターに取って代わる日が来るのだろうが、私も固唾を呑んで見守っているわけではない。

TheNextWebのAIエディターを務めるトリスタン・グリーン氏は、SwitchTransformerについて次のように語っている。「これら素晴らしいAIモデルが機械学習テクノロジーの最先端に存在しますが、本質的にはかくし芸を披露しているだけであることを覚えておくことが重要です。これらのシステムは言語を理解していません。言語を理解しているかのように微調整されているだけです。」

現段階で、間違いなく私がこの結果に関心があるのは明らかだ。この記事を書く際にそうしてきたのと同じくらい客観的であるが、私は人間のコンテンツクリエイターが、マシンよりも重要かつ優秀であり続けることに強い関心を持っている。しかしそれは、NLPとNLGテクノロジーを使って、どのように私の仕事を向上させることができるかがわからないということではない。

実際のところ、AIは何年にもわたって、私の執筆と編集の力になってきた。私はRevを使って、音声と動画のインタビューの自動文字起こしをおこなう。また、SEOButlerの創業者であるジョナサン・キークブッシュ氏とジャロッド・スピーワック氏のValueAddedPodcastの文字起こしをして、ショーノートをより迅速かつ正確に作成できるようにしている。そして、Grammarlyは、最も入念なエディターや校正者にとっても強力なツールとなっている。GPT-3やその他の高度なNLPモデルが、より正確で「信頼できる」ものになるにつれて、長い形式のコンテンツ、特に学術研究論文を要約する潜在的な能力は、極めて価値あるものとなる可能性がある。

私が待ち望む未来とは、AIがSEO主導のコンテンツ作成という骨の折れる作業の一部を排除してくれて、私がやらなければならないのは、ライターではなくマシンが部分的に作成した情報コンテンツを編集して完璧なものにするという状態であろう。それなら何とかなりそうだ。仕方ないのかもしれない。

*各Q&Aは、内容をわかりやすくするために編集および要約されている。

この記事の著者

DIGIFUL編集部

「DIGIFUL(デジフル)」は、株式会社Hakuhodo DY ONEが運営する「デジタル時代におけるマーケティング」をテーマにした、企業で活躍するマーケティング担当者のためのメディアです。

当社がこれまでに得たデータや経験から、具体的事例・将来展望・業界の最新注目ニュースなどについて情報を発信しています。ニュースやコラムだけでなく、日常業務や将来のマーケティング施策を考えるときに役立つダウンロード資料や、動画で学べるウェビナーコンテンツも随時追加していきます。

デジタルマーケティングの最新情報や知見を得るための信頼できる情報源の1つとしてお役立てください。

「DIGIFUL(デジフル)」は、株式会社Hakuhodo ...

Share

一覧に戻る