AJEC11月編集講座「生成AIと編集者のこれから」を受講して

【講義内容】
◎オンライン講座
 生成AIと編集者のこれから
     講師:藤本 隆(ふじもと・たかし)
     プランディット 編集事業部 編集長

【講師略歴】
ベネッセグループの編集専門会社にて編集業務に長年携わる。学習教材をはじめ、情報誌、フリーペーパー、教育系タブロイド、資格系教材、広告チラシ、フライヤーなど、広範な印刷媒体の企画・制作経験を持ち、原稿、記事の執筆、イラストレーション、DTPデザインもこなす。ベネッセグループ各社向けの育成研修講師を務める。
著書に『印刷発注の基本がわかる本』(日本能率協会マネジメントセンター)

 ──AJECの講師紹介から

 今回の講座は、主として、いま話題になっているChatGPTの活用がメインでしたので、とても期待しながら、聴講いたしました。スライドもたっぷりあり、最後の質疑応答の時間がほとんど取れなかったのは、残念でした。

 藤本さんは、いままでも、校正の講座などで部分的にAIの説明や、活用方法などに触れられていましたが、今回の講演では、生成AI、それもChatGPTに焦点を当てて、詳しく説明されました。ChatGPTの優れた特性や、限界などもとても分かりやすく、活用方法の工夫などについても説明されていました。

 ここでは藤本さんの講座の流れをスライド順に紹介しておきます。

<講義内容>
●はじめに
・「印刷と組版の歴史」で、物理的な手作業からデジタル化の説明があり、「情報伝達のあゆみ」で文字の発明から文字情報のデジタル化へ進んだこと
 →コンテンツの流通と活用の大変化の中で、量・種類・スピードに対応した「作り方の大変化が起きていること(編集者を取り巻く状況)

●AIとは何か
・コンピュータによる情報処理
 →Input(入力)に対してプログラムによる処理を行い、その結果Output(出力)を行う
・AI(Artificial Intelligence)とは、コンピュータ上に人間の知能を実装することを目的とした研究・技術のこと
 →大量データの機械学習(ディープラーニング)によるプログラム(モデル)の生成
・AIのプロセス
 →新たなデータに対して、生成したモデルに照らして結果を推定し判断するプロセス(結果の推定は、あくまでも確率計算で行われる)
 ※AIは、大量データの学習(学習プロセス)からモデルを生成し、新たなデータに対してモデルにより結果を推定し判断(推論プロセス)している

●生成AIとは
・AIと自然言語処理(コンピュータに言語を「理解」させ、「学習」「解析」できるようにするための技術)
 ①形態素解析→文を最小単位(形態素・トークン)に分割する技術
 ②コーパス→形態素解析をし、構造化された膨大な言語情報の集合(情報はベクトル表現されている)
 ③構造解析→トークン相互の係り受けや句構造を解析する技術(位置の符号化とアテンション)

【ChatGPTの特性】
○ChatGPTは、精巧な文の解析と超大規模な言語モデルの産物で、質問文を解析し、それに対応する文章を生成する
・解析しやすい質問文がよい回答の鍵(プロンプト・エンジニアリング)
 →質問文が解析できないと回答の正確性が大きく下がる
・制御項目以外は特定情報を参照していない
 →あくまでもLLM(大言語モデル)から語のつながりを推定して文章を生成している
・生成結果の検証や検算はしていない
 →事実としての正誤・検証は生成ロジックに入っていない

【プロンプトの工夫】
・形態素解析・構造解析での誤解が生じにくい文章
 →明快で単純な文・構造のはっきりした文法・箇条書き・英文
・役割(ロール)、条件、回答字数を明確にする
・文章以外の要素は、マークアップ(タグ)で区分する
・対話で内容を詰めず、1回のプロンプトで回答させるのがよい
 ※とても参考になる英語の問題のプロンプトと結果の例

【知識の偏りと知識の限界】
・公開コンテンツが少ない情報は学習結果のパラメーターが十分に生成されていないため正確ではない(データがありませんという答え)
・文法構造や論理は正しくても、「知識」「計算」の生成結果が正しいかは別問題。プロンプトの工夫と回答内容補正の手段を別途講ずる必要がある(ハルシネーションが起きる)

【ChatGPTの情報制御】──情報の個別性、正確性、最新性を担保するために
・プロンプトの工夫により、できるだけ正確な回答を得る
・カスタム指示、プラグインによる回答内容の制御
・ChatGPTのアップデートによる性能向上
・LLMファインチューニング、割り込みシステムの構築

【システムによる制御】
・普通のChatGPTに対して、専用システム(資料や自社DBを使う)を組み込んで、質問を補正させたり、資料に基づいた回答文を生成させたりする

【ChatGPTの利用】
・セキュリティーは問題ないか
 →LLMの原理上、入力内容がそのまま他者にわたることはないが、記録などのデータに配慮必要
・著作権の侵害は問題ないか
 →LLMの学習は、国内では合法。生成結果にも他者の著作権はないが、ファインチューニング時の依拠性に注意(類似物ができることがある)

●編集のこれから
デジタル化された情報を最大限に生かす編集制作へ
・ニューズに応じたコンテンツを瞬時に選び出す
 →文書の自動分類やレコメンド(お勧め抽出)⇔文脈の推定
・コンテンツをニーズに合わせて瞬時に編集する
 →自動要約、自動翻訳、キーワード注出⇔論旨の推定
・編集したコンテンツを自動で品質保証する
 →AI校正(機械校正、自動校正)⇔正しい日本語の推定

●編集者に必要なもの
・基本的な編集スキルと、複雑な仕事の流れを整理して進める段取り力
・クライアントをはじめ、各工程のプロフェッショナルとスムーズなやりとりを進める交渉力
・担当するテーマ・分野に対する深い専門性と、担当するテーマ・分野を広い視野で位置づける幅広い知識
・各工程における作業内容の理解と、各工程で扱われる用語の正しい理解
 ※要するに「興味・関心」をもつことが大切

<感想>
 やっと、編集者の立場から、体系的にChatGPTについて、どのような活用ができ、どのような問題点があるかを聞くことができました。特にプランディットさんでは、組織的にChatGPTの研究と実践に取り組まれており、藤本さんのChatGPTに対する理解は、かなり実践的で、先進的だと思っていたため、とても楽しみにしていました。結果は、期待通りでした。もちろん、これが全てではないでしょうが、これだけでも私たちには役立ちそうでした。

 ChatGPTを本づくりにどう活用するかという点では、おそらく企画、構成、原稿作成など、初期段階にかなりの有効性がありそうです。もちろん、校正や用語チェック(解説)などでも、今後の進化で、非常に役立ちそうです。最終的には、人間、つまり編集者がチェックする必要があり、あくまでも補助的な役割、言い換えればCopilot(副操縦士)のような存在になります。

 私が藤本さんの話で驚いたのは、英語の教材作成で、①英文の作成、②その英文を基にした問題作成、③解答例、そして④解答の解説という一連の作業を、一つのプロンプトで行っていたことでした。そして、このような場合は、対話よりも一つのプロンプトで答えさせる方が良いと指摘されたことです。私はこれまで、ChatGPTと対話しながら、①から順に④まで4回に分けて応答させていました。

 藤本さんの指摘では、ChatGPTは現段階でワーキングメモリに限界があり、時に前の内容を忘れてしまうことがあるので、一度に応答させた方が良いという指摘でした。なるほどと思いました。分けて応答させても、文脈を与えているので応えられないわけではありませんが、どこまで過去の文脈を参照できるかは現時点で保証されていないので、藤本さんの方法のほうが効率的だと理解しました。しかし、ChatGPT 4.0ターボでは、この点を含め、文字数の制限なども改善されているようです。

 いずれにしても、ChatGPTについては、適切な文脈をどう与えるかがプロンプトエンジニアリングのコツであり、それは私たち編集者が著者や画家、デザイナーにどれだけ適切な情報を与えて、適格な作品を作らせるかということと同じです。その意味では、編集者に最も適した作業であります。これらは、みんなで活用し、プロンプトの共有が重要だと思います。藤本さんの英語問題作成のプロンプトは、非常に参考になると思いますので、ぜひ応用して使ってみることをお勧めします。

 藤本さんは、恐らく知っていて語られなかったのだと思いますが、カスタム指示の話をしていました。現在は、新たにGPTsという機能が追加され、カスタマイズされた特別なGPTを作成できるようになっています。そこでは、一定量のデータをファイルとして提供すれば、それに応じた文章が生成できるようになります。極端な例を挙げれば、教科書の内容を全部読み込ませて、そこから問題を作成させることも可能です。資料としてPDFを読み込ませることも可能になっています。

 また、検証と計算は、ChatGPT単独ではできませんが、プラグインを使用することで、校正や確認を行うことが可能です。高度な大学入試の数学の問題さえも解答できます。これまで、ChatGPTでは不可能だと思われていたことが、藤本さんの説明でよく理解できました。持っている知識についても、かなり改善されており、誤った情報(ハルシネーション)も減少しています。もちろん、学習データに含まれていない知識については応答できませんが、複数の生成AIを組み合わせて使用することで、内容の照合も可能になってきました。

 文章生成AIには、ChatGPT 4、Bard、Bing、Claud2.1、Perplexityなどがあります。これは私の知っているサービスに限ったことです。Claud2.1とPerplexityはあまり使用していませんが、優れているそうです。どれもChatGPTが競争相手(Bingは少し性格が異なりますが)で、ChatGPTに追いつくことを目指しています。ChatHubというサービスがあり、これはブラウザ上で複数の生成AIを並べて同時に使用し、それぞれを比較できるようになっています。これを通じて、回答の正確性を確認することができます。もちろん、ChatHub自体は有料(これは30ドルの一括支払い制)で、その他の生成AIも有料のものは登録しておかなければ使用できません。

 また、生成AIは、文章だけでなく、画像や音声の生成にも用いられており、今後はさらにマルチモーダルな展開が見込まれます。ChatGPT 4では、画像生成や画像を入力して、それが何かを尋ねることができるようになっています。Adobe Fireflyの登場により、文章生成よりも様々なイラストの生成がAIの活用で拡大する可能性があります。単純なイラストなら、画像生成AIのほうが簡単に作成できます。すでにスマートフォンやタブレットのアプリでは、音声による対話が可能で、横になりながら人生相談をすることもできます。

 大切なことは、大企業でなくても、AIを使った編集作業ができるようになったということだと思います。どのように使ったらよいかはこれからの課題です。そのためにも、編集プロダクションの編集者一人ひとりが、普段から簡単に使えるように(検索アプリのように)準備し、そして、使ってみることが必要だと思いました。その上で、使い方を共有しましょう。

<参考図書>
① 小澤健祐著『生成AI 導入の教科書』(ワン・パブリッシング/2023.9.26)
② 野口竜司著『ChatGPT時代の文系AI人材になる―AIを操る7つのチカラ 』(東洋経済新報社/2023.10.4)

(文責:エディット東京オフィス 塚本鈴夫)