声だけでブログ完成⁉ ChatGPTと音声認識でストレスフリーな執筆ライフ

この記事の内容

  • Windowsの標準音声認識機能(Win+H)でしゃべるだけで文章を入力できます
  • 入力したテキストをChatGPTに渡すことで、ブログ記事として整形してもらえます
  • ChatGPTへのプロンプトを工夫することで、誤認識や冗長な部分を自動で修正できます
  • 出力はMarkdown形式なので、note.comなどのブログサービスにそのまま貼り付けられます
  • 対話形式で追加修正をお願いすることもでき、タイトルや強調箇所も調整できます

はじめに

マイクに向かってしゃべるだけで、自動的にブログ記事が完成してしまう——そんな夢のような方法を実際にやってみた様子をご紹介します。使うツールはWindowsの標準音声認識機能とChatGPTの2つだけです。論より証拠ということで、実際の手順を見ていきましょう。


ステップ1: Windowsの音声認識を起動する

Windowsには標準で音声認識機能が搭載されています。起動方法はとてもシンプルで、以下のショートカットキーを押すだけです。

Windows+H

このショートカットを押すと音声認識が起動し、話した内容がそのままテキストとして入力されます。あとは伝えたいことを自由にしゃべるだけです。

音声認識の精度について

現在の音声認識技術はかなり高い精度を持っていますが、完璧ではありません。話した内容が違う単語として認識されたり、一部が正しく拾えなかったりすることもあります。しかし、そこで心配する必要はありません。多少の誤認識があっても、次のステップでChatGPTが前後の文脈から意味を汲み取って修正してくれます。

また、しゃべりながら同じことを繰り返したり、「まあまあまあ」といった口癖が入ったりすることも気にしなくて大丈夫です。それらも含めてChatGPTがきれいに整理してくれます。


ステップ2: ChatGPTに渡すプロンプトを準備する

音声認識で取得したテキストをChatGPTに渡す際は、編集の方針を伝えるプロンプトを先頭に付けます。実際に使っているプロンプトの例を以下に示します。

Markdow調n

このプロンプトのポイントは、ChatGPTを「編集者」として位置づけているところです。要約ではなく編集をお願いすることで、しゃべった内容のエッセンスを残しつつ読みやすい文章に仕上げてもらえます。


ステップ3: ChatGPTに送信してブログ記事を生成する

プロンプトと音声認識テキストを合わせてChatGPTに送信すると、見出し付きのMarkdown形式でブログ記事が返ってきます。

実際に試した際、ダラダラとしゃべった音声認識テキストが以下のような構成の記事に変換されました。

  • タイトル
  • 導入文
  • 音声認識機能の説明
  • ChatGPTによる編集の役割
  • まとめ

GPT-4のほうが精度は高いですが、GPT-3.5(無料版)でも同様のことができます。


ステップ4: 対話形式で追加修正する

最初の出力に少し直したい部分があれば、そのまま会話を続けて修正をお願いできます。たとえば、タイトルや強調箇所を変更したい場合は以下のようにお願いします。

ChCahtaGtPG調TPT調Windows

このように普通の日本語でお願いするだけで、ChatGPTが意図をくみ取って書き直してくれます。


生成した記事をブログに貼り付ける

ChatGPTが出力するテキストはMarkdown形式なので、note.comなどのMarkdownに対応したブログサービスにそのままペーストするだけで、見出しや段落が整った状態で表示されます。

文字数が足りないと感じた場合は、「1000文字で出力してください」「1500文字で出力してください」のように具体的な文字数を指定して再生成してもらうこともできます。


プロンプトエンジニアリングについて

巷ではプロンプトのテンプレートやテクニックが数多く紹介されていますが、普通に日本語でお願いするだけでも十分に動作します。「ステップバイステップで考えてください」のような特定の表現がモデルの性能を引き出すことは論文でも証明されており、有効な場面があることは事実です。しかし、一般的な用途であれば特別な勉強をしなくても直感的にお願いするだけで使えるというのが実感です。

なお、英語でプロンプトを書いたほうがわずかに性能が向上するとも言われていますが、日本語でも十分実用的なレベルで動作します。


まとめ

音声認識とChatGPTを組み合わせることで、しゃべるだけでブログ記事を爆速で作成できます。手順をまとめると以下のとおりです。

  1. Windows キー + H で音声認識を起動し、書きたい内容をしゃべる
  2. 音声認識されたテキストをコピーする
  3. 編集用プロンプトの後ろにテキストを貼り付けてChatGPTに送信する
  4. 返ってきたMarkdown形式の記事をブログサービスに貼り付ける
  5. 必要であれば対話形式で追加修正する

多少の誤認識や話の重複があっても、ChatGPTが文脈を読み取って整理してくれます。ブログ執筆のハードルを大きく下げてくれる方法ですので、ぜひ試してみてください。