GAS×AIで定型業務を秒速化——議事録5分→30秒の自動化フロー全公開
これまでは動画編集ソフトで手動作成していた議事録。GASとGemini/Whisperを連携させ、完全に「手放し」で運用するための構築記。
課題:毎週3時間消える「議事録地獄」と、これまでの限界
総務部2人体制(実質DX担当は私ひとり)の環境では、各部署からの議事録作成依頼が絶えません。これまでは以下のフローで対応していました。
- 会議を録画・録音
- PowerDirector に読み込ませ、自動文字起こし機能を回す
- ChatGPT にコピペし、専門用語の修正や補足説明を加えて整形
- PowerPoint 資料として手動でレイアウトを整える
この方法でも十分効率化できていましたが、どうしても「手作業でのコピペ」や「ソフトの立ち上げ」といった、自分の手が拘束される時間が週に3〜4時間発生していました。
解決策:GAS + Gemini + Whisper の全自動パイプライン
「ソフトを操作する時間」すらゼロにするため、現在構築を進めているのが以下のフローです。
録音データ (Driveへ保存)
↓ GASが検知 → Whisper API(文字起こし)
↓ Gemini API(要約・専門用語の補足・構造化)
↓ Google Docs / PPT(テンプレートに自動流し込み)
↓ Gmail / Slack(関係者に自動送信)
GASがこれらをすべて裏側でつなぐため、自分は「録音ファイルをDriveに放り込むだけ」で完結します。
実装の核心:専門用語を逃さない「補足修正プロンプト」
これまでの運用経験から、AIに丸投げすると「社内用語」や「専門用語」でミスが起きやすいことがわかっています。そこで、Gemini APIには以下の「専門用語補完型」のプロンプトを渡しています。
# 指示
以下の会議の文字起こしを、専門用語を適切に補足しながら議事録形式に変換してください。
# 専門用語・背景知識の補足
- [プロジェクトA]:来期導入予定の基幹システムの呼称
- [GAS]:Google Apps Scriptの略。自動化ツールとして使用
- [社内規定12条]:福利厚生に関する規定
# 出力フォーマット
**会議の目的**: [1文で要約]
**決定事項**:
- (箇条書き)
**アクションアイテム**:
| 担当者 | タスク | 期限 |
|--------|--------|------|
**議論の要点**: [200字以内]
自動化の成果(予測含む)
| 作業工程 | 以前(PowerDirector併用) | 自動化後(GAS×AI) |
|---|---|---|
| 文字起こし | 20〜30分(PC拘束) | 3分(バックグラウンド) |
| 要約・修正 | 15分(手動コピペ) | 自動(Gemini) |
| 資料化(PPT) | 20分(手動レイアウト) | 自動(GAS流し込み) |
| 合計 | 約60分/回 | 5分(最終確認のみ) |
これにより、月換算で**約12〜16時間の「自分の時間」**を取り戻せる計算です。
ハマったポイントと対策
1. Whisper×GASの確実性
実は「Whisper×GAS」の連携は、まだ誰もが簡単に使えるほど情報の鮮度が高くありません。現在、**「エラーが出ずに確実に動くプロンプトとコード」**を検証中です。安定性が確認でき次第、このブログで全コードを公開する予定です。
2. GASのタイムアウト問題(6分の壁)
長時間の会議ファイルをWhisperに投げると、処理時間がGASの制限(6分)を超えてしまいます。
- 対策: ファイルを10分ごとに分割してAPIに投げる、または完了を待たずにトリガーでリレー形式に処理する設計が必要です。
まとめ
これまでの「便利なソフトを使い分ける」フェーズから、「システム同士を連携させて自分の手を離す」フェーズへ。
以前はChatGPTに1行ずつ聞きながら数週間かけて作っていた仕組みも、今は Claude Code を併走させることで、数時間でプロトタイプが完成します。ツールに使われるのではなく、AIを「部下」として組織化する感覚が、これからの総務には求められていると感じます。
次回予告: 検証が完了次第、**「そのままコピーして使える!Whisper×GAS連携スクリプト」**も公開予定です。ご期待ください。