📊 総務部2人体制(実質DX担当は1人)#GAS#自動化#議事録#Gemini#Whisper

GAS×AIで定型業務を秒速化——議事録5分→30秒の自動化フロー全公開

by ソラ12分
使用AI:Gemini APIGoogle Apps ScriptWhisper

これまでは動画編集ソフトで手動作成していた議事録。GASとGemini/Whisperを連携させ、完全に「手放し」で運用するための構築記。

課題:毎週3時間消える「議事録地獄」と、これまでの限界

総務部2人体制(実質DX担当は私ひとり)の環境では、各部署からの議事録作成依頼が絶えません。これまでは以下のフローで対応していました。

  1. 会議を録画・録音
  2. PowerDirector に読み込ませ、自動文字起こし機能を回す
  3. ChatGPT にコピペし、専門用語の修正や補足説明を加えて整形
  4. PowerPoint 資料として手動でレイアウトを整える

この方法でも十分効率化できていましたが、どうしても「手作業でのコピペ」や「ソフトの立ち上げ」といった、自分の手が拘束される時間が週に3〜4時間発生していました。

解決策:GAS + Gemini + Whisper の全自動パイプライン

「ソフトを操作する時間」すらゼロにするため、現在構築を進めているのが以下のフローです。

録音データ (Driveへ保存)
  ↓ GASが検知 → Whisper API(文字起こし)
  ↓ Gemini API(要約・専門用語の補足・構造化)
  ↓ Google Docs / PPT(テンプレートに自動流し込み)
  ↓ Gmail / Slack(関係者に自動送信)

GASがこれらをすべて裏側でつなぐため、自分は「録音ファイルをDriveに放り込むだけ」で完結します。

実装の核心:専門用語を逃さない「補足修正プロンプト」

これまでの運用経験から、AIに丸投げすると「社内用語」や「専門用語」でミスが起きやすいことがわかっています。そこで、Gemini APIには以下の「専門用語補完型」のプロンプトを渡しています。

# 指示
以下の会議の文字起こしを、専門用語を適切に補足しながら議事録形式に変換してください。

# 専門用語・背景知識の補足
- [プロジェクトA]:来期導入予定の基幹システムの呼称
- [GAS]:Google Apps Scriptの略。自動化ツールとして使用
- [社内規定12条]:福利厚生に関する規定

# 出力フォーマット
**会議の目的**: [1文で要約]
**決定事項**:
- (箇条書き)
**アクションアイテム**:

| 担当者 | タスク | 期限 |
|--------|--------|------|

**議論の要点**: [200字以内]

自動化の成果(予測含む)

作業工程以前(PowerDirector併用)自動化後(GAS×AI)
文字起こし20〜30分(PC拘束)3分(バックグラウンド)
要約・修正15分(手動コピペ)自動(Gemini)
資料化(PPT)20分(手動レイアウト)自動(GAS流し込み)
合計約60分/回5分(最終確認のみ)

これにより、月換算で**約12〜16時間の「自分の時間」**を取り戻せる計算です。

ハマったポイントと対策

1. Whisper×GASの確実性

実は「Whisper×GAS」の連携は、まだ誰もが簡単に使えるほど情報の鮮度が高くありません。現在、**「エラーが出ずに確実に動くプロンプトとコード」**を検証中です。安定性が確認でき次第、このブログで全コードを公開する予定です。

2. GASのタイムアウト問題(6分の壁)

長時間の会議ファイルをWhisperに投げると、処理時間がGASの制限(6分)を超えてしまいます。

  • 対策: ファイルを10分ごとに分割してAPIに投げる、または完了を待たずにトリガーでリレー形式に処理する設計が必要です。

まとめ

これまでの「便利なソフトを使い分ける」フェーズから、「システム同士を連携させて自分の手を離す」フェーズへ。

以前はChatGPTに1行ずつ聞きながら数週間かけて作っていた仕組みも、今は Claude Code を併走させることで、数時間でプロトタイプが完成します。ツールに使われるのではなく、AIを「部下」として組織化する感覚が、これからの総務には求められていると感じます。

次回予告: 検証が完了次第、**「そのままコピーして使える!Whisper×GAS連携スクリプト」**も公開予定です。ご期待ください。