📊 個人プロジェクト#Gemini#学習データ#Claude Code#パーソナライズ

Gemini 1年分の会話履歴を学習データ化——Claude Codeで「自分専用AI」を育てる実験

by ソラ10分
使用AI:Gemini (Google Takeout)Claude Code (Data Cleaning/Structuring)

Google TakeoutでGemini(旧Bard)の1年分のチャット履歴を抽出し、Claude Codeで整形・構造化。個人の思考パターンをAIに学習させるパーソナライズ実験の記録。

Google Takeoutを使って、Gemini(旧Bard)と交わした1年分のチャット履歴を抽出しました。その膨大なデータをClaude Codeで整形・構造化し、自分だけの「思考の癖」をAIに学習させるためのパーソナライズ用データを作成するまでのプロセスをご紹介します。

きっかけ:「AIに自分を知ってほしい」

AIとの日々が日常になるにつれ、AIに「自分」のことをより深く知ってもらい、指示を出すたびに自分について繰り返し説明する手間を省きたい、という想いが募っていました。

そこで、1年間分の対話データを抽出し、自分自身の思考プロセスやよく使う言葉、得意・不得意な領域をAIに読み込ませることで、「阿吽の呼吸」でやり取りができるパーソナライズ環境を作れるのではないか?と考えました。

Step 1:Google Takeoutでデータ抽出

まず、Google Takeoutで「Gemini」のデータをエクスポートしました。

  • データの形式:HTML形式
  • キャプチャ範囲:2025年3月から2026年3月までの1年間
  • データ容量:数メガバイト(1年以上分だとかなりの量になります)

エクスポートされたデータは、やり取りごとにHTMLファイルに分かれており、そのままではAIの学習データとしては扱いにくい状態でした。

Step 2:Claude Codeでデータ整形

抽出したHTMLデータを、最新のAI開発エージェントである「Claude Code」を使って、構造化されたJSONやMarkdown形式へと変換しました。

Claude Codeへの指示:

「この数千件のHTMLファイルを読み込み、ユーザーの質問内容とAIの回答をペアにして、日付・トピックごとのJSONファイルを作成してください。」

Claude Codeは、その圧倒的なコンテキスト読み込み能力で、不規則なHTML構造を正確に解析し、数分で綺麗な学習データ作り上げました。

Step 3:分析——自分の思考パターンを可視化

構造化したデータを使って、自分がAIに対してどのような質問を投げかけているのかを分析しました。

質問パターンの分析結果

カテゴリ割合主なテーマ
業務効率化38%自動化・業務フロー改善
AI活用29%プロンプト最適化・新ツール調査
技術学習18%Next.js・Python・GAS
ガジェット10%スペック比較・購入相談
その他5%雑談・アイデア出し

発見:自分の「AI活用スタイル」

分析を通じて気づいた自分の特徴:

  • 具体的な数値を好む (「時短できる」より「月20時間削減できる」と聞きたい)
  • 実務への応用を常に意識 (理論より実践例を求める傾向)
  • 失敗事例に強い関心 (成功例より「何がうまくいかなかったか」を重視)

Step 4:パーソナライズプロンプトの作成

分析結果を元に、AIとの会話開始時に使う「自己紹介プロンプト」を作りました。

【私のプロフィール(AIへの事前情報)】
職業:現役総務部長(部内2人体制・実質DX担当は自分ひとり)
専門:AI活用・業務自動化・バックオフィス最適化
思考スタイル:
- 数値による効果検証を重視
- 実務での再現性を最優先
- 失敗事例から学ぶことを好む
よく使う業務:GAS・Python・Next.js・Claude Code
現在の課題:[その日の課題をここに入力]

このプロンプトを会話の冒頭に置くと、AIの回答精度が体感で大幅に向上しました。

まとめと今後の展望

AIとの会話履歴は「自分の思考の鏡」です。

HTMLからJSONへ、そして分析へと進めることで、自分が何に時間を使い、何に迷っているかが見えてきます。今後は、この構造化したデータをRAG(検索拡張生成)の一部として組み込み、さらにシームレスな「自分専用AI」へと進化させていきたいと考えています。