仕事で渡されたPDFやスライドに、複雑なグラフや図解が載っていて困ったことはありませんか?文字であればコピーして検索できますが、画像の中にある数値や図の流れを一つひとつ読み解くのは骨が折れる作業です。
GoogleのAIツール「NotebookLM」を使えば、こうした視覚的な情報もテキストと同じように読み取ることができます。この記事では、NotebookLMがグラフの数値をどこまで正確に把握できるのか、その精度や使い方のコツを実ユーザーの視点で解説します。
NotebookLMが図解やグラフを理解する仕組み
そもそも、なぜAIが画像であるグラフの内容を理解できるのでしょうか?その秘密は、NotebookLMの土台となっている技術にあります。
Gemini 1.5 Proのマルチモーダル機能
NotebookLMには「Gemini 1.5 Pro」という最新のAIモデルが搭載されています。このモデルは「マルチモーダル」と呼ばれ、文字だけでなく画像や音声も同時に処理できるのが大きな強みです。
これまでのAIは、画像を一度文字に変換(OCR)してから内容を理解していましたが、Geminiは画像を「見たまま」理解できます。そのため、グラフの形や色の違い、図解の中にある矢印の向きなども、人間と同じように捉えることが可能です。
テキストと画像を同時に処理するメリット
図解の中には、図のすぐ横に重要な注釈が書いてあることも多いですよね?マルチモーダルなNotebookLMは、図の内容と周りの説明文をセットで分析します。
これにより「このグラフの赤色の線は何を指しているのか」といった、図と文章を組み合わせないと分からない複雑な内容も、的確に読み取れるようになります。
PDFやスライド内の視覚情報を読み取るプロセス
NotebookLMにPDFやGoogleスライドを読み込ませると、AIは自動的に全ページをスキャンします。画像単体のアップロードには対応していませんが、資料の一部として貼り付けられていれば認識の対象です。
解析の流れ
- 資料内の画像の位置を特定する。
- 画像がグラフなのか、フローチャートなのかを判別する。
- 軸のラベル、凡例、数値を読み取る。
- 周りのテキストと照らし合わせて、情報の整合性を確認する。
NotebookLMで読み取り可能な図表の種類
実際にどんな図表であれば読み取ってくれるのか、具体的に見ていきましょう。
棒グラフや折れ線グラフなどの数値データ
もっとも得意なのは、数値を視覚化したグラフです。棒グラフの高さや折れ線グラフの推移を読み取り、大まかな数値や成長率を計算してくれます。
例えば、売上推移のグラフから「2023年から2024年にかけてどれくらい伸びた?」と聞けば、グラフの形から数値を読み取って回答してくれます。
フローチャートや概念図といった構造図
業務フローや組織図など、要素が線でつながっている図解も得意分野です。どの工程の次に何が来るのか、誰が誰に報告するのかといった「関係性」を言葉で説明してくれます。
読み取れる構造の例
- システム構成図のサーバーのつながり
- マーケティングのカスタマージャーニーマップ
- 法令の適用範囲を示すベン図
地図やインフォグラフィックに含まれる情報
地域のデータを示した地図や、イラストと数字を組み合わせたインフォグラフィックも解析できます。地図上の色の濃淡が何を意味しているのかを読み取り、地域ごとの特徴をまとめてくれます。
ただし、あまりにデザイン性が高すぎて文字が歪んでいるような図解は、読み取りをミスすることがあるので注意が必要です。
グラフ内の数値はどこまで正確に把握できるのか
読者の皆さんが一番気になるのは「AIの読み取った数値が本当に合っているのか」という点ではないでしょうか?
表形式データ(テーブル)の読み取り精度
資料の中に「表(テーブル)」として数値が並んでいる場合、その精度は極めて高いです。AIは表の行と列を正確に把握できるため、数値の書き間違いはほとんど起こりません。
数値を正確に抜き出したいのであれば、グラフそのものよりも、その根拠となっている表が資料内に含まれている方が有利です。
グラフの目盛りから数値を推測する際の誤差
一方で、表がなく「グラフの絵」しかない場合、AIは目盛りから数値を推測します。このとき、数パーセント程度の誤差が生じることがあります。
例えば、グラフ上では「105」に見える点が、AIの判断で「103」や「107」と出力される可能性があります。
なぜ誤差が出るのでしょうか?
AIはピクセル単位で位置を測定していますが、人間が定規を当てるのと同様に、微妙な読み取りのズレが発生するためです。
複雑な多軸グラフや極小フォントの限界
複数の軸があるグラフや、注釈の文字が米粒のように小さい場合は、読み取りの限界に達することがあります。
| 項目 | 読み取りの正確性 | 理由 |
| テキストの表 | ◎(ほぼ正確) | 行列の構造をデータとして認識できるため |
| 単純な棒グラフ | ◯(高い) | 高低差がはっきりしており、軸との対照が容易 |
| 複雑な折れ線 | △(誤差あり) | 線が重なり合うと、どれがどのデータか混同する |
| 極小文字の注釈 | ×(困難) | 画質が足りないと文字を判別できない |
資料内の図解を正確に読み取らせるコツ
AIに丸投げするのではなく、少し工夫して質問を投げるだけで、回答の精度は劇的に上がります。
グラフの軸や単位を明示的に質問する
ただ「グラフの内容を教えて」と聞くのではなく、要素を指定して質問しましょう。
「縦軸の単位は何ですか?」や「凡例の青色の線は何を表していますか?」と先に確認させることで、AIが図解のルールを正しく理解し、その後の回答ミスを防げます。
解析したい範囲を絞って指示を出す
ページ数が多い資料の場合、AIが別のグラフと混同してしまうことがあります。
質問の仕方の例
- 「5ページの左上にある円グラフについて教えてください」
- 「2024年度の決算ハイライトの図解だけを要約して」
このように、場所を具体的に指定することで、AIの「視線」を正しい場所へ誘導できます。
複数の図表を比較させて傾向を導き出す
NotebookLMの強みは、複数のソースをまたいで分析できることです。
「1ページのグラフと3ページの表で、数値に矛盾はありませんか?」と聞いてみてください。AIがそれぞれの図表を突き合わせ、情報の整合性をチェックしてくれます。
図解の読み取りに失敗する原因と対策
うまく読み取ってくれない時は、資料側に原因があるかもしれません。
画像の解像度が低く文字が潰れている場合
PDFに貼り付けられた画像が粗いと、AIも文字を判別できません。
スマホで撮影した書類の画像などは特に注意が必要です。
対策として、可能であればスキャナで取り込み直すか、スクリーンショットを撮り直して画質を上げた状態でスライドに貼り直してみましょう。
背景色と文字色のコントラストが弱いケース
おしゃれなデザインの資料によくある「薄いグレーの背景に白い文字」といった組み合わせは、AIにとって非常に読みにくいものです。
読み取れない時のサイン
- 「資料内に該当するデータが見当たりません」と回答される。
- 全く関係のない数値を答えてしまう。
- 図があること自体を無視される。
読み取れない時の代替案
どうしても読み取れない場合は、その図解の内容を自分で2〜3行のテキストにしてメモ(ソース)として追加しましょう。
「図1:2023年の売上は1億円」と書いておけば、AIはそのメモを優先して参照し、他の分析と組み合わせてくれます。
決算資料や論文で活用する具体的なメリット
実務では、NotebookLMの図解分析能力をどのように活かせるのでしょうか。
数年分の業績グラフから成長率を算出
決算資料には、数年分の推移グラフがよく載っています。これを一つひとつ手で計算するのは面倒ですよね。
NotebookLMに「過去5年間の売上高をグラフから読み取って、平均成長率を計算して」と頼めば、データの抽出から計算までを一気に終わらせることができます。
複雑なモデル図を一瞬でテキスト要約
学術論文や技術資料にある、複雑なシステム構成図やアルゴリズムのフロー。これらを読み解くには時間がかかります。
「この図解に登場する各要素の役割と、データの流れる順番を箇条書きで教えて」と指示すれば、難解な図もあっという間に理解可能なテキストに変わります。
複数のスライドから関連する図表を抽出
100ページを超えるようなスライドの中から、特定のテーマに関する図だけを探し出すのは大変です。
「『二酸化炭素排出量』に関するグラフが載っているページをすべてリストアップして、それぞれの要点をまとめて」と指示することで、必要な情報へのアクセススピードが格段に上がります。
数値の正確性を担保するためのチェック方法
AIは便利ですが、最後は人間の目による確認が不可欠です。
出典リンクを活用した原本確認
NotebookLMの回答には、必ずソースへのリンク(シークレット)が表示されます。
数値が含まれる回答があったら、必ずその横にあるリンクをクリックしてください。
資料のどの部分を見てその数値を導き出したのかがハイライトされるため、目視での確認が数秒で完了します。
重要な数値は「要約」ではなく「抽出」させる
「要約して」と頼むと、AIが計算しやすいように数値を丸めてしまう(例:1,048円を1,000円とする)ことがあります。
正確な数値を出すためのプロンプト例
資料の3ページにあるグラフから、各月の数値を1円単位で正確に書き出してください。
推測が含まれる場合は、その旨を明記してください。
このように、指示を具体的にすることで、AIの勝手な判断を抑えることができます。
AIの回答と目視を組み合わせたダブルチェック
最も安全な運用は「AIに下書きをさせ、人間が清書する」という形です。
AIに数値をリストアップさせ、自分は原本を見ながらその数値が正しいかをチェックする。
ゼロから自分で数値を拾うよりも、この「確認作業」に徹する方が、ミスを防ぎつつ時間を短縮できます。
| チェック項目 | 確認のポイント |
| 出典リンク | 回答の根拠となった画像やページと一致しているか |
| 単位のミス | 「百万」や「千」などの単位を読み飛ばしていないか |
| 推測の有無 | グラフから無理やり読み取った「もっともらしい数字」ではないか |
まとめ:NotebookLMで視覚情報を効率よくデータ化しよう
NotebookLMは、これまで「見る」しかなかった図解やグラフを、活用可能な「データ」に変えてくれる強力なツールです。Gemini 1.5 Proのマルチモーダル機能により、資料内の複雑な視覚情報もかなりの精度で読み取れるようになりました。
ただし、グラフの目盛りから数値を読み取る際には、わずかな誤差が出る可能性があることも忘れてはいけません。出典リンクをこまめに確認し、重要な数値はプロンプトで工夫して抽出させることで、情報の正確さをしっかりと守りましょう。
まずは手元にある、図解だらけで読み飛ばしていたPDFをNotebookLMに放り込んでみてください。これまで気づかなかった新しい発見があるかもしれませんよ。

