AppSheet (アップシート) と Google の生成AI「 Gemini 」を活用した AI OCR の実証実験レポートです。GAS × Gemini API 連携と Gemini in AppSheet Solutions(AI task)の2つの方法で、請求書・レシート・名刺の読み取り精度、処理速度、コストパフォーマンスを徹底比較しました。各20サンプルを使用した定量的な評価の結果、GAS連携では平均97.5〜98点、AI taskでは平均94.25〜97.5点の高精度を記録しました。実験データに基づく詳細分析とエラーパターンの考察、それぞれの推奨ケースまで包括的に解説しています。
本ブログ記事及びサンプルデータの著作権は、当社に帰属します。AppSheetを学習する目的での個人使用を除き、無断での複製、転載、改変、翻案、公衆送信等の利用を禁止します。詳細は、ウェブサイト利用規約をご確認ください。
目次
1. AppSheet で実現する AI OCR - 2つの方法を徹底比較
AppSheet でAI OCRを実行し、請求書情報、レシート情報、名刺を読み取って、データ化する実験を行いました。
AppSheet では、以下の2つの方法でAI OCRができます。
- GAS × Gemini API連携:Automation から Google Apps Script(GAS)を呼び出して、GAS から API 経由で Gemini にファイルや画像を送信し、情報を抽出する方法
- Gemini in AppSheet Solutions(AI task):2025年6月30日に正式リリース(GA)された「Gemini in AppSheet Solutions」の機能で、Automation から AI task を使用して情報を抽出する
結論を先にお伝えすると、コストと精度を重視するなら「GAS × Gemini API連携」、ノーコードを重視するなら「Gemini in AppSheet Solutions(AI task)」がおすすめです。以下が実験結果のサマリーです。
実験結果サマリー
GAS × Gemini API | AppSheet AI task | |
---|---|---|
精度 | 97.5 〜 98 点 | 94.25 〜 97.5 点 |
速度 | 12 秒 | 16 〜 18秒 |
コスト | 無料枠内 | 月額 2,496円〜 |
難易度 | GAS開発必要 | ノーコード |
2. AppSheet アプリの構築方法 - 2つのアプローチ
1. GAS × Gemini API 連携で AppSheet アプリを構築
GAS(Google Apps Script)とは、Googleが提供するクラウドベースのプログラミング環境です。JavaScriptでコードを書いて、様々なGoogle サービスと連携できます。また、Gemini API とは、Google の生成AI「Gemini」をプログラムから利用できるサービスです。今回は、GAS から Gemini API を呼び出して、請求書ファイルやレシート・名刺画像を送信し、情報を抽出するアプリを作成しました。
アプリの構築手順は以下の通りです。
はじめに、後述する採点基準の項目を列とする請求書、レシート、名刺の各テーブルを持つアプリを作成します。
Automationを作成し、以下のように設定します。
請求書は請求書ファイルを追加または更新した時、レシートと名刺はスマホアプリで撮影して追加または更新した時をトリガとするEventを設定します。
Stepを追加して、Call a scriptタスクから、Gemini API との連携プログラムを記述したGASプロジェクトを呼び出し、Gemini APIの実行結果を戻り値として受け取ります。
Stepを追加して、GASの戻り値をテーブルに保存します。
2. AppSheet Enterprise Plus で Gemini in AppSheet Solutions(AI task)を活用
Gemini in AppSheet Solutions(AI task)を使用するためには、AppSheet Enterprise Plus ライセンスが必要です。AppSheet Enterprise Plus ライセンスは、AppSheetの上位プランで、Automation からノーコードでAI機能が利用できます。
Gemini in AppSheet Solutions(AI task)利用条件
- Google Workspaceの有料プラン契約
- AppSheet Enterprise Plusライセンス購入(月額2,496円〜)
GAS × Gemini API 連携と同様にアプリを作成します。Automationを作成し、Eventは GAS × Gemini API 連携と同様に設定します。
Stepを以下のように設定します。
- AI task:Extract
- Extract(抽出)とCategory(分類)があるが、今回は情報の抽出が目的なので「Extract」を選択します。
- Input column:請求書ファイルを保存する列(File型)、レシートと名刺はスマホで撮影した画像を保存する列(Image型)をプルダウンから選択します。
- Output:Save to table
- Add:採点基準の項目列を「Add」で追加します。
- Additional instructions:プロンプトを記述します。
3. AppSheet での AI OCR 比較実験 - 検証条件の設定
GAS × Gemini API連携とGemini in AppSheet Solutions(AI task)の実験条件は以下の通りです。
実験条件の詳細
GAS × Gemini API連携 | Gemini in AppSheet Solutions(AI task) | |
---|---|---|
AppSheetライセンス | AppSheet Core | AppSheet Enterprise Plus |
追加料金 | Google Workspace有料契約している場合は、追加料金なし | AppSheet Enterprise Plusライセンスを追加(1ユーザー月額2,496円) |
Geminiモデル | Gemini 2.0 flash | 不明(非公開) |
Gemini追加料金 | 無料枠内 | AppSheet Enterprise Plus 1ライセンスに付与される1,000クレジット(月間)の範囲内 |
請求書 | 20社分の請求書を共通で使用(20社の様式は全て異なり、サンプルNoを1から20まで付与) | |
レシート | 20枚のレシートを共通で使用(20枚の様式は全て異なり、サンプルNoを1から20まで付与) | |
名刺 | 20名分の名刺を共通で使用(20名はすべて異なる所属で、サンプルNoを1から20まで付与) | |
プロンプト | 請求書用、レシート用、名刺用にアプリスイートが作成した同じプロンプトを共通で使用 |
AppSheetライセンスの違いについて
GAS × Gemini API連携は、AppSheet Coreライセンスでできるため、Google Workspace の Business か Enterprise エディション(有料プラン)を契約していれば追加料金は不要です。
Gemini in AppSheet Solutions(AI task)は、AppSheet Enterprise Plus ライセンスが必須です。フレキシブルプランだと1ユーザーあたり月額2,496円、年間/定期プランだと1ユーザーあたり年額24,960円(月額2,080円)が追加料金として必要です。
Geminiモデルの選択
GAS × Gemini API連携には、Gemini 2.0 flashを使用しました。Gemini 2.0 flash は無料枠が多くとられているため、今回の実験は無料枠の範囲内でできました。
Gemini in AppSheet Solutions(AI task)で使用されている Gemini モデルは非公開のため不明としました。Gemini in AppSheet Solutions(AI task)では、Automation で AI task を実行する度に、クレジットを消費します。クレジットは、AppSheet Enterprise Plus ライセンスを購入すると、1ユーザーあたり月間1,000クレジットが付与されます。今回の実験は、1,000クレジットの範囲内で行ったため追加料金は支払っていません。AI task を実行していき、1,000クレジットを超えると、ライセンスを追加で購入する必要があります。
使用した素材とプロンプトについて
実験で使用した請求書、レシート、名刺はそれぞれ20枚用意し、結果を比較できるように、GAS × Gemini API連携とGemini in AppSheet Solutions(AI task)で同じものを共通で使用しました。
また、用意した請求書、レシート、名刺は、20枚とも様式がそれぞれ異なるものとし、難易度を分散させることにより、実用に近い形で読み取り精度を測定するようにしました。
Geminiに与えるプロンプト(指示文)は、アプリスイートで作成したものを共通で使用しました。プロンプトは、請求書用、レシート用、名刺用にそれぞれ最適化されています。2024年11月に、Gemini 1.5 Pro を使用してGAS × Gemini API連携をテストした際に、後述する採点基準で読み取り結果を採点し、平均で90点以上を記録した実績があるプロンプトなので、今回もこのプロンプトを採用しました。
GAS × Gemini API 連携で使用したGASのコードも、アプリスイートが請求書用、レシート用、名刺用にそれぞれ開発したものを使用しました。このコードも、2024年11月の Gemini 1.5 Pro のテストで使用したコードで、Gemini API の実行と結果の処理に最適化されています。
4. AppSheet での AI OCR 精度評価 - 採点基準の設定
請求書、レシート、名刺の読み取り結果について、それぞれの採点基準は以下の通りです。
例えば、以下の例のように項目がそもそも存在しない場合は、プロンプトで空欄で出力するように指示しており、正しく空欄で出力された場合は正解扱いとなります:
- 海外法人の請求書やレシートで適格請求書の登録番号が存在しない場合は空欄を出力すれば正解とする
- 名刺に記載する情報には決まりがないので、採点基準項目が存在しない場合は空欄を出力すれば正解とする
請求書とレシートの適用については、明細欄に記載されている商品名やサービス名を過不足なく抽出できれば正解とします。必ずしも全ての情報を抜き出す必要はなく100字以内に要約します。例えば、購入した商品・サービスが2つあるにも関わらず、1つしか抽出できなかった場合は減点対象とします。
請求書情報の採点基準
項目 | 採点基準 | 配点 |
---|---|---|
請求日 | 請求日の日付を正確に抽出すれば正解 | 20 |
請求元企業名 | 請求元企業の正式名称を正確に抽出すれば正解 | 20 |
請求金額と通貨 | 請求金額と通貨(JPY、USD等)を正確に抽出すれば正解 | 20 |
登録番号 | 適格請求書の登録番号を正確に抽出すれば正解 | 20 |
適用 | 商品名やサービス名を100字以内に要約する
|
20 |
レシート情報の採点基準
項目 | 採点基準 | 配点 |
---|---|---|
支払日 | 支払日の日付を正確に抽出すれば正解 | 20 |
支払先 | 支払先の企業名及び店舗名を正確に抽出すれば正解 | 20 |
支払金額合計 | 支払金額の合計(税込)を正確に抽出すれば正解 | 20 |
登録番号 | 適格請求書の登録番号を正確に抽出すれば正解 | 20 |
適用 | 購入した商品名やサービス名を100字以内に要約する
|
20 |
名刺情報の採点基準
項目 | 採点基準 | 配点 |
---|---|---|
氏名 | 日本語表記の氏名を正確に抽出すれば正解 | 10 |
会社名 | 正式な会社名を正確に抽出すれば正解 | 10 |
部署名 | 支店名と部署名を正確に抽出すれば正解 | 10 |
役職 | 役職を正確に抽出すれば正解 | 10 |
郵便番号 | 郵便番号を正確に抽出すれば正解 | 10 |
住所 | 住所を正確に抽出すれば正解 | 10 |
電話番号 | 会社電話番号(携帯番号を除外)を正確に抽出すれば正解 | 10 |
携帯電話番号 | 携帯番号を正確に抽出すれば正解 | 10 |
メールアドレス | 本人のメールアドレスを正確に抽出すれば正解 | 10 |
Webサイト | 会社WebサイトのURLを正確に抽出すれば正解 | 10 |
5. AppSheet での AI OCR 実験結果
実験結果の概要は以下の通りです。平均得点は、各サンプルについて採点基準に沿って採点し、20サンプルの平均を計算しました。平均時間は、Automation Monitorに記録されている「Execution Time (In seconds)」を各サンプルについて記録し、20サンプルの平均を計算しました。
読み取り結果:平均得点と平均時間
GAS × Gemini API連携 | Gemini in AppSheet Solutions(AI task) | |||
---|---|---|---|---|
平均得点 | 平均時間(秒) | 平均得点 | 平均時間(秒) | |
請求書 | 97.5 点 | 12.00 | 94.25 点 | 18.40 |
レシート | 98 点 | 12.30 | 94.5 点 | 16.10 |
名刺 | 98 点 | 12.25 | 97.5 点 | 16.30 |
GAS × Gemini API 連携 - Gemini 2.0 flash が高精度の読み取りを実現
まず、驚いたのは、Gemini 2.0 flash を使用したGAS × Gemini API 連携の読み取り精度の高さです。同じ flash モデルでも、2024年11月にテストした Gemini 1.5 flash とは比べものにならないほど高精度で、Gemini 1.5 Pro と比較しても 2.0 flash の方が優秀な結果を残しました。
Gemini モデル別に比較すると以下のようになります。
- Gemini 1.5 flash:平均 50 〜 60 点(実用レベル以下)
- Gemini 1.5 Pro:平均 90 点以上(無料枠が少ない)
- Gemini 2.0 flash:平均 97.5 〜 98 点(無料枠内で実現)
ただし、読み取り精度は100%ではないため、結果確認・修正機能の実装が必須です。それでも、修正箇所は1ヶ所程度なので、軽微な修正で済みます。
Gemini in AppSheet Solutions(AI task)も善戦
結果を比較すると、Gemini in AppSheet Solutions(AI task)も意外と善戦しました。GAS × Gemini API 連携と性能を比較すると以下のようになりました。
- 精度:GAS × Gemini API 連携より 0.5 〜 3.5 点低い程度
- 速度:3.8 〜 6.4 秒遅い
- 総合評価:実用レベルに十分達している
AI task で使用している Gemini のモデルは非公表のため不明ですが、結果から推察すると、2.0 flash と同等か若干劣る程度だと思われます。1.5 flash は言うまでもなく、1.5 Pro よりも優れた能力を持っているように見えます。
一つ注意しなければいけないのは、ファイルや画像のサイズです。今回の実験では、4.4MBの請求書PDFを送信した時にファイルサイズ超過でエラーとなり読み取りができませんでした("TaskStatusDescription":"Size of the input to AI Task exceeded the limits set")。
アップロードする画像サイズは、アプリエディタ左側メニュー「Settings」をクリックし、ナビゲーションで Views > General を選択します。Inputs 設定パネルの「Input upload size」を「Default」にしておくとよいでしょう。
この設定を「Full」にすると画像サイズが4MBを超えることがあるので注意しましょう。画像サイズは大きければ読み取り精度が高くなるわけではないので、「Default」で問題ありません。
6. AppSheet での AI OCR 詳細分析 - エラーパターンの考察
GAS × Gemini API連携の詳細結果
請求書読み取り結果
# | 減点箇所 | 詳細 | 原因の推測 |
---|---|---|---|
15 | 請求金額 | 米ドル請求の通貨単位を間違えた(抽出結果:¥、正解:$) | 通貨記号については「USD」等の記載がなく「$」だけだと間違う可能性がある |
16 | 請求元企業名 | 請求先と間違えた | 請求元企業名が様式の上部に記載されていない場合は、間違える可能性がある |
18 | 摘要 | 抽出内容が不十分 | 明細が表組でない、または、表組が複数ある場合は抽出が難しい |
#15と#16は、プロンプトで指示しているにも関わらずミスしているので、一定の確率でミスが起こると思った方がよいでしょう。#18は誤りがあるわけでなく概ね合っているので正解でも問題ないレベルです。
レシート読み取り結果
# | 減点箇所 | 詳細 | 原因の推測 |
---|---|---|---|
6 | 摘要 | ガソリンの給油量を抽出して欲しかった | 1つの商品が2段で表示されていると、1段目の情報のみ抽出する |
16 | 摘要 | 駐車場の駐車料金が抽出できなかった | 駐車料金の商品名「A料金」等は、他の情報(精算機No、発券機No、時刻等)と合わせて表示されている |
17 | 摘要 | 駐車場の駐車料金が抽出できなかった | 駐車料金の商品名「A料金」等は、他の情報(精算機No、発券機No、時刻等)と合わせて表示されている |
20 | 摘要 | 商品名以外の情報(値引き適用、レジNo)も抽出してしまった | 商品名とその他の情報が同じ表組に含まれている |
レシートに記載されている登録番号は文字が小さく、場所も様式によりまちまちなので読み取りが難しいと思いましたが、全問正解という優秀な結果でした。
#6はガソリンスタンドのレシートで給油量も抽出して欲しかったのですが、汎用的なプロンプトだと難しいため、車両管理アプリなどではガソリンスタンド専用のプロンプトにすればよいと思います。
名刺読み取り結果
# | 減点箇所 | 詳細 | 原因の推測 |
---|---|---|---|
9 | 電話番号 | 携帯電話番号と会社番号が混在している | 携帯電話番号には "TEL" の記載があるが、代表電話の番号にはなかった |
11 | WEBサイト | WEBサイトが名刺に記載されているが抽出できなかった | WEBサイトの記載がドメインのみ("https://"が省略されている) |
15 | 会社名 | 会社名が間違い(抽出結果:株式会社〇〇、正解:〇〇事務所) | 株式会社ではなく司法書士事務所だったため |
15 | 役職 | 役職が記載されているが正しく抽出できなかった | 役職の場所に事務所のキャッチコピーも混在していて紛らわしい |
#9は、プロンプトで指示している内容でしたが、Gemini 2.0 flashが誤動作を起こしたかのようなミスでした。このようなミスは一定の確率で起こりうるものです。
#15は、司法書士個人と事務所の情報が混在して記載されているため、読み取りが難しい事例でした。
Gemini in AppSheet Solutionsの詳細結果
請求書読み取り結果
# | 減点箇所 | 詳細 | 原因の推測 |
---|---|---|---|
1 | 請求日 | 日付を間違えた | "0"を"8"と間違えた |
3 | 適用 | 2行ある明細の1行目の商品しか抽出できなかった | 明細行内の文字数が多いため、プロンプトの指示(100字以内)に合わせて省略した |
5 | 請求元企業名 | 企業名が正しく抽出できなかった | 2行ある企業名の1行目だけを抽出した |
6 | 適用 | 明細から商品名を抽出できなかった | 明細が請求書の2頁に出現するため、見逃しまたは明細であると認識できなかった |
8 | 請求日 | 発行日を抽出した | 「取引日」を請求日として抽出して欲しかったが、プロンプトに指示がなかったため |
11 | 登録番号 | 登録番号を抽出したが、間違いがあった | 登録番号が社印と重なっており見にくかった |
18 | 適用 | 抽出内容が不十分 | 明細が表組でない、または、表組が複数ある場合は抽出が難しい |
情報が2行になっていたり、2頁にわたっている場合に、それぞれ1行目だけ、1頁だけの情報しか抽出できないという傾向がありました。
#1と#11は読み取りにくい箇所をそのまま読み間違いして出力したように見えました。
レシート読み取り結果
# | 減点箇所 | 詳細 | 原因の推測 |
---|---|---|---|
1 | 登録番号 | 登録番号を抽出できなかった | 不明 |
2 | 登録番号 | 登録番号を抽出できなかった | 不明 |
4 | 登録番号 | 登録番号を抽出できなかった | 不明 |
6 | 摘要 | ガソリンの給油量も拾って欲しかった | 1つの商品が2段で表示されている |
9 | 摘要 | 明細行が2行あるが、1行しか抽出していない | 明細行に記載されている商品名の文字数が多いため、プロンプトの指示(100字以内)に合わせた |
10 | 登録番号 | 登録番号を抽出したが、間違いがあった | 印刷が薄いレシート |
20 | 摘要 | 商品名以外の情報(値引き適用、レジNo)も拾ってしまった | 商品名とその他の情報が同じ表組に含まれている |
実験の前半(#1、#2、#4)で登録番号を抽出できないミスが続きましたが、特に文字が小さかったり、場所が分かりにくかったりしたわけではないので、一定の確率で起こるミスが前半に固まったのかもしれません。後半はミスなく登録番号を抽出できました。
登録番号のミスは痛かったですが、それ以外はGAS × Gemini API連携の結果と遜色なく、十分に評価できる結果でした。
名刺読み取り結果
# | 減点箇所 | 詳細 | 原因の推測 |
---|---|---|---|
2 | 部署名 | 部署名が正しく抽出できなかった | 部署名が2行になっており、下の行だけ抽出した |
11 | WEBサイト | WEBサイトが名刺に記載されているが抽出できなかった | WEBサイトの記載がドメインのみ("https://"が省略されている) |
15 | 会社名 | 会社名が間違い(抽出結果:株式会社〇〇、正解:〇〇事務所) | 株式会社ではなく司法書士事務所だったため |
15 | 役職 | 役職が記載されているが正しく抽出できなかった | 役職の場所に事務所のキャッチコピーも混在していて紛らわしい |
15 | WEBサイト | 会社のWEBサイトではなく個人のブログサイトのURLを抽出した | 個人のブログサイトがメインの場所に表示されているため |
Gemini in AppSheet Solutions(AI task)は、情報が2行になっている場合に、2行目を抽出しないことがある傾向が見られました。
#15は、GAS × Gemini API連携と同様に、司法書士個人と事務所の情報が混在して記載されているため読み取りが難しく大幅に減点されましたが、全体としては、GAS × Gemini API連携の結果と遜色ない結果でした。
7. AppSheet での AI OCR 総合評価 - どちらがおすすめ?
1. 読み取り精度の比較
読み取り精度は、Gemini 2.0 flashを使用したGAS × Gemini API連携が若干上回りますが、Gemini in AppSheet Solutions(AI task)も遜色なく実用に耐えうるレベルです。
生成AIを使用したOCRでは、一定の確率で読み取りミスが起こり、発生確率は、GAS × Gemini API連携とGemini in AppSheet Solutions(AI task)でそれほど差がないように見えます。
読み取りミスに備えて、簡易に修正できるようにアクションを工夫するとよいでしょう。
2. 処理速度の比較
平均時間は、GAS × Gemini API連携がGemini in AppSheet Solutions(AI task)よりも、約20〜30%高速であり、明確な差がありました。
GAS × Gemini API連携といえど平均で12秒かかるため、専用のレシート読み取りアプリや名刺読み取りアプリと比較すると遅いことには変わりありません。スピードを求めるなら専用システムを導入した方がよいでしょう。
3. コストパフォーマンスの比較
GAS × Gemini API連携のコスト
Gemini 2.0 flashの無料枠の範囲内ですべての実験を行い、追加で料金を支払っていません。
実際にはファイルや画像をGoogleドライブにアップロードする時間、結果を確認する時間などがかかるため、個人で作業する分には短時間で大量の読み取りは不可能でしょう。
使用トークン数は、Gemini 1.5モデルより増えており、入力トークン数は倍増していますが、それでもPDFファイル1枚や画像1枚程度ではたかがしれているため、大人数で短時間に大量の読み取りをしない限り、無料枠を超えることはないと思われます。
今回の実験で使用した Gemini 2.0 flash のトークン数は以下の通りです。
- 請求書
- 入力トークン数:1,354 または 2,128
- 出力トークン数:97 〜 212
- レシート
- 入力トークン数:1,864
- 出力トークン数:79 〜 112
- 名刺
- 入力トークン数:1,996
- 出力トークン数:132 〜 170
Gemini in AppSheet Solutions(AI task)のコスト
AppSheet Enterprise Plusライセンスに付与される1,000クレジット(1ライセンスあたり月間)の範囲内で全ての実験を行ったため、追加で料金は支払っていません。
AI taskを実行する度にクレジットが消費されます。消費したクレジットは、Admin Console > Reports > Gemini usageから調べることができます。
今回の実験では、実験前に3回ほどテストし、60サンプルで実験したので、AI taskを63回実行し、670クレジットを消費しました。よって、AI task 1回あたり約10クレジットを消費しました。つまり、AppSheet Enterprise Plus 1ライセンスあたり、月間で約100回の読み取りが可能という計算になります。
月間で付与されるクレジット数は、ライセンス数×1,000で、これを超えてAI taskを使用したい場合は、AppSheet Enterprise Plusライセンスを追加で購入する必要がありますが、これは現実的ではないため、月間で付与されるライセンス内で収めることになるでしょう。
月間で処理したい請求書、レシート、名刺の枚数と、クレジット数を比較して範囲内に収まるか事前にシミュレーションする必要があります。
8. 総合評価:5点満点での比較
以上を踏まえて、各項目を5点満点で評価しました。
AI OCR 総合評価
項目 | GAS × Gemini API連携 | Gemini in AppSheet Solutions(AI task) |
---|---|---|
読み取り精度 | 5 | 4 |
速度 | 3 | 2 |
コストパフォーマンス | 5 | 3 |
読み取り精度は、GAS × Gemini API連携に若干の優位性がありますが、Gemini in AppSheet Solutions(AI task)も遜色なく、実用に耐えうるレベルであることが分かりました。
速度には明らかに差があり、GAS × Gemini API連携が上回りましたが、専用アプリよりは遅いため、両方とも高評価とはなりませんでした。
コストパフォーマンスは、Gemini 2.0 flashの無料枠に収まる可能性が高い中小企業なら、GAS × Gemini API連携に優位性があります。Gemini in AppSheet Solutions(AI task)はノーコードの魅力はありますが、AppSheet Enterprise Plusライセンスが必須で、クレジット数を超えて使用できないことが減点対象となりました。
9. AppSheet での AI OCR 導入のまとめ
1. GAS × Gemini API連携がおすすめのケース
以下のケースに当てはまる場合は、GAS × Gemini API連携が読み取り精度とコストパフォーマンスの点で有利だと思います。
- コストを重視する企業:Google Workspace有料プランを契約済みで、追加コストを抑えたい場合
- 高い読み取り精度を求める場合:わずかでも高い精度を求める業務
- 処理速度を重視する場合:少しでも高速な処理を求める業務
- 開発スキルがある企業:GASの開発・保守ができる技術者がいる場合
2. Gemini in AppSheet Solutions(AI task)がおすすめのケース
以下のケースに当てはまる場合は、Gemini in AppSheet Solutions(AI task)を検討してもよいでしょう。
- ノーコードを重視する企業:プログラミングスキルがなくても導入・運用したい場合
- AppSheet Enterprise Plusを既に利用している企業:すでにライセンスを保有している場合
- 1ユーザーあたり月間100回程度の読み取りで十分な企業:処理量が限定的で、クレジット制限内に収まる場合
- 保守性を重視する場合:GASの保守が不要で、AppSheet内で完結させたい場合
3. 今後の AppSheet でのAI OCR活用
今回の実験により、AppSheet でのAI OCRは十分に実用レベルに達していることが確認できました。Gemini 2.0 flashの進化により、コストを抑えながら高精度なOCRが実現可能になりました。
特に中小企業においては、専用OCRシステムを導入するよりも、 AppSheet とGemini APIの組み合わせで十分なケースが多いと考えられます。読み取り結果の軽微な修正は必要ですが、手入力と比較すると大幅な効率化が期待できます。
AppSheet でのAI OCR導入を検討される際は、まず月間の処理量とコスト要件を明確にし、技術スキルの有無を考慮して最適な方法を選択することをおすすめします。