Gemini 1.5 Proって何ができるの?
弊社ではAI導入支援を行っていますが、そのような声をよくいただきます。
本記事では、Gemini 1.5 Proでできることや活用事例についてわかりやすくまとめて紹介していますので、ぜひ最後までご覧ください。
弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。⇒AI導入支援サービスの概要はこちら
執筆者:山口 鳳汰
ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。
その他、受託開発や教育など多数のAI事業に参画している。
運営会社:株式会社Walkers
ノーコード・AI専門の開発会社。
300件以上の開発/制作実績、200件以上の企業様を支援。
マーケティングやUI/UXと掛け合わせたサービス開発を得意としている。
執筆者:山口 鳳汰
ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。
運営会社:株式会社Walkers
ノーコード・AI専門の開発会社。
これまでに300件以上の開発/制作実績、200件以上の企業様を支援。
Gemini 1.5 Proでできること・活用事例15選
【事例①】動画化したスライドからQ&A作成
スライドを動画化してGemini 1.5 Proに読み込ませて、Q&Aを作成した事例です。工夫次第で応用の幅が広がることがわかる良い事例だと感じました。
PowerPointスライドに基づいたQ&Aを生成AIでやるの、図表とかあると前処理ややこしいなーって思ってたんだけど、1秒1スライド1FPS動画に変換してGemini 1.5 Proに読み込ませたら完璧に理解して応答してもらえた🙌 pic.twitter.com/rcO5nnOSdu
— うえぞう@うな技研代表 (@uezochan) May 15, 2024
【事例②】レビュー解析
Googleのレビューから解析することで、満足度などを算出した事例です。Gemini 1.5 Proを導入するだけで大きく業務効率化が進むことがわかります。
Gemini 1.5 Pro すごすぎんよ。USJのGoogleレビュー全てから見る問題点と改善点、満足度・不満TOP10なんてすぐ出力できちゃうんだな。しかも無料。すごい時代だよ。人がやらなきゃいけないことどんどん減っていくわ。 pic.twitter.com/V3LptN7uAp
— すん|AIとDXを医療にぶちこむ (@sunnariwakaru) May 31, 2024
【事例③】画像のコード化
プログラマーからするとデザインをそのままコード化できるため、大きく開発時間を短縮できます。
Thanks to its ability to detect bounding boxes, Gemini is incredible at coding UIs from images.
— Pietro Schirano (@skirano) May 30, 2024
I built an agentic system that looks at a UI, finds the bounding boxes, codes it, and refines the results based on the original image. 🧑💻
The best results I got from any model! pic.twitter.com/mK3RaqoGOg
【事例④】映画(長尺動画)の要約
30分以上の動画に対しても要約できてしまうのが、Gemini 1.5 Proのすごいところです。十分に実用可能です。
【Gemini 1.5 Pro:映画を数秒で要約】
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) February 20, 2024
Gemini 1.5 Proを使って45分程度の映画を数秒で要約した事例。
約70万トークン。
Youtubeの概要作成、映画の要約作成など色々な用途で使えそう。
マルチモーダルな膨大なコンテキストウィンドのLLMは強い。
ChatGPTを凌駕している部分でもある。 pic.twitter.com/XsEfQEitTY
【事例⑤】フォルダ生成プログラムの作成
プログラム構築能力も高いため、実用的なプログラムも作成できます。
一瞬で必要なフォルダ群を作る「フォルダ生成式」を作った。やっぱりプログラミングもGemini 1.5 Proが一番良い。
— 元木大介@生成AI塾&抽象プログラミング言語: ゾルトラーク、にわとこ (@ai_syacho) May 15, 2024
以下はお惣菜やさん開業プロジェクトのためのフォルダ#自然言語プログラミングにわとこ pic.twitter.com/kUgr6dIf1U
【事例⑥】タイムコード付きの動画文字起こし
文字起こしだけでなくタイムコードまで記載できるため、ミーティングなどに使えると感じています。
Having fun playing with new native audio capabilities in Gemini 1.5 Pro! ♊ Here’s a demo using audio from the #GoogleIO keynote with examples you can try: transcription, word-level timecodes, and searching audio by drawing. (🔊Video has sound) pic.twitter.com/56bmhM4Rwp
— Alexander Chen (@alexanderchen) May 22, 2024
【事例⑦】YouTubeの概要文章作成
YouTube運用をしている方にとってかなり応用できそうな事例だと考えられます。
セミナー動画を数分で、Youtube概要文章+ブログを作成してくれるGemini 1.5 が最強すぎる件。《プロンプト付き》
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) May 29, 2024
やはり、一番時短に繋がるのはこの使い方かなと。
①ウェビナー
②動画を録画
③Gemini 1.5 に突っ込む
④分数付きのキャプチャーとブログ完成… pic.twitter.com/4AHY5maVef
【事例⑧】Web上でのビデオチャット
リアルタイムで視聴しているビデオに対しても質問できるため、教育などの分野で応用できると感じています。
chat with video enabled by gemini 1.5 flash pic.twitter.com/Em18wNGfE2
— HaveFunWithAI (@HaveFunWithAI) May 18, 2024
【事例⑨】細かい画像の読み取り
Gemini 1.5 Proの画像解析能力が群を抜いていることがわかる事例となっています。
【Gemini 1.5 Proの性能が群を抜いてすごい件。GPT-4、Claude 3を凌駕】
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) April 4, 2024
目でも見えないくらい細かい生成AI企業のカオスマップをGemini 1.5 Pronで解析したところ、5分くらいずっとAIが動いて企業名を書き出した。
GPT-4:解析不能
Claude 3:本当に一部のみ
比較すると差は歴然。… pic.twitter.com/CPNZBApPcT
【事例⑩】議事録作成
議事録作成にAIを導入していないすべての人に有用な事例だと感じています。
【事例⑪】2,000ページまでの資料の情報取り込み
Gemini 1.5 Proでこのレベルのデータを処理できます。本当に規格外の性能です。
例:70ページある「2024 US ロボットレポート」をGemini 1.5 Proに食わせる。「英語の引用、日本語で回答」は結構使えるはず。引用は全部合ってるよう。ちなみに1Mコンテキストなんで、2000ページまでできる。https://t.co/DRhGYEJdVj https://t.co/ryhFgHpU8a pic.twitter.com/a9HoHkitlS
— シェイン・グウ (@shanegJP) April 28, 2024
【事例⑫】動画解析
レビュー解析と同じ容量で、動画解析にも使えます。
Google AI Gemini 1.5 Proがマジで凄かった❗️
— KEITO💻AIディレクター (@keitowebai) April 15, 2024
これは皆んな使ったほうが良いよ。
▼概要
・100万トークンという膨大な情報処理能力
・動画や音声ファイルを読み込んで内容を解析
・PDFなどのファイル読み込みにも対応
・APIでシステムに組み込むことが可能… pic.twitter.com/Fd3sDgknNn
【事例⑬】ウェアラブルデバイスとの連携
Gemini 1.5 Proを連携させることで、ユーザーが見たことや聞いたことに応じて質問に答えるようなデバイスを構築できます。
had a raspberry pi laying around and built an ai wearable called insight at @Google x @mhacks hackathon this weekend.
— Advait Paliwal (@advaitpaliwal) April 15, 2024
insight uses gemini 1.5 pro to answer questions based on what you see and hear, and it remembers those memories for you.
repo in comments pic.twitter.com/jKrkgAkGO6
【事例⑭】レポート作成
ただ分析するだけでなく、レポートとしても出力できます。
Introducing `gemini-youtube-researcher` 📈
— Matt Shumer (@mattshumer_) April 10, 2024
An open-source Gemini 1.5 Pro agent that LISTENS to videos and delivers topical reports.
Just provide a topic, and a chain of AIs with access to YouTube will analyze relevant videos and generate a comprehensive report for you. pic.twitter.com/bd0OZkvCkq
【事例⑮】録画データからバグ修正
録画からバグを見つけるという、プログラマーにとって驚きの使い方もできます。
The future of fixing bugs?
— Mckay Wrigley (@mckaywrigley) February 26, 2024
Just record them.
I filmed 3 separate bugs in an app and gave the videos to Gemini 1.5 Pro with my entire codebase.
It correctly identified & fixed each one.
AI is improving insanely fast. pic.twitter.com/xBefwp3ixH
Gemini 1.5 Proでできること・活用事例の紹介は以上です。この情報がお役に立てていれば嬉しく思います。
弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。