Difyで「Youtubeの字幕から動画内容を要約するチャットボット」を開発する方法について徹底解説!

この記事では、以下のようなAIアプリ開発ツール「Dify(ディファイ)」を用いた、Youtubeの字幕から動画内容を要約するチャットボットの開発方法を解説します。

Dify.AI tutorial for beginners」という動画のURLを送信

開発したYouTube要約チャットボットのURLはこちら:https://udify.app/chat/z9JVjXlRfl02POVO


弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。⇒AI導入支援サービスの概要はこちら

執筆者:山口 鳳汰
 

執筆者:山口 鳳汰
ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。

その他、受託開発や教育など多数のAI事業に参画している。

運営会社:株式会社Walkers

運営会社:株式会社Walkers
ノーコード・AI専門の開発会社。
300件以上の開発/制作実績、200件以上の企業様を支援。
マーケティングやUI/UXと掛け合わせたサービス開発を得意としている。

執筆者:山口 鳳汰

執筆者:山口 鳳汰
ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。

運営会社:株式会社Walkers

運営会社:株式会社Walkers
ノーコード・AI専門の開発会社。
これまでに300件以上の開発/制作実績、200件以上の企業様を支援。

クリックできる目次

Dify(ディファイ)とは?

Dify(ディファイ)とは「AI言語モデルを用いてチャットボットなどの独自アプリを開発することができるオープンソースのツール」です。
このツールを使うことで、プログラミングなど専門知識がなくても簡単に高性能なアプリを作成することができます。

「チャットボット」といわれると、企業のホームページなどに配置されている「お問い合わせ対応を行うチャットボット」を連想される方が多いと思われますが、
Difyでは、お問い合わせ対応以外にも複雑な処理を行うチャットボットを簡単に開発できます

Difyには無料プランも用意されているため、「簡単な業務をAIで効率化したいが、本当にできるか不安」という方でも安心して利用することができます。

»関連記事:Dify(ディファイ)とは?事例や使い方、商用利用まで完全解説!

YouTube要約チャットボットの開発方法

STEP
以下のURLよりDifyの公式サイトに移動する
STEP
アカウントを作成する
Dify公式サイト
Dify公式サイト

「GitHub」または「Google」アカウントを用いてDifyではアカウントを作成します。

手順や複雑さに違いはないため、普段よく使用するアカウントを選んで作成しましょう。
画面の指示に従い「GitHub」または「Google」アカウントでログインを行えば、Difyアカウントの作成は完了です。

STEP
設定を開く
Difyホーム画面
Difyホーム画面

アカウント作成またはログインが完了すると、Difyのトップページに移動します。

この画面右上に表示されている「自身のアカウント名」をクリックし、表示されるメニューから「設定」を選択します。

STEP
ChatGPTまたはClaudeと連携する
Difyのモデルプロパイダー画面
Difyのモデルプロパイダー画面

「モデルプロパイダー」を選択し、LLMの設定画面に移動します。

ChatGPTとClaudeに関しては標準でモデルの組み込みが行われているため、この2つのLLMのどちらかを使用してDifyを利用する場合には、

ChatGPTの場合は、OpenAIタブの横にある「API-KEYセットアップ」
Claudeの場合は、ANTHROPICタブの横にある「API-KEYセットアップ」

をクリックして、APIキーのセットアップ画面を表示します。
表示された画面にそれぞれのAPIキーを入力すると接続が完了し、Difyで使用できるようになります。

※ChatGPTの利用に限り、API接続を行わなくても一定回数無料で使用することが可能です。

STEP
ChatGPTまたはClaude以外のLLMと接続する
Difyのモデルプロパイダー画面
Difyのモデルプロパイダー画面

ステップ2と同様に、「モデルプロパイダー」を選択しLLMの設定画面に移動します。

この画面の下に表示されている、「モデルプロパイダを追加」から、使用したいLLMを探し、カーソルを合わせます。
カーソルを合わせると「モデルを追加」または「セットアップ」という表示が現れるため、そちらをクリックします。

表示された画面の指示に従い、モデルタイプの選択やAPIキーなどの求められた情報を入力すると接続が完了し、Difyで使用できるようになります。

※この設定は必須ではありません。特定のLLMをDifyで使用したい場合のみ設定を行なってください。

STEP
アプリを作成する
Difyホーム画面
Difyホーム画面

LLMの接続を行ったらホーム画面に移動し、「アプリを最初から作成」というボタンを選択します。

STEP
アプリの詳細を入力する
Difyアプリ作成画面
Difyアプリ作成画面

表示される画面で以下のように設定を行い、「作成する」ボタンをクリックします。

アプリタイプ:チャットボット
オーケストレーション:Chatflow
アプリアイコン:任意のものを選択
アプリ名:任意の名前を入力

STEP
LLMの設定を変更する
Difyアプリ作成画面
Difyアプリ作成画面

アプリ構築画面で「LLM」を選択し、以下のように設定を変更します。

モデル:ステップ4,5にて追加したLLMを選択(この記事ではGPT-4oを使用します。)
SYSTEM:以下の内容を入力

以下のYouTubeのURLから動画IDを抽出して、抽出した動画IDのみを出力してください。
--
{{#sys.query#}}
STEP
YouTube Transcripts APIをDifyに追加する
Difyアプリ作成画面
Difyアプリ作成画面

「LLM」ブロック右側のプラスボタンを選択します。

表示されるメニューから「ツール」を選択し、「YouTube Transcripts API」を選択して追加します。

STEP
DifyとSearchApiと連携を行う
Difyアプリ作成画面
Difyアプリ作成画面

追加した「YouTube Transcripts API」を開き、「承認するには」を選択します。

STEP
APIキーを取得するために、SearchApiの公式サイトに移動する
Difyアプリ作成画面
Difyアプリ作成画面

画面左下に表示されている「取得方法」を選択 または以下のURLよりSearchApiの公式サイトに移動します。

URL:https://www.searchapi.io

STEP
SearchApiのアカウントを作成する
SearchApi公式サイト
SearchApi公式サイト

画面右上の「Sign up」を選択し、SearchApiのアカウントを作成します。

STEP
APIキーを取得する
SearchAPIダッシュボード画面
SearchAPIダッシュボード画面

アカウント作成後に表示される画面にてAPIキーを取得することが可能です。

「Your API Key」という項目から、APIキーをコピーします。

STEP
APIキーをDifyに入力する
Difyアプリ作成画面
Difyアプリ作成画面

取得したAPIキーをDifyに入力し、保存を選択します。

STEP
YouTube Transcripts APIの設定を編集する
Difyアプリ作成画面
Difyアプリ作成画面

「video_id」と「Language」の項目を以下のように設定します、

video_id:

{{#llm.text#}}

Language:en

ここで入力をした言語の字幕のみをDifyが取得します。
ここでは英語の字幕を取得するため「en」と入力を行いましたが、別の言語の字幕を取得したい場合には、以下のURLから言語コードを確認して入力を行ってください。

URL:https://developers.google.com/custom-search/docs/ref_languages?hl=ja

STEP
LLMブロックを追加する
Difyアプリ作成画面
Difyアプリ作成画面

「YouTube Transcripts API」ブロック右側のプラスボタンを選択し、「LLM」ブロックを追加します。

STEP
LLMの設定を編集する
Difyアプリ作成画面
Difyアプリ作成画面

追加した「LLM2」というブロックを選択し、以下のように設定を変更します。

モデル:ステップ4,5にて追加したLLMを選択(この記事ではGPT-4oを使用します。)
コンテキスト:YouTube Transcripts APIの「text」を選択
SYSTEM:以下の内容を入力

以下はYouTubeの字幕データです。
日本語で要約をしてください。
--
*「/」を入力して表示されるメニューから、YouTube Transcripts APIの「text」を選択*
STEP
回答の設定を編集する
Difyアプリ作成画面
Difyアプリ作成画面

回答の設定を、「LLM2」というブロックの「text」に修正します。

STEP
作成したアプリを公開する
Difyアプリ作成画面
Difyアプリ作成画面

ここまでの設定を全て終えると、「YouTube字幕から動画内容を要約するチャットボット」の開発は完了です。
画面右上に表示されている「公開する」というボタンからアプリを公開しましょう。

公開後に正しく動画内容の要約が行われない場合、まず以下の内容を確認してください。
・チャットボットに送信するYouTube動画に「ステップ15で設定した言語の字幕」が存在しているか

それでも改善しない場合、ステップ8にて正しく動画IDのみを抽出できていない可能性があります。
SYSTEM欄に入力をするプロンプトを「絶対に動画ID以外のテキストを送信しないように」と念押しするものに修正をして、再度公開を行いましょう。


Difyを用いた「Youtubeの字幕から動画内容を要約するチャットボット」の開発方法の解説は以上です。この情報がDifyへの理解促進につながれば嬉しく思います。

弊社Walkersでは、“AIトレンドに乗り遅れたくないけど、具体的な活用法が見えない…”を解決するAI導入支援を行っています。補助金により1/3のコストで導入可能なので、ぜひAI活用にお悩みがある方はお気軽にご相談下さい。

AI導入支援サービスの概要はこちら>>

Walkersに無料で相談する>>

  • URLをコピーしました!

この記事を書いた人

ノーコード・AI開発会社「Walkers」のCMO。
AIサービス「Prompt Lab」運営。
その他、受託開発や教育など多数のAI事業に参画している。

クリックできる目次