【初心者向け】Difyを始めてみよう！基礎知識と初期設定手順

はじめに
Difyとは？？
Difyの始め方
モデルの初期設定
最後に

はじめに

さて今回は、Difyに関する基礎知識と初期設定手順についてまとめたいと思います。

Difyが話題になってかなり立ちましたが、今更ながらに触ってみたのでまとめました。

少し触ってみて分かりましたが、やはり面白い！GPTだけでも遊んでいて楽しかったですが、それ以上に遊びの幅が広がるように感じました。

まだ触ったことの無い人は是非この記事をきっかけに触ってみてください～。

Difyとは？？

Difyとは、生成AI（LLM）を活用したアプリケーションを、ノーコード/ローコードで構築・運用・公開できるAIアプリ開発プラットフォームです。クラウドサービスとしても、オープンソース（セルフホスト）としても提供され、個人から大規模企業まで幅広く利用可能です。

まぁ簡単にAIアプリを作れるツールとでも理解してもらえればOKだと思います。

特徴としては以下が挙げられます、参考程度で。

ノーコード/ローコード開発：
- ドラッグ＆ドロップやGUI操作で、AIチャットボット・ナレッジベースQA・ワークフロー型アプリなどが誰でも作れる。
- コーディング不要でビジネスユーザー、非エンジニアでもAI活用を推進可能。
多彩なアプリケーション構築：
- チャットボット、エージェント、テキスト生成、データパイプライン（ワークフロー）、ナレッジベース型QAなど複数タイプのAIアプリを設計可能。
- 「アプリケーション・オーケストレーション機能」により、複数AI機能を組み合わせた高度なアプリも構築可能。
幅広いLLM/AIモデルの統合：
- OpenAI（GPT-4/3.5/4o）、Azure OpenAI、Anthropic、Google Gemini、Hugging Face Hub、Ollamaなど主要なLLM／埋め込みモデルにノーコード接続。
- APIキーを登録するだけでモデル切り替え・比較・最適なモデルの選択が可能。
ナレッジベース（RAG/独自QA）機能：
- PDF、Word、テキスト、ウェブページ等多様なソースをナレッジベース化。
- AIチャットボットやワークフローから「自社文書」「業務FAQ」「規程集」などの独自データを引用したAI回答が可能。
多様な公開・連携方法：
- Webアプリ・APIエンドポイント・ウィジェット・LINEやSlack連携など多様な方法でアプリ公開・組み込みが可能。
- REST API/Webhook/プラグイン連携も対応し、システム間連携が容易。
マルチユーザー・チーム管理：
- ワークスペースやロールベース権限管理、メンバー管理、SaaS管理コンソールなど業務用途・企業利用も安心。
- 利用履歴、エラーログ、アクティビティダッシュボードも搭載。
拡張性・オープンソース：
- OSSとして無償公開（MITライセンス）。自社用のカスタマイズやオンプレミス運用も可。
- 外部DB（Milvus、Weaviate、Qdrant等）や自前LLM、独自APIとの統合も柔軟。

ちなみに使えるモデルリストは以下に記載されていますので、詳しく気になる方はご確認ください！

モデルプロバイダーリスト - Dify Docs

Difyの始め方

Difyを始めるのは特に難しくありません。Googleで”Dify”と検索し、公式サイトからアクセスしてください。

※以下が公式サイトです。ちなみにUIは頻繁に変わると思いますので、微妙に違ったらいい感じのところを選択してください。

Dify: 最先端のAgentic AI開発プラットフォーム

DifyでAgentic AIの可能性を解き放ちましょう。あらゆる規模のチームに向けて、自律型エージェント、RAGパイプライン、その他の機能をスムーズに開発、デプロイ、管理できます。

1. 「今すぐ始める」ボタンを押下

公式サイトにアクセスすると、「今すぐ始める」ボタンが出てくるので押下しましょう。

2. 適当にログイン

「今すぐ始める」ボタンを押下すると、ログイン画面に遷移します。適当にログインしてください。

ちなみに私はGoogleアカウントでログインしました。正直何でログインしてもOKだと思います。

GitHubでログインするとその後の連携とかスキップできる？分かりませんが・・・

3. ホーム画面に遷移

ログインに成功すると、ホーム画面に遷移します。

モデルの初期設定

Difyでは生成AIを活用してアプリを作っていくことになりますが、使いたいモデルは最初に設定をしてあげないと使えません。特に難しくないのでサクッと設定してしまいましょう。

1. 右上から「設定」ボタンを押下

設定画面からモデルの設定ができるので遷移しましょう。

2. ワークスペースの中から「モデルプロバイダー」を選択

左側にワークスペースというメニューがあります。その中から、「モデルプロバイダー」を選択しましょう。ここで、様々なモデルを利用可能な状態に設定することができます。

何も設定していないと、「モデルプロバイダーが設定されていません。」と表示されているかと思います。ご自身の使いたいモデルをインストールして、初期設定を済ませてください。

3. 好きなモデルをインストール

好きなモデルを選択してインストールボタンを押下してください。

インストールが完了すると、モデルの一覧に表示されます。

画像はOpenAIモデルをインストールしてみたものです。使えるモデルの一覧も見ることができますね。

4. API-KEY等セットアップ

私も一通り、インストールしてみました。

ただ、インストールするだけではモデルは使えません。（中々理解難しいですよね）APIでモデルを呼び出せるよう、API-KEY等を設定してあげる必要があります。

API-KEYの下にある、「セットアップ」ボタンを押下し、画面の指示に従ってAPI-KEYを作成、設定してください。

私はAzure OpenAI Serviceのモデルを設定しました。まぁ、MicrosoftがAzure環境の中でOpenAIモデルを使えるようにしているよ～程度で理解してもらえればOKです。単純に使えるものがあったからそれを登録しただけです。皆さんも使えるものをご用意してもらえればと思います。

API-KEYは設定するだけでは料金は発生しません。生成AIの場合は、指示を送る時と、出力を得る時に、トークン数（文字数）に応じた料金が発生します。何も考えずに使っていると膨大な金額を請求されかねないので注意してくださいね。余程の回数使ってないと膨大な金額にはならないと思いますが・・・

ちなみに、OpenAIモデルは無料で使える分があります。初めてモデルをインストールすると、クォータに「200」が設定されていると思います。単位は置いておいて、これが無料で使える分です。使っていけばこのクォータが消費され、「0」になるとAIモデルが使えなくなります。（※他のワークフロー等は使えるのでご安心を。）

このクォータ、だいたいGPT‑3.5相当で200回のAPI呼び出し、GPT‑4相当で20回のAPI呼び出しに相当するとのことです。気軽に使っているとすぐに無料分はなくなってしまいますね。また、使い切ってしまうと、特にリセットとかは無く、APIを設定するしかなくなってしまいますのでご注意を。

どうしても無料で使いたければ、無料で使えるLLMを探すしかないですね。GPT君に調査させたところ以下があるようですが、私は触ったことないので詳細分からずです・・・。

モデル名	概要
Llama 2, 3	Meta社が公開。商用利用可能。
Mistral	高速で軽量な英語・多言語モデル
Gemma	Googleのオープンモデル
Phi	Microsoft製の軽量LLM
Qwen	Alibabaの多言語LLM
Japanese StableLM	日本語対応のオープンソースLLM