Ai_mls

ChatGPT Agentでアプリを作ってみる

ChatGPT Agentでアプリを作ってみる

Hideki INOUE
ChatGPT Agentでアプリを作ってみる 2025/07/18にOpenAIがChatGPT Agentを発表しました。ChatGPT Agentはウェブサイトと対話しながら情報を収集・分析するタイプのエージェントです。OpenAI側で仮想デスクトップが提供され、その中でユーザの指示に基づいた操作が行われます。Operatorという名前で提供されていた機能の進化版という感じです。
メタドキュメント作成のススメ

メタドキュメント作成のススメ

Hideki INOUE
メタドキュメント作成のススメ システム開発では、設計書、ソースコード、サーバー構築手順書、業務手順書など、多様な成果物を複数の関係者やツールと協調しながら作成します。本稿では、生成AIと人間が共通の品質基準で成果物を作成できるよう、その指針となる メタドキュメント の作成と運用ワークフローについて説明しています。 メタドキュメントとは何か メタドキュメントは成果物そのものを直接記述するのではなく、成果物を生成・レビュー・保守するためのルール、構造、品質基準をメタレベルで定めた文書群です。以下のような文書が該当します。
API Key不要!OpenAI Function Callingにより検索エンジンであるDuckDuckGoとLangChainで、最新情報を参照する質問応答ボットを作る方法

API Key不要!OpenAI Function Callingにより検索エンジンであるDuckDuckGoとLangChainで、最新情報を参照する質問応答ボットを作る方法

Hideki INOUE
API Key不要!OpenAI Function Callingにより検索エンジンであるDuckDuckGoとLangChainで、最新情報を参照する質問応答ボットを作る方法 LangChain の Agent の機能を利用することで、検索エンジンで最新の情報を検索しながら、対話型モデルによる質問応答の仕組みを作ることが簡単にできます。ただ、Google 検索の API を利用するためには、API Key の発行など、少し準備に手間がかかります(SerpAPI も同様)。そこで、DuckDuckGo を検索エンジンとして利用する方法を試してみました。DuckDuckGo であれば API 経由での呼び出しでも事前の登録や API Key の発行が不要です。
GradioとLangChainでレスポンスがストリーミング出力されるChatbotを作る

GradioとLangChainでレスポンスがストリーミング出力されるChatbotを作る

Hideki INOUE
Gradio と LangChain でレスポンスがストリーミング出力される Chatbot を作る Gradio と LangChain を使うことで簡単に ChatGPT Clone を作ることができますが、レスポンスをストリーミング出力する実装サンプルがあまり見られなかったので、参考文献のコードを参考に、色々寄せて集めて見ました。同時リクエストがあった場合の挙動を確認していないため、あくまでお一人様用ということになります。
ローカルに保存した英語のPDFに日本語で質問応答するGradioでのデモンストレーション

ローカルに保存した英語のPDFに日本語で質問応答するGradioでのデモンストレーション

Hideki INOUE
ローカルに保存した英語の PDF に日本語で質問応答する Gradio でのデモンストレーション TL;DR ローカルに保存した英語の PDF に対して日本語で質問応答する Web アプリケーションのデモンストレーションです。事前に Index 作成した上で、質問応答するための画面を Gradio で作成しています。
対話型AIと音声認識を使って雑談してみる

対話型AIと音声認識を使って雑談してみる

Hideki INOUE
対話型 AI と音声認識を使って雑談してみる 音声認識を使って OpenAI の対話型 AI 用モデルと音声で雑談してみるサンプル実装です。音声認識部分はWhisper Micの実装をほぼそのまま利用しています。また、マイクに話しかけた言葉を,リアルタイムに AI が認識(whisper, whisper_mic, Python を使用)(Windows 上)を参考に日本語対応としています。