AI
2025.11.20
MCPプロトコルの理解 – AIと外部サービスの共通接続規格
MCPとはMCP(Model Context Protocol)は、AIアプリ(ChatGPTやClaudeなど)が外部システムとつながるための“共通の接続規格”です。これにより、AIは外部のデータ(ファイル・DBなど)やツール(検索・計算など)、ワークフローにアクセスし、作業をこなせるようになります。USB-C がデバイス同士を標準的につなぐのと同じように、MCP は AI と外部システムを標準的につなぐ“共通ポート”の役割を果たします。参考資料MCPとは https://modelcontextprotocol.io/docs/getting-started/introソース https://github.com/modelcontextprotocol/modelcontextprotocolアーキテクチャ https://modelcontextprotocol.io/docs/learn/architecture仕様 https://modelcontextprotocol.io/specification/2025-06-1
AI
2025.10.21
OpenAI Codex – AIエンジニアに仕事を頼める
OpenAI Codexとは?OpenAI Codexとは、2025年10月にOpenAIが正式リリースした開発者向けAIエージェントです。Codexは、ChatGPTアカウントと連携しながら、エディタ、ターミナル、クラウドなど様々な開発環境で動作する “コーディング・コラボレーター” です。Codexは、GPT-5-Codex モデルをベースにしており、コード補完だけでなく、リポジトリ全体を理解して課題を分解し、テストやリファクタリング、Pull Request(PR)の自動レビューまで行うそうです。ChatGPTアカウントとGitHubを接続することで、開発環境と深く統合し、チームメンバーのように協働できるとのことです。本家の情報はこちら3つの主要機能Slack連携(Codex for Slack)チームのSlackチャンネルから直接Codexにタスクを依頼したり、コードに関する質問をしたりできます。まるで同僚に話しかけるようにAIへ依頼できる自然なインターフェースです。Codex SDKCodex CLIと同じエージェントを、自社
AI
2025.10.13
ChatGPT API ハック – EC営業AIの構築 – 本番運用のための実装
リアルタイム応答でUXを改善通常の ChatGPT API は「生成が全部終わってから」まとめて返します。でも stream: true を使うと、ChatGPTが文を考えながら順次出力することができます。from openai import OpenAIopenai_api_key = "xxx"client = OpenAI(api_key=openai_api_key)stream = client.chat.completions.create( model="gpt-4o", messages=[ {"role": "system", "content": "あなたは薬局ECの営業アシスタントです。"}, {"role": "user", "content": "こんにちは!この店のおすすめ商品を教えてください。&
AI
2025.10.10
ChatGPT API ハック – EC営業AIの構築 – ベクトル検索によるRAGの導入
フェーズ2:ベクトル検索によるRAGの導入商品説明文から OpenAI Embedding を生成Pinecone / Weaviate / Supabase vector などでベクトル検索セットアップユーザーの質問 → 関連商品抽出 → messages に注入 → ChatGPT呼び出し効果・価格・注意点などを含む「事実ベースのセールストーク」生成Embeddingの生成Embeddingとは?Embeddingとは、文章や単語の「意味」をAIが理解できるように数値(ベクトル)で表したものです。たとえば「ニキビを治すクリーム」という文を入力すると、AIはその意味を数百〜数千次元の数値列に変換します。この数列は言葉そのものではなく、「スキンケア」「薬」「肌」「改善」といった概念的な特徴を含んでいます。Embeddingの大きな特徴は、似た意味の文章は近い位置に配置されることです。たとえば「ニキビを治すクリーム」と「肌荒れを防ぐ薬」は、単語が違っても意味が似ているため、ベクトル空間では近くに並びます。逆に「ヒゲ剃り
AI
2025.10.9
ChatGPT API ハック – EC営業AIの構築 – プロンプトと商品情報の連携
フェーズ1:プロンプトと商品情報の連携数件の商品(3〜5点)をJSONで用意system + user に商品情報を埋め込んで 呼び出し「人気・おすすめ」などの表現のトーンを制御レスポンスフォーマットをJSONに制御Shopifyから商品情報を取得store=access_token=curl -X GET "https://${store}.myshopify.com/admin/api/2025-01/products.json" \-H "X-Shopify-Access-Token: ${access_token}" > products.json必要な商品情報のみ取得import jsonwith open("products.json", "r", encoding="utf-8") as f: data = json.load(f)simplified_products =
AI
2025.10.7
ChatGPT API ハック – ①どこまでできるのか
はじめにいまさらですが、ChatGPT APIで何ができるのか、使いながら試していきます。ChatGPT API を使って何が実現できるか?ChatGPT APIは「単に質問に答えるAI」ではなく、あなたのサービスや業務の中で、“対話可能な脳”を好きな形で埋め込めるインターフェースです。想像を超える使い方一覧主に、私のようにSaaSを作る人・ECを運営する人・AIを実装する人向けに、「ChatGPT APIを使えばここまでできる」という事例・構想を、段階別に紹介します。【レベル1】よくある使い方ユースケース内容ECサイトのチャットボット「この商品は何?」「返品できる?」などに答えるお問い合わせ自動応答営業時間・料金・手順などFAQ対応メール・文章生成カスタマー返信文を生成/修正レビュー要約商品レビューを要約/感情分類【レベル2】中級者向け(現場レベルの自動化)ユースケース内容APIログの分析&アラートlogから異常トラフィックを発見し、Slackに通知Shopifyの商品説明を自動生成商品メタ情報から自然な説明
AI
2025.08.1
Google Agent Development Kit (ADK) Web UI とは?
ADKとは?Google の Agent Development Kit (ADK) Web UI は、Google が提供するオープンソースのフレームワークである Agent Development Kit (ADK) の一部として提供される、AI エージェント開発のためのブラウザベースのインターフェースです。これは、主に Gemini などの大規模言語モデル(LLM)を活用した AI エージェントの設計、開発、デバッグ、テストをより直感的かつ効率的に行うために作られています。簡単に言えば、AI エージェントをコードで記述しつつ、その動作をブラウザ上で視覚的に確認・調整できる「開発環境」です。ADK Web UI でできることADK Web UI は、以下のような機能を提供することで、AI エージェント開発のプロセスを効率化します。エージェントの定義と構成の視覚化: エージェントがどのような役割を持ち、どのようなツールを使用し、どのように動作フローをたどるのかを、グラフィカルに把握できます。プロンプトのテストとデバッグ: エージェン
AI
2025.07.31
Google AI StudioのGoogleGenAI と Vertex AIの使い分け
GoogleGenAI (とGoogle AI Studio) と Vertex AI は、どちらもGoogleの生成AIモデルを利用するためのものですが、ターゲットとするユーザーと提供する機能の範囲が大きく異なります。Google AI Studio & GoogleGenAI (APIキーを利用)ターゲットユーザー:AIモデルを素早く試したい個人開発者スタートアップ企業研究者生成AIのプロトタイピングを手軽に行いたいユーザー主な目的:生成AIモデル(特にGemini)への手軽なアクセスとプロトタイピング: Geminiモデルの機能を簡単に試し、アプリケーションに組み込むためのAPIキーを提供します。迅速な開発: @google/genai のようなクライアントライブラリを使うことで、わずかなコードでAIモデルの推論機能をアプリケーションに組み込めます。実験と学習: 直感的なUIでプロンプトをテストしたり、モデルの挙動を調整したりできます。特徴:無料枠での利用が可能: 多くの機能が
AI
2025.07.29
GoogleのVertex AIでGemini APIを利用する
はじめにこの記事では、以下を理解できます。GCPのサービスアカウントの作成と認証設定PythonのVertex AI SDKの使い方Gemini Proモデルの生成モデルへのツールの渡し方 (Function Calling)プロンプトへの問い合わせVertex AIとはVertex AI は、Google Cloud 上で機械学習モデルのライフサイクル(データ準備 → 訓練 → デプロイ → 推論 → モニタリング)を一貫して実行できるフルマネージドサービスです。Gemini API を使う文脈では、具体的に以下のような役割を担います。モデルのホスティング&呼び出し基盤Gemini のような大規模言語モデルを Google 側でホストし、REST や SDK(google-cloud-aiplatform)経由で安全に呼び出せる環境を提供認証・アクセス管理IAM/サービスアカウントによる細粒度の権限設定で、誰がどのモデルを呼べるかを制御スケーリングオンライン推論(低レイテンシ)もバッチ推論
AI
2025.07.5
WERによる文字起こし精度チェック
はじめにWER(Word Error Rate) は、音声認識システムや文字起こしサービスの精度を評価するための代表的な指標です。文字起こし結果と正解テキスト(ゴールドスタンダード)を比較し、誤りの割合を定量化します。WER の定義と計算式WER は次の3種類の誤りをすべて合計し、正解語数で割って算出します。S(Substitutions):誤って別の単語に置き換えられた単語数D(Deletions):正解ではあるが出力に欠落した単語数I(Insertions):出力に余分に挿入された単語数N:正解テキスト中の総単語数たとえば、正解テキストが「今日はいい天気ですね」、文字起こし結果が「今日はいい天気です」の場合:置換(Substitution):“ですね”→“です” ⇒ S=1挿入(Insertion):なし ⇒ I=0欠落(Deletion):なし ⇒ D=0正解語数:4(「今日は」「いい」「天気」「ですね」) ⇒ N=4なぜ WER を使うのか?