SESSION 01

オリエンテーション
環境セットアップ

研修の目的と1日の流れを共有し、OpenAI APIへの接続確認まで完了させる。ここでつまずかなければ、残りはスムーズに進む。

9:30 - 9:50(20分)
導入 + 実践
LECTURE / 10 MIN
研修ガイダンス
研修の目的
RAGとは

RAG = Retrieval-Augmented Generation(検索拡張生成)。LLMには「学習データ以降の情報を知らない」「社内文書を知らない」という制約がある。外部文書の検索を組み合わせることで、この制約を解決する技術がRAGだ。

ユーザーの質問
関連文書を検索
質問+検索結果を
LLMに渡す
回答を生成
  • LLM = Large Language Model の略。ChatGPTの裏側で動いているAIの本体にあたる。
  • 大量のテキストデータ(インターネット上の文章、書籍など)を学習し、「次にどんな単語が来るか」を予測する仕組みで文章を生成する。
  • GPT-4o-mini は OpenAI社が開発したLLMの一つ。本研修ではこのモデルを使用する。
  • LLMの制約として、学習データの時点以降の情報を知らない。たとえば昨日の社内会議の議事録は知らない。この制約を補うのがRAGという技術になる。

OpenAI Concepts ドキュメント

  • API(Application Programming Interface)= ソフトウェア同士が会話するための窓口。
  • たとえば「レストランの注文窓口」のようなもの。あなた(プログラム)がメニュー(API仕様)に沿って注文(リクエスト)すると、キッチン(サーバー)が料理(レスポンス)を返してくれる。
  • APIキー = その窓口を使うための「会員証」。誰がいつ使ったか記録・管理するために必要になる。
  • 研修用のAPIキーは .env ファイルに記載済み。このキーは研修専用で、費用は研修側で負担している。

OpenAI API リファレンス

使用する技術
01

Python

プログラミング言語。本研修ではPython 3.11以上を使用する。

AIやデータ分析の分野で最も使われている言語。文法がシンプルで読みやすく、ライブラリ(便利な部品集)が豊富。

Python公式ドキュメント

02

LangChain

LLMを使ったシステム構築ライブラリ。プロンプト管理からチェーン実行まで一貫して扱える。

LLMを直接呼び出すだけならLangChainは不要だが、プロンプト管理、外部データの取り込み、複数ステップの処理連結など、実用的なシステムを作るときに必要な部品が揃っている。

LangChain公式ドキュメント

03

LangGraph

複数処理を順番に繋いで実行するフレームワーク。State / Node / Edgeの3概念でワークフローを定義する。

LangChainの上位ライブラリ。「この処理の次はこの処理」という流れ(ワークフロー)を、視覚的にわかりやすいグラフ構造で定義できる。

LangGraph公式ドキュメント

04

OpenAI API

GPT-4o-miniとEmbeddingモデルの呼び出しに使用する。APIキーは研修用のものを配布済み。

OpenAI社(ChatGPTの開発元)が提供する有料のAPI。プログラムからChatGPTと同じAIを呼び出せる。GPT-4o-miniは高速・低コストのモデル。Embeddingモデルはテキストを数値(ベクトル)に変換する用途で使う(Session 03で詳しく扱う)。

OpenAI モデル一覧

05

FAISS

ベクトル検索のローカルDB。Meta社が開発したオープンソースライブラリで、高速な類似度検索が可能。

FAISS = Facebook AI Similarity Search の略。数千から数百万件のテキストの中から「意味が近いもの」を高速に見つけ出す。データベースのようなものだが、キーワード一致ではなく意味の近さで検索できる点が特徴。

FAISS GitHub リポジトリ

HANDS-ON / 10 MIN
環境接続テスト
開発環境の前提知識

テストを実行する前に、これから扱う環境の仕組みを押さえておく。

  • Pythonのプロジェクトごとに独立したライブラリ環境を作る仕組み。
  • たとえばプロジェクトAでは LangChain 0.3 を使い、プロジェクトBでは LangChain 0.2 を使う、ということが可能になる。
  • .venv フォルダの中にそのプロジェクト専用のPythonとライブラリが入っている。
  • 有効化コマンド: .venv\Scripts\Activate.ps1(Windows)。プロンプト先頭に (.venv) と表示されれば有効化済み。

Python公式 venv ドキュメント

  • 環境変数(プログラムの外から渡す設定値)を記録するファイル。
  • APIキーのような機密情報をコードに直接書くとセキュリティリスクがある。.envファイルに分離することで、コードを他人に見せてもキーが漏れない。
  • 本研修では OPENAI_API_KEY=sk-xxxxx という形式でAPIキーが記録されている。
  • Pythonの dotenv ライブラリが .env ファイルを読み込んでくれる。
ファイル: 00_test_connection.py

OpenAI APIへの接続と、研修で使うライブラリがすべてインストールされているかを一括確認するスクリプト。

EXERCISE

接続テストを実行する

  1. ターミナルを開く(Ctrl + @)
  2. 仮想環境を有効化: .venv\Scripts\Activate.ps1
  3. python 00_test_connection.py を実行
## 期待される出力 ======================================== 環境チェック ======================================== [OK] OPENAI_API_KEY が設定されています [OK] langchain 0.3.x [OK] langchain-openai (インストール済み) [OK] langgraph (インストール済み) [OK] faiss-cpu (インストール済み) OpenAI API 接続テスト中... [OK] Chat モデル接続成功: 接続成功 Embedding 接続テスト中... [OK] Embedding 接続成功 (次元数: 1536) ======================================== チェック完了 ========================================
確認

全項目が [OK] であれば準備完了。1つでも [NG] がある場合は講師に声をかけてください。

エラー内容対処法
OPENAI_API_KEY が設定されていません .envファイルの内容と保存場所を確認する
ライブラリがインストールされていません 仮想環境を有効化して pip install -r requirements.txt を再実行する
Chat モデル接続失敗: AuthenticationError .envの OPENAI_API_KEY を確認する
Chat モデル接続失敗: APIConnectionError ネットワーク接続(プロキシ・VPN・ファイアウォール)を確認する
コードの実行方法(この後の全演習で使う)
Step 1: ターミナルを開く
VSCodeで Ctrl + @ を押してターミナルを表示する。
Step 2: 仮想環境を有効化
.venv\Scripts\Activate.ps1 を実行する。プロンプトの先頭に (.venv) と表示されれば有効化済み。
Step 3: スクリプトを実行
python ファイル名.py で実行する。
Step 4: 編集後は保存してから再実行
コードを編集したら Ctrl+S で保存してから再実行する。保存忘れは最も多いミス。
参考リンク
Python公式ドキュメント OpenAI APIリファレンス LangChain公式ドキュメント LangGraph公式ドキュメント VSCode公式サイト