AIプロダクトデザイン

種類	仕組み	例
教師あり学習	正解付きデータで学習	迷惑メール判定、画像分類、回帰
教師なし学習	正解なしでデータの構造を発見	顧客グループ分け、異常検知、クラスタリング
自己教師あり学習	データ自身から正解を作って学習	LLMの事前学習（次の単語予測）
強化学習	試行錯誤で報酬を最大化	ゲームAI、ロボット制御、RLHF

候補	晴れ	曇り	雨	良い	...
確率	35%	20%	15%	12%	...

	ChatGPT	Gemini	Claude
開発元	OpenAI	Google	Anthropic
得意分野	汎用性が高い、プラグイン豊富	Google連携、検索統合	長文処理、指示追従性、プログラミング
月額料金	無料〜30,000円（Plus 3,000円）	無料〜36,400円（AI Pro 2,900円）	無料〜$200（Pro $20）

要素	説明	例
役割	AIにどんな立場で回答してほしいか	「UXデザイナーとして」
タスク	何をしてほしいか	「アプリの改善案を提案して」
条件	制約や前提	「大学生向け、3つ、各50字以内」
出力形式	どんな形で回答してほしいか	「表形式で」「箇条書きで」

曖昧なプロンプト	具体的なプロンプト
いい名前を考えて	カフェ巡りアプリの名前を5つ考えて。ひらがなorカタカナ4文字以内で
文章を直して	この文章をビジネスメール向けに敬語で書き直して
要約して	300字以内で、高校生にもわかる表現で要約して
コードを書いて	Pythonで、CSVファイルを読み込み売上の合計を計算するコードを書いて

アンチパターン	問題点	改善策
曖昧すぎる	AIが意図を推測するしかない	条件を具体的に
長すぎる	重要な指示が埋もれる	要点を絞る・構造化する
矛盾した指示	AIが混乱して中途半端な回答	優先順位を明示
一度に多すぎる	各項目の精度が下がる	ステップに分ける
否定形だけ	「何をすべきか」が不明	「こうしてほしい」を書く

入力	出力	例
テキスト → テキスト	ChatGPT、Claude	チャット、要約
テキスト → 画像	DALL-E、Midjourney	画像生成
画像 → テキスト	GPT-4o、Claude	画像の説明・分析
音声 → テキスト	Whisper	文字起こし
テキスト → 音声	ElevenLabs	音声合成
テキスト → 動画	Sora、Veo	動画生成

# Transformerの何がすごかったのか **それまでの問題：** 文章を1単語ずつ順番に処理していた → 長い文章の前後関係を捉えるのが苦手 **Transformerの解決策：「自己注意機構（Self-Attention）」** 文章全体を一度に並列で見て、「どの単語がどの単語と関係が深いか」を計算する例：「銀行の **窓口** で **口座** を開いた」 → 「窓口」と「口座」が強く関係 → この「銀行」は金融機関だとわかる例：「部屋の **窓** から **川** が見えた」 → 「窓」と「川」が強く関係 → この文脈は建物の話だとわかる ---

# AIの歴史と現在地 | 年代 | 出来事 | | ----- | -------------------------------------------------- | | 1950s | AI研究の開始。チューリングテストの提唱 | | 1980s | エキスパートシステム（ルールベースAI）のブーム | | 2012 | ディープラーニングが画像認識で圧勝（AlexNet） | | 2017 | Transformer発表 → 現在のLLMの基盤 | | 2018 | BERT（Google）→ 文章理解が飛躍的に向上 | | 2020 | GPT-3（OpenAI）→ 大規模言語モデルの実力を証明 | | 2022 | ChatGPT公開 → 一般ユーザーがLLMを使える時代に | | 2023- | GPT-4, Gemini, Claude → マルチモーダル化・高性能化 | **今は「AIの第3次ブーム」の真っ只中。しかも今回は実用化が伴っている。** ---

# AIツールの使い分け | やりたいこと | おすすめツール | 理由 | | ------------------------ | ---------------- | ---------------------------------------------- | | 素早くアイデアを出したい | ChatGPT | レスポンスが速く、プラグインで拡張可能 | | 長文を読んで要約したい | Claude / Gemini | コンテキストウィンドウが大きく、長文処理が得意 | | 最新情報を調べたい | Gemini | Google検索と連携し、最新情報にアクセス可能 | | 画像を生成したい | ChatGPT (DALL-E) | チャットの流れで画像生成ができる | | コードを書きたい | Claude / ChatGPT | どちらもコード生成が得意 | **実際にはどれも高性能なので、まず使い慣れたツールで試してみる。** うまくいかないときに別のツールを試す、という運用でOK。 ---

# プロダクト開発で使えるAI技術マップ | フェーズ | 使えるAI技術 | 具体的なツール | | -------------- | ---------------------------- | --------------------------- | | アイデア出し | LLMによるブレスト | ChatGPT, Claude | | ユーザー調査 | インタビュー文字起こし・分析 | Whisper, LLM | | UI設計 | モックアップ画像生成 | DALL-E, Midjourney | | プロトタイプ | コード生成 | Claude Code, GitHub Copilot | | テスト | テストケース生成・バグ検出 | LLM | | ドキュメント | マニュアル・説明文生成 | LLM | | マーケティング | コピー・SNS投稿生成 | LLM, 画像生成AI | **この授業では特に「LLMによるアイデア出し」と「コード生成」を多用する。** ---

# AIと著作権・倫理 AIを使う上で知っておくべきルール： **著作権について：** - AIが学習に使ったデータには著作物が含まれている - AIの出力が既存の著作物に酷似する場合、著作権侵害のリスクがある - 日本では2024年に文化庁がAIと著作権に関するガイドラインを公開 - **原則：AIの出力をそのまま公開する前に、類似する既存作品がないか確認する** **学術利用について：** - レポートや論文でAIを使った場合は、その旨を明記する - AIの出力をそのまま自分の成果として提出するのは不正行為になりうる - **この授業では：AIの活用は推奨。ただし「AIに丸投げ」ではなく「AIと一緒に考える」姿勢を重視する** ---

大阪公立大学 2026年度前期 初年次ゼミナール

AIプロダクトデザイン

第2回 生成AIの仕組み・使い方

今日のアジェンダ

1. 機械学習の基本

AIとは何か？

ルールベース vs 機械学習

ルールベースのアルゴリズム

機械学習

機械学習の3ステップ

機械学習の種類

ニューラルネットワーク

なぜ今AIが急速に進歩しているのか？

2. 大規模言語モデル (LLM)

LLMとは何か

LLMの基本原理：次の単語を予測する

確率はどこから来るのか：コーパス

LLMはどうやって学習するのか

LLMの能力と限界

できること

LLM単体ではできないこと・苦手なこと

ハルシネーション（幻覚）とは

様々なLLMサービス

LLMの出力には必ず「ゆらぎ」がある

コンテキストウィンドウと「記憶」

3. AIツールを使ってみよう

演習の準備

演習1：ランチスポットを聞いてみよう

演習1：気づいたことを共有しよう

演習1：気づいたことを共有しよう

演習2：要約してもらおう

演習2：気づいたことを共有しよう

演習2：気づいたことを共有しよう

演習3：アイデア出しを手伝ってもらおう

演習3：気づいたことを共有しよう

演習3：気づいたことを共有しよう

4. プロンプトエンジニアリング

プロンプトとは

プロンプトの基本構造

プロンプトのテクニック①：具体性を上げる

プロンプトのテクニック②：段階的に指示する

プロンプトのテクニック③：例を示す（Few-shot）

プロンプトのテクニック④：役割を与える

プロンプトのテクニック⑤：出力形式を指定する

演習4：プロンプトを改善してみよう（10分）

演習4：共有タイム

プロンプトのアンチパターン

5. マルチモーダルAI

マルチモーダルAIとは

画像生成AI

画像生成AIの仕組み（拡散モデル）

画像認識・理解AI

音声AI

動画生成AI

AIをプロダクトに組み込むパターン

AI活用の落とし穴

AIのバイアス（偏見）

演習5：AIに画像を読ませてみよう

演習5：気づいたことを共有しよう

まとめと次回予告

今日学んだこと

次回：第3回 HCI・プロトタイピング

大阪公立大学 2026年度前期初年次ゼミナール

第2回生成AIの仕組み・使い方