大阪公立大学 2026年度前期 初年次ゼミナール

AIプロダクトデザイン

第2回 生成AIの仕組み・使い方

2026年4月21日・4月28日(火)3限 | 森之宮学舎 710小教室 | 石丸翔也

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

今日のアジェンダ

  1. 機械学習の基本 — AIはどうやって「学ぶ」のか
  2. 大規模言語モデル (LLM) — テキスト生成の仕組み
  3. AIツールを使ってみよう — ChatGPT / Gemini / Claude を操作
  4. プロンプトエンジニアリング — 書き方で出力が変わる
  5. マルチモーダルAI — 画像・音声・動画を扱うAI
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

1. 機械学習の基本

AIはどうやって「学ぶ」のか

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

AIとは何か?

AI (人工知能) とはコンピュータに知的なタスクを行わせる技術の総称

  • AIに学習能力を持たせる取り組みをMachine Learning (ML; 機械学習) と呼ぶ
  • 機械学習の中で高い性能を発揮している手法にDeep Learning (DL; 深層学習) がある

AI ⊃ ML ⊃ DL の関係性

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

ルールベース vs 機械学習

ルールベースのアルゴリズム

人間が「もし〇〇なら△△」という規則を用意

  • 「"当選"が含まれていたら迷惑メール」「送信元が〇〇なら迷惑メール」...

デメリットを挙げると...

  • 条件に合致しないサンプルに対応できない
  • ルールが増えすぎて管理不能に

機械学習

データをもとにパターンを自動で学習させる

  • 大量の「迷惑メール」と「正常メール」のデータを与えて、学習を実行

メリットは..?

  • 新しい迷惑メールにも対応できる
  • 人間が思いつかないパターンも発見できる
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

機械学習の3ステップ

① データを集める
例:ラベル付けされた、猫の画像1万枚と猫でない画像1万枚を用意

② モデルを学習させる
猫とそれ以外を区別するのに有効なパターンができるように内部パラメータを更新

③ 新しいデータで予測する
利用する際は画像を入れる。また、テストデータを作ってモデルの性能を評価・改善

人間でいうと:
① たくさんの猫を見る → ② 猫の特徴を覚える → ③ 初めて見た動物が猫か判断する

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

機械学習の種類

種類 仕組み
教師あり学習 正解付きデータで学習 迷惑メール判定、画像分類、回帰
教師なし学習 正解なしでデータの構造を発見 顧客グループ分け、異常検知、クラスタリング
自己教師あり学習 データ自身から正解を作って学習 LLMの事前学習(次の単語予測)
強化学習 試行錯誤で報酬を最大化 ゲームAI、ロボット制御、RLHF

現在の生成AI(LLM)は 自己教師あり学習 + 教師あり学習 + 強化学習 を段階的に組み合わせて作られている(詳しくは後述)

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

ニューラルネットワーク

機械学習の中でも特に強力な手法:ニューラルネットワーク

人間の脳の神経細胞(ニューロン)のつながり方を模倣した計算モデル

基本構造:

  • 入力層:データを受け取る(画像のピクセル値、テキストの単語など)
  • 隠れ層:データを変換・加工する(特徴を抽出する)
  • 出力層:結果を出す(「猫:95%」「犬:3%」...)

深層学習(ディープラーニング) = 隠れ層を多段に積み重ねたもの
→ 層が深いほど複雑なパターンを学習できる

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

なぜ今AIが急速に進歩しているのか?

3つの要因が同時に揃った:

① データの爆発的増加
インターネット上のテキスト・画像・動画が膨大に蓄積された

② 計算能力の向上
GPU(グラフィック処理装置)が大規模な並列計算を可能にした

③ 「学び方」の工夫が次々と発明された
画像が得意な仕組み、文章の流れを読む仕組み、文全体を一気に見渡す仕組み…と、扱うデータに合わせた手法か登場

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

2. 大規模言語モデル (LLM)

テキスト生成の仕組み

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

LLMとは何か

LLM = Large Language Model(大規模言語モデル)

  • 大量のテキストデータ(Web、書籍、論文...)で学習した巨大なニューラルネットワーク
  • パラメータ数:数十億〜数兆個(人間の脳のニューロン数 約860億と同程度の規模)
  • 「次に来る単語を予測する」という単純なタスクを繰り返し学習した結果、文章生成・要約・翻訳・推論などの多様な能力を獲得した
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

LLMの基本原理:次の単語を予測する

LLMの本質は「次に来る確率が最も高い単語 (トークン) を予測する」こと

例:「今日の天気は」の次に来る単語は?

候補 晴れ 曇り 良い ...
確率 35% 20% 15% 12% ...

→ 確率に基づいて1つ選ぶ → 「晴れ」
→ 「今日の天気は晴れ」の次は? → 「です」(40%)
→ 繰り返して文章を生成する

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

確率はどこから来るのか:コーパス

LLMはWeb・書籍・論文など膨大なテキスト(コーパス)を読み、どの単語の後にどの単語が続きやすいかを数え上げている

例:「日本の首都は」の次に来る単語
コーパスを検索すると…

  • 「日本の首都は東京」 … 数百万件
  • 「日本の首都はどこ」 … 数十万件
  • 「日本の首都はパリ (誤り)」 … 少数

→ 出現頻度が高い単語ほど、次に選ばれる確率が高くなる

この学習効率を高めるために様々なアルゴリズムやアーキテクチャが考案されている

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

LLMはどうやって学習するのか

Step 1:事前学習(Pre-training) = 自己教師あり学習
インターネット上の膨大なテキスト(数兆トークン)から「次の単語予測」を学習
→ 言語の文法、知識、推論パターンを獲得
→ 数千台のGPUで数か月かけて学習(数十億円規模のコスト)

Step 2:ファインチューニング(Fine-tuning) = 教師あり学習
人間が書いた高品質な対話データで追加学習
→ 「質問に対して適切に回答する」振る舞いを学ぶ

Step 3:RLHF(人間のフィードバックによる強化学習) = 強化学習
人間が「良い回答」「悪い回答」を評価 → その評価をもとにモデルを改善
→ 有害な回答を減らし、有用な回答を増やす

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

LLMの能力と限界

できること

  • 自然な文章の生成・要約・翻訳
  • 質問応答・情報の整理
  • プログラムコードの生成・デバッグ
  • アイデアの壁打ち・ブレインストーミング

LLM単体ではできないこと・苦手なこと

  • 事実の正確性の保証
  • 最新情報に基づく回答
  • 数学的な厳密計算
  • 自分の知識の限界の認識

ChatGPTをはじめとするLLMサービスはLLMを中心としたツールチェーンを構築することによってLLMの弱点の解消を進めている (Web検索で最新情報を取得、プログラムを書いて計算、...)

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

ハルシネーション(幻覚)とは

LLMが事実と異なる情報をもっともらしく生成してしまう現象

例:
Q: 「〇〇大学の△△教授の研究業績を教えて」
A: 「△△教授は2019年にNature誌に論文を発表し...」← 実在しない論文を生成

なぜ起きるのか:
LLMは「次の単語の確率」で文章を生成しているだけで、「事実かどうか」を検証する仕組みを持っていない

対策:

  • AIの出力を鵜呑みにしない。重要な情報は必ず一次情報源で確認する
  • 「出典を示して」と依頼し、その出典が実在するか確認する
  • AIは下書き生成の道具として使い、最終判断は人間が行う
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

様々なLLMサービス

ChatGPT Gemini Claude
開発元 OpenAI Google Anthropic
得意分野 汎用性が高い、プラグイン豊富 Google連携、検索統合 長文処理、指示追従性、プログラミング
月額料金 無料〜30,000円(Plus 3,000円) 無料〜36,400円(AI Pro 2,900円) 無料〜$200(Pro $20)

LLMを使った作業のパフォーマンスをさらに高めるには複数サービスの使い分けが有効

  • タスクによって得意・不得意が異なる
  • 同じサービスでも軽いモデル・重いモデルが用意されている

一方で、どれも互いの良さを取り込んで進歩しているので、「今どれが一番か」を追い続けるより、手に馴染んだ1つを深く使うことがおすすめ

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

LLMの出力には必ず「ゆらぎ」がある

LLMの出力にはランダム性(確率的サンプリング) が含まれている

「今日の天気は」→ 「晴れ」(35%) 「曇り」(20%) 「雨」(15%)...
→ 毎回確率に基づいてランダムに選ぶので、結果が変わる

ランダム性を調整するためのtemperatureという内部パラメータ (小さい値ほど安定、大きい値ほど創造的だが不安定) があるが、基本的には各LLMサービス/APIが理想値を設定しているので編集不要

ランダム性を無理に制御しようとするのではなく、複数の案を出力して選択する視点が重要

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

コンテキストウィンドウと「記憶」

LLMは会話のコンテキスト (文脈) を一定量しか保持できない

コンテキストウィンドウ = AIが一度に見られるテキストの長さ

  • GPT-4o:128,000トークン(本1冊分程度)
  • Claude (Sonnet 4.6):1,000,000トークン(本10冊分程度)
  • Gemini:1,000,000〜2,000,000トークン

重要な性質:

  • ウィンドウを超えると古い情報は「忘れる」
  • 新しい会話を始めると、前の会話の内容は引き継がれない

長い作業を依頼するときは、必要な情報を別ファイルに書いて会話を仕切り直すと良い

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

3. AIツールを使ってみよう

ChatGPT / Gemini / Claude を操作する

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習の準備

以下の3つのサービスにアクセスしてください(全て無料で使えます)

① OpenAI ChatGPT
https://chat.openai.com

② Google Gemini
https://gemini.google.com

③ Anthropic Claude
https://claude.ai

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習1:ランチスポットを聞いてみよう

3つのAIに同じプロンプトを入力して、出力を比較しよう。

入力するプロンプト:

大阪公立大学の森之宮キャンパスの近くで、学生が1000円以内で行けるおすすめのランチスポットを3つ、店名と特徴を添えて教えてください。

発展: 今度は聞き方を変えて違いを確認しよう。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習1:気づいたことを共有しよう

比較ポイント:

  • 3つのAIで挙がった店のラインナップは揃うか、バラバラか
  • どんな情報源(食べログ/Google Maps/個人ブログ等)を参照しているか
  • 「おすすめ」の基準(安さ・ボリューム・雰囲気)はAIごとにどう違うか
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習1:気づいたことを共有しよう

比較ポイント:

  • 3つのAIで挙がった店のラインナップは揃うか、バラバラか
  • どんな情報源(食べログ/Google Maps/個人ブログ等)を参照しているか
  • 「おすすめ」の基準(安さ・ボリューム・雰囲気)はAIごとにどう違うか

ここから学べること:

  • Web検索があっても何を参照したかで結論が変わる → 出典を確認する習慣をつける
  • 同じ指示でもAIごとに判断基準が違う → 自分の基準を言語化して伝える必要がある
  • 推薦系タスクは複数AIを使って視点を増やすのが有効
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習2:要約してもらおう

以下のテキストを3つのAIに入力してください:

入力するプロンプト:

https://aipd.shoya.io/ のWebサイトの内容を要約してください

発展: 今度は聞き方を変えて違いを確認しよう。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習2:気づいたことを共有しよう

比較ポイント:

  • どの情報を「重要」とみなして残したか(定義/歴史/共通点)
  • 原文の言葉をそのまま使うか、自分の言葉で言い換えるか
  • 情報1つあたりの粒度(長さ・詳しさ)は揃っているか
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習2:気づいたことを共有しよう

比較ポイント:

  • どの情報を「重要」とみなして残したか(定義/歴史/共通点)
  • 原文の言葉をそのまま使うか、自分の言葉で言い換えるか
  • 情報1つあたりの粒度(長さ・詳しさ)は揃っているか

ここから学べること:

  • 要約は単なる「圧縮」ではなく、何を重要とみなすかの判断が入っている
  • 欲しい要約を得るには「誰向け/何のため」という観点を指示に含める
  • AIの要約を鵜呑みにせず、原文と照合して抜け落ちた情報を確認する
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習3:アイデア出しを手伝ってもらおう

AIに壁打ち相手になってもらう体験をしよう。

入力するプロンプト:

大学1年生が日常で困っていることを10個挙げてください。それぞれについて、アプリで解決するならどんなアプリがあるか、作れそうかも一言で添えてください。

発展: 出力された中から1つ選んで、さらに深掘りしてみよう:

「〇〇」について、もっと具体的にどんな場面で困るか、シナリオを5つ挙げてください。

→ このような「対話を重ねて深掘りする」使い方がAIの強み

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習3:気づいたことを共有しよう

比較ポイント:

  • 挙がった困りごとはどの領域(学業/人間関係/生活/金銭など)に偏っているか
  • 自分や身近な人の実感と合う項目はいくつあるか、違和感のある項目はどれか
  • 最初のリストと深掘り後のシナリオで、具体性やリアリティはどう変わったか
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習3:気づいたことを共有しよう

比較ポイント:

  • 挙がった困りごとはどの領域(学業/人間関係/生活/金銭など)に偏っているか
  • 自分や身近な人の実感と合う項目はいくつあるか、違和感のある項目はどれか
  • 最初のリストと深掘り後のシナリオで、具体性やリアリティはどう変わったか

ここから学べること:

  • AIのアイデア出しは量ととっかかりのために使う。質は対話で引き上げる
  • 出てきた案を自分の実感で取捨選択する姿勢が必要(AIの提案=正解ではない)
  • 一発で完成させず、対話を重ねて深掘りすることで独自性のあるアイデアに近づく
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

4. プロンプトエンジニアリング

書き方で出力が変わる

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトとは

プロンプト(Prompt) = AIへの入力テキスト(指示文)

AIの出力品質はプロンプトの書き方に大きく左右される

悪いプロンプトの例:

なんかいい感じのアプリのアイデア教えて

良いプロンプトの例:

大学1年生が履修登録で困っている場面を想定して、その課題を解決するスマホアプリのアイデアを3つ提案してください。各アイデアについて、ターゲットユーザー、解決する課題、主な機能を1文ずつで説明してください。

→ 具体的で、条件が明確で、出力形式を指定している

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトの基本構造

良いプロンプトには4つの要素がある:

要素 説明
役割 AIにどんな立場で回答してほしいか 「UXデザイナーとして」
タスク 何をしてほしいか 「アプリの改善案を提案して」
条件 制約や前提 「大学生向け、3つ、各50字以内」
出力形式 どんな形で回答してほしいか 「表形式で」「箇条書きで」

全部入りの例:

あなたはUXデザイナーです。大学生向けの時間割管理アプリのユーザビリティ改善案を3つ提案してください。各提案は「課題→改善案→期待される効果」の形式で、それぞれ140文字以内で記述してください。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトのテクニック①:具体性を上げる

曖昧 → 具体的 に変えるだけで出力が大幅に改善する

曖昧なプロンプト 具体的なプロンプト
いい名前を考えて カフェ巡りアプリの名前を5つ考えて。ひらがなorカタカナ4文字以内で
文章を直して この文章をビジネスメール向けに敬語で書き直して
要約して 300字以内で、高校生にもわかる表現で要約して
コードを書いて Pythonで、CSVファイルを読み込み売上の合計を計算するコードを書いて

ポイント: AIは「あなたの頭の中」を読めない。
文脈・条件・期待する出力をすべて言葉にして伝える必要がある。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトのテクニック②:段階的に指示する

一度に複雑な指示を出すより、ステップに分ける方が精度が上がる

一度に全部(精度が落ちやすい):

大学生向けアプリのアイデアを考えて、ペルソナを作って、画面設計もして

段階的に(精度が上がる):

① 大学1年生が困っていることを5つ挙げて
② その中で「空きコマの過ごし方」に焦点を当てて、ペルソナを1人作って
③ そのペルソナが使うアプリの画面構成を3画面分提案して

→ 各ステップでAIの回答を確認し、必要なら修正を加えてから次に進む

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトのテクニック③:例を示す(Few-shot)

AIに「こういう形式で答えてほしい」という例を1〜2個示すと精度が上がる

例なし:

以下のアプリレビューの感情を分析してください

例あり(Few-shot prompting):

以下のアプリレビューの感情を分析してください。

例1:「使いやすくて毎日開いてます!」→ ポジティブ(理由:満足度が高い)
例2:「アップデートで重くなった」→ ネガティブ(理由:品質低下への不満)

分析対象:「デザインは良いけど通知が多すぎる」→

→ 形式・粒度・判断基準が例から伝わるので、期待通りの回答が得られやすい

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトのテクニック④:役割を与える

AIに専門家の役割を与えると、その分野に適した回答が得られやすい ...こともある

役割なし:

このアプリの問題点を教えて

役割あり:

あなたは10年の経験を持つUXデザイナーです。新入社員が持ってきたこのアプリの問題点を...

基本的にはどのLLMサービスも「デフォルト」で良い出力が得られるようチューニングされているので、あくまで別の視野が必要な時に使うくらいで良い

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトのテクニック⑤:出力形式を指定する

出力形式を明示すると、整理された使いやすい回答が得られる

形式指定の例:

表形式で出力してください:
| 機能名 | メリット | デメリット | 優先度(高/中/低) |

以下の構成で出力してください:
【課題】〇〇
【解決策】〇〇
【実装の難易度】〇〇

→ 後で加工しやすい形式を指定すると、作業効率が上がる

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習4:プロンプトを改善してみよう(10分)

以下の「悪いプロンプト」を、今学んだテクニックを使って改善してください。

改善前:

ヒットするアプリのアイデアちょうだい

改善のヒント:

  • 役割を与える
  • ターゲットユーザーを明確にする
  • 条件を具体化する(個数、文字数、形式)
  • 出力形式を指定する

改善したプロンプトを実際にAIに入力して、出力の違いを体感してください。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習4:共有タイム

改善前と改善後で、出力はどう変わった?

よくある改善パターン:

  • 「3つ提案して」→ ちょうど3つ返ってくる
  • 「表形式で」→ 情報が整理されて比較しやすい
  • 「大学生向け」→ 年齢に合った提案になる
  • 「〇〇として回答して」→ 専門的な視点が加わる

まとめ:プロンプトは「AIへの設計書」
プロダクトの要件定義と同じ。曖昧な要件からは曖昧な成果物しか生まれない。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

プロンプトのアンチパターン

避けるべきプロンプトの書き方:

アンチパターン 問題点 改善策
曖昧すぎる AIが意図を推測するしかない 条件を具体的に
長すぎる 重要な指示が埋もれる 要点を絞る・構造化する
矛盾した指示 AIが混乱して中途半端な回答 優先順位を明示
一度に多すぎる 各項目の精度が下がる ステップに分ける
否定形だけ 「何をすべきか」が不明 「こうしてほしい」を書く

「AIが期待通りの回答をしない」のは、多くの場合プロンプトの問題。
→ まず自分の指示を見直す習慣をつけよう。

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

5. マルチモーダルAI

テキスト以外も扱えるAI

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

マルチモーダルAIとは

モーダル(Modality) = 情報の種類・形式
テキスト、画像、音声、動画、コード... これらは異なるモーダル

マルチモーダルAI = 複数のモーダルを同時に扱えるAI

入力 出力
テキスト → テキスト ChatGPT、Claude チャット、要約
テキスト → 画像 DALL-E、Midjourney 画像生成
画像 → テキスト GPT-4o、Claude 画像の説明・分析
音声 → テキスト Whisper 文字起こし
テキスト → 音声 ElevenLabs 音声合成
テキスト → 動画 Sora、Veo 動画生成
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

画像生成AI

テキストの指示(プロンプト)から画像を生成する技術

主なサービス:

  • DALL-E 3(OpenAI / ChatGPTに統合)
  • Midjourney(Discord経由で利用)
  • Stable Diffusion(オープンソース)
  • Adobe Firefly(Adobeツール統合、商用利用に配慮)
  • Gemini Imagen(Google)

プロダクトでの活用例:

  • UIデザインのモックアップ生成
  • プレゼン資料用のイラスト作成
  • ブランドのビジュアルコンセプト検討
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

画像生成AIの仕組み(拡散モデル)

現在の画像生成AIの主流:拡散モデル(Diffusion Model)

原理:
① きれいな画像にノイズ(砂嵐)を少しずつ加えていく過程を学習
② 学習後、ノイズだらけの画像から「ノイズを除去」する方向に生成
③ テキストの条件(プロンプト)に合うようにノイズ除去を誘導

イメージ:

  • 砂嵐の画面(ノイズ100%)からスタート
  • 「青い空と海の風景」という条件に合うように、少しずつノイズを取り除く
  • 最終的にプロンプトに合った画像が現れる

→ 「AIが絵を描いている」のではなく「ノイズから条件に合う画像を復元している」

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

画像認識・理解AI

画像を入力として受け取り、内容を理解・説明するAI

できること:

  • 画像内の文字を読み取る (OCR; Optical Character Recognition)
  • グラフや図表のデータを読み取る
  • UIデザインのスクリーンショットを分析する
  • 手書きのメモやスケッチを解釈する

プロダクトでの活用例:

  • アクセシビリティ (画像の代替テキスト自動生成)
  • レシート・領収書の自動読み取り
  • 名刺のデジタル化
  • 建物や植物の画像検索
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

音声AI

音声認識 (Speech-to-Text; 音声をテキストに変換する)

  • OpenAI Whisper:多言語対応の高精度文字起こし
  • Google Speech-to-Text:リアルタイム認識が得意
  • 活用例:議事録自動作成、字幕生成、音声入力

音声合成 (Text-to-Speech; テキストを自然な音声に変換する)

  • ElevenLabs:感情表現豊かな音声合成
  • OpenAI TTS:多言語の自然な音声
  • 活用例:読み上げ機能、ポッドキャスト生成、多言語対応

音声対話は認識+生成を組み合わせてリアルタイム会話を実現している

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

動画生成AI

テキストや画像から動画を生成する(2024〜2025年に急速に発展)

主なサービス:

  • Veo(Google DeepMind):最新はVeo 4。音声同期・長尺に対応
  • Runway Gen-4.5:クリエイター向け。物理シミュレーションが高精度

現状の限界:

  • 物理法則の正確な再現が難しい場面がまだある
  • 長時間の一貫性維持が課題
  • 生成に時間がかかる
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

AIをプロダクトに組み込むパターン

① チャットボット型
ユーザーの質問に自然言語で回答する

② レコメンデーション型
ユーザーの行動から好みを学習し、おすすめを表示

③ 自動生成型
ユーザーの入力をもとにコンテンツを生成

④ 認識・分類型
入力データを自動で認識・分類する

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

AI活用の落とし穴

① AIを使う必然性があるか?
ルールベースで十分な問題にAIを使うのはオーバーエンジニアリング
例:「営業時間の表示」にAIは不要

② エラー時のフォールバックはあるか?
AIは100%正確ではない。間違えたときにユーザーが困らない設計が必要
例:AIの回答に「参考情報です。正確性は保証しません」と表示

③ ユーザーの信頼を損なわないか?
AIがもっともらしいウソを言うと、プロダクト全体の信頼を失う
例:医療・法律の情報をAIが断定的に回答 → 危険

④ 倫理的に問題はないか?
プライバシー、バイアス、著作権の問題を事前に検討する

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

AIのバイアス(偏見)

AIは学習データに含まれるバイアスを引き継ぐ

例:

  • 「CEOのイラストを描いて」→ 男性のイラストばかり生成される
  • 「優秀な学生の特徴は?」→ 特定の文化圏の価値観に偏った回答
  • 「犯罪者の特徴を予測して」→ 人種や地域に基づく差別的な結果

学習データ(インターネット上のテキスト・画像)自体が社会の偏見を反映している

AIプロダクト設計で重要なこと:

  • 特定の属性(性別、年齢、人種)に基づく判断にAIを安易に使わない
  • AIの出力にバイアスがないかチェックするする機構をプロンプトやシステムに組み込む
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習5:AIに画像を読ませてみよう

ChatGPTまたはClaudeで画像認識を体験しよう。

やり方:

  1. スマホで身の回りのものを1枚撮影する(教室、ペン、ノートなど)
  2. AIのチャットに画像をアップロードする
  3. 「この画像に何が写っていますか?」と聞く

発展:

  • 「この画像からUXの問題点を指摘して」と聞いてみる
  • OMU+の画面スクリーンショットを読ませて分析させてみる
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

演習5:気づいたことを共有しよう

よくある発見:

  • テキストの読み取り精度が高い
  • 物体の認識はできるが、文脈の理解は人間に劣る
  • 「何が写っているか」は得意、「なぜそうなっているか」は苦手

プロダクトへの応用アイデア:

  • 手書きのワイヤフレームを写真に撮ってAIに説明させる → 第3回で実践
  • UIのスクリーンショットを読ませて改善点を指摘させる
  • 議事録代わりにホワイトボードを撮影してAIに整理させる
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

まとめと次回予告

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

今日学んだこと

機械学習の基本:

  • AIは「ルールを書く」のではなく「データからパターンを学習する」
  • 現在の生成AIの多くは 自己教師あり学習 + 教師あり学習 + 強化学習 を組み合わせている

Large Langauge Model(LLM)の仕組み:

  • 大規模言語モデルは「次の単語の予測」を繰り返してテキストを生成している
  • LLMサービスはツールチェーンの構築によってLLM単体の弱点の解消を進めている

プロンプトエンジニアリング:

  • 同じタスクでも、指示を具体化すると目的の応答を得やすくなる
  • 一度で解を得ようとせず、複数回・段階的な指示を前提としてプロンプトを書くと良い

マルチモーダルAI:

  • テキスト以外にも画像・音声・動画などを扱えるAIがある
  • 授業の後半で行うプロダクト開発の各フェーズで活用できる
AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

次回:第3回 HCI・プロトタイピング

ユーザビリティ、アフォーダンス、フィードバックなど、ヒューマンコンピュータインタラクション (HCI) の基本原則を事例とともに学ぶ。「誰のどんな課題を解くか」を明確にするためのユーザーシナリオの作成手法を実践する。手描きやAI画像生成により、UIプロトタイプ (ワイヤーフレーム〜モックアップ) を作成する。

a日程:5/12 (火) b日程:5/19 (火)

AIプロダクトデザイン|第2回 生成AIの仕組み・使い方

# Transformerの何がすごかったのか **それまでの問題:** 文章を1単語ずつ順番に処理していた → 長い文章の前後関係を捉えるのが苦手 **Transformerの解決策:「自己注意機構(Self-Attention)」** 文章全体を一度に並列で見て、「どの単語がどの単語と関係が深いか」を計算する 例:「銀行の **窓口** で **口座** を開いた」 → 「窓口」と「口座」が強く関係 → この「銀行」は金融機関だとわかる 例:「部屋の **窓** から **川** が見えた」 → 「窓」と「川」が強く関係 → この文脈は建物の話だとわかる ---

# AIの歴史と現在地 | 年代 | 出来事 | | ----- | -------------------------------------------------- | | 1950s | AI研究の開始。チューリングテストの提唱 | | 1980s | エキスパートシステム(ルールベースAI)のブーム | | 2012 | ディープラーニングが画像認識で圧勝(AlexNet) | | 2017 | Transformer発表 → 現在のLLMの基盤 | | 2018 | BERT(Google)→ 文章理解が飛躍的に向上 | | 2020 | GPT-3(OpenAI)→ 大規模言語モデルの実力を証明 | | 2022 | ChatGPT公開 → 一般ユーザーがLLMを使える時代に | | 2023- | GPT-4, Gemini, Claude → マルチモーダル化・高性能化 | **今は「AIの第3次ブーム」の真っ只中。しかも今回は実用化が伴っている。** ---

# AIツールの使い分け | やりたいこと | おすすめツール | 理由 | | ------------------------ | ---------------- | ---------------------------------------------- | | 素早くアイデアを出したい | ChatGPT | レスポンスが速く、プラグインで拡張可能 | | 長文を読んで要約したい | Claude / Gemini | コンテキストウィンドウが大きく、長文処理が得意 | | 最新情報を調べたい | Gemini | Google検索と連携し、最新情報にアクセス可能 | | 画像を生成したい | ChatGPT (DALL-E) | チャットの流れで画像生成ができる | | コードを書きたい | Claude / ChatGPT | どちらもコード生成が得意 | **実際にはどれも高性能なので、まず使い慣れたツールで試してみる。** うまくいかないときに別のツールを試す、という運用でOK。 ---

# プロダクト開発で使えるAI技術マップ | フェーズ | 使えるAI技術 | 具体的なツール | | -------------- | ---------------------------- | --------------------------- | | アイデア出し | LLMによるブレスト | ChatGPT, Claude | | ユーザー調査 | インタビュー文字起こし・分析 | Whisper, LLM | | UI設計 | モックアップ画像生成 | DALL-E, Midjourney | | プロトタイプ | コード生成 | Claude Code, GitHub Copilot | | テスト | テストケース生成・バグ検出 | LLM | | ドキュメント | マニュアル・説明文生成 | LLM | | マーケティング | コピー・SNS投稿生成 | LLM, 画像生成AI | **この授業では特に「LLMによるアイデア出し」と「コード生成」を多用する。** ---

# AIと著作権・倫理 AIを使う上で知っておくべきルール: **著作権について:** - AIが学習に使ったデータには著作物が含まれている - AIの出力が既存の著作物に酷似する場合、著作権侵害のリスクがある - 日本では2024年に文化庁がAIと著作権に関するガイドラインを公開 - **原則:AIの出力をそのまま公開する前に、類似する既存作品がないか確認する** **学術利用について:** - レポートや論文でAIを使った場合は、その旨を明記する - AIの出力をそのまま自分の成果として提出するのは不正行為になりうる - **この授業では:AIの活用は推奨。ただし「AIに丸投げ」ではなく「AIと一緒に考える」姿勢を重視する** ---