IoT＆AI

GPT-4VとDALL·E3のファーストインプレッション

2023.11.15

ChatGPTの新機能「GPT-4V」と「DALL·E3」が登場しました。

弊社代表・杉山貴思が動画で解説しております。

動画の内容は以下の通りです。

【動画の内容】

ChatGPTの新機能「GPT-4V」と「DALL·E3」についてのファーストインプレッション。
GPT-4Vは画像をアップロードして認識する機能で、以下の10の機能が紹介されています：
物体認識：画像に含まれる主要な物体や要素を特定。
シーンの説明：画像全体のシーンやコンテキストを説明。
色の認識：画像内の主要な色や色のパターンを特定。
アニメキャラクターの識別：アニメや漫画のキャラクターを特定。
スタイルとテクスチャーの認識：画像のアートスタイルやテクスチャーを認識。
シンボルやロゴの識別：画像内のシンボルやロゴを特定。
比較と類似性：複数の画像を比較して類似点や違いを特定。
動物や植物の識別：画像内の動物や植物を認識。
テキストの読み取り：画像内のテキストを読み取る。
基本的な感情の解析：画像内のキャラクターや動物の表情から基本的な感情を推測。
冷蔵庫の中の食材の写真を分析させるデモンストレーションを行い、GPT-4Vが食材を認識し、それに基づいて料理のレシピを提案する様子を示しています。
DALL·E3は画像生成機能で、例として「夕日が入る空を背景にタコの形の気球に乗っているペンギン」というプロンプトで2つの画像を生成するデモンストレーションが行われています。
これらの機能はChatGPT PLUS（有料アカウント）で利用可能。