GPT-4VとDALL·E3のファーストインプレッション
ChatGPTの新機能「GPT-4V」と「DALL·E3」が登場しました。
弊社代表・杉山貴思が動画で解説しております。
動画の内容は以下の通りです。
【動画の内容】
- ChatGPTの新機能「GPT-4V」と「DALL·E3」についてのファーストインプレッション。
- GPT-4Vは画像をアップロードして認識する機能で、以下の10の機能が紹介されています:
物体認識:画像に含まれる主要な物体や要素を特定。
シーンの説明:画像全体のシーンやコンテキストを説明。
色の認識:画像内の主要な色や色のパターンを特定。
アニメキャラクターの識別:アニメや漫画のキャラクターを特定。
スタイルとテクスチャーの認識:画像のアートスタイルやテクスチャーを認識。
シンボルやロゴの識別:画像内のシンボルやロゴを特定。
比較と類似性:複数の画像を比較して類似点や違いを特定。
動物や植物の識別:画像内の動物や植物を認識。
テキストの読み取り:画像内のテキストを読み取る。
基本的な感情の解析:画像内のキャラクターや動物の表情から基本的な感情を推測。 - 冷蔵庫の中の食材の写真を分析させるデモンストレーションを行い、GPT-4Vが食材を認識し、それに基づいて料理のレシピを提案する様子を示しています。
- DALL·E3は画像生成機能で、例として「夕日が入る空を背景にタコの形の気球に乗っているペンギン」というプロンプトで2つの画像を生成するデモンストレーションが行われています。
- これらの機能はChatGPT PLUS(有料アカウント)で利用可能。