
GPT-4o mini 登場!
みなさんこんにちは。
先週新しい AI モデルである GPT-4o mini が発表・リリースされました。
Azure OpenAI でも、Azure OpenAI Studioのプレイグラウンドから利用することができます。
GPT-4o の時も最初はプレイグラウンドのみでの利用でしたが、1, 2 週間後には API 利用もできるようになっていたため、今後に期待です。
GPT-4o について
GPT-4o mini の特徴
GPT-4o mini は GPT-3.5 の後継となるモデルです。
価格は GPT-3.5 よりも安く、応答速度も速いモデルとなっています。
それだけでなく、応答精度も非常に高いです。
軽く使っただけでも速度と精度には驚くこと間違いなしの性能です。
従来モデルとの比較
以下の内容 Azure OpenAI の他モデルとの検証を行いました。
(私が直接検証したわけではないのですが、後輩君からブログ投稿を託されたので結果を拝借します。)
■検証したモデル
・GPT-3.5 (0125)
・GPT-4o
・GPT-4o mini
■検証したプロンプト項目
①物語の作成
プロンプト:
次のキーワードを使って 1,000 文字以内の短編小説を書いてください。
キーワード:ロボット、冒険、友情
②要約
プロンプト:
次の文章を 100 文字以内で要約してください。
AI に関する文章(900文字)
検証結果
応答精度は①②ともにどのモデルでも申し分ない内容でした。
ここでは応答速度に注目して結果を記載します。
①物語の作成
・GPT-3.5 : 25秒(550文字)
・GPT-4o : 30秒(999文字)
・GPT-4o mini : 8秒(940文字)
②要約
・GPT-3.5 : 8秒(196文字)
・GPT-4o : 3秒(107文字)
・GPT-4o mini : 3秒(110文字)
GPT-4o も十分に応答速度は速いですが、 GPT-4o mini の速さがとにかく目立つ結果となりました。
検証から思ったこと
GPT-4o-mini がすごいのは言うまでもないのですが、今回の GPT-4o mini の登場と検証結果からファインチューニングという手法の難しさを改めて感じました。
ファインチューニングは、自前のデータを用意し、それを使ってモデルを学習させる手法です。大量のデータが必要となり、データの質も求められます。簡単に言ってしまえばとてもコストのかかる手法です。
それだけで活用するのは難しいのですが、今の時代は AI の進化が著しいです。せっかく学習させても、性能が大幅に向上した新モデルが数か月先には登場します。 GPT-4o mini のように応答速度が大幅に向上するのであれば、新モデルに乗り換えたくなるところです。
しかし、旧モデルで使用していた学習データをそのまま新モデルに使用できるとは限りません。学習そのものにかかる時間もそうですが、データの選定からまた行う必要があると考えると新モデルに移行するのは容易ではありません。
AI の進化がある程度落ち着いたら有効な場面も多い手法だとは思いますが、今の時代であればファンクションコーリングや RAG の活用を考えた方が良いのではないかと思いました。
GPT-4o mini に関してはまだ複雑なプロンプトや RAG での検証ができていないので、応答精度についてはもう少し詳しく調べたいと思います。
ここまで閲覧いただきありがとうございました!