GPT-4: ChatGPT 顔負けの AI チャットボットの使い方

ChatGPT が登場したとき、人々は AI チャットボットとしての自然言語能力に感銘を受け、畏敬の念を抱きました。しかし、大いに期待されていた GPT-4 大型言語モデルが登場すると、AI で可能だと考えられていたことの蓋が吹き飛ばされ、これを AGI (汎用人工知能) の初期の片鱗と呼ぶ人もいます。

このモデルの作成者である OpenAI は、これを同社の「より安全でより有用な応答を生成する最も先進的なシステム」と呼んでいます。使い方や何ができるのかなど、知っておくべきことはすべてここにあります。

GPT-4 は、正確な日は不明でしたが、Microsoft によって事前に確認されていたように、3 月 13 日に正式に発表されました。ただし、現時点では ChatGPT Plus の有料サブスクリプションでのみ利用できます。 ChatGPT の現在の無料バージョンは依然として GPT-3.5 に基づいていますが、比較すると精度や機能が劣ります。

GPT-4 は、「開発者がアプリケーションやサービスを構築するための」API としても利用できるようになりました。すでに GPT-4 を統合している企業には、Duolingo、Be My Eyes、Stripe、Khan Academy などがあります。 GPT-4 の最初の公開デモンストレーションも YouTube でライブストリーミングされ、その新機能の一部が披露されました。
GPT-4 の新機能は何ですか?
GPT-4 は OpenAI によって作成された新しい言語モデルで、人間の音声に似たテキストを生成できます。これは、現在 GPT-3.5 に基づいている ChatGPT で使用されているテクノロジを進化させたものです。 GPT は、Generative Pre-trained Transformer の頭字語で、人工ニューラルネットワークを使用して人間のように書くディープラーニングテクノロジーです。

OpenAI によると、この次世代言語モデルは、創造性、視覚的入力、より長いコンテキストという 3 つの主要な領域において ChatGPT よりも高度です。創造性の点では、創造的なプロジェクトの作成とユーザーとの共同作業の両方において GPT-4 の方がはるかに優れていると OpenAI は述べています。これらの例には、音楽、脚本、テクニカルライティング、さらには「ユーザーのライティングスタイルの学習」が含まれます。

GPT-4 開発者ライブストリーム
より長い文脈もこれに影響します。 GPT-4 は、ユーザーからのテキストを最大 25,000 ワード処理できるようになりました。 GPT-4 に Web リンクを送信して、そのページのテキストを操作するように依頼することもできます。 OpenAIによれば、これは長い形式のコンテンツや「長時間の会話」の作成に役立つ可能性があるという。

GPT-4 は、対話の基礎として画像を受信できるようになりました。 GPT-4 Web サイトで提供されている例では、チャットボットにいくつかの製パン材料の画像が与えられ、それらを使って何が作れるかを尋ねられます。ビデオも同じように使用できるかどうかは現時点では不明です。

最後に、OpenAI は、GPT-4 は前世代よりも使用するのが大幅に安全であるとも述べています。 OpenAI 独自の内部テストでは、事実に基づく回答が 40% 増加する一方で、「許可されていないコンテンツのリクエストに応答する」可能性が 82% 低くなることが報告されています。

OpenAIは、こうした進歩を遂げるために人間のフィードバックで訓練されてきたと述べ、「AIの安全性やセキュリティを含む分野での初期フィードバックのために50人以上の専門家と協力した」と主張している。

リリース以来数週間にわたり、ユーザーは、新しい言語の発明、現実世界への脱出方法の詳細、アプリの複雑なアニメーションをゼロから作成するなど、これを使って成し遂げた驚くべきことのいくつかを投稿してきました。最初のユーザーがこの製品を手に入れようと群がり、私たちはその機能を学び始めています。あるユーザーは、HTML と JavaScript を組み合わせて、GPT-4 に Pong の実用バージョンをわずか 60 秒で作成させたようです。

GPT-4 の視覚入力はどこにありますか?
GPT-4 で最も期待されている機能の 1 つは視覚入力です。これにより、ChatGPT Plus はテキストだけでなく画像を操作できるようになります。 OpenAI CEOのサム・アルトマン氏によると、画像を分析できることはGPT-4にとって大きな恩恵だが、安全性の問題を軽減するためにこの機能は保留されているという。

最近、一部のユーザー向けにビジュアル入力機能が公開された Bing Chat で、ビジュアル入力で何ができるかを試すことができます。 MiniGPT-4 と呼ばれる別のアプリケーションを使用してテストすることもできます。このオープンソースプロジェクトは博士課程の学生によって作成され、画像の処理には少し時間がかかりますが、ChatGPT で GPT-4 に正式に展開されれば、視覚入力を使用してどのような種類のタスクを実行できるかを示しています。プラス。

最高の GPT-4 プラグインは何ですか?
ChatGPTで計算を実行するWolframプラグイン。
プラグインは、ChatGPT Plus にお金を払う最大の理由の 1 つであり、モデルでできることの可能性を広げます。最も強力な例のうち 2 つは、コードインタープリターと Web ブラウザープラグインという OpenAI 自体によって作成されました。

ChatGPT Plus でこれらのプラグインを使用すると、GPT-4 の機能を大幅に拡張できます。 ChatGPT コードインタープリターは、永続セッションで Python を使用でき、アップロードとダウンロードも処理できます。一方、Web ブラウザプラグインは、GPT-4 にインターネット全体へのアクセスを提供し、モデルの制限を回避して、ユーザーに代わってインターネットからライブ情報を直接取得できるようにします。

GPT-4: ChatGPT 顔負けの AI チャットボットの使い方

コメント

プロフィール

カテゴリー

最新記事

RSS

リンク

P R