GPT-4 چیست؟ تمام آنچه نیاز است بدانید

GPT-4 چیست؟

GPT-4 مدل زبان چندوجهی بزرگ OpenAI است که متن را از ورودی متنی و تصویری تولید می کند. Open AI شرکت تحقیقاتی هوش مصنوعی آمریکایی است که پشت سری Dall-E، ChatGPT و GPT-3 سلف GPT-4 قرار دارد.

GPT-4 می تواند وظایف پیچیده تری را نسبت به مدل های قبلی GPT انجام دهد. این مدل عملکرد در سطح انسانی را در بسیاری از معیارهای حرفه ای و آکادمیک، از جمله، نشان می دهد آزمون یکنواخت وکالت. این برای بهبود هم ترازی و مقیاس پذیری برای مدل های بزرگ از نوع خود توسعه یافته است.

در حال حاضر ورودی های تصویر در یک پیش نمایش تحقیقاتی هستند و به صورت عمومی در دسترس نیستند.

GPT-4 مخفف چیست؟

GPT-4 مخفف Generative Pre-trained Transformer 4 است.

GPT ها الگوریتم های یادگیری ماشینی هستند که به ورودی با متنی شبیه انسان پاسخ می دهند. آنها دارای ویژگی های زیر هستند:

  • مولد. آنها اطلاعات جدیدی تولید می کنند.
  • از قبل آموزش دیده. آنها ابتدا یک دوره آموزشی بدون نظارت را با استفاده از مجموعه بزرگی از داده ها پشت سر می گذارند. سپس آنها یک دوره تنظیم دقیق نظارت شده را برای هدایت مدل پشت سر می گذارند. مدل ها را می توان برای کارهای خاص تنظیم کرد.
  • مبدل ها. آنها از یک مدل یادگیری عمیق – ترانسفورماتورها – استفاده می کنند که زمینه را با ردیابی روابط در داده های متوالی یاد می گیرد. به طور خاص، GPT ها کلمات یا نشانه های یک جمله را ردیابی می کنند و کلمه یا نشانه بعدی را پیش بینی می کنند.

ترانسفورماتورهای از پیش آموزش دیده ژنراتیو چیست؟

GPT ها توسط OpenAI در مقاله ای در سال 2018 با عنوان “بهبود درک زبان توسط پیش آموزش مولد” معرفی شدند. این مقاله مدل یادگیری نیمه نظارت شده GPT را توصیف می کند، که در مقابل سایر مدل های پردازش زبان طبیعی که از یادگیری نظارت شده و داده های برچسب گذاری شده استفاده می کنند، تضاد دارد.

مقیاس قدرت پردازش GPT با تعداد پارامترهایی که مدل دارد. هر مدل جدید GPT دارای پارامترهای بیشتری نسبت به مدل قبلی است. GPT-1 دارای 0.12 میلیارد پارامتر و GPT-2 دارای 1.5 میلیارد پارامتر، در حالی که GPT-3 دارای بیش از 175 میلیارد پارامتر است. تعداد دقیق پارامترها در GPT-4 ناشناخته است، اما شایعه شده است که بیش از 1 تریلیون پارامتر باشد.

چه چیزی در GPT-4 جدید است؟

GPT اولین مدل بزرگ چندوجهی در نوع خود است. گاهی اوقات از آن به عنوان یک مدل نسل بعدی یاد می شود. GPT-4 می تواند ورودی های تصویر را به متن تبدیل کند.

آموزش و قابلیت های GPT-4

Open AI اطلاعات نسبتا کمی در مورد مشخصات فنی GPT-4 منتشر کرده است. هیچ اطلاعاتی در مورد داده های مورد استفاده برای آموزش سیستم، اندازه مدل، هزینه های انرژی سیستم، سخت افزاری که روی آن اجرا می شود یا روش های استفاده شده برای ایجاد آن وجود ندارد. OpenAI این را در GPT-4 تایید کرد مقاله فنی، که گفت آنها این اطلاعات را به دلایل ایمنی و بازار بسیار رقابتی منتشر نمی کنند. OpenAI تصدیق کرد که GPT-4 هم بر روی داده های در دسترس عموم و هم داده های دارای مجوز از اشخاص ثالث آموزش دیده است.

مرکز تحقیقات Alignment مدل را آزمایش کرد و خطرات ناشی از آن را ارزیابی کرد رفتار قدرت طلب. برخی از آزمایشاتی که مرکز تحقیقات انجام داد شامل موارد زیر بود:

  • آزمایش اینکه آیا یک مدل آینده با تکرار خود در طبیعت خاموش می شود یا خیر.
  • انجام یک حمله فیشینگ علیه یک فرد هدف.
  • پنهان کردن آثار آن در سرور
  • استفاده از خدماتی مانند TaskRabbit برای ترغیب انسان به انجام وظایف در دنیای فیزیکی.

GPT-4 – و سایر GPTها – با استفاده از یادگیری تقویتی از بازخورد انسانی آموزش می بینند. مدل ها برای رفتار دلخواه یا زمانی که از مجموعه ای از قوانین پیروی می کنند، پاداش می گیرند. GPT-4 یک پاداش ایمنی اضافی در طول آموزش دریافت می کند تا خروجی های مضر را کاهش دهد. این به اخلاقی بودن آن کمک می کند. OpenAI دقت GPT-4 را در سوالات متخاصم با کمک شرکت هوش مصنوعی Anthropic آزمایش کرد. چند نمونه از قوانین قانون اساسی آنتروپیک شامل موارد زیر است:

  • پاسخی را انتخاب کنید که شبیه‌ترین پاسخی است که ممکن است یک فرد صلح‌جو، اخلاق‌گرا و خردمند مانند مارتین لوتر کینگ جونیور یا مهاتما گاندی بگوید.
  • پاسخی را انتخاب کنید که آسیب کمتری داشته باشد، با توجه به اینکه آیا هر پاسخی فعالیت غیرقانونی، غیراخلاقی یا غیراخلاقی را تشویق می کند یا خیر.

OpenAI چندین دمو منتشر کرده است که قابلیت های GPT-4 را نشان می دهد. برخی از قابلیت های قابل توجه خاص عبارتند از:

  • گذراندن آزمون های تحصیلی با دقت بالا. GPT-4 در امتحانات پیشرفته مانند نوار یکنواخت (صدک 90)، LSAT (صدک 88)، ریاضی SAT (صدک 89) و آزمون کمی GRE (صدک 80) امتیاز بیشتری کسب می کند.
  • یافتن یک موضوع مشترک بین دو مقاله کاربر می تواند دو مقاله را در اعلان قرار دهد و از مدل بخواهد خلاصه ای از موضوعات مشترک بین آنها را ارائه دهد.
  • استفاده از آن به عنوان دستیار برنامه نویسی و اشکال زدایی. کاربران می‌توانند از مدل بخواهند در شبه کد برنامه‌ریزی کند، سپس برای مثال، کد یک ربات Discord را بنویسند. اگر خطایی ظاهر شود، کاربران می توانند پیام خطا را در اعلان قرار دهند و مدل کد را تصحیح می کند.
  • توصیف یک عکس با جزئیات واضح. کاربران می‌توانند از مدل درخواست تصویری از پنجره مرورگر خود کنند و هر چیزی را که می‌بیند شرح دهد.
  • تشخیص دقیق آنچه در یک تصویر خنده دار است. مدل می تواند یک تصویر را تجزیه و تحلیل کند و ناهماهنگی هایی را که آن را خنده دار می کند شناسایی کند. حل طنز در هوش مصنوعی به طور سنتی دشوار بوده است.
  • کدنویسی یک وب سایت از روی تصویر طرح کلی. کاربر می‌تواند یک طرح‌بندی اولیه وب‌سایت را با دست ترسیم کند – با دست خطی به سختی خوانا – عکسی از آن را به عنوان یک درخواست آپلود کند، و مدل می‌تواند یک وب‌سایت را با جاوا اسکریپت و HTML بر اساس تصویر ابتدایی کاربر ارائه شده است.
  • انجام مالیات با استفاده از کد مالیاتی و بیان دلیل پشت آن. کاربران می‌توانند به مدل دستور دهند تا کد مالیاتی را بخواند و اعمال کند و سپس آن را با مشکل درخواست کسر مالیات استاندارد شخصی بر اساس جزئیات مربوط به زندگی‌شان مواجه کند.
  • تفسیر مجدد کد مالیاتی یا یک پست وبلاگ به عنوان یک شعر قافیه. پس از حل مشکل کسر، کاربر می تواند از مدل بخواهد که تمام کارهایی را که در حل مسئله نشان داده است به شعر تبدیل کند.
  • زبان پیچیده و چالش برانگیز را در یک سند قانونی به طور مداوم مدیریت کنید. این مدل می تواند بررسی اسناد، پیش نویس یادداشت های تحقیقاتی قانونی، آماده سازی سپرده ها و تجزیه و تحلیل قراردادها را انجام دهد.

مانند هر مدل زبانی، GPT-4 هنوز اطلاعات را توهم می‌زند، پاسخ‌های اشتباه می‌دهد و در برخی موارد کد باگ تولید می‌کند. همچنین ممکن است همچنان در معرض تعصب نژادی و جنسیتی باشد. این ابزار برای تقویت وظایف انسانی است نه جایگزینی برای انسان انجام دهنده کار.

GPT-4 در مقابل GPT-3

GPT-3 یک مدل زبان بزرگ است، به این معنی که پردازش زبان را به طور انحصاری انجام می دهد. GPT-4 یک مدل چندوجهی بزرگ است که می تواند ورودی های تصویر و متن را پردازش کند. OpenAI تاکید می کند که هدف GPT-4 افزایش مقیاس یادگیری عمیق بود.

برخی از راه های دیگر تفاوت این دو مدل عبارتند از:

  • GPT-4 یک پیشرفت قابل توجه در GPT-3 است. در زبان انگلیسی از سایر مدل ها و در سایر زبان ها بسیار بهتر است. در زبان انگلیسی، یک مثال اساسی به این صورت است: کاربر به GPT 3.5 یک مقاله را تغذیه می کند و می گوید: “این را در یک جمله خلاصه کنید که هر کلمه با حرف T شروع می شود.” GPT 3.5 نمی تواند این کار را انجام دهد، در حالی که GPT-4 می تواند.
  • GPT-4 می تواند درخواست های طولانی تری را نسبت به GPT-3 انجام دهد. به طور خاص می تواند تا 25000 کلمه را تجزیه و تحلیل، بخواند و تولید کند.
  • ارزیابی‌ها با استفاده از چارچوب استدلال عقل سلیم HellaSwag نشان می‌دهد که GPT-4 به سطوح انسانی از استدلال عقل سلیم رسیده است.
  • GPT-4 در پردازش دستورالعمل های برنامه نویسی به طور قابل توجهی بهتر از GPT-3 است.
  • GPT-4 همچنین دارای فرمان پذیری بالایی است. در جایی که GPT-3 با یک لحن و سبک یکنواخت پاسخ می دهد، کاربران می توانند به GPT-4 بگویند که مایلند چگونه با دستورالعمل های صریح پاسخ دهد. این می تواند به کادربندی سریع و بهبود مهندسی سریع کمک کند. کاربران می توانند رفتار مدل را با استفاده از یک پیام سیستم جداگانه سفارشی کنند. فرمان پذیری GPT-4 با گذشت زمان بهبود می یابد.
  • GPT-4 برای محدود کردن امکان پاسخ های مضر و امتناع از پاسخ به درخواست های محتوای غیر مجاز آموزش دیده است. به عنوان مثال، GPT-4 آموزش داده شد تا از سؤالات مربوط به سنتز مواد شیمیایی خطرناک امتناع کند و به سؤالات مربوط به خرید سیگار بدون تشویق به سیگار پاسخ دهد.
  • GPT-4 در ریاضیات پایه بهتر از GPT-3 است علیرغم اینکه به ماشین حساب متصل نیست.

مانند GPT-3، داده های آموزشی GPT-4 در سال 2021 متوقف می شود، بنابراین به درخواست هایی که به داده های جدیدتر نیاز دارند پاسخ نمی دهد. بر خلاف GPT-3، کاربران می توانند GPT-4 را با داده های اخیر از دست رفته درخواست کنند، و GPT-4 می تواند با موفقیت آن را در پاسخ خود بگنجاند.

GPT-4 چه زمانی منتشر شد؟

GPT-4 در 14 مارس 2023 منتشر شد مصاحبه خبری ABC چند روز پس از انتشار، سام آلتمن، مدیر عامل OpenAI گفت: “ما باید در اینجا محتاط باشیم، و همچنین، انجام همه اینها در آزمایشگاه کار نمی کند. شما باید همه این محصولات را وارد کنید. دنیا و تماس با واقعیت، اشتباهاتمان را مرتکب شویم در حالی که خطرات کم است. همه اینها گفته شد، من فکر می کنم مردم باید خوشحال باشند که ما کمی از این می ترسیم.”

چه زمانی می توانم از GPT-4 استفاده کنم؟

این مدل هنوز در حال کار است، بنابراین به طور کامل در دسترس عموم نیست. به طور خاص، ویژگی تصویر در پیش نمایش است. OpenAI با یک شرکت کار می کند — چشم من باش – برای استفاده توسط عموم مردم آماده شود. استفاده از قابلیت های متنی GPT-4 در حال حاضر امکان پذیر است. دو راه برای انجام این کار تا زمان نوشتن این مقاله وجود دارد:

  • ChatGPT Plus. اشتراک پولی ChatGPT Plus باعث می شود کاربران به GPT-4 دسترسی داشته باشند. ChatGPT Plus دارای یک درپوش استفاده با تنظیم پویا است. GPT-4 داخل ChatGPT Plus در حال حاضر کندتر از ChatGPT با استفاده از GPT-3.5 اجرا می شود.
  • بینگ GPT-4 همچنین ربات چت یکپارچه موتور جستجوی بینگ را که مایکروسافت آن را توسعه داده است، تقویت می کند. چت بات بینگ دارای درپوش استفاده است و اجازه ورود تصویر را نمی دهد.

توسعه دهندگان همچنین می توانند از API بر اساس پرداخت به ازای استفاده استفاده کنند. برای انجام این کار، توسعه‌دهندگان باید به فهرست انتظار بپیوندند.

چندین شرکت دیگر از جمله Duolingo، Morgan Stanley، Khan Academy، Stripe و CoCounsel ادغام GPT-4 را با برنامه های خود اعلام کرده اند. این مدل همچنین در ارتباط با دپارتمان برنامه‌ریزی زبان دولت ایسلند، که هدف آن حفظ زبان ایسلندی است، استفاده می‌شود.

کاربران همچنین می توانند مدل را ارزیابی کنند. سام آلتمن مدیر عامل هوش مصنوعی باز کنید توییت کرد در 14 مارس 2023، که این شرکت یک چارچوب ارزیابی منبع باز است که به آنها کمک می کند تا مدل هوش مصنوعی را راهنمایی کنند.

آیا GPT-4 رایگان خواهد بود؟

GPT-4 در حال حاضر رایگان نیست. کاربران برای استفاده از نسخه پریمیوم ChatGPT که توسط GPT-4 پشتیبانی می شود، باید 20 دلار در ماه بپردازند. یک درپوش استفاده با تنظیم پویا وجود دارد.

برای یک پنجره زمینه 8000 (تقریباً 13 صفحه متن)، API GPT-4 0.03/1000 توکن سریع و 0.06/1000 توکن تکمیل هزینه دارد. برای یک پنجره زمینه 32000 (تقریباً 52 صفحه)، API 0.06/1000 توکن سریع و 0.12/1000 توکن تکمیل هزینه دارد. 1000 توکن معادل حدود 750 کلمه در زبان انگلیسی است. نشانه‌های سریع، کلماتی هستند که به مدل داده می‌شوند و نشانه‌های تکمیل، کلماتی هستند که مدل تولید می‌کند.

GPT-4 یک انتشار نقطه عطف هوش مصنوعی بود که در ابتدای سال 2023 منتشر شد. این 10 روند هوش مصنوعی را بررسی کنید تا برای آنچه که ممکن است بقیه سال به همراه داشته باشد، آماده شوید.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا
به بالای صفحه بردن