هوش مصنوعی مولد(Generative AI) چیست؟ تمام آنچه نیاز است بدانید

هوش مصنوعی مولد نوعی فناوری هوش مصنوعی است که می تواند انواع مختلفی از محتوا از جمله متن، تصویر، صدا و داده های مصنوعی تولید کند . هیاهوی اخیر در مورد هوش مصنوعی مولد به دلیل سادگی رابط های کاربری جدید برای ایجاد متن، گرافیک و ویدیوهای با کیفیت بالا در عرض چند ثانیه است.لازم به ذکر است که این فناوری کاملاً جدید نیست. هوش مصنوعی مولد در دهه 1960 در چت بات ها معرفی شد. اما تا سال 2014، با معرفی شبکه‌های متخاصم مولد یا GAN – نوعی الگوریتم یادگیری ماشینی – بود که هوش مصنوعی مولد توانست تصاویر، ویدیوها و صداهای واقعی قانع‌کننده‌ای از افراد واقعی ایجاد کند.

از یک طرف، این قابلیت جدید فرصت هایی را باز کرده است که شامل دوبله بهتر فیلم و محتوای آموزشی غنی می شود. همچنین نگرانی‌های مربوط به دیپ‌فیک‌ها – تصاویر یا ویدیوهای جعلی دیجیتالی – و حملات مضر امنیت سایبری به مشاغل، از جمله درخواست‌های شرورانه‌ای که به طور واقع بینانه رئیس یک کارمند را تقلید می‌کنند، باز کرد.

Generative AI PowerPoint and Google Slides Template - PPT Slides

دو پیشرفت اخیر اضافی که در زیر با جزئیات بیشتر مورد بحث قرار خواهند گرفت، نقش مهمی در جریان اصلی هوش مصنوعی مولد ایفا کرده‌اند: ترانسفورماتورها و مدل‌های زبان پیشرفتی که آنها فعال کرده‌اند. ترانسفورماتورها نوعی یادگیری ماشینی هستند که به محققان امکان آموزش مدل های بزرگتر را بدون نیاز به برچسب زدن همه داده ها از قبل می دهند. بنابراین می‌توان مدل‌های جدید را بر روی میلیاردها صفحه متن آموزش داد و در نتیجه به پاسخ‌هایی با عمق بیشتری دست یافت. علاوه بر این، ترانسفورماتورها مفهوم جدیدی به نام توجه را باز کردند که مدل‌ها را قادر می‌سازد تا ارتباطات بین کلمات را در صفحات، فصل‌ها و کتاب‌ها ردیابی کنند و نه فقط در جملات جداگانه. و نه فقط کلمات: ترانسفورماتورها همچنین می توانند از توانایی خود برای ردیابی اتصالات برای تجزیه و تحلیل کد، پروتئین ها، مواد شیمیایی و DNA استفاده کنند.

جدول زمانی تاریخچه فناوری‌های هوش مصنوعی مولد

پیشرفت‌های سریع در مدل‌های به اصطلاح زبان بزرگ ( LLM ) – یعنی مدل‌هایی با میلیاردها یا حتی تریلیون‌ها پارامتر – عصر جدیدی را گشوده است که در آن مدل‌های هوش مصنوعی مولد می‌توانند متن جذاب بنویسند، تصاویر واقعی واقعی را ترسیم کنند و حتی تا حدودی سرگرم‌کننده خلق کنند. کمدی در پرواز علاوه بر این، نوآوری‌ها در هوش مصنوعی چندوجهی، تیم‌ها را قادر می‌سازد تا محتوا را در انواع مختلف رسانه، از جمله متن، گرافیک و ویدئو تولید کنند. این اساس ابزارهایی مانند Dall-E است که به طور خودکار تصاویر را از توضیحات متن ایجاد می کند یا زیرنویس متنی را از تصاویر ایجاد می کند.

با وجود این پیشرفت ها، ما هنوز در روزهای اولیه استفاده از هوش مصنوعی مولد برای ایجاد متن خوانا و گرافیک های سبک فوتورئالیستی هستیم. پیاده‌سازی‌های اولیه مشکلاتی با دقت و سوگیری داشته‌اند، همچنین مستعد توهم و پاسخ‌های عجیب و غریب هستند . با این حال، پیشرفت تاکنون نشان می دهد که قابلیت های ذاتی این نوع هوش مصنوعی می تواند اساساً تجارت را تغییر دهد. در آینده، این فناوری می تواند به نوشتن کد، طراحی داروهای جدید، توسعه محصولات، طراحی مجدد فرآیندهای تجاری و تغییر زنجیره تامین کمک کند.

هوش مصنوعی مولد چگونه کار می کند؟

هوش مصنوعی مولد با یک اعلان شروع می شود که می تواند به شکل متن، تصویر، ویدئو، طرح، نت های موسیقی یا هر ورودی باشد که سیستم هوش مصنوعی می تواند پردازش کند. سپس الگوریتم‌های مختلف هوش مصنوعی در پاسخ به درخواست، محتوای جدید را برمی‌گردانند. محتوا می‌تواند شامل مقاله‌ها، راه‌حل‌هایی برای مشکلات یا تقلبی واقعی باشد که از تصاویر یا صدای یک شخص ایجاد شده است.

نسخه‌های اولیه هوش مصنوعی مولد نیازمند ارسال داده‌ها از طریق یک API یا یک فرآیند پیچیده بود. توسعه دهندگان باید با ابزارهای ویژه آشنا می شدند و برنامه های کاربردی را با استفاده از زبان هایی مانند پایتون می نوشتند.

اکنون، پیشگامان در هوش مصنوعی مولد در حال توسعه تجربیات کاربری بهتری هستند که به شما امکان می دهد درخواست را به زبان ساده توصیف کنید. پس از پاسخ اولیه، می‌توانید نتایج را با بازخورد درباره سبک، لحن و سایر عناصری که می‌خواهید محتوای تولید شده منعکس کند، سفارشی کنید.

تصویری که نقل قول هایی درباره هوش مصنوعی مولد از کارشناسان صنعت را نشان می دهد

مدل های مولد هوش مصنوعی

مدل‌های هوش مصنوعی مولد الگوریتم‌های هوش مصنوعی مختلف را برای نمایش و پردازش محتوا ترکیب می‌کنند. به عنوان مثال، برای تولید متن، تکنیک‌های مختلف پردازش زبان طبیعی ، نویسه‌های خام (مانند حروف، علائم نقطه‌گذاری و کلمات) را به جملات، بخش‌هایی از گفتار، موجودیت‌ها و کنش‌ها تبدیل می‌کنند که با استفاده از تکنیک‌های رمزگذاری چندگانه به صورت بردار نمایش داده می‌شوند. به طور مشابه، تصاویر به عناصر بصری مختلف تبدیل می شوند که به صورت بردار نیز بیان می شوند. یکی از احتیاط‌ها این است که این تکنیک‌ها همچنین می‌توانند سوگیری‌ها، نژادپرستی، فریبکاری و خفگی موجود در داده‌های آموزشی را رمزگذاری کنند.

هنگامی که توسعه دهندگان راهی برای نشان دادن جهان می گیرند، از یک شبکه عصبی خاص برای تولید محتوای جدید در پاسخ به یک پرس و جو یا درخواست استفاده می کنند. تکنیک‌هایی مانند GAN و رمزگذارهای خودکار متغیر (VAE) – شبکه‌های عصبی با رمزگشا و رمزگذار – برای تولید چهره‌های واقعی انسان، داده‌های مصنوعی برای آموزش هوش مصنوعی یا حتی فکس‌های انسان‌های خاص مناسب هستند.

پیشرفت‌های اخیر در ترانسفورماتورهایی مانند نمایش‌های رمزگذار دوطرفه Google از Transformers ( BERT )، GPT OpenAI و Google AlphaFold همچنین منجر به شبکه‌های عصبی شده‌اند که نه تنها می‌توانند زبان، تصاویر و پروتئین‌ها را رمزگذاری کنند، بلکه محتوای جدیدی تولید می‌کنند.

چگونه شبکه های عصبی هوش مصنوعی مولد را تغییر می دهند

محققان از همان روزهای اولیه هوش مصنوعی، هوش مصنوعی و ابزارهای دیگری را برای تولید محتوا به صورت برنامه‌ریزی کرده‌اند. اولین رویکردها، که به عنوان سیستم‌های مبتنی بر قوانین و بعداً به عنوان «سیستم‌های خبره» شناخته می‌شوند، از قوانین به‌صراحت ساخته شده برای تولید پاسخ‌ها یا مجموعه داده‌ها استفاده می‌کنند.

شبکه‌های عصبی، که اساس بسیاری از برنامه‌های کاربردی هوش مصنوعی و یادگیری ماشین امروزی را تشکیل می‌دهند، این مشکل را تغییر دادند. شبکه‌های عصبی که برای تقلید از نحوه عملکرد مغز انسان طراحی شده‌اند، قوانین را از یافتن الگوها در مجموعه داده‌های موجود «یاد می‌گیرند». اولین شبکه های عصبی که در دهه 1950 و 1960 توسعه یافتند، به دلیل کمبود قدرت محاسباتی و مجموعه داده های کوچک محدود شدند. تا قبل از ظهور کلان داده در اواسط دهه 2000 و بهبود در سخت افزار کامپیوتر، شبکه های عصبی برای تولید محتوا عملی شدند.

زمانی که محققان راهی برای اجرای موازی شبکه‌های عصبی در واحدهای پردازش گرافیکی (GPU) که در صنعت بازی‌های رایانه‌ای برای ارائه بازی‌های ویدیویی استفاده می‌شدند، شتاب گرفت. تکنیک‌های جدید یادگیری ماشین که در دهه گذشته توسعه یافته‌اند، از جمله شبکه‌های متخاصم و ترانسفورماتورهای مولد فوق‌الذکر ، زمینه را برای پیشرفت‌های قابل توجه اخیر در محتوای تولید شده توسط هوش مصنوعی فراهم کرده‌اند.

Dall-E، ChatGPT و Bard چیست؟

ChatGPT، Dall-E و Bard رابط های هوش مصنوعی مولد محبوب هستند.

دال-ای. Dall-E که بر روی مجموعه داده های بزرگی از تصاویر و توضیحات متنی مرتبط با آنها آموزش دیده است، نمونه ای از یک برنامه کاربردی هوش مصنوعی چندوجهی است که اتصالات را در رسانه های مختلف مانند بینایی، متن و صدا شناسایی می کند. در این صورت معنای کلمات را به عناصر بصری متصل می کند. این با استفاده از پیاده‌سازی GPT OpenAI در سال 2021 ساخته شد. Dall-E 2، نسخه دوم و با قابلیت‌تر، در سال 2022 منتشر شد. کاربران را قادر می‌سازد تا تصاویر را در سبک‌های مختلف تولید کنند که توسط درخواست‌های کاربر هدایت می‌شود .

ChatGPT. چت ربات مجهز به هوش مصنوعی که در نوامبر 2022 جهان را طوفانی کرد، بر اساس اجرای OpenAI GPT-3.5 ساخته شد. OpenAI راهی برای تعامل و تنظیم دقیق پاسخ های متنی از طریق رابط چت با بازخورد تعاملی ارائه کرده است. نسخه های قبلی GPT فقط از طریق یک API قابل دسترسی بودند. GPT-4 در 14 مارس 2023 منتشر شد. ChatGPT تاریخچه مکالمه خود با یک کاربر را در نتایج خود گنجانده است و یک مکالمه واقعی را شبیه سازی می کند. پس از محبوبیت باورنکردنی رابط GPT جدید، مایکروسافت سرمایه گذاری جدید قابل توجهی را در OpenAI اعلام کرد و نسخه ای از GPT را در موتور جستجوی Bing خود ادغام کرد.

تصویر دو چک لیست را نشان می دهد که ویژگی های ChatGPT را در مقابل بارد مقایسه می کند — در اینجا یک عکس فوری از تفاوت های ChatGPT و Bard آورده شده است.

بارد. گوگل یکی دیگر از رهبران اولیه در تکنیک‌های هوش مصنوعی ترانسفورماتور برای پردازش زبان، پروتئین‌ها و دیگر انواع محتوا بود. این منبع باز برخی از این مدل ها را برای محققان تهیه کرد. با این حال، هرگز یک رابط عمومی برای این مدل ها منتشر نکرد. تصمیم مایکروسافت برای پیاده‌سازی GPT در بینگ، گوگل را وادار کرد تا یک ربات چت عمومی به نام Google Bard را به بازار عرضه کند.، بر روی یک نسخه سبک وزن از خانواده مدل های زبان بزرگ LaMDA خود ساخته شده است. گوگل متحمل ضرر قابل توجهی در قیمت سهام پس از شروع سریع بارد شد، زیرا مدل زبانی به اشتباه گفت تلسکوپ وب اولین سیاره ای است که در یک منظومه شمسی خارجی کشف کرد. در همین حال، پیاده‌سازی‌های مایکروسافت و ChatGPT نیز به دلیل نتایج نادرست و رفتار نامنظم، در اولین فعالیت‌های خود چهره خود را از دست دادند. گوگل از آن زمان نسخه جدیدی از Bard را رونمایی کرده است که بر روی پیشرفته ترین LLM خود، PaLM 2 ساخته شده است، که به Bard اجازه می دهد در پاسخ به سوالات کاربران کارآمدتر و بصری تر باشد.

موارد استفاده برای هوش مصنوعی مولد چیست؟

هوش مصنوعی مولد را می توان در موارد استفاده مختلف برای تولید هر نوع محتوا به کار برد. این فناوری به لطف پیشرفت های پیشرفته ای مانند GPT که می تواند برای برنامه های مختلف تنظیم شود، برای همه انواع کاربران در دسترس تر می شود. برخی از موارد استفاده برای هوش مصنوعی مولد شامل موارد زیر است:

پیاده سازی ربات های چت برای خدمات مشتری و پشتیبانی فنی.
استفاده از دیپ فیک برای تقلید از افراد یا حتی افراد خاص.
بهبود دوبله فیلم ها و محتوای آموزشی به زبان های مختلف.
نوشتن پاسخ ایمیل، پروفایل دوستیابی، رزومه و مقالات ترم.
خلق هنر فوتورئالیستی در سبکی خاص.
بهبود ویدیوهای نمایش محصول
پیشنهاد ترکیبات دارویی جدید برای آزمایش.
طراحی محصولات فیزیکی و ساختمان.
بهینه سازی طرح های تراشه های جدید
نوشتن موسیقی به سبک یا لحن خاص.

مزایای هوش مصنوعی مولد چیست؟

هوش مصنوعی مولد را می توان به طور گسترده در بسیاری از زمینه های کسب و کار به کار برد. می تواند تفسیر و درک محتوای موجود را آسان تر کند و به طور خودکار محتوای جدید ایجاد کند. توسعه‌دهندگان در حال بررسی راه‌هایی هستند که هوش مصنوعی مولد می‌تواند جریان‌های کاری موجود را بهبود بخشد، با توجه به تطبیق گردش‌های کاری کاملاً برای استفاده از این فناوری. برخی از مزایای بالقوه پیاده سازی هوش مصنوعی مولد شامل موارد زیر است:

خودکارسازی فرآیند دستی نوشتن محتوا.
کاهش تلاش برای پاسخ دادن به ایمیل ها.
بهبود پاسخ به سؤالات فنی خاص.
ایجاد بازنمایی های واقع بینانه از مردم.
خلاصه کردن اطلاعات پیچیده در یک روایت منسجم.
ساده سازی فرآیند تولید محتوا در یک سبک خاص.

محدودیت های هوش مصنوعی مولد چیست؟

پیاده سازی های اولیه هوش مصنوعی مولد به وضوح محدودیت های فراوان آن را نشان می دهد. برخی از چالش‌هایی که هوش مصنوعی مولد ارائه می‌کند ناشی از رویکردهای خاص مورد استفاده برای اجرای موارد استفاده خاص است. برای مثال، خواندن خلاصه‌ای از یک موضوع پیچیده آسان‌تر از توضیحی است که حاوی منابع مختلفی است که نکات کلیدی را پشتیبانی می‌کنند. با این حال، خوانایی خلاصه به قیمت این است که کاربر بتواند بررسی کند که اطلاعات از کجا آمده است.

در اینجا برخی از محدودیت‌هایی که باید در هنگام پیاده‌سازی یا استفاده از یک برنامه هوش مصنوعی مولد در نظر گرفته شود آورده شده است:

همیشه منبع محتوا را مشخص نمی کند.
ارزیابی سوگیری منابع اصلی می تواند چالش برانگیز باشد.
محتوای واقعی، شناسایی اطلاعات نادرست را دشوارتر می کند.
درک چگونگی تنظیم شرایط جدید ممکن است دشوار باشد.
نتایج ممکن است بیش از تعصب، تعصب و نفرت را پنهان کند.

توجه تنها چیزی است که نیاز دارید: ترانسفورماتورها قابلیت جدیدی را به ارمغان می آورند

در سال 2017، گوگل در مورد نوع جدیدی از معماری شبکه عصبی گزارش داد که پیشرفت های قابل توجهی در کارایی و دقت در کارهایی مانند پردازش زبان طبیعی به همراه داشت. رویکرد پیشرفت، به نام ترانسفورماتور ، بر اساس مفهوم توجه بود.

در سطح بالا، توجه به توصیف ریاضی از چگونگی ارتباط چیزها (مثلاً کلمات) با یکدیگر، تکمیل و اصلاح یکدیگر اشاره دارد. محققان این معماری را در مقاله اصلی خود با عنوان ” توجه تنها چیزی است که نیاز دارید ” توصیف کردند که نشان می دهد چگونه یک شبکه عصبی ترانسفورماتور قادر است بین انگلیسی و فرانسوی را با دقت بیشتری و تنها در یک چهارم زمان آموزش نسبت به سایر شبکه های عصبی ترجمه کند. این تکنیک پیشرفت همچنین می‌تواند روابط یا نظم‌های پنهان بین چیزهای دیگری را که در داده‌هایی مدفون شده‌اند کشف کند که ممکن است انسان‌ها از آن‌ها بی‌اطلاع باشند، زیرا برای بیان یا تشخیص آن‌ها بسیار پیچیده بودند.

معماری ترانسفورماتور از زمان معرفی به سرعت تکامل یافته است و باعث پیدایش LLM هایی مانند GPT-3 و تکنیک های قبل از آموزش بهتر، مانند BERT گوگل شده است.

نگرانی های پیرامون هوش مصنوعی مولد چیست؟

ظهور هوش مصنوعی مولد نیز نگرانی های مختلفی را برانگیخته است . اینها به کیفیت نتایج، پتانسیل سوء استفاده و سوء استفاده و پتانسیل ایجاد اختلال در مدل های تجاری موجود مربوط می شود. در اینجا برخی از انواع خاصی از مسائل مشکل ساز ناشی از وضعیت فعلی هوش مصنوعی مولد آورده شده است:

می تواند اطلاعات نادرست و گمراه کننده ارائه دهد.
بدون دانستن منبع و منشأ اطلاعات، اعتماد کردن دشوارتر است.
می تواند انواع جدیدی از سرقت ادبی را ترویج کند که حقوق تولیدکنندگان محتوا و هنرمندان محتوای اصلی را نادیده می گیرد.
ممکن است مدل‌های کسب‌وکار موجود مبتنی بر بهینه‌سازی موتور جستجو و تبلیغات را مختل کند.
تولید اخبار جعلی را آسان تر می کند.
این ادعا را آسان‌تر می‌کند که شواهد عکاسی واقعی از یک تخلف فقط جعلی تولید شده توسط هوش مصنوعی است.
این می تواند افراد را برای حملات سایبری مؤثرتر مهندسی اجتماعی جعل کند.

پیاده سازی هوش مصنوعی مولد فقط مربوط به فناوری نیست. کسب و کارها همچنین باید تأثیر آن را بر افراد و فرآیندها در نظر بگیرند.

چند نمونه از ابزارهای مولد هوش مصنوعی چیست؟

ابزارهای مولد هوش مصنوعی برای حالت‌های مختلف مانند متن، تصویر، موسیقی، کد و صدا وجود دارد. برخی از تولیدکنندگان محتوای AI محبوب برای کاوش عبارتند از:

ابزارهای تولید متن عبارتند از GPT، Jasper، AI-Writer و Lex.
ابزارهای تولید تصویر عبارتند از Dall-E 2، Midjourney و Stable Diffusion.
ابزارهای تولید موسیقی عبارتند از Amper، Dadabots و MuseNet.
ابزارهای تولید کد عبارتند از CodeStarter، Codex، GitHub Copilot و Tabnine.
ابزارهای ترکیب صدا عبارتند از Descript، Listnr و Podcast.ai.
شرکت‌های ابزار طراحی تراشه هوش مصنوعی شامل Synopsys، Cadence، Google و Nvidia هستند.

استفاده از موارد برای هوش مصنوعی مولد، بر اساس صنعت

فناوری‌های مولد جدید هوش مصنوعی گاهی اوقات به عنوان فناوری‌های همه منظوره مشابه قدرت بخار، الکتریسیته و محاسبات توصیف می‌شوند، زیرا می‌توانند عمیقاً بر بسیاری از صنایع و موارد استفاده تأثیر بگذارند. مهم است که در نظر داشته باشید، مانند فناوری‌های همه‌منظوره قبلی، اغلب دهه‌ها طول می‌کشید تا افراد بهترین راه را برای سازماندهی گردش‌های کاری برای استفاده از رویکرد جدید به جای سرعت بخشیدن به بخش‌های کوچکی از گردش‌های کاری موجود بیابند. در اینجا چند روش وجود دارد که کاربردهای هوش مصنوعی مولد می توانند بر صنایع مختلف تأثیر بگذارند:

امور مالی می تواند تراکنش ها را در زمینه سابقه یک فرد برای ایجاد سیستم های تشخیص تقلب بهتر مشاهده کند.
شرکت های حقوقی می توانند از هوش مصنوعی مولد برای طراحی و تفسیر قراردادها، تجزیه و تحلیل شواهد و پیشنهاد استدلال استفاده کنند.
سازندگان می توانند از هوش مصنوعی مولد برای ترکیب داده های دوربین ها، اشعه ایکس و سایر معیارها برای شناسایی دقیق تر و اقتصادی تر قطعات معیوب و علل ریشه ای استفاده کنند.
شرکت‌های فیلم و رسانه می‌توانند از هوش مصنوعی برای تولید مقرون به صرفه‌تر محتوا و ترجمه آن به زبان‌های دیگر با صدای خود بازیگران استفاده کنند.
صنعت پزشکی می‌تواند از هوش مصنوعی مولد برای شناسایی مؤثرتر دارو‌های امیدبخش استفاده کند.
شرکت های معماری می توانند از هوش مصنوعی مولد برای طراحی و تطبیق نمونه های اولیه سریعتر استفاده کنند.
شرکت های بازی سازی می توانند از هوش مصنوعی مولد برای طراحی محتوا و سطوح بازی استفاده کنند.

GPT به پانتئون فناوری های همه منظوره می پیوندد

OpenAI، یک شرکت تحقیقاتی و استقرار هوش مصنوعی، ایده های اصلی ترانسفورماتورها را برای آموزش نسخه خود به نام Generative Pre-trained Transformer یا GPT در نظر گرفت. ناظران اشاره کرده اند که GPT همان مخفف مورد استفاده برای توصیف فناوری های همه منظوره مانند موتور بخار، برق و محاسبات است. بسیاری موافق هستند که GPT و سایر پیاده سازی های ترانسفورماتور در حال حاضر به نام خود عمل می کنند زیرا محققان راه هایی را برای اعمال آنها در صنعت، علم، تجارت، ساخت و ساز و پزشکی کشف می کنند.

اخلاق و سوگیری در هوش مصنوعی مولد

علیرغم وعده‌هایشان، ابزارهای مولد جدید هوش مصنوعی مجموعه‌ای از کرم‌ها را در مورد دقت، قابل اعتماد بودن، سوگیری ، توهم و سرقت ادبی باز می‌کنند – مسائل اخلاقی که احتمالا سال‌ها طول می‌کشد تا حل شوند. هیچ یک از مسائل به خصوص برای هوش مصنوعی جدید نیست. به عنوان مثال، اولین حمله مایکروسافت به چت بات ها در سال 2016، به نام Tay، پس از اینکه شروع به پخش لفاظی های تحریک آمیز در توییتر کرد، باید خاموش می شد.

چیزی که جدید است این است که آخرین محصول از برنامه های هوش مصنوعی مولد در سطح منسجم تر به نظر می رسد. اما این ترکیبی از زبان انسان‌مانند و انسجام مترادف با هوش انسانی نیست و در حال حاضر بحث‌های زیادی در مورد اینکه آیا می‌توان مدل‌های هوش مصنوعی مولد را برای داشتن توانایی استدلال آموزش داد یا خیر، وجود دارد. یکی از مهندسان گوگل حتی پس از اعلام عمومی برنامه هوش مصنوعی مولد این شرکت، مدل‌های زبان برای برنامه‌های گفتگو (LaMDA) اخراج شد.

واقع گرایی متقاعد کننده محتوای AI مولد مجموعه جدیدی از خطرات هوش مصنوعی را معرفی می کند. تشخیص محتوای تولید شده توسط هوش مصنوعی را دشوارتر می کند و مهمتر از آن، تشخیص اشتباهات را دشوارتر می کند. وقتی برای نوشتن کد یا ارائه توصیه های پزشکی به نتایج هوش مصنوعی مولد تکیه می کنیم، این می تواند مشکل بزرگی باشد. بسیاری از نتایج هوش مصنوعی مولد شفاف نیستند، بنابراین تعیین اینکه آیا، برای مثال، حق نسخه‌برداری را نقض می‌کنند یا مشکلی با منابع اصلی که از آنها نتیجه گرفته‌اند، مشکل است. اگر نمی دانید هوش مصنوعی چگونه به نتیجه رسید، نمی توانید دلیل اشتباه بودن آن را بیان کنید.

هوش مصنوعی مولد در مقابل هوش مصنوعی

هوش مصنوعی مولد محتوای جدید، پاسخ‌های چت، طرح‌ها، داده‌های مصنوعی یا دیپ‌فیک تولید می‌کند. از سوی دیگر، هوش مصنوعی سنتی بر شناسایی الگوها، تصمیم گیری، بهبود تجزیه و تحلیل، طبقه بندی داده ها و کشف تقلب متمرکز شده است.

همانطور که در بالا ذکر شد، هوش مصنوعی مولد اغلب از تکنیک های شبکه عصبی مانند ترانسفورماتور، GAN و VAE استفاده می کند. انواع دیگر هوش مصنوعی، به طور متمایز، از تکنیک هایی مانند شبکه های عصبی کانولوشنال ، شبکه های عصبی تکراری و یادگیری تقویتی استفاده می کنند .

هوش مصنوعی مولد اغلب با یک اعلان شروع می شود که به کاربر یا منبع داده اجازه می دهد یک پرس و جو یا مجموعه داده اولیه را برای هدایت تولید محتوا ارسال کند. این می‌تواند یک فرآیند تکراری برای کشف تغییرات محتوا باشد. الگوریتم‌های سنتی هوش مصنوعی داده‌های جدید را پردازش می‌کنند تا یک نتیجه ساده را به دست آورند.

تاریخچه هوش مصنوعی مولد

چت بات الایزا که توسط جوزف وایزنبام در دهه 1960 ایجاد شد، یکی از اولین نمونه های هوش مصنوعی مولد بود . این پیاده‌سازی‌های اولیه از یک رویکرد مبتنی بر قوانین استفاده می‌کردند که به‌دلیل محدود بودن واژگان، فقدان زمینه و اتکای بیش از حد به الگوها، از جمله کاستی‌های دیگر، به راحتی شکسته شد. سفارشی سازی و گسترش ربات های چت اولیه نیز دشوار بود.

این زمینه در پی پیشرفت‌های شبکه‌های عصبی و یادگیری عمیق در سال 2010 شاهد تجدید حیات بود که این فناوری را قادر ساخت تا به طور خودکار تجزیه متن موجود، طبقه‌بندی عناصر تصویر و رونویسی صدا را بیاموزد.

ایان گودفلو GAN ها را در سال 2014 معرفی کرد. این تکنیک یادگیری عمیق یک رویکرد جدید برای سازماندهی شبکه های عصبی رقیب برای تولید و سپس رتبه بندی تغییرات محتوا ارائه کرد. اینها می توانند افراد، صداها، موسیقی و متن واقع بینانه تولید کنند. این علاقه الهام‌بخش – و ترس از – این بود که چگونه می‌توان از هوش مصنوعی مولد برای ایجاد دیپ‌فیک‌های واقعی که صداها و افراد را در ویدیوها جعل می‌کنند، استفاده کرد.

از آن زمان، پیشرفت در سایر تکنیک‌ها و معماری‌های شبکه عصبی به گسترش قابلیت‌های هوش مصنوعی مولد کمک کرده است. تکنیک ها شامل VAE ها، حافظه کوتاه مدت بلند مدت، ترانسفورماتورها، مدل های انتشار و میدان های تابشی عصبی است .

بهترین شیوه ها برای استفاده از هوش مصنوعی مولد

بهترین شیوه ها برای استفاده از هوش مصنوعی مولد بسته به روش ها، گردش کار و اهداف مورد نظر متفاوت است. با این حال، در نظر گرفتن عوامل اساسی مانند دقت، شفافیت و سهولت استفاده در کار با هوش مصنوعی مهم است. اقدامات زیر به دستیابی به این عوامل کمک می کند:

تمام محتوای تولیدی هوش مصنوعی را برای کاربران و مصرف کنندگان به وضوح برچسب گذاری کنید.
دقت محتوای تولید شده را با استفاده از منابع اولیه در صورت لزوم بررسی کنید.
در نظر بگیرید که چگونه سوگیری ممکن است در نتایج AI تولید شده بافته شود.
با استفاده از ابزارهای دیگر، کیفیت کد و محتوای تولید شده توسط هوش مصنوعی را دوباره بررسی کنید.
نقاط قوت و محدودیت های هر ابزار هوش مصنوعی مولد را بیاموزید.
با حالت های رایج شکست در نتایج آشنا شوید و روی آنها کار کنید.

آینده هوش مصنوعی مولد

عمق و سهولت باورنکردنی ChatGPT نویدبخشی را برای پذیرش گسترده هوش مصنوعی مولد نشان داده است. مطمئناً، برخی از مشکلات در راه اندازی ایمن و مسئولانه این فناوری را نیز نشان داده است. اما این مسائل مربوط به اجرای اولیه، تحقیقاتی را برای ابزارهای بهتر برای تشخیص متن، تصاویر و ویدیوی تولید شده توسط هوش مصنوعی الهام بخش کرده است. صنعت و جامعه همچنین ابزارهای بهتری برای ردیابی منشأ اطلاعات خواهند ساخت تا هوش مصنوعی قابل اعتمادتری ایجاد کنند.

علاوه بر این، پیشرفت‌ها در پلت‌فرم‌های توسعه هوش مصنوعی به سرعت بخشیدن به تحقیق و توسعه قابلیت‌های هوش مصنوعی مولد بهتر در آینده برای متن، تصاویر، ویدئو، محتوای سه بعدی، داروها، زنجیره‌های تامین، تدارکات و فرآیندهای تجاری کمک می‌کند. به همان اندازه که این ابزارهای یکباره جدید خوب هستند، مهم ترین تأثیر هوش مصنوعی مولد از تعبیه این قابلیت ها به طور مستقیم در نسخه هایی از ابزارهایی است که قبلاً استفاده می کنیم.

چک‌کننده‌های گرامر بهتر می‌شوند. ابزارهای طراحی به طور یکپارچه توصیه های مفید بیشتری را مستقیماً در جریان کار قرار می دهند. ابزارهای آموزشی قادر خواهند بود به طور خودکار بهترین شیوه ها را در یک بخش از سازمان شناسایی کنند تا به آموزش کارآمدتر دیگران کمک کنند. و اینها تنها کسری از راه هایی هستند که هوش مصنوعی مولد نحوه کار ما را تغییر می دهد.

تصویر فهرستی از مزایای تجاری مختلف هوش مصنوعی مولد — هوش مصنوعی مولد راه خود را در بسیاری از عملکردهای تجاری پیدا خواهد کرد.

سوالات متداول هوش مصنوعی

در زیر برخی از سوالات متداول مردم در مورد هوش مصنوعی مولد وجود دارد.

چه کسی هوش مصنوعی مولد را ایجاد کرد؟

جوزف وایزنبام اولین هوش مصنوعی مولد را در دهه 1960 به عنوان بخشی از چت بات Eliza ایجاد کرد.

ایان گودفلو در سال 2014 شبکه‌های متخاصم مولد را برای تولید افراد با ظاهر و صدای واقعی نشان داد.

تحقیقات بعدی در مورد LLM از Open AI و Google شور و شوق اخیر را برانگیخت که به ابزارهایی مانند ChatGPT، Google Bard و Dall-E تبدیل شده است.

هوش مصنوعی مولد چگونه می تواند جایگزین مشاغل شود؟

هوش مصنوعی مولد این پتانسیل را دارد که جایگزین مشاغل مختلف شود، از جمله موارد زیر:

نوشتن توضیحات محصول
ایجاد کپی بازاریابی
تولید محتوای اولیه وب
راه اندازی فروش تعاملی.
پاسخگویی به سوالات مشتریان.
ساخت گرافیک برای صفحات وب

برخی از شرکت‌ها به دنبال فرصت‌هایی برای جایگزینی انسان‌ها در صورت امکان هستند، در حالی که برخی دیگر از هوش مصنوعی مولد برای افزایش و تقویت نیروی کار موجود خود استفاده می‌کنند.

چگونه یک مدل هوش مصنوعی مولد بسازید؟

یک مدل هوش مصنوعی مولد با رمزگذاری کارآمد نمایشی از آنچه می‌خواهید تولید کنید شروع می‌شود. به عنوان مثال، یک مدل هوش مصنوعی تولیدی برای متن ممکن است با یافتن راهی برای نمایش کلمات به عنوان بردارهایی که شباهت بین کلماتی که اغلب در یک جمله استفاده می‌شوند یا به معنای چیزهای مشابه هستند، شروع شود.

پیشرفت‌های اخیر در تحقیقات LLM به صنعت کمک کرده است که فرآیند مشابهی را برای نمایش الگوهای موجود در تصاویر، صداها، پروتئین‌ها، DNA، داروها و طرح‌های سه‌بعدی پیاده‌سازی کند. این مدل هوش مصنوعی مولد راهی کارآمد برای نمایش نوع دلخواه محتوا و تکرار کارآمد بر روی تغییرات مفید فراهم می‌کند.

چگونه یک مدل هوش مصنوعی مولد را آموزش می دهید؟

مدل هوش مصنوعی مولد باید برای یک مورد خاص آموزش داده شود. پیشرفت اخیر در LLM یک نقطه شروع ایده آل برای سفارشی کردن برنامه ها برای موارد استفاده مختلف فراهم می کند. به عنوان مثال، مدل محبوب GPT توسعه یافته توسط OpenAI برای نوشتن متن، تولید کد و ایجاد تصاویر بر اساس توضیحات نوشته شده استفاده شده است.

آموزش شامل تنظیم پارامترهای مدل برای موارد استفاده مختلف و سپس تنظیم دقیق نتایج در مجموعه داده‌های آموزشی است. به عنوان مثال، یک مرکز تماس ممکن است یک ربات چت را در برابر انواع سوالاتی که نمایندگان خدمات از انواع مشتریان دریافت می‌کنند و پاسخ‌هایی که نمایندگان خدمات در ازای آن می‌دهند، آموزش دهد. یک برنامه تولید تصویر، بر خلاف متن، ممکن است با برچسب هایی شروع شود که محتوا و سبک تصاویر را توصیف می کند تا مدل را برای تولید تصاویر جدید آموزش دهد.

هوش مصنوعی مولد چگونه کار خلاقانه را تغییر می دهد؟

هوش مصنوعی مولد به کارگران خلاق کمک می کند تا انواع ایده ها را کشف کنند. هنرمندان ممکن است با یک مفهوم اولیه طراحی شروع کنند و سپس تغییرات را بررسی کنند. طراحان صنعتی می توانند تغییرات محصول را بررسی کنند. معماران می توانند چیدمان های مختلف ساختمان را بررسی کرده و آنها را به عنوان نقطه شروعی برای اصلاح بیشتر تجسم کنند.

همچنین می تواند به دموکراتیک کردن برخی از جنبه های کار خلاق کمک کند. به عنوان مثال، کاربران تجاری می توانند تصاویر بازاریابی محصول را با استفاده از توضیحات متنی کشف کنند. آنها می توانند این نتایج را با استفاده از دستورات یا پیشنهادات ساده اصلاح کنند.

آینده هوش مصنوعی مولد چیست؟

توانایی ChatGPT برای تولید متن انسان مانند کنجکاوی گسترده ای را در مورد پتانسیل هوش مصنوعی مولد برانگیخته است. همچنین مشکلات و چالش های پیش رو را روشن کرد.

در کوتاه مدت، کار بر بهبود تجربه کاربر و گردش کار با استفاده از ابزارهای هوش مصنوعی مولد متمرکز خواهد شد. همچنین ایجاد اعتماد در نتایج مولد هوش مصنوعی ضروری خواهد بود.

بسیاری از شرکت‌ها نیز هوش مصنوعی تولیدی را روی داده‌های خود سفارشی می‌کنند تا به بهبود برندسازی و ارتباطات کمک کنند. تیم های برنامه نویسی از هوش مصنوعی مولد برای اعمال بهترین شیوه های خاص شرکت برای نوشتن و قالب بندی کدهای خوانا و سازگارتر استفاده خواهند کرد.

فروشندگان قابلیت‌های هوش مصنوعی مولد را در ابزارهای اضافی خود ادغام می‌کنند تا جریان کار تولید محتوا را ساده‌تر کنند. این امر باعث نوآوری در نحوه افزایش بهره وری توسط این قابلیت های جدید می شود.

هوش مصنوعی مولد همچنین می‌تواند در جنبه‌های مختلف پردازش داده‌ها، تبدیل، برچسب‌گذاری و بررسی به عنوان بخشی از جریان‌های کاری تجزیه و تحلیل افزوده نقش داشته باشد. برنامه‌های کاربردی وب معنایی می‌توانند از هوش مصنوعی مولد برای ترسیم خودکار طبقه‌بندی‌های داخلی که مهارت‌های شغلی را به طبقه‌بندی‌های مختلف در سایت‌های آموزش مهارت و استخدام نشان می‌دهند، استفاده کنند. به طور مشابه، تیم‌های تجاری از این مدل‌ها برای تبدیل و برچسب‌گذاری داده‌های شخص ثالث برای ارزیابی‌های پیچیده‌تر ریسک و قابلیت‌های تحلیل فرصت استفاده خواهند کرد.

در آینده، مدل‌های هوش مصنوعی مولد برای پشتیبانی از مدل‌سازی سه‌بعدی، طراحی محصول، توسعه دارو، دوقلوهای دیجیتال، زنجیره‌های تامین و فرآیندهای تجاری گسترش خواهند یافت. این کار تولید ایده‌های محصول جدید، آزمایش با مدل‌های مختلف سازمانی و کشف ایده‌های تجاری مختلف را آسان‌تر می‌کند.

آخرین فناوری هوش مصنوعی تعریف شده است

هنر هوش مصنوعی (هنر هوش مصنوعی)
هنر هوش مصنوعی هر شکلی از هنر دیجیتال است که با ابزارهای هوش مصنوعی ایجاد یا تقویت شده است.

Auto-GPT
Auto-GPT یک عامل هوش مصنوعی منبع باز آزمایشی است که مبتنی بر مدل زبان GPT-4 است که به طور مستقل وظایف را برای دستیابی به یک هدف تصویر بزرگ تعیین شده توسط کاربر به هم متصل می کند.

Google Search Generative Experience
Google Search Generative Experience (SGE) مجموعه ای از قابلیت های جستجو و رابط است که نتایج مولد مبتنی بر هوش مصنوعی را در پاسخ های جستجوی موتور جستجوی Google ادغام می کند.

یادگیری کیو یادگیری
کیو یک رویکرد یادگیری ماشینی است که مدل را قادر می‌سازد تا به طور مکرر یاد بگیرد و در طول زمان با انجام اقدامات صحیح بهبود یابد.

آزمایشگاه‌های جستجوی Google (GSE)
GSE ابتکاری از بخش Google Alphabet برای ارائه قابلیت‌ها و آزمایش‌های جدید برای جستجوی Google در قالب پیش‌نمایش قبل از در دسترس قرار گرفتن عمومی است.

امتیاز آغازین
امتیاز اولیه (IS) یک الگوریتم ریاضی است که برای اندازه‌گیری یا تعیین کیفیت تصاویر ایجاد شده توسط هوش مصنوعی از طریق یک شبکه متخاصم مولد (GAN) استفاده می‌شود. کلمه “شروع” به جرقه خلاقیت یا شروع اولیه یک فکر یا عمل به طور سنتی توسط انسان ها اشاره دارد.

یادگیری تقویتی از بازخورد انسانی (RLHF)
RLHF یک رویکرد یادگیری ماشینی است که تکنیک های یادگیری تقویتی، مانند پاداش ها و مقایسه ها را با راهنمایی های انسانی برای آموزش یک عامل هوش مصنوعی ترکیب می کند. ادامه مطلب

چند مدل مولد برای پردازش زبان طبیعی چیست؟

برخی از مدل های مولد برای پردازش زبان طبیعی شامل موارد زیر است:

XLNet دانشگاه کارنگی ملون
GPT (ترانسفورماتور از پیش آموزش دیده مولد) OpenAI
ALBERT گوگل (برت “A Lite”)
Google BERT
Google LaMDA

آیا هوش مصنوعی هرگز آگاهی پیدا می کند؟

برخی از طرفداران هوش مصنوعی بر این باورند که هوش مصنوعی مولد گامی اساسی به سوی هوش مصنوعی همه منظوره و حتی آگاهی است. یکی از آزمایش‌کننده‌های اولیه چت ربات LaMDA گوگل حتی زمانی که به طور عمومی اعلام کرد که این ربات حساس است، سر و صدای زیادی به پا کرد. سپس او را از شرکت آزاد کردند.

در سال 1993، نویسنده علمی تخیلی آمریکایی و دانشمند کامپیوتر، ورنور وینج، اظهار داشت که در 30 سال آینده، ما توانایی تکنولوژیکی برای ایجاد یک “هوش مافوق بشری” – هوش مصنوعی که از انسان ها باهوش تر است – خواهیم داشت که پس از آن دوره بشری خواهد بود. پایان. Ray Kurzweil پیشگام هوش مصنوعی چنین “تکینگی” را تا سال 2045 پیش بینی کرد.

بسیاری دیگر از کارشناسان هوش مصنوعی فکر می کنند که می تواند بسیار دورتر باشد. رادنی بروکس، پیشگام ربات، پیش‌بینی کرد که هوش مصنوعی در طول عمرش حس یک کودک 6 ساله را به دست نمی‌آورد، اما می‌تواند تا سال 2048 مانند یک سگ باهوش و توجه به نظر برسد.

آخرین اخبار و روندهای هوش مصنوعی مولد

نیاز به مقررات و حکمرانی هوش مصنوعی در هفته‌های اخیر همچنان سرفصل خبرها بوده است. کارشناسان فناوری از جمله رهبران گوگل، OpenAI و Anthropic تاکید کردند که خطر انقراض ناشی از هوش مصنوعی باید یک اولویت جهانی باشد. آنها همچنین خواستار آن شدند که شرکت هایی که محصولات قدرتمند هوش مصنوعی می سازند در دولت ها برای اهداف ردیابی ثبت شوند و آموزش های اخلاقی به کسانی که روی سیستم های هوش مصنوعی کار می کنند ارائه شود. در پاسخ، گروهی شامل بسیاری از محققان دانشگاهی و سازمان‌های غیرانتفاعی گزارشی منتشر کردند که به توسعه‌دهندگان هوش مصنوعی توصیه می‌کند پتانسیل یک مدل را برای ایجاد خطرات شدید در مراحل اولیه توسعه و کاهش هرگونه پیامد خطرناک احتمالی ارزیابی کنند.

ارزش تراشه‌های هوش مصنوعی با افزایش تقاضا برای فناوری مبتنی بر هوش مصنوعی پس از معرفی ChatGPT افزایش یافت. در آخرین فراخوان درآمد Nvidia در 24 می، این شرکت درآمد سه ماهه اول خود را 7.19 میلیارد دلار اعلام کرد و جنسن هوانگ، مدیرعامل ChatGPT AI را “لحظه آیفون” نامید. روز بعد، ارزش بازار انویدیا افزایش یافت و آن را به نهمین شرکت در تاریخ تبدیل کرد که به ارزش یک تریلیون دلاری رسید.

در دیگر اخبار صنعت، Snowflake هر یک برای خرید Neeva، یک فروشنده موتور جستجو که پلتفرم آن از هوش مصنوعی مولد و فناوری مدل زبان بزرگ تغذیه می‌شود، توافق کردند . این اکتساب به فروشنده ابر داده اجازه می دهد قابلیت های هوش مصنوعی مولد را در مجموعه مدیریت داده خود گسترش دهد و به طور بالقوه استفاده از این فناوری را برای مخاطبان گسترده تری باز کند.