از یک طرف، این قابلیت جدید فرصت هایی را باز کرده است که شامل دوبله بهتر فیلم و محتوای آموزشی غنی می شود. همچنین نگرانیهای مربوط به دیپفیکها – تصاویر یا ویدیوهای جعلی دیجیتالی – و حملات مضر امنیت سایبری به مشاغل، از جمله درخواستهای شرورانهای که به طور واقع بینانه رئیس یک کارمند را تقلید میکنند، باز کرد.
دو پیشرفت اخیر اضافی که در زیر با جزئیات بیشتر مورد بحث قرار خواهند گرفت، نقش مهمی در جریان اصلی هوش مصنوعی مولد ایفا کردهاند: ترانسفورماتورها و مدلهای زبان پیشرفتی که آنها فعال کردهاند. ترانسفورماتورها نوعی یادگیری ماشینی هستند که به محققان امکان آموزش مدل های بزرگتر را بدون نیاز به برچسب زدن همه داده ها از قبل می دهند. بنابراین میتوان مدلهای جدید را بر روی میلیاردها صفحه متن آموزش داد و در نتیجه به پاسخهایی با عمق بیشتری دست یافت. علاوه بر این، ترانسفورماتورها مفهوم جدیدی به نام توجه را باز کردند که مدلها را قادر میسازد تا ارتباطات بین کلمات را در صفحات، فصلها و کتابها ردیابی کنند و نه فقط در جملات جداگانه. و نه فقط کلمات: ترانسفورماتورها همچنین می توانند از توانایی خود برای ردیابی اتصالات برای تجزیه و تحلیل کد، پروتئین ها، مواد شیمیایی و DNA استفاده کنند.
پیشرفتهای سریع در مدلهای به اصطلاح زبان بزرگ ( LLM ) – یعنی مدلهایی با میلیاردها یا حتی تریلیونها پارامتر – عصر جدیدی را گشوده است که در آن مدلهای هوش مصنوعی مولد میتوانند متن جذاب بنویسند، تصاویر واقعی واقعی را ترسیم کنند و حتی تا حدودی سرگرمکننده خلق کنند. کمدی در پرواز علاوه بر این، نوآوریها در هوش مصنوعی چندوجهی، تیمها را قادر میسازد تا محتوا را در انواع مختلف رسانه، از جمله متن، گرافیک و ویدئو تولید کنند. این اساس ابزارهایی مانند Dall-E است که به طور خودکار تصاویر را از توضیحات متن ایجاد می کند یا زیرنویس متنی را از تصاویر ایجاد می کند.
با وجود این پیشرفت ها، ما هنوز در روزهای اولیه استفاده از هوش مصنوعی مولد برای ایجاد متن خوانا و گرافیک های سبک فوتورئالیستی هستیم. پیادهسازیهای اولیه مشکلاتی با دقت و سوگیری داشتهاند، همچنین مستعد توهم و پاسخهای عجیب و غریب هستند . با این حال، پیشرفت تاکنون نشان می دهد که قابلیت های ذاتی این نوع هوش مصنوعی می تواند اساساً تجارت را تغییر دهد. در آینده، این فناوری می تواند به نوشتن کد، طراحی داروهای جدید، توسعه محصولات، طراحی مجدد فرآیندهای تجاری و تغییر زنجیره تامین کمک کند.
هوش مصنوعی مولد چگونه کار می کند؟
هوش مصنوعی مولد با یک اعلان شروع می شود که می تواند به شکل متن، تصویر، ویدئو، طرح، نت های موسیقی یا هر ورودی باشد که سیستم هوش مصنوعی می تواند پردازش کند. سپس الگوریتمهای مختلف هوش مصنوعی در پاسخ به درخواست، محتوای جدید را برمیگردانند. محتوا میتواند شامل مقالهها، راهحلهایی برای مشکلات یا تقلبی واقعی باشد که از تصاویر یا صدای یک شخص ایجاد شده است.
نسخههای اولیه هوش مصنوعی مولد نیازمند ارسال دادهها از طریق یک API یا یک فرآیند پیچیده بود. توسعه دهندگان باید با ابزارهای ویژه آشنا می شدند و برنامه های کاربردی را با استفاده از زبان هایی مانند پایتون می نوشتند.
اکنون، پیشگامان در هوش مصنوعی مولد در حال توسعه تجربیات کاربری بهتری هستند که به شما امکان می دهد درخواست را به زبان ساده توصیف کنید. پس از پاسخ اولیه، میتوانید نتایج را با بازخورد درباره سبک، لحن و سایر عناصری که میخواهید محتوای تولید شده منعکس کند، سفارشی کنید.
![تصویری که نقل قول هایی درباره هوش مصنوعی مولد از کارشناسان صنعت را نشان می دهد](https://aliayoubi.com/wp-content/uploads/2023/06/تصویری-که-نقل-قول-هایی-درباره-هوش-مصنوعی-مولد-از-کارشناسان-صنعت-را-نشان-می-دهد.webp)
مدل های مولد هوش مصنوعی
مدلهای هوش مصنوعی مولد الگوریتمهای هوش مصنوعی مختلف را برای نمایش و پردازش محتوا ترکیب میکنند. به عنوان مثال، برای تولید متن، تکنیکهای مختلف پردازش زبان طبیعی ، نویسههای خام (مانند حروف، علائم نقطهگذاری و کلمات) را به جملات، بخشهایی از گفتار، موجودیتها و کنشها تبدیل میکنند که با استفاده از تکنیکهای رمزگذاری چندگانه به صورت بردار نمایش داده میشوند. به طور مشابه، تصاویر به عناصر بصری مختلف تبدیل می شوند که به صورت بردار نیز بیان می شوند. یکی از احتیاطها این است که این تکنیکها همچنین میتوانند سوگیریها، نژادپرستی، فریبکاری و خفگی موجود در دادههای آموزشی را رمزگذاری کنند.
هنگامی که توسعه دهندگان راهی برای نشان دادن جهان می گیرند، از یک شبکه عصبی خاص برای تولید محتوای جدید در پاسخ به یک پرس و جو یا درخواست استفاده می کنند. تکنیکهایی مانند GAN و رمزگذارهای خودکار متغیر (VAE) – شبکههای عصبی با رمزگشا و رمزگذار – برای تولید چهرههای واقعی انسان، دادههای مصنوعی برای آموزش هوش مصنوعی یا حتی فکسهای انسانهای خاص مناسب هستند.
پیشرفتهای اخیر در ترانسفورماتورهایی مانند نمایشهای رمزگذار دوطرفه Google از Transformers ( BERT )، GPT OpenAI و Google AlphaFold همچنین منجر به شبکههای عصبی شدهاند که نه تنها میتوانند زبان، تصاویر و پروتئینها را رمزگذاری کنند، بلکه محتوای جدیدی تولید میکنند.
چگونه شبکه های عصبی هوش مصنوعی مولد را تغییر می دهند
محققان از همان روزهای اولیه هوش مصنوعی، هوش مصنوعی و ابزارهای دیگری را برای تولید محتوا به صورت برنامهریزی کردهاند. اولین رویکردها، که به عنوان سیستمهای مبتنی بر قوانین و بعداً به عنوان «سیستمهای خبره» شناخته میشوند، از قوانین بهصراحت ساخته شده برای تولید پاسخها یا مجموعه دادهها استفاده میکنند.
شبکههای عصبی، که اساس بسیاری از برنامههای کاربردی هوش مصنوعی و یادگیری ماشین امروزی را تشکیل میدهند، این مشکل را تغییر دادند. شبکههای عصبی که برای تقلید از نحوه عملکرد مغز انسان طراحی شدهاند، قوانین را از یافتن الگوها در مجموعه دادههای موجود «یاد میگیرند». اولین شبکه های عصبی که در دهه 1950 و 1960 توسعه یافتند، به دلیل کمبود قدرت محاسباتی و مجموعه داده های کوچک محدود شدند. تا قبل از ظهور کلان داده در اواسط دهه 2000 و بهبود در سخت افزار کامپیوتر، شبکه های عصبی برای تولید محتوا عملی شدند.
زمانی که محققان راهی برای اجرای موازی شبکههای عصبی در واحدهای پردازش گرافیکی (GPU) که در صنعت بازیهای رایانهای برای ارائه بازیهای ویدیویی استفاده میشدند، شتاب گرفت. تکنیکهای جدید یادگیری ماشین که در دهه گذشته توسعه یافتهاند، از جمله شبکههای متخاصم و ترانسفورماتورهای مولد فوقالذکر ، زمینه را برای پیشرفتهای قابل توجه اخیر در محتوای تولید شده توسط هوش مصنوعی فراهم کردهاند.
Dall-E، ChatGPT و Bard چیست؟
ChatGPT، Dall-E و Bard رابط های هوش مصنوعی مولد محبوب هستند.
دال-ای. Dall-E که بر روی مجموعه داده های بزرگی از تصاویر و توضیحات متنی مرتبط با آنها آموزش دیده است، نمونه ای از یک برنامه کاربردی هوش مصنوعی چندوجهی است که اتصالات را در رسانه های مختلف مانند بینایی، متن و صدا شناسایی می کند. در این صورت معنای کلمات را به عناصر بصری متصل می کند. این با استفاده از پیادهسازی GPT OpenAI در سال 2021 ساخته شد. Dall-E 2، نسخه دوم و با قابلیتتر، در سال 2022 منتشر شد. کاربران را قادر میسازد تا تصاویر را در سبکهای مختلف تولید کنند که توسط درخواستهای کاربر هدایت میشود .
ChatGPT. چت ربات مجهز به هوش مصنوعی که در نوامبر 2022 جهان را طوفانی کرد، بر اساس اجرای OpenAI GPT-3.5 ساخته شد. OpenAI راهی برای تعامل و تنظیم دقیق پاسخ های متنی از طریق رابط چت با بازخورد تعاملی ارائه کرده است. نسخه های قبلی GPT فقط از طریق یک API قابل دسترسی بودند. GPT-4 در 14 مارس 2023 منتشر شد. ChatGPT تاریخچه مکالمه خود با یک کاربر را در نتایج خود گنجانده است و یک مکالمه واقعی را شبیه سازی می کند. پس از محبوبیت باورنکردنی رابط GPT جدید، مایکروسافت سرمایه گذاری جدید قابل توجهی را در OpenAI اعلام کرد و نسخه ای از GPT را در موتور جستجوی Bing خود ادغام کرد.
![تصویر دو چک لیست را نشان می دهد که ویژگی های ChatGPT را در مقابل بارد مقایسه می کند](https://aliayoubi.com/wp-content/uploads/2023/06/تصویر-دو-چک-لیست-را-نشان-می-دهد-که-ویژگی-های-ChatGPT-را-در-مقابل-بارد-مقایسه-می-کند.webp)
بارد. گوگل یکی دیگر از رهبران اولیه در تکنیکهای هوش مصنوعی ترانسفورماتور برای پردازش زبان، پروتئینها و دیگر انواع محتوا بود. این منبع باز برخی از این مدل ها را برای محققان تهیه کرد. با این حال، هرگز یک رابط عمومی برای این مدل ها منتشر نکرد. تصمیم مایکروسافت برای پیادهسازی GPT در بینگ، گوگل را وادار کرد تا یک ربات چت عمومی به نام Google Bard را به بازار عرضه کند.، بر روی یک نسخه سبک وزن از خانواده مدل های زبان بزرگ LaMDA خود ساخته شده است. گوگل متحمل ضرر قابل توجهی در قیمت سهام پس از شروع سریع بارد شد، زیرا مدل زبانی به اشتباه گفت تلسکوپ وب اولین سیاره ای است که در یک منظومه شمسی خارجی کشف کرد. در همین حال، پیادهسازیهای مایکروسافت و ChatGPT نیز به دلیل نتایج نادرست و رفتار نامنظم، در اولین فعالیتهای خود چهره خود را از دست دادند. گوگل از آن زمان نسخه جدیدی از Bard را رونمایی کرده است که بر روی پیشرفته ترین LLM خود، PaLM 2 ساخته شده است، که به Bard اجازه می دهد در پاسخ به سوالات کاربران کارآمدتر و بصری تر باشد.
موارد استفاده برای هوش مصنوعی مولد چیست؟
هوش مصنوعی مولد را می توان در موارد استفاده مختلف برای تولید هر نوع محتوا به کار برد. این فناوری به لطف پیشرفت های پیشرفته ای مانند GPT که می تواند برای برنامه های مختلف تنظیم شود، برای همه انواع کاربران در دسترس تر می شود. برخی از موارد استفاده برای هوش مصنوعی مولد شامل موارد زیر است:
- پیاده سازی ربات های چت برای خدمات مشتری و پشتیبانی فنی.
- استفاده از دیپ فیک برای تقلید از افراد یا حتی افراد خاص.
- بهبود دوبله فیلم ها و محتوای آموزشی به زبان های مختلف.
- نوشتن پاسخ ایمیل، پروفایل دوستیابی، رزومه و مقالات ترم.
- خلق هنر فوتورئالیستی در سبکی خاص.
- بهبود ویدیوهای نمایش محصول
- پیشنهاد ترکیبات دارویی جدید برای آزمایش.
- طراحی محصولات فیزیکی و ساختمان.
- بهینه سازی طرح های تراشه های جدید
- نوشتن موسیقی به سبک یا لحن خاص.
مزایای هوش مصنوعی مولد چیست؟
هوش مصنوعی مولد را می توان به طور گسترده در بسیاری از زمینه های کسب و کار به کار برد. می تواند تفسیر و درک محتوای موجود را آسان تر کند و به طور خودکار محتوای جدید ایجاد کند. توسعهدهندگان در حال بررسی راههایی هستند که هوش مصنوعی مولد میتواند جریانهای کاری موجود را بهبود بخشد، با توجه به تطبیق گردشهای کاری کاملاً برای استفاده از این فناوری. برخی از مزایای بالقوه پیاده سازی هوش مصنوعی مولد شامل موارد زیر است:
- خودکارسازی فرآیند دستی نوشتن محتوا.
- کاهش تلاش برای پاسخ دادن به ایمیل ها.
- بهبود پاسخ به سؤالات فنی خاص.
- ایجاد بازنمایی های واقع بینانه از مردم.
- خلاصه کردن اطلاعات پیچیده در یک روایت منسجم.
- ساده سازی فرآیند تولید محتوا در یک سبک خاص.
محدودیت های هوش مصنوعی مولد چیست؟
پیاده سازی های اولیه هوش مصنوعی مولد به وضوح محدودیت های فراوان آن را نشان می دهد. برخی از چالشهایی که هوش مصنوعی مولد ارائه میکند ناشی از رویکردهای خاص مورد استفاده برای اجرای موارد استفاده خاص است. برای مثال، خواندن خلاصهای از یک موضوع پیچیده آسانتر از توضیحی است که حاوی منابع مختلفی است که نکات کلیدی را پشتیبانی میکنند. با این حال، خوانایی خلاصه به قیمت این است که کاربر بتواند بررسی کند که اطلاعات از کجا آمده است.
در اینجا برخی از محدودیتهایی که باید در هنگام پیادهسازی یا استفاده از یک برنامه هوش مصنوعی مولد در نظر گرفته شود آورده شده است:
- همیشه منبع محتوا را مشخص نمی کند.
- ارزیابی سوگیری منابع اصلی می تواند چالش برانگیز باشد.
- محتوای واقعی، شناسایی اطلاعات نادرست را دشوارتر می کند.
- درک چگونگی تنظیم شرایط جدید ممکن است دشوار باشد.
- نتایج ممکن است بیش از تعصب، تعصب و نفرت را پنهان کند.
توجه تنها چیزی است که نیاز دارید: ترانسفورماتورها قابلیت جدیدی را به ارمغان می آورند
در سال 2017، گوگل در مورد نوع جدیدی از معماری شبکه عصبی گزارش داد که پیشرفت های قابل توجهی در کارایی و دقت در کارهایی مانند پردازش زبان طبیعی به همراه داشت. رویکرد پیشرفت، به نام ترانسفورماتور ، بر اساس مفهوم توجه بود.
در سطح بالا، توجه به توصیف ریاضی از چگونگی ارتباط چیزها (مثلاً کلمات) با یکدیگر، تکمیل و اصلاح یکدیگر اشاره دارد. محققان این معماری را در مقاله اصلی خود با عنوان ” توجه تنها چیزی است که نیاز دارید ” توصیف کردند که نشان می دهد چگونه یک شبکه عصبی ترانسفورماتور قادر است بین انگلیسی و فرانسوی را با دقت بیشتری و تنها در یک چهارم زمان آموزش نسبت به سایر شبکه های عصبی ترجمه کند. این تکنیک پیشرفت همچنین میتواند روابط یا نظمهای پنهان بین چیزهای دیگری را که در دادههایی مدفون شدهاند کشف کند که ممکن است انسانها از آنها بیاطلاع باشند، زیرا برای بیان یا تشخیص آنها بسیار پیچیده بودند.
معماری ترانسفورماتور از زمان معرفی به سرعت تکامل یافته است و باعث پیدایش LLM هایی مانند GPT-3 و تکنیک های قبل از آموزش بهتر، مانند BERT گوگل شده است.
نگرانی های پیرامون هوش مصنوعی مولد چیست؟
ظهور هوش مصنوعی مولد نیز نگرانی های مختلفی را برانگیخته است . اینها به کیفیت نتایج، پتانسیل سوء استفاده و سوء استفاده و پتانسیل ایجاد اختلال در مدل های تجاری موجود مربوط می شود. در اینجا برخی از انواع خاصی از مسائل مشکل ساز ناشی از وضعیت فعلی هوش مصنوعی مولد آورده شده است:
- می تواند اطلاعات نادرست و گمراه کننده ارائه دهد.
- بدون دانستن منبع و منشأ اطلاعات، اعتماد کردن دشوارتر است.
- می تواند انواع جدیدی از سرقت ادبی را ترویج کند که حقوق تولیدکنندگان محتوا و هنرمندان محتوای اصلی را نادیده می گیرد.
- ممکن است مدلهای کسبوکار موجود مبتنی بر بهینهسازی موتور جستجو و تبلیغات را مختل کند.
- تولید اخبار جعلی را آسان تر می کند.
- این ادعا را آسانتر میکند که شواهد عکاسی واقعی از یک تخلف فقط جعلی تولید شده توسط هوش مصنوعی است.
- این می تواند افراد را برای حملات سایبری مؤثرتر مهندسی اجتماعی جعل کند.
![](https://aliayoubi.com/wp-content/uploads/2023/06/img_6494953bcd8ae.webp)
چند نمونه از ابزارهای مولد هوش مصنوعی چیست؟
ابزارهای مولد هوش مصنوعی برای حالتهای مختلف مانند متن، تصویر، موسیقی، کد و صدا وجود دارد. برخی از تولیدکنندگان محتوای AI محبوب برای کاوش عبارتند از:
- ابزارهای تولید متن عبارتند از GPT، Jasper، AI-Writer و Lex.
- ابزارهای تولید تصویر عبارتند از Dall-E 2، Midjourney و Stable Diffusion.
- ابزارهای تولید موسیقی عبارتند از Amper، Dadabots و MuseNet.
- ابزارهای تولید کد عبارتند از CodeStarter، Codex، GitHub Copilot و Tabnine.
- ابزارهای ترکیب صدا عبارتند از Descript، Listnr و Podcast.ai.
- شرکتهای ابزار طراحی تراشه هوش مصنوعی شامل Synopsys، Cadence، Google و Nvidia هستند.
استفاده از موارد برای هوش مصنوعی مولد، بر اساس صنعت
فناوریهای مولد جدید هوش مصنوعی گاهی اوقات به عنوان فناوریهای همه منظوره مشابه قدرت بخار، الکتریسیته و محاسبات توصیف میشوند، زیرا میتوانند عمیقاً بر بسیاری از صنایع و موارد استفاده تأثیر بگذارند. مهم است که در نظر داشته باشید، مانند فناوریهای همهمنظوره قبلی، اغلب دههها طول میکشید تا افراد بهترین راه را برای سازماندهی گردشهای کاری برای استفاده از رویکرد جدید به جای سرعت بخشیدن به بخشهای کوچکی از گردشهای کاری موجود بیابند. در اینجا چند روش وجود دارد که کاربردهای هوش مصنوعی مولد می توانند بر صنایع مختلف تأثیر بگذارند:
- امور مالی می تواند تراکنش ها را در زمینه سابقه یک فرد برای ایجاد سیستم های تشخیص تقلب بهتر مشاهده کند.
- شرکت های حقوقی می توانند از هوش مصنوعی مولد برای طراحی و تفسیر قراردادها، تجزیه و تحلیل شواهد و پیشنهاد استدلال استفاده کنند.
- سازندگان می توانند از هوش مصنوعی مولد برای ترکیب داده های دوربین ها، اشعه ایکس و سایر معیارها برای شناسایی دقیق تر و اقتصادی تر قطعات معیوب و علل ریشه ای استفاده کنند.
- شرکتهای فیلم و رسانه میتوانند از هوش مصنوعی برای تولید مقرون به صرفهتر محتوا و ترجمه آن به زبانهای دیگر با صدای خود بازیگران استفاده کنند.
- صنعت پزشکی میتواند از هوش مصنوعی مولد برای شناسایی مؤثرتر داروهای امیدبخش استفاده کند.
- شرکت های معماری می توانند از هوش مصنوعی مولد برای طراحی و تطبیق نمونه های اولیه سریعتر استفاده کنند.
- شرکت های بازی سازی می توانند از هوش مصنوعی مولد برای طراحی محتوا و سطوح بازی استفاده کنند.
GPT به پانتئون فناوری های همه منظوره می پیوندد
OpenAI، یک شرکت تحقیقاتی و استقرار هوش مصنوعی، ایده های اصلی ترانسفورماتورها را برای آموزش نسخه خود به نام Generative Pre-trained Transformer یا GPT در نظر گرفت. ناظران اشاره کرده اند که GPT همان مخفف مورد استفاده برای توصیف فناوری های همه منظوره مانند موتور بخار، برق و محاسبات است. بسیاری موافق هستند که GPT و سایر پیاده سازی های ترانسفورماتور در حال حاضر به نام خود عمل می کنند زیرا محققان راه هایی را برای اعمال آنها در صنعت، علم، تجارت، ساخت و ساز و پزشکی کشف می کنند.
اخلاق و سوگیری در هوش مصنوعی مولد
علیرغم وعدههایشان، ابزارهای مولد جدید هوش مصنوعی مجموعهای از کرمها را در مورد دقت، قابل اعتماد بودن، سوگیری ، توهم و سرقت ادبی باز میکنند – مسائل اخلاقی که احتمالا سالها طول میکشد تا حل شوند. هیچ یک از مسائل به خصوص برای هوش مصنوعی جدید نیست. به عنوان مثال، اولین حمله مایکروسافت به چت بات ها در سال 2016، به نام Tay، پس از اینکه شروع به پخش لفاظی های تحریک آمیز در توییتر کرد، باید خاموش می شد.
چیزی که جدید است این است که آخرین محصول از برنامه های هوش مصنوعی مولد در سطح منسجم تر به نظر می رسد. اما این ترکیبی از زبان انسانمانند و انسجام مترادف با هوش انسانی نیست و در حال حاضر بحثهای زیادی در مورد اینکه آیا میتوان مدلهای هوش مصنوعی مولد را برای داشتن توانایی استدلال آموزش داد یا خیر، وجود دارد. یکی از مهندسان گوگل حتی پس از اعلام عمومی برنامه هوش مصنوعی مولد این شرکت، مدلهای زبان برای برنامههای گفتگو (LaMDA) اخراج شد.
واقع گرایی متقاعد کننده محتوای AI مولد مجموعه جدیدی از خطرات هوش مصنوعی را معرفی می کند. تشخیص محتوای تولید شده توسط هوش مصنوعی را دشوارتر می کند و مهمتر از آن، تشخیص اشتباهات را دشوارتر می کند. وقتی برای نوشتن کد یا ارائه توصیه های پزشکی به نتایج هوش مصنوعی مولد تکیه می کنیم، این می تواند مشکل بزرگی باشد. بسیاری از نتایج هوش مصنوعی مولد شفاف نیستند، بنابراین تعیین اینکه آیا، برای مثال، حق نسخهبرداری را نقض میکنند یا مشکلی با منابع اصلی که از آنها نتیجه گرفتهاند، مشکل است. اگر نمی دانید هوش مصنوعی چگونه به نتیجه رسید، نمی توانید دلیل اشتباه بودن آن را بیان کنید.
![](https://aliayoubi.com/wp-content/uploads/2023/06/img_6494953c533ee.png)
هوش مصنوعی مولد در مقابل هوش مصنوعی
هوش مصنوعی مولد محتوای جدید، پاسخهای چت، طرحها، دادههای مصنوعی یا دیپفیک تولید میکند. از سوی دیگر، هوش مصنوعی سنتی بر شناسایی الگوها، تصمیم گیری، بهبود تجزیه و تحلیل، طبقه بندی داده ها و کشف تقلب متمرکز شده است.
همانطور که در بالا ذکر شد، هوش مصنوعی مولد اغلب از تکنیک های شبکه عصبی مانند ترانسفورماتور، GAN و VAE استفاده می کند. انواع دیگر هوش مصنوعی، به طور متمایز، از تکنیک هایی مانند شبکه های عصبی کانولوشنال ، شبکه های عصبی تکراری و یادگیری تقویتی استفاده می کنند .
هوش مصنوعی مولد اغلب با یک اعلان شروع می شود که به کاربر یا منبع داده اجازه می دهد یک پرس و جو یا مجموعه داده اولیه را برای هدایت تولید محتوا ارسال کند. این میتواند یک فرآیند تکراری برای کشف تغییرات محتوا باشد. الگوریتمهای سنتی هوش مصنوعی دادههای جدید را پردازش میکنند تا یک نتیجه ساده را به دست آورند.
تاریخچه هوش مصنوعی مولد
چت بات الایزا که توسط جوزف وایزنبام در دهه 1960 ایجاد شد، یکی از اولین نمونه های هوش مصنوعی مولد بود . این پیادهسازیهای اولیه از یک رویکرد مبتنی بر قوانین استفاده میکردند که بهدلیل محدود بودن واژگان، فقدان زمینه و اتکای بیش از حد به الگوها، از جمله کاستیهای دیگر، به راحتی شکسته شد. سفارشی سازی و گسترش ربات های چت اولیه نیز دشوار بود.
این زمینه در پی پیشرفتهای شبکههای عصبی و یادگیری عمیق در سال 2010 شاهد تجدید حیات بود که این فناوری را قادر ساخت تا به طور خودکار تجزیه متن موجود، طبقهبندی عناصر تصویر و رونویسی صدا را بیاموزد.
ایان گودفلو GAN ها را در سال 2014 معرفی کرد. این تکنیک یادگیری عمیق یک رویکرد جدید برای سازماندهی شبکه های عصبی رقیب برای تولید و سپس رتبه بندی تغییرات محتوا ارائه کرد. اینها می توانند افراد، صداها، موسیقی و متن واقع بینانه تولید کنند. این علاقه الهامبخش – و ترس از – این بود که چگونه میتوان از هوش مصنوعی مولد برای ایجاد دیپفیکهای واقعی که صداها و افراد را در ویدیوها جعل میکنند، استفاده کرد.
از آن زمان، پیشرفت در سایر تکنیکها و معماریهای شبکه عصبی به گسترش قابلیتهای هوش مصنوعی مولد کمک کرده است. تکنیک ها شامل VAE ها، حافظه کوتاه مدت بلند مدت، ترانسفورماتورها، مدل های انتشار و میدان های تابشی عصبی است .
![](https://aliayoubi.com/wp-content/uploads/2023/06/img_6494953cd895f.webp)
بهترین شیوه ها برای استفاده از هوش مصنوعی مولد
بهترین شیوه ها برای استفاده از هوش مصنوعی مولد بسته به روش ها، گردش کار و اهداف مورد نظر متفاوت است. با این حال، در نظر گرفتن عوامل اساسی مانند دقت، شفافیت و سهولت استفاده در کار با هوش مصنوعی مهم است. اقدامات زیر به دستیابی به این عوامل کمک می کند:
- تمام محتوای تولیدی هوش مصنوعی را برای کاربران و مصرف کنندگان به وضوح برچسب گذاری کنید.
- دقت محتوای تولید شده را با استفاده از منابع اولیه در صورت لزوم بررسی کنید.
- در نظر بگیرید که چگونه سوگیری ممکن است در نتایج AI تولید شده بافته شود.
- با استفاده از ابزارهای دیگر، کیفیت کد و محتوای تولید شده توسط هوش مصنوعی را دوباره بررسی کنید.
- نقاط قوت و محدودیت های هر ابزار هوش مصنوعی مولد را بیاموزید.
- با حالت های رایج شکست در نتایج آشنا شوید و روی آنها کار کنید.
آینده هوش مصنوعی مولد
عمق و سهولت باورنکردنی ChatGPT نویدبخشی را برای پذیرش گسترده هوش مصنوعی مولد نشان داده است. مطمئناً، برخی از مشکلات در راه اندازی ایمن و مسئولانه این فناوری را نیز نشان داده است. اما این مسائل مربوط به اجرای اولیه، تحقیقاتی را برای ابزارهای بهتر برای تشخیص متن، تصاویر و ویدیوی تولید شده توسط هوش مصنوعی الهام بخش کرده است. صنعت و جامعه همچنین ابزارهای بهتری برای ردیابی منشأ اطلاعات خواهند ساخت تا هوش مصنوعی قابل اعتمادتری ایجاد کنند.
علاوه بر این، پیشرفتها در پلتفرمهای توسعه هوش مصنوعی به سرعت بخشیدن به تحقیق و توسعه قابلیتهای هوش مصنوعی مولد بهتر در آینده برای متن، تصاویر، ویدئو، محتوای سه بعدی، داروها، زنجیرههای تامین، تدارکات و فرآیندهای تجاری کمک میکند. به همان اندازه که این ابزارهای یکباره جدید خوب هستند، مهم ترین تأثیر هوش مصنوعی مولد از تعبیه این قابلیت ها به طور مستقیم در نسخه هایی از ابزارهایی است که قبلاً استفاده می کنیم.
چککنندههای گرامر بهتر میشوند. ابزارهای طراحی به طور یکپارچه توصیه های مفید بیشتری را مستقیماً در جریان کار قرار می دهند. ابزارهای آموزشی قادر خواهند بود به طور خودکار بهترین شیوه ها را در یک بخش از سازمان شناسایی کنند تا به آموزش کارآمدتر دیگران کمک کنند. و اینها تنها کسری از راه هایی هستند که هوش مصنوعی مولد نحوه کار ما را تغییر می دهد.
![تصویر فهرستی از مزایای تجاری مختلف هوش مصنوعی مولد](https://aliayoubi.com/wp-content/uploads/2023/06/تصویر-فهرستی-از-مزایای-تجاری-مختلف-هوش-مصنوعی-مولد.png)
سوالات متداول هوش مصنوعی
در زیر برخی از سوالات متداول مردم در مورد هوش مصنوعی مولد وجود دارد.
چه کسی هوش مصنوعی مولد را ایجاد کرد؟
جوزف وایزنبام اولین هوش مصنوعی مولد را در دهه 1960 به عنوان بخشی از چت بات Eliza ایجاد کرد.
ایان گودفلو در سال 2014 شبکههای متخاصم مولد را برای تولید افراد با ظاهر و صدای واقعی نشان داد.
تحقیقات بعدی در مورد LLM از Open AI و Google شور و شوق اخیر را برانگیخت که به ابزارهایی مانند ChatGPT، Google Bard و Dall-E تبدیل شده است.
هوش مصنوعی مولد چگونه می تواند جایگزین مشاغل شود؟
هوش مصنوعی مولد این پتانسیل را دارد که جایگزین مشاغل مختلف شود، از جمله موارد زیر:
- نوشتن توضیحات محصول
- ایجاد کپی بازاریابی
- تولید محتوای اولیه وب
- راه اندازی فروش تعاملی.
- پاسخگویی به سوالات مشتریان.
- ساخت گرافیک برای صفحات وب
برخی از شرکتها به دنبال فرصتهایی برای جایگزینی انسانها در صورت امکان هستند، در حالی که برخی دیگر از هوش مصنوعی مولد برای افزایش و تقویت نیروی کار موجود خود استفاده میکنند.
چگونه یک مدل هوش مصنوعی مولد بسازید؟
یک مدل هوش مصنوعی مولد با رمزگذاری کارآمد نمایشی از آنچه میخواهید تولید کنید شروع میشود. به عنوان مثال، یک مدل هوش مصنوعی تولیدی برای متن ممکن است با یافتن راهی برای نمایش کلمات به عنوان بردارهایی که شباهت بین کلماتی که اغلب در یک جمله استفاده میشوند یا به معنای چیزهای مشابه هستند، شروع شود.
پیشرفتهای اخیر در تحقیقات LLM به صنعت کمک کرده است که فرآیند مشابهی را برای نمایش الگوهای موجود در تصاویر، صداها، پروتئینها، DNA، داروها و طرحهای سهبعدی پیادهسازی کند. این مدل هوش مصنوعی مولد راهی کارآمد برای نمایش نوع دلخواه محتوا و تکرار کارآمد بر روی تغییرات مفید فراهم میکند.
چگونه یک مدل هوش مصنوعی مولد را آموزش می دهید؟
مدل هوش مصنوعی مولد باید برای یک مورد خاص آموزش داده شود. پیشرفت اخیر در LLM یک نقطه شروع ایده آل برای سفارشی کردن برنامه ها برای موارد استفاده مختلف فراهم می کند. به عنوان مثال، مدل محبوب GPT توسعه یافته توسط OpenAI برای نوشتن متن، تولید کد و ایجاد تصاویر بر اساس توضیحات نوشته شده استفاده شده است.
آموزش شامل تنظیم پارامترهای مدل برای موارد استفاده مختلف و سپس تنظیم دقیق نتایج در مجموعه دادههای آموزشی است. به عنوان مثال، یک مرکز تماس ممکن است یک ربات چت را در برابر انواع سوالاتی که نمایندگان خدمات از انواع مشتریان دریافت میکنند و پاسخهایی که نمایندگان خدمات در ازای آن میدهند، آموزش دهد. یک برنامه تولید تصویر، بر خلاف متن، ممکن است با برچسب هایی شروع شود که محتوا و سبک تصاویر را توصیف می کند تا مدل را برای تولید تصاویر جدید آموزش دهد.
هوش مصنوعی مولد چگونه کار خلاقانه را تغییر می دهد؟
هوش مصنوعی مولد به کارگران خلاق کمک می کند تا انواع ایده ها را کشف کنند. هنرمندان ممکن است با یک مفهوم اولیه طراحی شروع کنند و سپس تغییرات را بررسی کنند. طراحان صنعتی می توانند تغییرات محصول را بررسی کنند. معماران می توانند چیدمان های مختلف ساختمان را بررسی کرده و آنها را به عنوان نقطه شروعی برای اصلاح بیشتر تجسم کنند.
همچنین می تواند به دموکراتیک کردن برخی از جنبه های کار خلاق کمک کند. به عنوان مثال، کاربران تجاری می توانند تصاویر بازاریابی محصول را با استفاده از توضیحات متنی کشف کنند. آنها می توانند این نتایج را با استفاده از دستورات یا پیشنهادات ساده اصلاح کنند.
آینده هوش مصنوعی مولد چیست؟
توانایی ChatGPT برای تولید متن انسان مانند کنجکاوی گسترده ای را در مورد پتانسیل هوش مصنوعی مولد برانگیخته است. همچنین مشکلات و چالش های پیش رو را روشن کرد.
در کوتاه مدت، کار بر بهبود تجربه کاربر و گردش کار با استفاده از ابزارهای هوش مصنوعی مولد متمرکز خواهد شد. همچنین ایجاد اعتماد در نتایج مولد هوش مصنوعی ضروری خواهد بود.
بسیاری از شرکتها نیز هوش مصنوعی تولیدی را روی دادههای خود سفارشی میکنند تا به بهبود برندسازی و ارتباطات کمک کنند. تیم های برنامه نویسی از هوش مصنوعی مولد برای اعمال بهترین شیوه های خاص شرکت برای نوشتن و قالب بندی کدهای خوانا و سازگارتر استفاده خواهند کرد.
فروشندگان قابلیتهای هوش مصنوعی مولد را در ابزارهای اضافی خود ادغام میکنند تا جریان کار تولید محتوا را سادهتر کنند. این امر باعث نوآوری در نحوه افزایش بهره وری توسط این قابلیت های جدید می شود.
هوش مصنوعی مولد همچنین میتواند در جنبههای مختلف پردازش دادهها، تبدیل، برچسبگذاری و بررسی به عنوان بخشی از جریانهای کاری تجزیه و تحلیل افزوده نقش داشته باشد. برنامههای کاربردی وب معنایی میتوانند از هوش مصنوعی مولد برای ترسیم خودکار طبقهبندیهای داخلی که مهارتهای شغلی را به طبقهبندیهای مختلف در سایتهای آموزش مهارت و استخدام نشان میدهند، استفاده کنند. به طور مشابه، تیمهای تجاری از این مدلها برای تبدیل و برچسبگذاری دادههای شخص ثالث برای ارزیابیهای پیچیدهتر ریسک و قابلیتهای تحلیل فرصت استفاده خواهند کرد.
در آینده، مدلهای هوش مصنوعی مولد برای پشتیبانی از مدلسازی سهبعدی، طراحی محصول، توسعه دارو، دوقلوهای دیجیتال، زنجیرههای تامین و فرآیندهای تجاری گسترش خواهند یافت. این کار تولید ایدههای محصول جدید، آزمایش با مدلهای مختلف سازمانی و کشف ایدههای تجاری مختلف را آسانتر میکند.
آخرین فناوری هوش مصنوعی تعریف شده است
هنر هوش مصنوعی (هنر هوش مصنوعی)
هنر هوش مصنوعی هر شکلی از هنر دیجیتال است که با ابزارهای هوش مصنوعی ایجاد یا تقویت شده است.
Auto-GPT
Auto-GPT یک عامل هوش مصنوعی منبع باز آزمایشی است که مبتنی بر مدل زبان GPT-4 است که به طور مستقل وظایف را برای دستیابی به یک هدف تصویر بزرگ تعیین شده توسط کاربر به هم متصل می کند.
Google Search Generative Experience
Google Search Generative Experience (SGE) مجموعه ای از قابلیت های جستجو و رابط است که نتایج مولد مبتنی بر هوش مصنوعی را در پاسخ های جستجوی موتور جستجوی Google ادغام می کند.
یادگیری کیو یادگیری
کیو یک رویکرد یادگیری ماشینی است که مدل را قادر میسازد تا به طور مکرر یاد بگیرد و در طول زمان با انجام اقدامات صحیح بهبود یابد.
آزمایشگاههای جستجوی Google (GSE)
GSE ابتکاری از بخش Google Alphabet برای ارائه قابلیتها و آزمایشهای جدید برای جستجوی Google در قالب پیشنمایش قبل از در دسترس قرار گرفتن عمومی است.
امتیاز آغازین
امتیاز اولیه (IS) یک الگوریتم ریاضی است که برای اندازهگیری یا تعیین کیفیت تصاویر ایجاد شده توسط هوش مصنوعی از طریق یک شبکه متخاصم مولد (GAN) استفاده میشود. کلمه “شروع” به جرقه خلاقیت یا شروع اولیه یک فکر یا عمل به طور سنتی توسط انسان ها اشاره دارد.
یادگیری تقویتی از بازخورد انسانی (RLHF)
RLHF یک رویکرد یادگیری ماشینی است که تکنیک های یادگیری تقویتی، مانند پاداش ها و مقایسه ها را با راهنمایی های انسانی برای آموزش یک عامل هوش مصنوعی ترکیب می کند. ادامه مطلب
چند مدل مولد برای پردازش زبان طبیعی چیست؟
برخی از مدل های مولد برای پردازش زبان طبیعی شامل موارد زیر است:
- XLNet دانشگاه کارنگی ملون
- GPT (ترانسفورماتور از پیش آموزش دیده مولد) OpenAI
- ALBERT گوگل (برت “A Lite”)
- Google BERT
- Google LaMDA
آیا هوش مصنوعی هرگز آگاهی پیدا می کند؟
برخی از طرفداران هوش مصنوعی بر این باورند که هوش مصنوعی مولد گامی اساسی به سوی هوش مصنوعی همه منظوره و حتی آگاهی است. یکی از آزمایشکنندههای اولیه چت ربات LaMDA گوگل حتی زمانی که به طور عمومی اعلام کرد که این ربات حساس است، سر و صدای زیادی به پا کرد. سپس او را از شرکت آزاد کردند.
در سال 1993، نویسنده علمی تخیلی آمریکایی و دانشمند کامپیوتر، ورنور وینج، اظهار داشت که در 30 سال آینده، ما توانایی تکنولوژیکی برای ایجاد یک “هوش مافوق بشری” – هوش مصنوعی که از انسان ها باهوش تر است – خواهیم داشت که پس از آن دوره بشری خواهد بود. پایان. Ray Kurzweil پیشگام هوش مصنوعی چنین “تکینگی” را تا سال 2045 پیش بینی کرد.
بسیاری دیگر از کارشناسان هوش مصنوعی فکر می کنند که می تواند بسیار دورتر باشد. رادنی بروکس، پیشگام ربات، پیشبینی کرد که هوش مصنوعی در طول عمرش حس یک کودک 6 ساله را به دست نمیآورد، اما میتواند تا سال 2048 مانند یک سگ باهوش و توجه به نظر برسد.
آخرین اخبار و روندهای هوش مصنوعی مولد
نیاز به مقررات و حکمرانی هوش مصنوعی در هفتههای اخیر همچنان سرفصل خبرها بوده است. کارشناسان فناوری از جمله رهبران گوگل، OpenAI و Anthropic تاکید کردند که خطر انقراض ناشی از هوش مصنوعی باید یک اولویت جهانی باشد. آنها همچنین خواستار آن شدند که شرکت هایی که محصولات قدرتمند هوش مصنوعی می سازند در دولت ها برای اهداف ردیابی ثبت شوند و آموزش های اخلاقی به کسانی که روی سیستم های هوش مصنوعی کار می کنند ارائه شود. در پاسخ، گروهی شامل بسیاری از محققان دانشگاهی و سازمانهای غیرانتفاعی گزارشی منتشر کردند که به توسعهدهندگان هوش مصنوعی توصیه میکند پتانسیل یک مدل را برای ایجاد خطرات شدید در مراحل اولیه توسعه و کاهش هرگونه پیامد خطرناک احتمالی ارزیابی کنند.
ارزش تراشههای هوش مصنوعی با افزایش تقاضا برای فناوری مبتنی بر هوش مصنوعی پس از معرفی ChatGPT افزایش یافت. در آخرین فراخوان درآمد Nvidia در 24 می، این شرکت درآمد سه ماهه اول خود را 7.19 میلیارد دلار اعلام کرد و جنسن هوانگ، مدیرعامل ChatGPT AI را “لحظه آیفون” نامید. روز بعد، ارزش بازار انویدیا افزایش یافت و آن را به نهمین شرکت در تاریخ تبدیل کرد که به ارزش یک تریلیون دلاری رسید.
در دیگر اخبار صنعت، Snowflake هر یک برای خرید Neeva، یک فروشنده موتور جستجو که پلتفرم آن از هوش مصنوعی مولد و فناوری مدل زبان بزرگ تغذیه میشود، توافق کردند . این اکتساب به فروشنده ابر داده اجازه می دهد قابلیت های هوش مصنوعی مولد را در مجموعه مدیریت داده خود گسترش دهد و به طور بالقوه استفاده از این فناوری را برای مخاطبان گسترده تری باز کند.