قدرت API OpenAI و تمام امکاناتی که آن را فعال می کند را کشف کنید.
قدرت مولد ChatGPT از زمان راهاندازی آن باعث ایجاد جنون در دنیای فناوری شده است. برای به اشتراک گذاشتن شهود هوش مصنوعی، OpenAI APIهای ChatGPT و Whisper را در 1 مارس 2023 منتشر کرد تا توسعهدهندگان بتوانند درون برنامهای را بررسی و مصرف کنند.
APIهای OpenAI دارای نقاط پایانی ارزشمندی هستند که ادغام هوش مصنوعی را آسان می کند. بیایید قدرت API های OpenAI را بررسی کنیم تا ببینیم چگونه می توانند برای شما مفید باشند.
OpenAI API چه کاری می تواند انجام دهد؟
OpenAI API مجموعه ای از ابزارهای کاربردی برای برنامه نویسان بسته بندی می کند. اگر قصد دارید روزانه هوش مصنوعی درون برنامه ای ارائه دهید، OpenAI با توانایی های زیر زندگی شما را آسان تر می کند.
چت کنید
نقطه پایانی تکمیل گپ OpenAI API به کاربر نهایی کمک می کند تا با استفاده از مدل GPT-3.5-turbo، یک جلسه تعاملی طبیعی و انسان پسند با یک دستیار مجازی ایجاد کند.
در پشت صحنه، تماس API از یک آرایه پیام از نقش ها و محتوا استفاده می کند. در سمت کاربر، محتوا مجموعه ای از دستورالعمل ها برای دستیار مجازی است که کاربر را درگیر می کند، در حالی که برای مدل، محتوا پاسخ آن است.
نقش سطح بالا سیستم است که در آن عملکرد کلی دستیار مجازی را تعریف می کنید. به عنوان مثال، زمانی که برنامه نویس به سیستم چیزی مانند “شما یک دستیار مجازی مفید هستید” می گوید، انتظار دارید که در حد ظرفیت یادگیری خود به سوالات مختلف پاسخ دهد.
بعد از اینکه به آن گفتیم “یک دستیار مجازی مفید” است، در اینجا نحوه انجام یکی از چت های خط فرمان ما با مدل GPT-3.5-turbo آمده است:
حتی میتوانید عملکرد مدل را با ارائه پارامترهایی مانند دما، جریمه حضور، فرکانس پنالتی و موارد دیگر بهبود بخشید. اگر تا به حال از ChatGPT استفاده کرده اید، از قبل می دانید که مدل تکمیل چت OpenAI چگونه کار می کند.
تکمیل متن
API تکمیل متن، قابلیتهای مکالمه، درج متن و تکمیل متن را بر اساس مدلهای پیشرفته GPT-3.5 فراهم میکند.
مدل قهرمان در نقطه پایانی تکمیل متن، text-davinci-003 است، که به طور قابل توجهی شهودی تر از مدل های زبان طبیعی GPT-3 است. نقطه پایانی یک درخواست کاربر را میپذیرد و به مدل اجازه میدهد به طور طبیعی پاسخ دهد و جملات ساده تا پیچیده را با استفاده از متن انسانپسند کامل کند.
اگرچه نقطه پایان تکمیل متن به اندازه نقطه پایانی چت شهودی نیست، اما بهتر میشود – با افزایش نشانههای متن ارائهشده به مدل text-davinci-003.
به عنوان مثال، زمانی که مدل را روی max_tokens از هفت قرار دادیم، تعدادی تکمیل نیمه کاره به دست آوردیم:
با این حال، افزایش max_tokens به 70 افکار منسجم تری ایجاد کرد:
گفتار به متن
میتوانید گفتار صوتی را با استفاده از نقاط پایانی رونویسی و ترجمه OpenAI رونویسی و ترجمه کنید. نقاط پایانی گفتار به متن بر اساس مدل Whisper v2-large است که از طریق نظارت ضعیف در مقیاس بزرگ توسعه یافته است.
با این حال، OpenAI می گوید هیچ تفاوتی بین مدل Whisper آن و مدل منبع باز وجود ندارد. بنابراین فرصت های بی پایانی را برای ادغام یک رونویس کننده و مترجم چندزبانه هوش مصنوعی در برنامه شما در مقیاس ارائه می دهد.
استفاده از نقطه پایانی ساده است. تنها کاری که باید انجام دهید این است که یک فایل صوتی مدل را تهیه کنید و به ترتیب با openai.Audio.translate یا openai.Audio.transcribe تماس بگیرید تا آن را ترجمه یا رونویسی کنید. این نقاط پایانی حداکثر حجم فایل 25 مگابایت را می پذیرند و از اکثر انواع فایل های صوتی از جمله mp3، mp4، MPEG، MPGA، m4a، wav و webm پشتیبانی می کنند.
مقایسه متن
نقطه پایانی مقایسه متن OpenAI API رابطه بین متون را با استفاده از مدل text-embedding-ada-002، یک مدل جاسازی نسل دوم، اندازه گیری می کند. Embedding API از این مدل برای ارزیابی رابطه بین متون بر اساس فاصله بین دو نقطه برداری استفاده می کند. هرچه این تفاوت بیشتر باشد، متون مورد مقایسه کمتر مرتبط هستند.
نقطه پایانی جاسازی شده دارای خوشه بندی متن، تفاوت ها، ارتباط، توصیه ها، احساسات و طبقه بندی است. به علاوه، به ازای هر حجم توکن شارژ می شود.
اگرچه اسناد OpenAI میگوید که میتوانید از دیگر مدلهای تعبیهکننده نسل اول استفاده کنید، مدل اولی با قیمت ارزانتر بهتر است. با این حال، OpenAI هشدار می دهد که مدل تعبیه ممکن است سوگیری اجتماعی را نسبت به افراد خاص نشان دهد، همانطور که در آزمایشات ثابت شده است.
تکمیل کد
نقطه پایان تکمیل کد بر روی OpenAI Codex ساخته شده است، مجموعهای از مدلهایی که با استفاده از زبان طبیعی و میلیاردها خط کد از مخازن عمومی آموزش داده شدهاند.
نقطه پایانی در نسخه بتا محدود و رایگان است و از بسیاری از زبان های برنامه نویسی مدرن از جمله جاوا اسکریپت، پایتون، برو، پی اچ پی، روبی، شل، تایپ اسکریپت، سوئیفت، پرل و SQL پشتیبانی می کند.
با مدل code-davinci-002 یا code-cushman-001، نقطه پایانی تکمیل کد میتواند خطوط کد را بهطور خودکار درج کند یا بلوکهای کد را از اعلان کاربر بچرخاند. در حالی که مدل دوم سریعتر است، اولی نیروگاه نقطه پایانی است، زیرا دارای درج کد برای تکمیل خودکار کد است.
به عنوان مثال، شما می توانید یک بلوک کد را با ارسال یک اعلان به نقطه پایانی در نظر زبان مقصد ایجاد کنید.
در اینجا برخی از پاسخهایی است که هنگام تلاش برای ایجاد برخی بلوکهای کد در پایتون و جاوا اسکریپت از طریق ترمینال دریافت کردیم:
تولید تصویر
این یکی از بصری ترین ویژگی های OpenAI API است. بر اساس مدل تصویر DALL.E، عملکرد تصویر OpenAI API دارای نقاط پایانی برای تولید، ویرایش، و ایجاد تغییرات تصویر از درخواستهای زبان طبیعی است.
اگرچه هنوز ویژگیهای پیشرفتهای مانند ارتقاء مقیاس را ندارد زیرا هنوز در مرحله بتا است، خروجیهای مقیاسنشده آن نسبت به مدلهای هنری مولد مانند Midjourney و Stable Diffusion چشمگیرتر است.
در حالی که به نقطه پایانی تولید تصویر میروید، فقط باید یک درخواست، اندازه تصویر و تعداد تصویر ارائه دهید. اما نقطه پایانی ویرایش تصویر از شما میخواهد که تصویری را که میخواهید ویرایش کنید و یک ماسک RGBA که نقطه ویرایش را علامتگذاری میکند، علاوه بر پارامترهای دیگر اضافه کنید.
از سوی دیگر، نقطه پایانی تغییرات، فقط به تصویر هدف، تعداد تغییرات و اندازه خروجی نیاز دارد. در زمان نگارش، نقاط پایانی تصویر بتا OpenAI فقط میتوانند فریمهای مربعی در محدوده ۲۵۶×۲۵۶، ۵۱۲×۵۱۲ و ۱۰۲۴×۱۰۲۴ پیکسل را بپذیرند.
ما یک برنامه ساده برای تولید تصویر با استفاده از این نقطه پایانی ایجاد کردیم، و اگرچه برخی از جزئیات را از دست داد، اما نتیجه باورنکردنی داشت:
نحوه استفاده از OpenAI API
استفاده از OpenAI API ساده است و از الگوی مصرف API معمولی پیروی می کند.
- بسته openai را با استفاده از pip: pip install openai نصب کنید. اگر به جای آن از Node استفاده می کنید، می توانید این کار را با استفاده از npm: npm install openai انجام دهید.
- کلیدهای API خود را بگیرید: وارد داشبورد OpenAI خود شوید و روی نماد نمایه خود در بالا سمت راست کلیک کنید. به View API Keys رفته و روی Create new secret key کلیک کنید تا کلید مخفی API شما تولید شود.
- از طریق یک زبان سمت سرور مانند پایتون یا جاوا اسکریپت (Node) به نقاط پایانی مدل انتخابی خود تماس های API برقرار کنید. اینها را به APIهای سفارشی خود وارد کنید و نقاط پایانی خود را آزمایش کنید.
- سپس API های سفارشی را از طریق چارچوب های جاوا اسکریپت مانند React، Vue یا Angular واکشی کنید.
- دادهها (درخواستهای کاربر و پاسخهای مدل) را در یک رابط کاربری جذاب بصری ارائه دهید و برنامه شما برای استفاده در دنیای واقعی آماده است.
چه چیزی می توانید با OpenAI API ایجاد کنید؟
API های OpenAI نقاط ورودی را برای استفاده واقعی از یادگیری ماشین و یادگیری تقویتی ایجاد می کنند. در حالی که فرصتهای خلاقیت فراوان است، در اینجا چند مورد از آنچه میتوانید با APIهای OpenAI بسازید آورده شده است:
- یک ربات چت دستیار مجازی بصری را با استفاده از نقطه پایانی تکمیل چت در وب سایت یا برنامه خود ادغام کنید.
- یک برنامه ویرایش و دستکاری تصویر ایجاد کنید که می تواند به طور طبیعی یک شی را در یک تصویر در هر نقطه مشخص شده با استفاده از نقاط پایانی تولید تصویر وارد کند.
- با استفاده از نقطه پایانی تنظیم دقیق مدل OpenAI، یک مدل یادگیری ماشین سفارشی از ابتدا بسازید.
- با استفاده از نقطه پایانی مدل گفتار به نوشتار، زیرنویسها و ترجمهها را برای ویدیوها، صدا، و مکالمات زنده برطرف کنید.
- با استفاده از نقطه پایانی مدل تعبیه شده OpenAI، احساسات منفی را در برنامه خود شناسایی کنید.
- پلاگین های تکمیل کد مخصوص زبان برنامه نویسی را برای ویرایشگرهای کد و محیط های توسعه یکپارچه (IDE) ایجاد کنید.
بی نهایت با API های OpenAI بسازید
ارتباطات روزانه ما اغلب شامل تبادل محتوای نوشتاری است. OpenAI API تنها تمایلات خلاقانه و پتانسیل خود را با موارد استفاده از زبان طبیعی به ظاهر نامحدود گسترش می دهد.
هنوز روزهای اولیه برای OpenAI API است. اما انتظار داشته باشید که با گذشت زمان با ویژگی های بیشتری تکامل یابد.