خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

راهنمای OpenAI API و کارهایی که می توانید با آن انجام دهید

قدرت API OpenAI و تمام امکاناتی که آن را فعال می کند را کشف کنید.

قدرت مولد ChatGPT از زمان راه‌اندازی آن باعث ایجاد جنون در دنیای فناوری شده است. برای به اشتراک گذاشتن شهود هوش مصنوعی، OpenAI APIهای ChatGPT و Whisper را در 1 مارس 2023 منتشر کرد تا توسعه‌دهندگان بتوانند درون برنامه‌ای را بررسی و مصرف کنند.

APIهای OpenAI دارای نقاط پایانی ارزشمندی هستند که ادغام هوش مصنوعی را آسان می کند. بیایید قدرت API های OpenAI را بررسی کنیم تا ببینیم چگونه می توانند برای شما مفید باشند.

OpenAI API چه کاری می تواند انجام دهد؟

OpenAI API مجموعه ای از ابزارهای کاربردی برای برنامه نویسان بسته بندی می کند. اگر قصد دارید روزانه هوش مصنوعی درون برنامه ای ارائه دهید، OpenAI با توانایی های زیر زندگی شما را آسان تر می کند.

چت کنید

نقطه پایانی تکمیل گپ OpenAI API به کاربر نهایی کمک می کند تا با استفاده از مدل GPT-3.5-turbo، یک جلسه تعاملی طبیعی و انسان پسند با یک دستیار مجازی ایجاد کند.

در پشت صحنه، تماس API از یک آرایه پیام از نقش ها و محتوا استفاده می کند. در سمت کاربر، محتوا مجموعه ای از دستورالعمل ها برای دستیار مجازی است که کاربر را درگیر می کند، در حالی که برای مدل، محتوا پاسخ آن است.

نقش سطح بالا سیستم است که در آن عملکرد کلی دستیار مجازی را تعریف می کنید. به عنوان مثال، زمانی که برنامه نویس به سیستم چیزی مانند “شما یک دستیار مجازی مفید هستید” می گوید، انتظار دارید که در حد ظرفیت یادگیری خود به سوالات مختلف پاسخ دهد.

بعد از اینکه به آن گفتیم “یک دستیار مجازی مفید” است، در اینجا نحوه انجام یکی از چت های خط فرمان ما با مدل GPT-3.5-turbo آمده است:

گزارش های CLI چت تکمیل چت

حتی می‌توانید عملکرد مدل را با ارائه پارامترهایی مانند دما، جریمه حضور، فرکانس پنالتی و موارد دیگر بهبود بخشید. اگر تا به حال از ChatGPT استفاده کرده اید، از قبل می دانید که مدل تکمیل چت OpenAI چگونه کار می کند.

تکمیل متن

API تکمیل متن، قابلیت‌های مکالمه، درج متن و تکمیل متن را بر اساس مدل‌های پیشرفته GPT-3.5 فراهم می‌کند.

مدل قهرمان در نقطه پایانی تکمیل متن، text-davinci-003 است، که به طور قابل توجهی شهودی تر از مدل های زبان طبیعی GPT-3 است. نقطه پایانی یک درخواست کاربر را می‌پذیرد و به مدل اجازه می‌دهد به طور طبیعی پاسخ دهد و جملات ساده تا پیچیده را با استفاده از متن انسان‌پسند کامل کند.

مطلب مرتبط:   منظور از PayPal Open-Sourcing JunoDB برای توسعه دهندگان چیست؟

اگرچه نقطه پایان تکمیل متن به اندازه نقطه پایانی چت شهودی نیست، اما بهتر می‌شود – با افزایش نشانه‌های متن ارائه‌شده به مدل text-davinci-003.

به عنوان مثال، زمانی که مدل را روی max_tokens از هفت قرار دادیم، تعدادی تکمیل نیمه کاره به دست آوردیم:

تست مدل تکمیل متن از طریق CLI

با این حال، افزایش max_tokens به 70 افکار منسجم تری ایجاد کرد:

تست مدل تکمیل متن از طریق CLI کاملتر است

گفتار به متن

می‌توانید گفتار صوتی را با استفاده از نقاط پایانی رونویسی و ترجمه OpenAI رونویسی و ترجمه کنید. نقاط پایانی گفتار به متن بر اساس مدل Whisper v2-large است که از طریق نظارت ضعیف در مقیاس بزرگ توسعه یافته است.

با این حال، OpenAI می گوید هیچ تفاوتی بین مدل Whisper آن و مدل منبع باز وجود ندارد. بنابراین فرصت های بی پایانی را برای ادغام یک رونویس کننده و مترجم چندزبانه هوش مصنوعی در برنامه شما در مقیاس ارائه می دهد.

استفاده از نقطه پایانی ساده است. تنها کاری که باید انجام دهید این است که یک فایل صوتی مدل را تهیه کنید و به ترتیب با openai.Audio.translate یا openai.Audio.transcribe تماس بگیرید تا آن را ترجمه یا رونویسی کنید. این نقاط پایانی حداکثر حجم فایل 25 مگابایت را می پذیرند و از اکثر انواع فایل های صوتی از جمله mp3، mp4، MPEG، MPGA، m4a، wav و webm پشتیبانی می کنند.

مقایسه متن

نقطه پایانی مقایسه متن OpenAI API رابطه بین متون را با استفاده از مدل text-embedding-ada-002، یک مدل جاسازی نسل دوم، اندازه گیری می کند. Embedding API از این مدل برای ارزیابی رابطه بین متون بر اساس فاصله بین دو نقطه برداری استفاده می کند. هرچه این تفاوت بیشتر باشد، متون مورد مقایسه کمتر مرتبط هستند.

نقطه پایانی جاسازی شده دارای خوشه بندی متن، تفاوت ها، ارتباط، توصیه ها، احساسات و طبقه بندی است. به علاوه، به ازای هر حجم توکن شارژ می شود.

اگرچه اسناد OpenAI می‌گوید که می‌توانید از دیگر مدل‌های تعبیه‌کننده نسل اول استفاده کنید، مدل اولی با قیمت ارزان‌تر بهتر است. با این حال، OpenAI هشدار می دهد که مدل تعبیه ممکن است سوگیری اجتماعی را نسبت به افراد خاص نشان دهد، همانطور که در آزمایشات ثابت شده است.

تکمیل کد

نقطه پایان تکمیل کد بر روی OpenAI Codex ساخته شده است، مجموعه‌ای از مدل‌هایی که با استفاده از زبان طبیعی و میلیاردها خط کد از مخازن عمومی آموزش داده شده‌اند.

مطلب مرتبط:   نحوه ایجاد سطوح در بازی های گودو

نقطه پایانی در نسخه بتا محدود و رایگان است و از بسیاری از زبان های برنامه نویسی مدرن از جمله جاوا اسکریپت، پایتون، برو، پی اچ پی، روبی، شل، تایپ اسکریپت، سوئیفت، پرل و SQL پشتیبانی می کند.

با مدل code-davinci-002 یا code-cushman-001، نقطه پایانی تکمیل کد می‌تواند خطوط کد را به‌طور خودکار درج کند یا بلوک‌های کد را از اعلان کاربر بچرخاند. در حالی که مدل دوم سریعتر است، اولی نیروگاه نقطه پایانی است، زیرا دارای درج کد برای تکمیل خودکار کد است.

به عنوان مثال، شما می توانید یک بلوک کد را با ارسال یک اعلان به نقطه پایانی در نظر زبان مقصد ایجاد کنید.

در اینجا برخی از پاسخ‌هایی است که هنگام تلاش برای ایجاد برخی بلوک‌های کد در پایتون و جاوا اسکریپت از طریق ترمینال دریافت کردیم:

خط فرمان تکمیل کد OpenAI

تولید تصویر

این یکی از بصری ترین ویژگی های OpenAI API است. بر اساس مدل تصویر DALL.E، عملکرد تصویر OpenAI API دارای نقاط پایانی برای تولید، ویرایش، و ایجاد تغییرات تصویر از درخواست‌های زبان طبیعی است.

اگرچه هنوز ویژگی‌های پیشرفته‌ای مانند ارتقاء مقیاس را ندارد زیرا هنوز در مرحله بتا است، خروجی‌های مقیاس‌نشده آن نسبت به مدل‌های هنری مولد مانند Midjourney و Stable Diffusion چشمگیرتر است.

در حالی که به نقطه پایانی تولید تصویر می‌روید، فقط باید یک درخواست، اندازه تصویر و تعداد تصویر ارائه دهید. اما نقطه پایانی ویرایش تصویر از شما می‌خواهد که تصویری را که می‌خواهید ویرایش کنید و یک ماسک RGBA که نقطه ویرایش را علامت‌گذاری می‌کند، علاوه بر پارامترهای دیگر اضافه کنید.

از سوی دیگر، نقطه پایانی تغییرات، فقط به تصویر هدف، تعداد تغییرات و اندازه خروجی نیاز دارد. در زمان نگارش، نقاط پایانی تصویر بتا OpenAI فقط می‌توانند فریم‌های مربعی در محدوده ۲۵۶×۲۵۶، ۵۱۲×۵۱۲ و ۱۰۲۴×۱۰۲۴ پیکسل را بپذیرند.

ما یک برنامه ساده برای تولید تصویر با استفاده از این نقطه پایانی ایجاد کردیم، و اگرچه برخی از جزئیات را از دست داد، اما نتیجه باورنکردنی داشت:

تست تولید تصویر برای OpenAI

نحوه استفاده از OpenAI API

صفحه کلید مخفی OpenAI API

استفاده از OpenAI API ساده است و از الگوی مصرف API معمولی پیروی می کند.

  1. بسته openai را با استفاده از pip: pip install openai نصب کنید. اگر به جای آن از Node استفاده می کنید، می توانید این کار را با استفاده از npm: npm install openai انجام دهید.
  2. کلیدهای API خود را بگیرید: وارد داشبورد OpenAI خود شوید و روی نماد نمایه خود در بالا سمت راست کلیک کنید. به View API Keys رفته و روی Create new secret key کلیک کنید تا کلید مخفی API شما تولید شود.
  3. از طریق یک زبان سمت سرور مانند پایتون یا جاوا اسکریپت (Node) به نقاط پایانی مدل انتخابی خود تماس های API برقرار کنید. اینها را به APIهای سفارشی خود وارد کنید و نقاط پایانی خود را آزمایش کنید.
  4. سپس API های سفارشی را از طریق چارچوب های جاوا اسکریپت مانند React، Vue یا Angular واکشی کنید.
  5. داده‌ها (درخواست‌های کاربر و پاسخ‌های مدل) را در یک رابط کاربری جذاب بصری ارائه دهید و برنامه شما برای استفاده در دنیای واقعی آماده است.
مطلب مرتبط:   چگونه با استفاده از HTML، CSS و جاوا اسکریپت یک بازی مار بسازیم

چه چیزی می توانید با OpenAI API ایجاد کنید؟

API های OpenAI نقاط ورودی را برای استفاده واقعی از یادگیری ماشین و یادگیری تقویتی ایجاد می کنند. در حالی که فرصت‌های خلاقیت فراوان است، در اینجا چند مورد از آنچه می‌توانید با APIهای OpenAI بسازید آورده شده است:

  1. یک ربات چت دستیار مجازی بصری را با استفاده از نقطه پایانی تکمیل چت در وب سایت یا برنامه خود ادغام کنید.
  2. یک برنامه ویرایش و دستکاری تصویر ایجاد کنید که می تواند به طور طبیعی یک شی را در یک تصویر در هر نقطه مشخص شده با استفاده از نقاط پایانی تولید تصویر وارد کند.
  3. با استفاده از نقطه پایانی تنظیم دقیق مدل OpenAI، یک مدل یادگیری ماشین سفارشی از ابتدا بسازید.
  4. با استفاده از نقطه پایانی مدل گفتار به نوشتار، زیرنویس‌ها و ترجمه‌ها را برای ویدیوها، صدا، و مکالمات زنده برطرف کنید.
  5. با استفاده از نقطه پایانی مدل تعبیه شده OpenAI، احساسات منفی را در برنامه خود شناسایی کنید.
  6. پلاگین های تکمیل کد مخصوص زبان برنامه نویسی را برای ویرایشگرهای کد و محیط های توسعه یکپارچه (IDE) ایجاد کنید.

بی نهایت با API های OpenAI بسازید

ارتباطات روزانه ما اغلب شامل تبادل محتوای نوشتاری است. OpenAI API تنها تمایلات خلاقانه و پتانسیل خود را با موارد استفاده از زبان طبیعی به ظاهر نامحدود گسترش می دهد.

هنوز روزهای اولیه برای OpenAI API است. اما انتظار داشته باشید که با گذشت زمان با ویژگی های بیشتری تکامل یابد.