چگونه با استفاده از DALL-E API یک Image Generator در React بسازیم

یک front-end ساده برای DALL-E API بسازید و همین امروز با محتوای تولید شده توسط هوش مصنوعی آزمایش کنید.

هوش مصنوعی به طور مداوم در حال بهبود است و اکنون می تواند تصاویر شگفت انگیزی ایجاد کند. یک نمونه ویروسی اخیر ثروتمندترین و با نفوذترین افراد جهان را با لباس های پاره و زندگی در یک محیط فقیر نشین به تصویر می کشد. آنچه در مورد تصاویر قابل توجه است، سطح بالایی از جزئیات ثبت شده در افراد و محیط اطراف آنها است.

مدل‌های زبانی مانند DALL-E و Midjourney این قابلیت‌های تولید تصویر را تقویت می‌کنند، توصیف‌های متنی را به عنوان ورودی دریافت می‌کنند و تصاویری جذاب ایجاد می‌کنند.

با نحوه ادغام API DALL-E OpenAI برای تولید تصاویر در برنامه React آشنا شوید.

تولید تصویر با استفاده از مدل زبان DALL-E OpenAI

مدل زبان DALL-E چگونه تصاویر را تولید می کند؟ DALL-E بدون کاوش در پیچیدگی‌های تولید تصویر هوش مصنوعی ابتدا توصیفات متنی ارائه شده به آن را به عنوان ورودی با استفاده از پردازش زبان طبیعی (NLP) تفسیر می‌کند. سپس تصویری واقع گرایانه ارائه می کند که دقیقاً با توضیحات داده شده مطابقت دارد.

اعلان های ورودی می تواند شامل توضیحات متنی یک شخص، شی یا صحنه باشد. علاوه بر این، می تواند شامل جزئیاتی مانند رنگ، شکل و اندازه خاص نیز باشد. صرف نظر از پیچیدگی یا سادگی متن ورودی، DALL-E تصویری تولید می کند که دقیقاً با توضیحات ورودی مطابقت دارد.

توجه به این نکته مهم است که مدل زبان، درست مانند سایر مدل‌ها، بر روی یک مجموعه داده بزرگ با میلیون‌ها داده تصویر آموزش داده شده است تا نحوه شناسایی و تولید تصاویر واقعی واقعی از ورودی‌های داده شده را بیاموزد.

شروع با API DALL-E OpenAI

API DALL-E OpenAI برای استفاده به عنوان نسخه بتا عمومی در دسترس است. برای ادغام API برای استفاده در برنامه React خود، به یک کلید برای API OpenAI نیاز دارید. به OpenAI بروید و وارد صفحه نمای کلی حساب خود شوید تا کلید API خود را بگیرید.

پس از ورود به سیستم، روی نماد نمایه کاربر در قسمت بالا سمت راست صفحه نمای کلی خود کلیک کنید. سپس، گزینه View API keys را انتخاب کرده و کلیک کنید.

مطلب مرتبط: مکانیسم های تایمر با سی و لینوکس

در صفحه تنظیمات کلیدهای API، بر روی دکمه ایجاد کلید مخفی جدید کلیک کنید، یک نام برای کلید API خود وارد کنید و برای ایجاد کلید API خود، روی Create Secret کلیک کنید.

یک پروژه React ایجاد کنید

دستورات زیر را روی ترمینال خود اجرا کنید تا یک پروژه React جدید به صورت محلی ایجاد کنید. توجه داشته باشید، باید Node.js را نصب کرده باشید.

برای آموزش نصب Node.js در ویندوز و نحوه نصب Node.js در اوبونتو به این دو مقاله مراجعه کنید.

mkdir React-project cd React-project npx create-react-app image-generator-app cd image-generator-app npm start

همچنین، به جای استفاده از دستور create-react-app، می توانید از Vite برای راه اندازی پروژه React خود استفاده کنید. Vite یک ابزار ساخت است که برای ساخت سریع و کارآمد برنامه های کاربردی وب طراحی شده است.

برای ایجاد تصاویر، API DALL-E OpenAI را ادغام کنید

هنگامی که برنامه React خود را راه اندازی کردید، کتابخانه Node.js OpenAI را برای استفاده در برنامه های React خود نصب کنید.

npm install openai

سپس، در پوشه اصلی پوشه پروژه خود، یک فایل env. جدید ایجاد کنید تا کلید API خود را نگه دارد.

REACT_APP_OPENAI_API_KEY = "API KEY"

می توانید کد این پروژه را در این مخزن GitHub پیدا کنید.

یک مؤلفه تولید کننده تصویر ایجاد کنید

در پوشه /src، یک پوشه جدید ایجاد کنید، نام اجزای آن را بگذارید و یک فایل جدید در داخل آن به نام ImageGenerator.js ایجاد کنید. کد زیر را به این فایل اضافه کنید.

با وارد کردن ماژول های مورد نیاز شروع کنید:

import '../App.css'; 
import { useState } from "react"; 
import { Configuration, OpenAIApi } from "openai";

ماژول پیکربندی، سرویس گیرنده API OpenAI را برای استفاده پیکربندی می کند، در حالی که ماژول OpenAIApi روش هایی را برای تعامل با API OpenAI ارائه می دهد. این دو ماژول دسترسی و استفاده از ویژگی های DALL-E را از اپلیکیشن React ممکن می سازند.

سپس یک کامپوننت تابعی تعریف کرده و کد زیر را به آن اضافه کنید:

function ImageGenerator() {
    const [prompt, setPrompt] = useState("");
    const [result, setResult] = useState("");
    const [loading, setLoading] = useState(false);

    const [placeholder, setPlaceholder] = useState(
      "Search for a lion with Paint Brushes painting the mona lisa painting..."
    );

    const configuration = new Configuration({
      apiKey: process.env.REACT_APP_OPENAI_API_KEY,
    });
  
    const openai = new OpenAIApi(configuration);
  
    const generateImage = async () => {
      setPlaceholder(`Search ${prompt}..`);
      setLoading(true);

      try {
        const res = await openai.createImage({
          prompt: prompt,
          n: 1,
          size: "512x512",
        });

        setLoading(false);
        setResult(res.data.data[0].url);
      } catch (error) {
        setLoading(false);
        console.error(`Error generating image: ${error.response.data.error.message}`);
      }
    };

این کد یک جزء تابعی React به نام ImageGenerator را تعریف می کند. این مؤلفه از چندین متغیر حالت برای مدیریت اعلان ورودی، نتیجه خروجی، وضعیت بارگیری و متن مکان‌نما استفاده می‌کند.

مطلب مرتبط: templateUrl و styleUrl در Angular چیست؟

این مؤلفه همچنین یک شی پیکربندی برای کلاینت OpenAI API ایجاد می کند که شامل کلید API بازیابی شده از متغیر محیطی است.

وقتی کاربر روی دکمه‌ای کلیک می‌کند و از اعلان کاربر عبور می‌کند، عملکرد ناهمزمان generalImage اجرا می‌شود.

سپس، متد openai.createImage را فراخوانی می کند تا یک تصویر بر اساس دستور داده شده ایجاد کند. این روش یک شی پاسخ را برمی گرداند که شامل URL تصویر تولید شده است.

اگر فراخوانی API با موفقیت انجام شود، کد متغیر حالت نتیجه را با URL به روز می کند و وضعیت بارگیری را روی false تنظیم می کند. اگر تماس API ناموفق باشد، همچنان وضعیت بارگیری را روی نادرست تنظیم می کند، اما همچنین یک پیام خطا را به کنسول ثبت می کند.

در نهایت، عناصر React JSX را که جزء Image generator را تشکیل می‌دهند، رندر کنید.

    return (
      <div className="container">
        { loading ? (
        <>
          <h3>Generating image... Please Wait...</h3>
        </>
        ) : (
        <>
          <h2>Generate an Image using Open AI API</h2>

          <textarea
            className="app-input"
            placeholder={placeholder}
            onChange={(e) => setPrompt(e.target.value)}
            rows="10"
            cols="100"
          />

          <button onClick={generateImage}>Generate an Image</button>

          { result.length > 0 ? (
            <img className="result-image" src={result} alt="result" />
          ) : (
            <>
            </>
          )}
        </>
        )}
      </div>
    )
}

export default ImageGenerator

کد این مؤلفه به صورت مشروط عناصر مختلف را بر اساس مقدار متغیر حالت بارگذاری ارائه می کند.

اگر بارگذاری درست باشد، پیام بارگیری را نشان می دهد. برعکس، اگر بارگیری نادرست باشد، رابط اصلی برای تولید یک تصویر با استفاده از OpenAI API را نشان می‌دهد که شامل یک ناحیه متنی است که درخواست‌های کاربر و یک دکمه ارسال را ضبط می‌کند.

مطلب مرتبط: آنچه باید در مورد Data Binding در Vue بدانید در اینجا آمده است

متغیر حالت نتیجه URL تصویر تولید شده را نگه می دارد که بعداً در مرورگر ارائه می شود.

کامپوننت App.js را به روز کنید

این کد را به فایل App.js خود اضافه کنید:

import './App.css';
import ImageGenerator from './component/ImageGenerator';

function App() {
  return (
    <div className="App">
      <header className="App-header">
       <ImageGenerator />
      </header>
    </div>
  );
}

export default App;

اکنون می توانید پیش بروید و سرور توسعه را برای به روز رسانی تغییرات بچرخانید و با مرورگر خود به http://localhost:3000 بروید تا عملکرد تولید تصویر را آزمایش کنید.

برای به دست آوردن بهترین نتایج ممکن هنگام استفاده از ابزار هوش مصنوعی برای تولید یک تصویر، مطمئن شوید که یک درخواست دقیق در قسمت متن ارائه دهید. این به این معنی است که تصویر را تا حد امکان کامل توصیف کنید، بدون هیچ جزئیاتی.

این فرآیند مهندسی سریع نامیده می شود و شامل ارائه اعلان های دقیق است تا مدل زبان بتواند بهترین نتایج را بر اساس ورودی های ارائه شده کاربر ایجاد کند.

با توجه به افزایش اخیر نرم افزار هوش مصنوعی موجود در بازار، دنبال کردن حرفه ای در مهندسی سریع می تواند یک فرصت سودآور باشد.

به حداکثر رساندن قدرت مدل های زبان در توسعه نرم افزار

ابزارهای هوش مصنوعی که توسط مدل‌های زبانی بزرگ طراحی شده‌اند، به دلیل ویژگی‌ها و قابلیت‌های باورنکردنی خود، زمینه توسعه نرم‌افزار را طوفانی کرده‌اند.

این ابزارها دارای پتانسیل بهبود اکوسیستم نرم‌افزاری کنونی هستند و به توسعه‌دهندگان اجازه می‌دهند تا ویژگی‌های جالب هوش مصنوعی را که استفاده از محصولات مختلف را بهبود می‌بخشد، ادغام کنند – استفاده از فناوری هوش مصنوعی فرصتی بی‌نظیر برای ساخت نرم‌افزار به روش‌های نوآورانه است.