آموزش تصویری

نحوه استفاده از Nano Banana در Google Gemini و Google Lens

تصور کنید دوربین جادویی‌ در گوشی خود دارید که می‌تواند هر عکس معمولی را به تصویری خاص و خلاقانه تبدیل کند، مثلاً شما را روی ساحلی آفتابی در کنار یک سلبریتی قرار دهد یا سلفی‌های شما را به یک فیگور اکشن سه‌بعدی تبدیل کند!
این همان کاری است که Nano Banana، مدل ویرایش تصویر پیشرفته در Google Gemini انجام می‌دهد. در این مقاله یاد می‌گیریم Nano Banana چیست و چطور در اپلیکیشن جمینای و همچنین با Google Lens از آن استفاده کنیم.

Nano Banana در گوگل جمینای چیست؟

نکته‌ی جالب اینجاست که در برنامه‌ی Gemini اصلاً دکمه یا ویژگی‌ای به نام «Nano Banana» وجود ندارد!
در واقع، آنچه کاربران به این نام می‌شناسند، همان فناوری Google 2.5 Flash Image است؛ سیستمی مبتنی بر متن برای تولید تصویر از روی توضیحات کاربر (Text-to-Image).

ماجرای نام «Banana» از پلتفرم LMArena، یکی از سایت‌های تست هوش مصنوعی، آغاز شد. کاربران در آن‌جا به شوخی از نماد موز استفاده کردند، اما این شوخی به‌سرعت محبوب شد و نام «Nano Banana» روی مدل ماند.
در سپتامبر ۲۰۲۵، با افزایش محبوبیت این مدل، تعداد دانلودهای اپ Gemini از مرز ۱۰ میلیون گذشت و بیش از ۲۰۰ میلیون تصویر با آن ویرایش شد.

اگرچه ابزارهای تولید تصویر با هوش مصنوعی سال‌هاست وجود دارند، اما نانو بنانا امکاناتی بسیار پیشرفته‌تر و دقیق‌تر ارائه می‌دهد، از جمله:

  • ویرایش‌های پیاپی (Sequential Edits): می‌توانید با چند دستور ساده، بخش‌هایی از تصویر را تغییر دهید، بدون اینکه پس‌زمینه‌ی اصلی خراب شود.
  • حفظ یکسانی سوژه‌ها (Subject Uniformity): در چند تصویر مختلف، ظاهر یک شخصیت یا شیء را ثابت نگه می‌دارد.
  • ترکیب چند تصویر (Multi-Image Composition): چند عکس را در یک تصویر واحد و هماهنگ ترکیب می‌کند.
  • اصلاحات جزئی متوالی: با چند ویرایش کوچک، به نتیجه‌ی دقیق‌تر می‌رسید.
  • طراحی چندوجهی (Multimodal Design): می‌تواند متن، لوگو یا عناصر گرافیکی را به‌صورت هوشمند در اشیای موجود جای دهد.

مدتی، این ویژگی باعث شد Gemini به پربازدیدترین اپ استور تبدیل شود. در گوشی‌های جدید اندروید، جمینای در سیستم‌عامل ادغام شده، اما کاربران همچنان می‌توانند آن را غیرفعال کنند.

استفاده از نانو بنانا در اپلیکیشن Google Gemini (اندروید و iOS)

برای استفاده از Nano Banana در برنامه‌ی جمینای، مراحل زیر را دنبال کنید:

۱. با حساب Gmail خود وارد اپ Gemini شوید. اگر قبلاً آن را غیرفعال کرده‌اید، دوباره فعالش کنید و مطمئن شوید حالت پیش‌فرض Gemini 2.5 Flash فعال است.

۳. روی دکمه‌ی + بزنید تا تصویری از دوربین، گالری، فایل‌ها یا Google Drive انتخاب کنید.

۴. در پنجره‌ی بازشده گزینه‌ی Agree را تأیید کنید تا از نظر حق‌کپی مشکلی پیش نیاید (تصاویری که خودتان گرفته‌اید معمولاً امن هستند).

در مثال زیر، ویژگی ترکیب چند تصویر را آزمایش می‌کنیم. در دستور متنی از هوش مصنوعی خواسته می‌شود تنها یک عنصر مثلاً فنجان قهوه از تصویر اول به میز خالی در تصویر دوم منتقل شود.

پس از چند ثانیه، تصویر جدید آماده می‌شود: فنجان قهوه بدون تغییر در سایر بخش‌ها، به تصویر دوم اضافه شده است.

تمام تصاویر ساخته‌شده دارای نشان غیرقابل حذف SynthID از Google DeepMind هستند تا مشخص شود با هوش مصنوعی تولید شده‌اند.

می‌توانید با چند دستور دیگر، ویرایش‌های متوالی انجام دهید، مثلاً فنجان قهوه را با نمونه‌ی جدیدی جایگزین کنید.

استفاده از نانو بنانا با Google Lens و حالت هوش مصنوعی در جستجوی گوگل

علاوه بر برنامه‌ی جمینای، نانو بنانا در حال حاضر از طریق Google Lens و AI Mode نیز در دسترس است.
فعلاً این قابلیت در کشورهای محدودی مانند آمریکا و هند عرضه شده، اما به‌زودی در سراسر جهان فعال خواهد شد.

برای استفاده از آن اپ Google Search را در گوشی باز کنید. روی گزینه‌ی Google Lens بزنید تا دوربین باز شود. اکنون باید آیکون موزی با اسم Create را ببینید.

با زدن دکمه‌ی Create، دکمه‌ی شاتر دوربین به شکل موز درمی‌آید! از اینجا می‌توانید سلفی بگیرید و آن را به یک آواتار سه‌بعدی ابرقهرمان تبدیل کنید. نانو بنانا سپس از شما ایده‌های بیشتری می‌پرسد تا نتیجه را جذاب‌تر کند.

Google Lens می‌تواند با تصاویر و ویدیوهای موجود در گوشی هم کار کند. برای این کار باید به Google Search اجازه‌ی دسترسی به گالری خود را بدهید.

سپس یک تصویر از گالری انتخاب کنید، مثلاً عکسی از یک لیوان نوشیدنی.

به‌صورت خودکار وارد حالت AI Mode می‌شوید. اکنون می‌توانید هر تغییری که می‌خواهید روی تصویر اعمال کنید. در این مثال، از مدل خواسته شده تصویر را در فضای یک کافه قرار دهد تا توانایی طراحی چندوجهی آن آزمایش شود.

پس از چند ثانیه، تصویر جدید با افکت نانو بنانا ساخته می‌شود و مانند قبل دارای واترمارک SynthID است.

مدل Gemini 2.5 Flash Image یا همان نانو بنانا، انقلابی در ویرایش تصویر مبتنی بر هوش مصنوعی محسوب می‌شود.
این فناوری از محدودیت‌های نسل‌های قبلی فراتر رفته و تصاویری خلق می‌کند که به‌سختی می‌توان تفاوتشان را با عکس‌های واقعی تشخیص داد. گوگل احتمالاً در آینده نانو بنانا را به اپلیکیشن‌های بیشتری مثل Google Photos نیز اضافه کند.

جمع‌بندی

نانو بنانا ترکیبی از خلاقیت و فناوری است که مرز میان عکس واقعی و تصویر ساخته‌شده را محو می‌کند. چه بخواهید یک عکس معمولی را جذاب‌تر کنید و چه قصد طراحی خلاقانه داشته باشید، این ویژگی تجربه‌ای تازه از ویرایش هوشمند ارائه می‌دهد. با این حال، همیشه باید به حریم خصوصی و پیامدهای اخلاقی آن توجه داشت، چون هرچه هوش مصنوعی واقعی‌تر شود، تشخیص واقعیت از ساختگی سخت‌تر خواهد شد.

بیشتر بخوانید:

نحوه ساخت عکس به سبک استودیو جیبلی با Chatgpt و رایگان
پرامپت های خلاقانه برای ساخت عکس با GPT-4o
گوگل جمنای چیست و چگونه از آن استفاده کنیم؟

وحید خاکپور

متولد 76 . مبتدی در همه چیز. علاقه مند به یادگیری و به اشتراک گذاشتن تجربه های مفید.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *