پاراگرافیکا، دوربینی عجیب‌وغریب، بدون لنز و سنسور

دوربینی مجهز به هوش مصنوعی

توسط احمدرضا فرزان جم Last updated ۱۴۰۲/۰۵/۲۴

Paragraphica یک «دوربینِ» «مضمون به تصویر» است. این دستگاه از داده‌های موقعیت مکانی و هوش مصنوعی برای شناسایی «عکس» یک مکان خاص استفاده می‌کند. در حال حاضر یک نمونه اولیه از این دستگاه ساخته شده‌است و یک دوربین مجازی هم در دسترس عموم است تا قدرت هوش مصنوعی آن را امتحان کنند؛ البته اگر سرور آن پایین نیاید!

طراح آلمانی، بیورن کارمان، انگار که این دستگاه را از فیلم‌های علمی‌تخیلی بیرون کشیده‌است. این دستگاه لنز ندارد، اما یک قطعه شبیه به تار عنکبوت دارد که در واقع از پوزه موش‌های کور پوزه‌ستاره‌ای الهام گرفته شده‌است. این حیوان از دماغ خود برای حرکت در محیط استفاده می‌کند. از آنجا که این دوربین هیچ نوری دریافت نمی‌کند، طراح از این استعاره استفاده کرده‌است.
ویزور دوربین یک تصویر بی‌درنگ از موقیعت مکانی کاربر نشان می‌دهد. وقتی که کاربر دکمه شاتر را فشار می‌دهد یک «بازنمایی علمی از توضیحات» ثبت می‌کند. سه دکمه چرخان در بالای دستگاه به کاربر اجازه می‌دهد داده‌ها و پارامترهای هوش مصنوعی را که روی ظاهر تصویر نهایی تأثیر می‌گذارند، کنترل کند.

یکی از نمونه‌عکس‌های پاراگرافیکا. عکس سمت چپ محیط واقعی است، پاراگرافی که هوش مصنوعی تولید کرده در وسط دیده می‌شود و عکس تولیدشده توسط دوربین در سمت راست

پاراگرافیکا از چه داده‌هایی برای ایجاد تصاویر استفاده می‌کند؟
طبق آنچه در سایت این دستگاه آمده، با استفاده از APIهای در دسترس، موقعیت مکانی، آب‌وهوا، زمان دقیق و مکان‌های اطراف شناسایی می‌شود. دستگاه همه داده‌ها را با هم ترکیب می‌کند، سپس یک پاراگراف متن تولید می‌شود که موقعیت و لحظه جاری را توصیف می‌کند. سپس دستگاه آن پاراگراف را به یک تصویر تبدیل می‌کند. نتیجه نهایی در واقع ترجمه‌ای از این است که هوش مصنوعی در آن لحظه فضای اطراف را چگونه «می‌بیند».

طبق گفته کارمان «جالب است که عکس‌ها حس‌وحال و احساسات جاری در مکان مورد نظر را ثبت می‌کنند، اما به‌شکلی وهم‌آلود؛ چنان‌که عکس‌ها هیچ‌وقت موبه‌مو شبیه جایی که حضور دارم نیستند.»
این دستگاه از پردازنده Raspberry Pi 4 برای اجرای عملیات متن به تصویر در کنار Stable Diffusion API، Noodl و کد پایتون استفاده می‌کند.

دکمه‌های چرخان چه کاربردی دارند؟
• دکمه چرخان اول محدوده مورد جست‌وجوی دستگاه را مشخص می‌کند.
• دومی چیزی میزان film grain یا همان نویزی که در تصاویر طبیعی می‌بینیم کنترل می‌کند.
• دکمه چرخان سوم میزان وفاداری هوش مصنوعی به پاراگراف را کنترل می‌کند. خود کارمان از عبارت تمثیلی میزان شفاف یا تار بودن تصویر برای توصیف عملکرد این کلید استفاده می‌کند.

اختراع‌های جدید هوش مصنوعی