بعد از این که گوگل ویدیوی خیرهکننده نمایش کارکرد Gemini را انتشار کرد، اشکار شد که این ویدیو جعلی بوده است. اکنون کاربری این ویدیو را با پشتیبانی قابلیت «ویژن» (Vision) در GPT-4 بازسازی کرده است. در این ویدیو میبینیم کارهایی که جمینای ادعای انجام آنها را داشت، توسط هوش مصنوعی OpenAI انجام میبشود.
بر پایه گزارشی تازه، یک کاربر در یوتوب با انتشار کردن یک ویدیو، قوت رقیب مهم Gemini، یعنی GPT-4 را به رخ کشید. کانال یوتوب Greg Technology ویدیویی را انتشار کرده که در آن دموی Gemini در GPT-4 بازسازی شده است. برخلاف دموی جعلی گوگل، این ویدیو در لحظه و با پرامپتهای صوتی ضبط شده است.
در این ویدیو کاربر با پشتیبانی قابلیت ویژن GPT-4، از این هوش مصنوعی میخواهد که حرکات او را تشخیص دهد. این کاربر بعد از نشاندادن یک قلب با دستش، توانست با مقداری تأخیر از هوش مصنوعی جواب درست را بگیرد. این چنین GPT-4 توانست نقاشی اردکی که برای جمینای به نمایش گذاشته شده می بود را زیاد سریع تشخیص دهد. هوش مصنوعی OpenAI حتی قادر می بود بازی سنگ، کاغذ، قیچی را شناسایی کند، ولی در جوابدادن درنگ بیشتری نشان داد.
کارکرد مدل هوش مصنوعی GPT-4 در قیاس با جمینای گوگل
مدل زبان بزرگ (LLM) جمینای گوگل قدرتمندترین مجموعه مدلهای هوش مصنوعی این شرکت تا به امروز است. گوگل در تلاشی برای نشاندادن توانمندیهای چندوجهی مدل زبانی بزرگ خود، یک ویدیو از جمینای انتشار کرد که انگارً به خواستهای صوتی کاربر سریعاً و در لحظه جواب میداد. در ابتدا، این دمو تعداد بسیاری را شگفتزده کرد، اما بعد از آن اشکار شد که گوگل دستکاریهایی را در نمایش خروجی کار انجام داده است تا ویدیو روانتر و کارکرد این مدل هوش مصنوعی گسترش یافتهتر بهنظر برسد.
با این حساب، ویدیوی کانال Greg Technology میتواند زیاد مهم برداشت بشود، چرا که این کاربر با مدل هوش مصنوعی OpenAI که رقیب مهم جمینای بهحساب میآید، این آزمایش را انجام داده است. اما برخلاف دموی گوگل، این ویدیو زیاد واقعی بهنظر میرسد.