مدل‌های پرقدرت‌تر Gemini Pro و Gemini Ultra به گفته گوگل قدرتمندترین مدل‌های زبانی بزرگ هستند که تاکنون طراحی شده‌اند. گوگل برای معرفی این مدل جدید هوش مصنوعی خود از یک ویدئو استفاده کرد که شگفتی بسیاری را برانگیخت، این ویدئو نشان می‌داد که هوش مصنوعی «جمینای» تا چه اندازه قادر به درک عمیق و سریع اتفاقات پیش روی آن است. هرچند دو روز بعد مشخص شد که این ویدئو خیلی هم واقعی نبوده و باعث انتقادات بسیاری از گوگل شد. گوگل مدل هوش مصنوعی Gemini Pro را روی چت‌بات گوگل بارد فعال کرده است، اما از نظر تکنیکی آمارهای مقایسه بین مدل هوش مصنوعی گوگل در انجام کارهای مختلف نشانگر برتری محسوس گوگل در این زمینه است. مثلا در زمینه حل مسائل ریاضی مدل جمینای اولترا قادر به حل ۲/۵۳ درصد مسائل مختلف ریاضی بود. این میزان برای «۴-GPT» که قدرتمندترین نسخه چت‌ جی‌پی‌تی به شمار می‌رود ۹/۵۲ درصد است. در زمینه کدنویسی هوش مصنوعی گوگل ۹/۷۴ درصد عملکرد دارد، در حالی که این میزان برای «۴-GPT» برابر با ۶۷ درصد است. در زمینه ترجمه ماشینی نیز عملکرد جمینای گوگل ۴/۷۴ درصد و چت‌ جی‌پی‌تی ۸/۷۳ درصد است. گوگل نشان داده که مدل هوش مصنوعی جمینای اولترا این شرکت نسبتا برتری محسوس ولی نه‌چندان زیادی نسبت به «۴-GPT» دارد. با این حال این برتری اندک بعد از یک سال فرصت گوگل برای رقابت با چت‌ جی‌پی‌تی به وجود آمده و مشخص نیست که گوگل چقدر می‌تواند این برتری اندک را حفظ کند.


گوگل «جمینای» چیست؟
جمینای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که می‌تواند نه تنها متن، بلکه تصاویر، ویدئوها و صداها را نیز درک کند. به عنوان یک مدل چندوجهی، جمینای قادر به انجام وظایف پیچیده‌ای در حوزه ریاضیات، فیزیک و سایر زمینه‌ها و همچنین درک و تولید کد با کیفیت بالا در زبان‌های برنامه‌نویسی مختلف است.
در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل «بارد» و تلفن همراه هوشمند گوگل پیکسل ادغام شده است، اما به تدریج در سایر سرویس‌های گوگل نیز قرار خواهد گرفت. به گفته «دنیس حسابیس» مدیرعامل و یکی از بنیانگذاران گوگل دیپ‌مایند، جمینای نتیجه تلاش‌های مشترک در مقیاس بزرگ توسط تیم‌های سراسر گوگل، از جمله همکاران ما در بخش پژوهش گوگل است. این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده و این به آن معناست که می‌تواند موارد مختلفی را به هم تعمیم دهد و به‌طور یکپارچه درک کند، کار کند و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.


چه کسی «جمینای» را ساخته است؟
جمینای توسط گوگل و آلفابت که شرکت مادر گوگل است، ایجاد و به عنوان پیشرفته‌ترین مدل هوش مصنوعی این شرکت تا به امروز منتشر شد. گوگل دیپ مایند نیز سهم قابل‌توجهی در توسعه جمینای داشته است. گوگل، «جمینای» را به عنوان یک مدل انعطاف‌پذیر توصیف می‌کند که می‌تواند روی همه چیز از مراکز داده گوگل گرفته تا دستگاه‌های تلفن همراه اجرا شود. برای دستیابی به این انعطاف‌پذیری، جمینای در سه نسخه عرضه می‌شود: نانوجمینای، پروجمینای و اولترا جمینای
اندازه مدل «نانو جمینای» برای اجرا روی تلفن‌های همراه هوشمند، به‌ویژه «گوگل پیکسل ۸» طراحی شده است. این مدل برای انجام کارها روی دستگاهی که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارد، مانند ارائه پیشنهاد برای پاسخ‌ در برنامه‌های چت یا خلاصه کردن متن ساخته شده است.
پرو جمینای که در مراکز داده گوگل اجرا می‌شود، برای تامین آخرین نسخه چت‌بات هوش مصنوعی این شرکت یعنی «بارد»، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است.
اگرچه «اولترا جمینای» هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف می‌کند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدل‌های زبانی بزرگ(LLM) فراتر رفته است. این هوش مصنوعی برای کارهای بسیار پیچیده طراحی شده و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود.
چگونه می‌توان به «جمینای» دسترسی پیدا کرد؟
جمینای اکنون در محصولات گوگل در اندازه‌های نانو و پرو، مانند تلفن پیکسل ۸ و چت‌بات بارد، در دسترس است.
گوگل قصد دارد جمینای را به مرور در موتور جستجوگر، تبلیغات، کروم و سایر سرویس‌های خود ادغام کند.
توسعه‌دهندگان و مشتریان سازمانی از ۱۳ دسامبر می‌توانند از طریق Gemini API در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به پرو جمینای دسترسی داشته باشند.
توسعه‌دهندگان اندروید نیز از طریق AICore به نانوجمینای دسترسی خواهند داشت که به صورت پیش‌نمایش اولیه در دسترس خواهد بود.
به نظر می‌رسد مدل جدید جمینای گوگل یکی از بزرگ‌ترین و پیشرفته‌ترین مدل‌های هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدل‌های محبوبی که در حال حاضر چت‌بات‌های هوش مصنوعی را تقویت می‌کنند، جمینای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدل‌های دیگر، مانند «جی‌پی‌تی-۴»، برای چندوجهی بودن واقعا به اتصالات و ادغام‌ها متکی هستند.
در مقایسه با «جی‌پی‌تی-۴» که یک مدل عمدتا مبتنی بر متن است، جمینای به راحتی وظایف چندوجهی را به صورت بومی انجام می‌دهد.
در حالی که «جی‌پی‌تی‌-۴» در کارهای مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات «اُپن‌ای‌آی» متوسل می‌شود و برای تولید تصاویر و پردازش صدا به «۳ DALL-E» و «ویسپر» متکی است. همچنین به نظر می‌رسد جمینای گوگل بیشتر از سایر مدل‌های موجود در حال حاضر روی محصول متمرکز باشد. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده یا برنامه‌ این کار را دارد، زیرا به هر دو دستگاه بارد و پیکسل ۸ قدرت می‌بخشد. مدل‌های دیگر، مانند «جی‌پی‌تی-۴» و ‌«Meta’s Llama»، بیشتر سرویس‌گرا هستند و برای برنامه‌ها، ابزارها و خدمات توسعه‌دهندگان مختلف شخص ثالث در دسترس قرار دارند.
با این حال هرچند «چت‌جی‌پی‌تی» نخستین مدل هوش مصنوعی مولد در جهان است که توانست به انقلابی در این زمینه منجر شود، اما تاریخ کسب و کارها نشان داده که نخستین‌ها لزوما برنده نخواهند بود. نمونه‌ای چون «نوکیا» و «بلک‌بری» در جهان موبایل‌ها یکی از آنهاست که پیشگامان تلفن‌های هوشمند دیگر وجود ندارند یا از آنها تنها نامی باقی مانده است.

 

منبع: جهان صنعت