Web Analytics Made Easy - Statcounter
به نقل از «فرارو»
2024-04-29@19:31:10 GMT

آیا جمینی گوگل واقعا بهتر از چت جی پی تی است؟

تاریخ انتشار: ۳ دی ۱۴۰۲ | کد خبر: ۳۹۳۵۶۶۵۷

آیا جمینی گوگل واقعا بهتر از چت جی پی تی است؟

فرارو- گوگل دیپ مایند اخیرا جمینی (Gemini) را معرفی کرده که مدل جدید هوش مصنوعی برای رقابت با چت جی پی تی (Chat GPT) محسوب می‌شود. هر دو مدل نمونه‌هایی از "هوش مصنوعی مولد" هستند که یاد می‌گیرند الگو‌هایی از اطلاعات ورودی را برای تولید داده‌های جدید (تصاویر، کلمات یا رسانه‌های دیگر) بیابند، با این حال چت جی پی تی بر یک مدل زبان بزرگ (LLM) متمرکز است.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!

به گزارش فرارو به نقل از کانورسیشن، چت جی پی تی یک برنامه وب برای مکالمات می‌باشد که مبتنی بر شبکه عصبی معروف به GPT (آموزش داده شده بر روی مقادیر بسیار زیاد متن) است. گوگل نیز یک برنامه وب مکالمه به نام "بارد" (Bard) را ساخته که بر اساس مدلی به نام (LaMDA) (آموزش داده شده بر روی گفتگو) است. گوگل اکنون این برنامه را براساس جمینی (Gemini) ارتقا می‌دهد.

آن چه جمینی را از مدل‌های هوش مصنوعی مولد قبلی متمایز می‌سازد آن است که یک مدل چند وجهی می‌باشد. این بدان معناست که جمینی به طور مستقیم با چندین حالت ورودی و خروجی کار می‌کند: علاوه بر پشتیبانی از ورودی و خروجی متن از تصاویر، صدا و ویدئو نیز پشتیبانی می‌کند. بر این اساس نام اختصاری جدیدی در حال ظهور است: LMM (مدل چند وجهی بزرگ) که نباید با LLM اشتباه گرفته شود.

شرکت Open AI مدلی به نام GPT-۴Vision را معرفی کرده که می‌تواند با تصاویر، صدا و متن نیز کار کند. با این وجود، این یک مدل کاملا چند وجهی به روشی که جمینی وعده داده نیست.

برای مثال، در حالی که چت جی پی تی – ۴ (Chat GPT-۴) که توسط GPT-۴V تغذیه می‌شود می‌تواند با ورودی‌های صوتی کار کند و خروجی‌های گفتاری تولید کند،  این کار با تبدیل گفتار به متن در ورودی با استفاده از مدل یادگیری عمیق دیگری به نام Whisper انجام می‌شود. چت جی پی تی – ۴ همچنین متن را با استفاده از مدلی متفاوت در خروجی به گفتار تبدیل می‌کند به این معنی که خود GPT-۴V صرفا با متن کار می‌کند.

به همین ترتیب چت جی پی تی – ۴ (ChatGPT-۴) می‌تواند تصاویر را تولید کند، اما این کار را با تولید پیام‌های متنی انجام می‌دهد که به یک مدل یادگیری عمیق جداگانه به نام Dall-E ۲ منتقل می‌شوند که توضیحات متن را به تصاویر تبدیل می‌کند.

در مقابل، گوگل جمینی را به گونه‌ای طراحی کرد که "چند وجهی بومی" باشد بدان معنا که مدل اصلی به طور مستقیم طیفی از انواع ورودی (صوت، تصاویر، ویدئو و متن) را کنترل می‌کند و می‌تواند آن‌ها را نیز به طور مستقیم خروجی دهد.

تمایز بین این دو رویکرد ممکن است موردی آکادمیک به نظر برسد، اما مهم است. نتیجه گیری کلی از گزارش فنی گوگل و سایر آزمایش‌های کیفی تا به امروز این است که نسخه عمومی فعلی جمینی به نام Gemini ۱.۰ Pro به طور کلی به خوبی GPT-۴ نیست و از نظر قابلیت‌ها بیش‌تر شبیه به GPT ۳.۵ می‌باشد.

گوگل همچنین نسخه قدرتمندتری از جمینی را به نام Gemini ۱.۰ Ultra معرفی کرد و نتایجی را ارائه نمود که نشان می‌دهد قدرتمندتر از GPT-۴ است. با این وجود، ارزیابی این موضوع به دو دلیل دشوار است. دلیل اول آن که گوگل هنوز Ultra را منتشر نکرده بنابراین، در حال حاضر نمی‌توان نتایج را به طور مستقل مورد تایید قرار داد.

دلیل دومی که نشان می‌دهد چرا ارزیابی ادعا‌های گوگل دشوار می‌باشد آن است که آن شرکت تصمیم گرفت یک ویدئوی تا حدی فریبنده منتشر کند. برای مثال، جمینی از قبل چند کار خاص را یاد گرفته بود مانند ترفند سه فنجان و توپ که در آن ردیابی می‌کند که توپ زیر کدام فنجان است. برای این کار دنباله‌ای از تصاویر ثابت ارائه شده بود که در آن دست‌های مجری بر روی فنجان‌های در حال تعویض است.

آینده امیدوار کننده

علیرغم تمام این موارد جمینی و مدل‌های چندوجهی بزرگ گامی رو به جلو برای هوش مصنوعی مولد هستند. این به دلیل قابلیت‌های آینده آنان و هم چنین به دلیل چشم انداز رقابتی ابزار‌های هوش مصنوعی است. GPT-۴ بر روی حدود ۵۰۰ میلیارد کلمه از تمام متن‌های با کیفیت خوب و در دسترس عموم آموزش داده شد.

عملکرد مدل‌های یادگیری عمیق عموما با افزایش پیچیدگی مدل و مقدار داده‌های آموزشی هدایت می‌شود. این وضعیت منجر به طرح این پرسش شده که چگونه می‌توان به پیشرفت‌های بیش تری دست یافت، زیرا تقریبا داده‌های آموزشی جدید برای مدل‌های زبان به اتمام رسیده است. با این وجود، مدل‌های چندوجهی ذخایر جدید عظیمی از داده‌های آموزشی را در قالب تصاویر، صدا و فیلم باز می‌کنند.

ابزار‌های مبتنی بر هوش مصنوعی مانند جمینی که می‌توانند به طور مستقیم بر روی همه این داده‌ها آموزش ببینند احتمالا در آینده قابلیت‌های بسیار بیش تری خواهند داشت. هم چنین، ایجاد چشم انداز رقابتی هوش مصنوعی انسان را هیجان زده می‌سازد. در سال گذشته علیرغم ظهور بسیاری از مدل‌های هوش مصنوعی مولد مدل‌های GPT ساخته شده توسط Open AI غالب بوده اند و سطحی از عملکرد را نشان می‌دهند که سایر مدل‌ها قادر به نزدیک شدن به آن نبوده اند.

جمینی گوگل نشان دهنده ظهور یک رقیب بزرگ است که به پیشبرد این چشم انداز کمک می‌کند. البته Open AI تقریبا به طور قطع بر روی GPT-۵ کار می‌کند و می‌توان انتظار داشت که چندوجهی نیز باشد و قابلیت‌های جدید قابل توجهی را نشان دهد. هم چنین، برخی از ویژگی‌های پیاده سازی جمینی دوست داشتنی هستند. برای مثال، گوگل نسخه‌ای به نام "جمینی نانو" (Gemini Nano) را معرفی کرده که بسیار سبک‌تر است و می‌تواند به طور مستقیم بر روی گوشی‌های تلفن همراه هوشمند اجرا شود.

منبع: فرارو

کلیدواژه: قیمت طلا و ارز قیمت خودرو قیمت موبایل هوش مصنوعی مولد طور مستقیم چت جی پی تی قابلیت ها چند وجهی داده ها بر روی یک مدل مدل ها

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت fararu.com دریافت کرده‌است، لذا منبع این خبر، وبسایت «فرارو» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۳۵۶۶۵۷ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

واکسن سرطان میزان بقا را دو برابر می‌کند

به گزارش گروه سلامت خبرگزاری علم و فناوری آنا، مریم اسلامی پزشک و ی تخصصی ژنتیک، فلوشیپ پزشکی بازساختی اظهار کرد: واکسن سرطان، میزان بقا را دو برابر می‌کند و امید جدیدی را برانگیخته می‌کند.

این واکسن سفارشی، امیدی برای درمان دارد و در مرحله نهایی آزمایشات در UCLH قرار دارد.

بیماران بریتانیایی در حال آزمایش واکسن بالقوه درمانی شخصی‌شده mRNA برای ملانوم هستند که نور امیدی را برای بیماران سرطان پوست ارائه می‌کند.

اینواکسن سفارشی ساخته شده توسط Moderna و MSD می‌تواند برای هر بیمار در عرض چند هفته ایجاد شود. به گفته Metro، آزمایشات اولیه کاهش قابل توجهی در عود ملانوم نشان داد.

این واکسن با دستور دادن به سیستم ایمنی بدن برای هدف قرار دادن و از بین بردن سلول‌های سرطانی عمل می‌کند.
این درمان نوآورانه در حال حاضر تحت آزمایشات مرحله نهایی به رهبری UCLH قرار دارد و بالقوه می‌تواند در برابر سرطان‌های ریه، مثانه و کلیه نیز موثر باشد.

Heather Shaw، سرپرست این کارآزمایی، نسبت به توانایی این دارو در درمان ملانوما ابراز خوش بینی کرد و در حال بررسی کاربرد آن در سایر سرطان‌ها است.

او گفت: اینیکی از هیجان‌انگیزترین چیز‌هایی است که در مدت زمان طولانی دیده‌ایم. اینیک ابزار واقعاً دقیق است. چیز‌ها بسیار فنی هستند و به خوبی برایبیمار ایجاد می‌شوند، بیماران واقعاً در مورد آنها هیجان زده هستند.
Steve Young، مردی ۵۲ ساله از استیونیج، که یکی از اولین شرکت کنندگان در UCLH است. برای تقریباً ده سال، Steve Young برآمدگی روی سر خود داشت که هیچ فکری برای آن نمی‌کرد. با این حال، معلوم شد که ملانوما است، تشخیصی که شوک بزرگی به همراه داشت.
پدرم در ۵۷ سالگی بر اثر آمفیزم درگذشت، و من در واقع فکر کردم: "من از پدرم کوچکتر خواهم مرد. "

او افزود: این واقعاً علاقه من را برانگیخت. به محض اینکه آنها به این فناوری mRNA که برای مبارزه با سرطان استفاده می‌شود اشاره کردند، من به نظرم جذاب می‌رسید و هنوز هم همان احساس را دارم. من واقعاً بسیار هیجان زده هستم. این بهترین شانس من برای جلوگیری از مسیر سرطان است.

انتهای پیام/

دیگر خبرها

  • قطعی ۱۷ ساعته آب منازل شهرک سازمانی والفجر در پرندک
  • کپی گوگل از روی اپل: قابلیت دانلود هم‌زمان چند اپلیکیشن در گوگل‌پلی
  • نصب همزمان ۲ اپ در موبایل اندروید ممکن شد
  • «مست عشق» فیلم قابل قبولی نیست/ فروش بالا نمی‌تواند دلیل بر کامل بودن یک اثر باشد
  • خسروی: خوشحالی بعد از گل من، یک کار شخصی بود
  • عصبانیت پوچتینو: وی‌اِی‌آر بارها به من و تیمم آسیب زده
  • آیا صدام حسین واقعا «دیوانه خاورمیانه» بود؟
  • مصدومیت ستاره بایرن در آستانه بازی با رئال
  • ورزش واقعا باعث رشد قد می‌شود؟
  • واکسن سرطان میزان بقا را دو برابر می‌کند