آیا جمینی گوگل واقعا بهتر از چت جی پی تی است؟
تاریخ انتشار: ۳ دی ۱۴۰۲ | کد خبر: ۳۹۳۵۶۶۵۷
فرارو- گوگل دیپ مایند اخیرا جمینی (Gemini) را معرفی کرده که مدل جدید هوش مصنوعی برای رقابت با چت جی پی تی (Chat GPT) محسوب میشود. هر دو مدل نمونههایی از "هوش مصنوعی مولد" هستند که یاد میگیرند الگوهایی از اطلاعات ورودی را برای تولید دادههای جدید (تصاویر، کلمات یا رسانههای دیگر) بیابند، با این حال چت جی پی تی بر یک مدل زبان بزرگ (LLM) متمرکز است.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
به گزارش فرارو به نقل از کانورسیشن، چت جی پی تی یک برنامه وب برای مکالمات میباشد که مبتنی بر شبکه عصبی معروف به GPT (آموزش داده شده بر روی مقادیر بسیار زیاد متن) است. گوگل نیز یک برنامه وب مکالمه به نام "بارد" (Bard) را ساخته که بر اساس مدلی به نام (LaMDA) (آموزش داده شده بر روی گفتگو) است. گوگل اکنون این برنامه را براساس جمینی (Gemini) ارتقا میدهد.
آن چه جمینی را از مدلهای هوش مصنوعی مولد قبلی متمایز میسازد آن است که یک مدل چند وجهی میباشد. این بدان معناست که جمینی به طور مستقیم با چندین حالت ورودی و خروجی کار میکند: علاوه بر پشتیبانی از ورودی و خروجی متن از تصاویر، صدا و ویدئو نیز پشتیبانی میکند. بر این اساس نام اختصاری جدیدی در حال ظهور است: LMM (مدل چند وجهی بزرگ) که نباید با LLM اشتباه گرفته شود.
شرکت Open AI مدلی به نام GPT-۴Vision را معرفی کرده که میتواند با تصاویر، صدا و متن نیز کار کند. با این وجود، این یک مدل کاملا چند وجهی به روشی که جمینی وعده داده نیست.
برای مثال، در حالی که چت جی پی تی – ۴ (Chat GPT-۴) که توسط GPT-۴V تغذیه میشود میتواند با ورودیهای صوتی کار کند و خروجیهای گفتاری تولید کند، این کار با تبدیل گفتار به متن در ورودی با استفاده از مدل یادگیری عمیق دیگری به نام Whisper انجام میشود. چت جی پی تی – ۴ همچنین متن را با استفاده از مدلی متفاوت در خروجی به گفتار تبدیل میکند به این معنی که خود GPT-۴V صرفا با متن کار میکند.
به همین ترتیب چت جی پی تی – ۴ (ChatGPT-۴) میتواند تصاویر را تولید کند، اما این کار را با تولید پیامهای متنی انجام میدهد که به یک مدل یادگیری عمیق جداگانه به نام Dall-E ۲ منتقل میشوند که توضیحات متن را به تصاویر تبدیل میکند.
در مقابل، گوگل جمینی را به گونهای طراحی کرد که "چند وجهی بومی" باشد بدان معنا که مدل اصلی به طور مستقیم طیفی از انواع ورودی (صوت، تصاویر، ویدئو و متن) را کنترل میکند و میتواند آنها را نیز به طور مستقیم خروجی دهد.
تمایز بین این دو رویکرد ممکن است موردی آکادمیک به نظر برسد، اما مهم است. نتیجه گیری کلی از گزارش فنی گوگل و سایر آزمایشهای کیفی تا به امروز این است که نسخه عمومی فعلی جمینی به نام Gemini ۱.۰ Pro به طور کلی به خوبی GPT-۴ نیست و از نظر قابلیتها بیشتر شبیه به GPT ۳.۵ میباشد.
گوگل همچنین نسخه قدرتمندتری از جمینی را به نام Gemini ۱.۰ Ultra معرفی کرد و نتایجی را ارائه نمود که نشان میدهد قدرتمندتر از GPT-۴ است. با این وجود، ارزیابی این موضوع به دو دلیل دشوار است. دلیل اول آن که گوگل هنوز Ultra را منتشر نکرده بنابراین، در حال حاضر نمیتوان نتایج را به طور مستقل مورد تایید قرار داد.
دلیل دومی که نشان میدهد چرا ارزیابی ادعاهای گوگل دشوار میباشد آن است که آن شرکت تصمیم گرفت یک ویدئوی تا حدی فریبنده منتشر کند. برای مثال، جمینی از قبل چند کار خاص را یاد گرفته بود مانند ترفند سه فنجان و توپ که در آن ردیابی میکند که توپ زیر کدام فنجان است. برای این کار دنبالهای از تصاویر ثابت ارائه شده بود که در آن دستهای مجری بر روی فنجانهای در حال تعویض است.
آینده امیدوار کنندهعلیرغم تمام این موارد جمینی و مدلهای چندوجهی بزرگ گامی رو به جلو برای هوش مصنوعی مولد هستند. این به دلیل قابلیتهای آینده آنان و هم چنین به دلیل چشم انداز رقابتی ابزارهای هوش مصنوعی است. GPT-۴ بر روی حدود ۵۰۰ میلیارد کلمه از تمام متنهای با کیفیت خوب و در دسترس عموم آموزش داده شد.
عملکرد مدلهای یادگیری عمیق عموما با افزایش پیچیدگی مدل و مقدار دادههای آموزشی هدایت میشود. این وضعیت منجر به طرح این پرسش شده که چگونه میتوان به پیشرفتهای بیش تری دست یافت، زیرا تقریبا دادههای آموزشی جدید برای مدلهای زبان به اتمام رسیده است. با این وجود، مدلهای چندوجهی ذخایر جدید عظیمی از دادههای آموزشی را در قالب تصاویر، صدا و فیلم باز میکنند.
ابزارهای مبتنی بر هوش مصنوعی مانند جمینی که میتوانند به طور مستقیم بر روی همه این دادهها آموزش ببینند احتمالا در آینده قابلیتهای بسیار بیش تری خواهند داشت. هم چنین، ایجاد چشم انداز رقابتی هوش مصنوعی انسان را هیجان زده میسازد. در سال گذشته علیرغم ظهور بسیاری از مدلهای هوش مصنوعی مولد مدلهای GPT ساخته شده توسط Open AI غالب بوده اند و سطحی از عملکرد را نشان میدهند که سایر مدلها قادر به نزدیک شدن به آن نبوده اند.
جمینی گوگل نشان دهنده ظهور یک رقیب بزرگ است که به پیشبرد این چشم انداز کمک میکند. البته Open AI تقریبا به طور قطع بر روی GPT-۵ کار میکند و میتوان انتظار داشت که چندوجهی نیز باشد و قابلیتهای جدید قابل توجهی را نشان دهد. هم چنین، برخی از ویژگیهای پیاده سازی جمینی دوست داشتنی هستند. برای مثال، گوگل نسخهای به نام "جمینی نانو" (Gemini Nano) را معرفی کرده که بسیار سبکتر است و میتواند به طور مستقیم بر روی گوشیهای تلفن همراه هوشمند اجرا شود.
منبع: فرارو
کلیدواژه: قیمت طلا و ارز قیمت خودرو قیمت موبایل هوش مصنوعی مولد طور مستقیم چت جی پی تی قابلیت ها چند وجهی داده ها بر روی یک مدل مدل ها
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت fararu.com دریافت کردهاست، لذا منبع این خبر، وبسایت «فرارو» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۳۵۶۶۵۷ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
واکسن سرطان میزان بقا را دو برابر میکند
به گزارش گروه سلامت خبرگزاری علم و فناوری آنا، مریم اسلامی پزشک و ی تخصصی ژنتیک، فلوشیپ پزشکی بازساختی اظهار کرد: واکسن سرطان، میزان بقا را دو برابر میکند و امید جدیدی را برانگیخته میکند.
این واکسن سفارشی، امیدی برای درمان دارد و در مرحله نهایی آزمایشات در UCLH قرار دارد.
بیماران بریتانیایی در حال آزمایش واکسن بالقوه درمانی شخصیشده mRNA برای ملانوم هستند که نور امیدی را برای بیماران سرطان پوست ارائه میکند.
اینواکسن سفارشی ساخته شده توسط Moderna و MSD میتواند برای هر بیمار در عرض چند هفته ایجاد شود. به گفته Metro، آزمایشات اولیه کاهش قابل توجهی در عود ملانوم نشان داد.
این واکسن با دستور دادن به سیستم ایمنی بدن برای هدف قرار دادن و از بین بردن سلولهای سرطانی عمل میکند.
این درمان نوآورانه در حال حاضر تحت آزمایشات مرحله نهایی به رهبری UCLH قرار دارد و بالقوه میتواند در برابر سرطانهای ریه، مثانه و کلیه نیز موثر باشد.
Heather Shaw، سرپرست این کارآزمایی، نسبت به توانایی این دارو در درمان ملانوما ابراز خوش بینی کرد و در حال بررسی کاربرد آن در سایر سرطانها است.
او گفت: اینیکی از هیجانانگیزترین چیزهایی است که در مدت زمان طولانی دیدهایم. اینیک ابزار واقعاً دقیق است. چیزها بسیار فنی هستند و به خوبی برایبیمار ایجاد میشوند، بیماران واقعاً در مورد آنها هیجان زده هستند.
Steve Young، مردی ۵۲ ساله از استیونیج، که یکی از اولین شرکت کنندگان در UCLH است. برای تقریباً ده سال، Steve Young برآمدگی روی سر خود داشت که هیچ فکری برای آن نمیکرد. با این حال، معلوم شد که ملانوما است، تشخیصی که شوک بزرگی به همراه داشت.
پدرم در ۵۷ سالگی بر اثر آمفیزم درگذشت، و من در واقع فکر کردم: "من از پدرم کوچکتر خواهم مرد. "
او افزود: این واقعاً علاقه من را برانگیخت. به محض اینکه آنها به این فناوری mRNA که برای مبارزه با سرطان استفاده میشود اشاره کردند، من به نظرم جذاب میرسید و هنوز هم همان احساس را دارم. من واقعاً بسیار هیجان زده هستم. این بهترین شانس من برای جلوگیری از مسیر سرطان است.
انتهای پیام/