Yeni çok modlu yapay zeka modeli ChatGPT yapıcının üstesinden gelebilir mi?

Google, neredeyse bir yıl süren gizliliğin ardından nihayet Gemini projesinin örtüsünü kaldırdı ve dünya artık projenin yeteneklerini inceleme fırsatı buldu. Google Gemini, şirketin en büyük yapay zeka modelidir ve en güçlü sürümünde görüntü, video ve ses formatlarında çıktılar üretebilen çok modlu bir yapay zeka sistemidir. Yapay zeka modeli, OpenAI’nin GPT-4’üyle doğrudan rekabet edecek ve ilk atışlar Google tarafından zaten yapıldı. Google, lansmanında, aslında bir karşılaştırma yapmayı düşünmeden, Gemini AI modelinin, kıyaslamaların çoğunda diğer tüm modelleri geride bıraktığını iddia etti. Peki Google Gemini, GPT-4’ten ne kadar farklı ve ChatGPT oluşturucusunu geçebilir mi? Bir göz atalım.

Google İkizler

Gemini modelinin problem çözme becerilerinin Google tarafından özellikle matematik ve fizikte usta olduğu şeklinde lanse edilmesi, yapay zeka iyimserleri arasında bunun insanların yaşamını iyileştirecek bilimsel buluşlara yol açabileceği yönündeki umutları artırıyor.

Gemini’nin arkasındaki yapay zeka bölümü Google DeepMind’ın CEO’su Demis Hassabis, “Bu, yapay zekanın gelişiminde önemli bir kilometre taşı ve Google’da bizim için yeni bir dönemin başlangıcıdır” dedi.

Google, Gemini’nin şimdiye kadarki en esnek modeli olduğunu ve veri merkezlerinden mobil cihazlara kadar her şeyde verimli bir şekilde çalışabildiğini iddia etti. En son teknolojiye sahip yetenekleri, geliştiricilerin ve kurumsal müşterilerin yapay zeka ile oluşturma ve ölçeklendirme yöntemlerini önemli ölçüde geliştirecek. Üç çeşidi mevcuttur: Gemini Nano, temel model Gemini Pro ve görüntü, video ve ses sonuçları üretebilen en gelişmiş modeli Gemini Ultra.

İkizler ve GPT-4

Google ayrıca kendi kriterlerini GPT-4’ünkilerle karşılaştırarak test etti ve şirket, yapay zeka modelinin 32 kıyaslamanın 30’unda OpenAI’nin LLM’sini yendiğini iddia ediyor. Blog yazısında şöyle deniyordu: “Gemini modellerimizi titizlikle test ediyoruz ve çok çeşitli görevlerdeki performanslarını değerlendiriyoruz. Gemini Ultra’nın doğal görüntü, ses ve video anlayışından matematiksel akıl yürütmeye kadar performansı, büyük dil modeli (LLM) araştırma ve geliştirmesinde kullanılan yaygın olarak kullanılan 32 akademik kriterin 30’unda mevcut en son sonuçları aşmaktadır.

Peki Google Gemini’nin liderliği ele geçirdiği bu kriterlerden bazıları nelerdi? Bunlardan ilki ve en önemlisi, hem dünya bilgisini hem de problem çözme yeteneklerini test etmek için matematik, fizik, tarih, hukuk, tıp ve etik gibi 57 konunun birleşimini kullanan MMLU’ydu (büyük çoklu görev dil anlayışı). Şirkete göre Gemini, yüzde 90,0 puanla insan uzmanları geride bırakan ilk model oldu. Karşılaştırıldığında GPT-4 yüzde 86,4 puan aldı.

Gemini aynı zamanda Reasoning şemsiyesi altında Big-Bench Hard (çok adımlı muhakeme) ve DROP (okuduğunu anlama) kriterlerinde de GPT-4’ün yüzde 83,1 ve 80,9 puanlarına kıyasla sırasıyla yüzde 83,6 ve yüzde 82,4 puan alarak öndeydi. Ayrıca kodlama ve matematik tabanlı kıyaslamalarda OpenAI LLM’yi de geride bıraktı. Ancak GPT-4, HellaSwag’da (günlük görevler için sağduyulu muhakeme) yüzde 95,3 gibi devasa bir puan elde ederek, yüzde 87,8 puan alan Gemini’yi geride bıraktı.

Yeni çok modlu yapay zeka modeli ChatGPT yapıcının üstesinden gelebilir mi?

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön