Son zamanlarda yapay zeka modelleri, sadece sohbet etmekle kalmayıp, kod yazma, veri analizi ve teknik problem çözme gibi alanlarda da yarışıyor. Google, Deep Think’i laboratuvar ve saha ihtiyaçlarına daha yakın bir araç haline getirmeyi hedefliyor. Şirket, modern problemlerin tek doğru cevabı olmayan, verisi dağınık veya eksik olan sorunlara odaklanıyor. Google’ın paylaştığı karşılaştırmalara göre, Deep Think bazı testlerde dikkate değer bir performans gösteriyor. Model, Humanity’s Last Exam adlı ölçütte araç kullanmadan %48,4 seviyesine ulaşıyor. ARC Prize Foundation tarafından doğrulanan ARC AGI 2 testinde ise %84,6 başarı elde ediliyor. Ayrıca, Codeforces için 3455 Elo değeri ile ilgili bilgi veriliyor. Google, modelin kimya, fizik ve diğer bilim alanlarında da gelişme sağladığını belirtiyor. Güncellenen Deep Think’in pratik senaryolara odaklandığı ve araştırmacıların karmaşık verileri yorumlayıp mühendislerin fiziksel sistemleri modellemesine yardımcı olduğu aktarılıyor. Ayrıca, bir çizimi analiz edip 3D baskıya uygun bir modele dönüştürme senaryosunun da mümkün olduğu vurgulanıyor.
Gemini Deep Think yenilendi: Araştırmalar için yeni dönem