Matematiksel görevleri çözmek, yapay zekanın en büyük zorluklarından biridir. Google'ın yan kuruluşu DeepMind, yapay zekasını bu yılki Uluslararası Matematik Olimpiyatı'ndaki (IMO) görevlerle test etti. DeepMind'ın bir blog yazısında duyurduğu gibi, modeller altı görevden dördünü doğru bir şekilde çözmeyi başardı ve böylece gümüş madalya seviyesine ulaştı.
Duyuru
IMO'ya her yıl 100'den fazla ülkeden öğrenci katılıyor. Toplam altı zorlu görevi çözmek için iki kez dört buçuk saatiniz var. Katılımcılar puan topluyor ve puanlarına göre bronz, gümüş veya altın madalya kazanabiliyorlar. Görevler cebir, kombinatorik, geometri ve sayı teorisinin matematiksel alanlarından gelmektedir. IMO 2024, Temmuz ortasında İngiltere'nin Bath kentinde gerçekleşti.
DeepMind, AlphaProof ve AlphaGeometry 2 AI modellerini bu yılın IMO görevleriyle test etti. İki model, altı görevden dördünü doğru bir şekilde çözmeyi başardı: AlphaProof, iki cebirsel problemi ve Olimpiyatların en zor problemi olan ve yalnızca beş katılımcı tarafından çözülen bir sayı teorisi problemini çözdü. AlphaGeometry2 geometri problemini çözdü. Ancak her ikisi de iki kombinatoryal görevde başarısız oldu. Yapay zekalar 42 üzerinden toplam 28 puan aldı. Bu, altından sadece bir puan uzakta olan gümüş madalyaya karşılık geliyor. Ancak yapay zeka modelleri rekabetin zaman sınırını aştı: Yapay zekalar çözümlerden birini bulmak için üç gün harcadı, ancak diğerini birkaç dakika içinde çözdü.
Yapay zeka çözümleri, IMO Altın ve Fields Madalyası sahibi matematikçiler Prof. Sir Timothy Gowers ve iki kez IMO Altın Madalyası sahibi ve IMO 2024 Problem Seçim Komitesi Başkanı Dr. Joseph Myers tarafından gözden geçirildi. Bunun gibi bariz olmayan bir tasarıma sahip olmak gerçekten etkileyici ve son teknoloji olduğunu düşündüğüm şeyin çok ötesine geçiyor,” diyor Gowers DeepMind blogunda.
Birleşik dil modelleri
AlphaProof problemlerin çözümü için matematiksel dili resmileştirir. İlk olarak matematik problemleri Gemini tabanlı bir dil modeli kullanılarak Yalın programlama diline çevrilir. Bu matematiksel ispatlar için bir yardımcıdır. Daha sonra, pekiştirmeli öğrenmeyi kullanan ve daha önce kendi kendine satranç ve Go öğretmiş olan bir algoritma olan AlphaZero, bir test teklifi oluşturur. Bu nihayet Yalın kullanılarak kontrol edilir. Bunun avantajı, yapay zeka tarafından halüsinasyona uğratılan çözümlerin kontrol edilebilmesi ve çözülebilmesidir.
AlphaGeometry2, AlphaGeometry aracının geometrik problemleri çözmeye yönelik daha da geliştirilmiş halidir. İkincisi, önceki IMO'ların görevlerini yılın başında çözdü. AlphaGeometry2 nöro-sembolik bir yapay zekadır: sinir ağlarını sembolik yapay zekayla birleştirir. Dil modeli potansiyel çözümleri hızlı bir şekilde tanımlamasına rağmen kararlarını gerekçelendiremez. Kullanılan dil modeli Gemini'yi temel alıyor ancak önceki modele göre on kat daha fazla veriyle yeniden eğitildi. Sembolik yapay zekalar ise resmi mantığa dayanır ve sonuçlara ulaşmak için açık kurallar kullanır. Bu kombinasyonla AlphaGeometry2, son 25 yılda IMO'nun geometri problemlerinin %83'ünü çözebildi; önceki model ise bu oranı yalnızca %53'e çıkardı.
ayrıca oku
Daha fazla göster
daha az göster
Daha yakın zamanlarda, IMO görevleri bir makine öğrenimi sorunu olarak ortaya çıktı ve yapay zekanın ileri düzey matematiksel görevleri çözme yeteneğinin bir ölçüsü olarak kabul ediliyor. Karmaşık matematik problemlerini çözebilen bir yapay genel zekanın (AGI), araştırma ve teknolojik geliştirmede çok sayıda uygulama alanı olacaktır.
(spa)
Duyuru
IMO'ya her yıl 100'den fazla ülkeden öğrenci katılıyor. Toplam altı zorlu görevi çözmek için iki kez dört buçuk saatiniz var. Katılımcılar puan topluyor ve puanlarına göre bronz, gümüş veya altın madalya kazanabiliyorlar. Görevler cebir, kombinatorik, geometri ve sayı teorisinin matematiksel alanlarından gelmektedir. IMO 2024, Temmuz ortasında İngiltere'nin Bath kentinde gerçekleşti.
DeepMind, AlphaProof ve AlphaGeometry 2 AI modellerini bu yılın IMO görevleriyle test etti. İki model, altı görevden dördünü doğru bir şekilde çözmeyi başardı: AlphaProof, iki cebirsel problemi ve Olimpiyatların en zor problemi olan ve yalnızca beş katılımcı tarafından çözülen bir sayı teorisi problemini çözdü. AlphaGeometry2 geometri problemini çözdü. Ancak her ikisi de iki kombinatoryal görevde başarısız oldu. Yapay zekalar 42 üzerinden toplam 28 puan aldı. Bu, altından sadece bir puan uzakta olan gümüş madalyaya karşılık geliyor. Ancak yapay zeka modelleri rekabetin zaman sınırını aştı: Yapay zekalar çözümlerden birini bulmak için üç gün harcadı, ancak diğerini birkaç dakika içinde çözdü.
Yapay zeka çözümleri, IMO Altın ve Fields Madalyası sahibi matematikçiler Prof. Sir Timothy Gowers ve iki kez IMO Altın Madalyası sahibi ve IMO 2024 Problem Seçim Komitesi Başkanı Dr. Joseph Myers tarafından gözden geçirildi. Bunun gibi bariz olmayan bir tasarıma sahip olmak gerçekten etkileyici ve son teknoloji olduğunu düşündüğüm şeyin çok ötesine geçiyor,” diyor Gowers DeepMind blogunda.
Birleşik dil modelleri
AlphaProof problemlerin çözümü için matematiksel dili resmileştirir. İlk olarak matematik problemleri Gemini tabanlı bir dil modeli kullanılarak Yalın programlama diline çevrilir. Bu matematiksel ispatlar için bir yardımcıdır. Daha sonra, pekiştirmeli öğrenmeyi kullanan ve daha önce kendi kendine satranç ve Go öğretmiş olan bir algoritma olan AlphaZero, bir test teklifi oluşturur. Bu nihayet Yalın kullanılarak kontrol edilir. Bunun avantajı, yapay zeka tarafından halüsinasyona uğratılan çözümlerin kontrol edilebilmesi ve çözülebilmesidir.
AlphaGeometry2, AlphaGeometry aracının geometrik problemleri çözmeye yönelik daha da geliştirilmiş halidir. İkincisi, önceki IMO'ların görevlerini yılın başında çözdü. AlphaGeometry2 nöro-sembolik bir yapay zekadır: sinir ağlarını sembolik yapay zekayla birleştirir. Dil modeli potansiyel çözümleri hızlı bir şekilde tanımlamasına rağmen kararlarını gerekçelendiremez. Kullanılan dil modeli Gemini'yi temel alıyor ancak önceki modele göre on kat daha fazla veriyle yeniden eğitildi. Sembolik yapay zekalar ise resmi mantığa dayanır ve sonuçlara ulaşmak için açık kurallar kullanır. Bu kombinasyonla AlphaGeometry2, son 25 yılda IMO'nun geometri problemlerinin %83'ünü çözebildi; önceki model ise bu oranı yalnızca %53'e çıkardı.
ayrıca oku
Daha fazla göster
daha az göster
Daha yakın zamanlarda, IMO görevleri bir makine öğrenimi sorunu olarak ortaya çıktı ve yapay zekanın ileri düzey matematiksel görevleri çözme yeteneğinin bir ölçüsü olarak kabul ediliyor. Karmaşık matematik problemlerini çözebilen bir yapay genel zekanın (AGI), araştırma ve teknolojik geliştirmede çok sayıda uygulama alanı olacaktır.
(spa)