Aracı kalitesi: ChatGPT & Co., bağımsız aracıları izler

Adanali

Member
Daha uzun bir sunumun slaytları için metin oluşturun: Bu tür karmaşık projeler bile dil modelleriyle (Large Language Models, LLM) uygulanabilir. Ancak, örneğin sunumun yapısını ve tek tek slaytların içeriğini aşamalı olarak türetmek için kullanıcının her adım için dil modelini tekrar tekrar istemesi gerekir. Bir dizi yeni proje, dil modellerinin bu tür karmaşık görevleri bağımsız olarak çözmesini sağlamayı amaçlamaktadır.


Örneğin, GPT-3.5 tabanlı AgentGPT ana sayfasında deneyebilirsiniz. Orada bir temsilciye iş verirseniz, örneğin ‘Bana Gazetecilik Yüksek Lisansları hakkında 30 sayfalık bir sunum oluşturun: Gazeteciler bunları nasıl kullanabilir ve tehlikeleri nelerdir?


  • Ek aktivite: LLM’ler ve bunların gazetecilikte kullanımı hakkında araştırma ve bilgi toplayın.
  • Görev eklendi: Sunum için, gazetecilerin LLM’leri ve olası tehditleri nasıl kullanabileceklerine ilişkin bölümler de dahil olmak üzere bir taslak oluşturun.
  • Eklenen görev: Toplanan bilgileri ve özetlenen bölümleri içeren 30 sayfalık bir sunum yazın ve biçimlendirin.
AgentGPT daha sonra bu alt işleri birer birer gerçekleştirir ve sonunda sunum içeriğinin bir kısmını tarayıcıda görüntüler. Tamamlamamasının tek nedeni çok pahalı olması: “Üzgünüm, bu bir demo olduğu için aracılarımızı çok uzun süre çalıştıramayız.” İsterseniz OpenAI API anahtarınızı yatırabilir ve masrafları size ait olmak üzere AgentGPT’nin çalışmasına izin verebilirsiniz.




Godmode.space, planlanan adımların her birini kullanıcıyla birlikte netleştirir.  Ayrıca bota diğer ikincil görevleri de atayabilir.



Godmode.space, planlanan adımların her birini kullanıcıyla birlikte netleştirir. Ayrıca bota diğer ikincil görevleri de atayabilir.



bellek ve arayüzler


Benzer bir tarayıcı uygulaması Godmode.space adresinde bulunabilir. Ancak temsilci hemen başlamaz, sizin işbirliğinize güvenir. “Gazetecilikte LLM’ler hakkında 30 sayfalık bir sunum oluşturun: Gazeteciler bunları nasıl kullanabilir ve tehditler nelerdir?” ziyaretçinin “fikirlerine” katılmasına izin verir. Bot ikincil bir adım atmadan önce kullanıcının bunu onaylaması gerekir. Alternatif olarak, kendi fikirlerini getirebilir ve botu farklı bir yöne yönlendirebilir.


Tarayıcı arayüzleri nedeniyle, AgentGPT ve Godmode.space, son haftalarda ortaya çıkan bir dizi projenin özellikle canlı iki örneğidir. Bunların çoğu, Yohei Nakajima’nın 9 KB’den daha kısa bir JavaScript betiği olan BabyAGI’den ilham almış olabilir. BabyAGI’nin GitHub ana sayfası bu tür 20’den fazla sistemi listeler.

Bu projelerin tümü benzer bir yapıya ve karşılaştırılabilir işlevselliğe sahiptir. Görevleri çözmek veya karmaşık görevleri daha küçük adımlara bölmek için OpenAI API’sini kullanırlar. Bir veritabanı, alt görevleri ve ara sonuçları saklar.

Temel olarak, bir komut dosyası bir döngüden geçer: o listedeki ilk bitmemiş görevi veritabanından alır, işler ve sonucu veritabanında depolar. Ardından, yeni görevler oluşturun ve daha önce tamamlanan görevin genel amacına ve sonucuna göre görev listesini yeniden önceliklendirin.

Tüm aşamalarda, bu aracılar kendi kendine sorma adı verilen bir teknik kullanırlar: OpenAI API’yi bir bilgi istemi ile beslerler, böylece GPT daha fazla işlemeyi kontrol eden yeni istemler üretebilir. BabyAGI, örneğin aşağıdaki gibi yeni görevler oluşturur:


const prompt = `You are an AI who
performs one task based on the
following objective: ${objective}n.
Take into account these previously
completed tasks: ${context}n.
Your task: ${task}nResponse:`



Değişken objective genel etkinliği, değişkeni içerir context zaten çözülmüş alt görevler ve değişken task geçerli alt görev.

BabyAGI ve AgentGPT, yalnızca sorun giderme için OpenAI ile iletişim kurar, Godmode.space şimdiden bir adım önde. Ayrıca arama motorlarını sorgular ve dönen sonuçları değerlendirir.




Makalenin demo sayfasında



“Generative Agents: Interactive Simulacra of Human Behavor” makalesinin demo sayfasında, sanal aracıları gün boyunca gezdirebilirsiniz.



Özerk küçük dünya


Smallville’in sanal dünyasında “yaşayan ve çalışan” 25 yazılım temsilcisi çok daha fazlasını yapabilir. Ajanlar “uyanır, kahvaltı yapar ve işe giderler; yazarlar yazarken sanatçılar resim yaparlar; fikirler oluştururlar, birbirlerini gözlemlerler ve sohbetler başlatırlar; yaratıcılarına göre, bir sonraki günün planını ele alırken geçmiş günleri hatırlar ve düşünürler” Stanford Üniversitesi ve Google’dan.

Smallville’in 2B dünyası ve sakinleri, “Üretken Ajanlar: İnsan Davranışının Etkileşimli Simülakrları” adlı bilimsel makaleye aittir. Uygulamalı simülasyon, insan davranışının etkileşimli uygulamalarda nasıl güvenilir bir şekilde temsil edilebileceğini göstermeyi amaçlamaktadır.

BabyAGI & Co’da olduğu gibi, onların sistemi de temsilci eylemlerini ve konuşmalarını metin olarak çıkaran bir dil modeli olan GPT-3.5’i kullanır. Bu, Smallville’deki bireysel pozisyonları tanımlamaya çok benzer şekilde, diğer temsilciler için bir girdi görevi görür. Dil modeli daha sonra, bir rol yapma oyununda olduğu gibi paralel olarak 25 aracının eylemlerini oynar.

Araştırmacılar, temsilcilerin 48 saat boyunca takip edilebileceği etkileşimli bir demo sağladı. Her ajan tıklanabilir. Bu sayede gözlemciler, şu anda ne yaptığını, nerede olduğunu ve kiminle ne hakkında konuştuğunu her an metin biçiminde anlayabilir.

Şubat ve Smallville’de yayınlanan makale, medyada muazzam bir yer aldı ve sonunda ajan sistemlerinde patlamayı ateşledi. Bunun kesinlikle bilim adamlarının sadece dil düzeyinde kalmamış, aynı zamanda faillerinin faaliyet gösterdiği grafiksel bir dünya yaratmış olmaları gerçeğiyle bir ilgisi vardır.

Robot denetleyicisi olarak dil modeli?


Dil modelleri aracılar olarak sanal ortamlara entegre edilebilirse, bunları fiziksel dünyada da kullanmak mantıklıdır. Ajanlar girdilerini, örneğin çıktıları kendileri için çevrilen sensörlerden ve kontrol robotlarından alabilirler. Microsoft’un AI araştırma departmanı tarafından buna bakan bir çalışma zaten var. Bir vaka, diğer şeylerin yanı sıra, robotik bir kol kullanarak otonom bir robotla bir buzdolabının açılmasını ve bir şişenin çıkarılmasını içeriyor.




Her Smallville sakini, her an ne yaptıklarını ve ne hakkında konuştuklarını görebilir.



Smallville sakinlerinin her birinin, ne yaptıklarını ve ne hakkında konuştuklarını her zaman görebilirsiniz.



Ancak, dil modellerinin robotları kontrol etmeye hazır hale gelmesi muhtemelen biraz zaman alacaktır. Kesin talimatlar yerine yaratıcı metinler yazma eğiliminde olmalarının yanı sıra, robotun bileşenlerinin uygun şekilde kontrol edilmesi bilgisinden de yoksundurlar. “Yapay Zeka” (AI) eksik eylem dizileri sunduğundan, Microsoft araştırmacıları başka bir düzeltme katmanı sunmak zorunda kaldı: AI tarafından üretilen komutları kontrol eden bir insan.

Smallville’in yaratıcıları bile, simülasyonun daha uzun süre çalışmasına izin verilirse ajanların ortalığı kasıp kavuramayacağını bilmiyor. Şimdiye kadar simülasyonu sadece iki gün çalıştırdılar. Bununla birlikte, bilim adamları makalelerinde dil modelinin halüsinasyon görebileceği veya dilbilimsel olarak kontrolden çıkabileceği konusunda uyarıyorlar.







(Resim:

11/2023 var

)



İki faktörlü kimlik doğrulama, çevrimiçi hesaplarınızı tek bir paroladan daha iyi korur, ancak bilgisayar korsanları hızlanıyor! Siber suçluların 2 faktörlü korumayı nasıl atlattığını ve kendinizi nasıl koruyacağınızı gösteriyoruz. Ayrıca akıllı ulaşım için beş e-bisikleti test ettik. Hangi şehir kavşağının sizin için uygun olduğunu öğrenin. Önerilen bir PC yapısı olarak, bir ses iş istasyonumuz var, ChatGPT ile kodladık ve gizlilik korumalı Mullvad tarayıcısını inceledik. 40 yıllık özel c’t’mizde, c’t’in ünlü üçüncü sayfasına bakıyoruz. Bunu ve daha fazlasını c’t 11/2023’te okuyabilirsiniz.









c't Magazine'den daha fazlası



c't Magazine'den daha fazlası




(Evet)



Haberin Sonu
 
Üst