“Browser Use: Geliştiricilerin Hayali, AI Desteği ve Erişilebilirlikte Sınır Tanımayan Seçenek”

Posted by:
Emre Kılıç
Cts, 08 Şub
0 Comment
Feature image

OpenAI geçen hafta ilk yapay zeka Ajansı Operator’ü sergiledi, ancak zaten size online görevleri tamamlayabilen bir yapay zeka aracı olan Browser Use adında mücadeleci bir rakibi var. Bu Bilgisayar Kullanım Ajansı (CPU), sizin fare veya klavyeye dokunmanıza gerek olmadan web sitelerinden yazı yazabilir, arama yapabilir, düğmelere tıklayabilir ve bilgi kopyalayabilir ve aylık 200 dolarlık ChatGPT Pro aboneliğine ihtiyaç duymaz. Browser Use aslında ücretsiz, en azından API koduyla oynayacak zamanınız varsa. Ancak, API sürümünü kullanmak için GitHub’un nasıl çalıştığını yeterince bildiğimi düşünmüştüm. Saatlerce belgeleri karıştırdıktan, ayarları değiştirdikten ve örnekleri izledikten sonra, bunun daha fazla kodlama bilgisine ihtiyaç duyacağını, nereden bilebilirdim ki? Browser Use benim için mutluluk verici bir şekilde, OpenAI’nın kendi GPT-4o modelini kullanan bir bulut versiyonu tanıttı. Ağır teknik detayları çıkarır ve herhangi bir ek çalışma yapmadan işleri daha tanıdık bir sohbet biçimine dönüştürür. Sınırlamaları vardır ve maliyeti 30 dolardır, ancak beceriksiz API karışıklığımdan sonra bir fırsat gibi geldi. Ve hatta bu (hala açıkça tamamlanmamış) şekilde, AI’nin nasıl çalıştığını mühendislik itilenini ve müzakeresi üzerine biraz çaba harcamanız gerekmektedir. En kısıtlayıcı yönü, AI’nın yaptığına yanıt veremeyeceğiniz ve talebinizi düzeltme şansınızın olmadığı tek bir talimat verebilmenizdir.

Tüm bu düzenlemelerle, Browser Use’ı birkaç gerçek dünya testinden geçirdim. İlk olarak fiyat karşılaştırma görevini gerçekleştirdim. ”Amazon, Best Buy ve Walmart’a gidin ve ‘MacBook Air M2’ için arama yapın. Her sitedeki ilk beş sonuçtan ürün adını, fiyatını ve stok durumunu çıkarın. Fiyatları karşılaştırın ve en düşük olanı belirleyin. Eğer indirimler veya kuponlar varsa, onları kaydedin. En iyi teklifi ve nereden satın alacağınızı içeren bir final özeti verin.” İyi bir şekilde işi yaptı, ancak gizli indirimler veya kuponlar bulamadı. Yine de, birden çok site üzerinde fiyat izleme işlemini otomatikleştirebileceğim gerçeği oldukça heyecan vericiydi. Bununla birlikte, bu tür bir ajan için devam eden bir sorun, bir web sitesinin insan olup olmadığını kontrol etmek istemesi durumunda meydana gelir. Browser Use’ın isterseniz devralmanıza izin veren bir düğmesi vardır, ancak gerektiğinde sizi uyarır. İnsanlığınızı kanıtlayabilir ve ardından AI’ın tekrar devralmasına izin vermek için devam et’i tıklayabilirsiniz.

Sonraki işlem, New York’tan Londra’ya 15 Aralık 2025’te British Air ile gidiş-dönüş uçuş aramasıydı. Browser Use, kalkış saati ve diğer ilgili detaylar da dahil olmak üzere 750 dolar ödenmiş bir British Airways uçuşu çıkardı. Bu, özellikle fiyat düşüşlerini düzenli olarak kontrol etmek için otomatikleştirmek isteyen seyahat edenler için son derece faydalı olabilir.

Son olarak, hava durumu tahmini ve planlamayı “weather.com’da New York City için 7 günlük hava durumu tahminini kontrol edin ve sıcaklık eğilimlerini, yağmur şanslarını ve herhangi bir ciddi hava uyarısını özetleyin ve giysiler için nasıl giyilmesi gerektiğini önerin,” diye sordum. Hava, ses asistanları için en popüler kullanım alanlarından biridir, bu yüzden daha karmaşık bir talebi nasıl ele aldığını görmek istedim. İyi iş çıkardı, sadece tahminden bilgileri çıkarmakla kalmadı, ayrıca hangi günlerde hafif bir ceket giymem gerektiğini ve hangi günlerde “soğuk yağmur şansıyla serin bir ceket ve şal ile yalıtmamı önerdi.

Anahtar fark, erişilebilirlik arasındadır. Browser Use, geliştiriciler için bir Çakı gibi. Tarayıcıda neredeyse her şeyi yapmak için esnekliğe sahiptir, ancak araçları nasıl kullanacağınızı bilmelisiniz. Kodlara dalabilir, onu ayarlayabilir ve tam ihtiyaçlarınıza göre şekillendirebilirsiniz. Bir özellik eksikse, onu eklemenize engel olacak hiçbir şey yoktur. Açık kaynaklı olan Browser Use, sürekli olarak iyileştirilen aktif bir geliştirici topluluğuna sahiptir. Bu da siz sorunlarla karşılaşırsanız, yanıtlar bulabileceğiniz forumlar ve GitHub tartışmaları olduğu anlamına gelir. Öte yandan, OpenAI’nin Operator’ü, bir uşak kiralamaya benzer. Size birçok şey yapar ama belirli sınırlar içinde. Operatörün gücü, OpenAI’nin geniş AI ekosistemiyle entegrasyonudur, daha ince nüansları kararlaştırabilen özel modellere erişim sağlar. Ancak OpenAI’nin fiyatlandırma yapısı ve sınırlı özelleştirme seçenekleri ile kısıtlanırsınız. Browser Use mükemmel değil. Bulut sürümü bile bazı sabır gerektirir. İsteklerinizi dikkatlice hazırlamanız, sorun giderme için kendinizi hazırlamanız ve ara sıra baştan başlamanız gerekebilir. Bulut sürümü bu durumun bazılarını düzeltebilir ancak şu anda, konuşma içinde düzenleme yapamama ve yanıt verememe sınırlamalarını, esnek doğasına sert sınırlar koyar.

Ve hız da bazen sinir bozucu olabilir. İkinci testimin videosuna bakın, bu gerçek işlemin dört katı hızdadır.

Şu anda, Browser Use, geliştiriciler, araştırmacılar ve kendi ellerinizle kirletmekten çekinmeyen otomasyon meraklıları gibi oynama keyfi alan kişiler için en uygun olanıdır. Çabalarınızı göze almak istiyorsanız, rekabetten çok daha az maliyetli olan güçlü, esnek bir araç elde edersiniz. Ancak hafta sonunuzu yapılandırma dosyalarıyla boğuşarak geçirmek istemiyorsanız, Operator belki de daha hoşgörülü bir seçenek olabilir. Her durumda, web otomasyonu patlamaya hazır.

Tags:

0 0 votes
Article Rating
Subscribe
Bildir
guest

0 Comments
Eskiler
En Yeniler Beğenilenler
Inline Feedbacks
View all comments