Yeni bir çağın erken dönem çocukları olarak hepimiz kaskatı bir A4 kağıdının bir tarafından tutup çekiştiriyor ve elimizde kalan parçalardan bir şeyler “üretiyoruz”. Yırtılan ve buruşan kağıdın dokusu, aldığı şekil, parmaklarımızın arasında bıraktığı yakıcı kesik hissi yani üretmenin bize bıraktığı bilinmezlik ise bu yarışta içimizde yaşıyor. Bu pek de yeni olmayan olgu, dijital çağın gerek influencer kültürü gerekse maddi kaygılar yaratan boyutu nedeniyle bir eşik atlamış durumda. Influencer kültürünün yarattığı hobisizlik ve yetersizlik hissi ya da sanatın, sosyal bilimlerin ve edebiyatın “karın doyurmaması” üzerine geçmişte yazıldı, bugün de yazılıyor. Bu metin ise bu noktalarda büyük bir iddia taşımamasına rağmen gelişen dijital teknolojilerin etkisi üzerine, bilhassa şu sıralar bizim yerimize görevlerimizi icra eden yapay zeka üzerine söyleyecek şeylere sahip.
Dijital çağda üretilen görsel, işitsel ve yazılı içeriklerin niteliği ve ortaya çıkış hızı yalnızca estetik bir tartışmadan ibaret değil; aynı zamanda psikolojik, politik ve ekonomik yönlere de sahip. Çünkü bu üretimlerin veçhesi geldiğimiz edebi, sanatsal, bilimsel birikim noktasında da ardıllarımızdan farklı. Olanın üzerine koymakla, olmakta olanla ilgilenmekteyiz. Ancak artık tek üreten biz bilimum sanatçılar, yazarlar, bilim insanları değiliz.
Yapay zekâ tabanlı üretim araçlarının hızlı yükselişi, bu tartışmanın boyutlarını daha da belirgin hale getirmiş durumda. Özellikle “deep-learning”, yani verilen bir veri grubu ile sonuçları tahmin eden birden fazla katmandan, yapay sinir ağlarından oluşan bir makine öğrenme yöntemi ile çalışan metin-görsel modelleri, bireysel yaratıcılığın ötesinde, toplumsal veri birikimlerini işleyerek yeni imgeler üretmekte.
Bu imgeler ne klasik anlamda fotoğraf ne de tekil bir öznenin yaratıcı ürünü olarak değerlendirilebilir; daha ziyade, geniş ölçekli veri gruplarının birtakım istatistiksel işlemlerinin sonucu olarak ortaya çıkan “ortalama” varlıklardır.
Bilimkurgu yazarı Ted Chiang bu sebeple şu aralar insanların aile fotoğraflarını tabloya çeviren ChatGPT’yi “web’in bulanık bir jpeg’i” olarak tanımlayarak bu tartışmayı özetliyor. Chiang’ın işaret ettiği “bulanıklık”, yalnızca teknik bir kalite eksikliğini değil, aynı zamanda anlamın çözülmesini, özgünlüğün kaybını ve istatistiksel olanın ortalamaya indirgenmiş bir temsilini ifade ediyor.
Chiang’ın bu tanımından etkilenen Hito Steyerl ise bu fikri daha da ileri taşıyarak, yapay zekâ üretimlerini “ortalama imgeler” (mean images) olarak kavramsallaştırıyor ve bunların hem istatistiksel ortalamayı yansıttığını hem de toplumsal vasatlığı yeniden ürettiğini gösteriyor. İşte bu noktada, metnin başında bahsettiğimiz biz insanların çıktılarına rakip olan yapay zekanın mevcut durumda estetik konusunda niteliğini tartışmaya açıyor ve onun toplumsallıktan ve ekonomik ilişkilerden ayrı düşünülemeyeceğini görüyoruz. Bu ilişkileri daha görünür hâle getirmek için kavramları açmaya ihtiyacımız var.
Ortalama imgeler kavramı, çok katmanlı bir anlam taşıyor . Bir yandan “mean” sözcüğü İngilizcede ortalama anlamına gelir; bu, istatistiksel sürecin doğrudan işaretidir. Yapay zekâ, geniş veri gruplarını işlerken olasılık dağılımlarına dayanır ve ürettiği her yeni imge, belirli bir kategorinin istatistiksel ortalamasını temsil eder. Bu kategori örneğin bir kedi olsun, modele “kedi resmi” üretmesi söylendiğinde, model aslında eğitim verilerindeki milyonlarca kedinin ortak özelliklerini bir araya getirerek ortalama bir kedi resmi üretir.
Öte yandan “mean” sözcüğü vasat, bayağı, düşük kaliteli anlamına da gelir. Bu anlam, şunu işaret eder: Üretilen imgeler yalnızca ortalamayı değil aynı zamanda vasatlığı, sıradanlığı, geçmişte üretilmiş olanların çoğunluğunun normlarına indirgenmiş bir estetik anlayışını da temsil eder. Steyerl, öte yandan bu imgeleri “ortalama halüsinasyonlar” olarak nitelendirir. Onlar rastgele hayaller değil, toplumsal normların ve klişelerin yeniden üretildiği, ortalamaya sıkıştırılmış görsel anlatılardır. Ve bu; insanın kendini, kendi kelimeleriyle, kendi yol haritasıyla kısacası emeğiyle anlatmasına yabancı bir konsepttir.
Sanatsal pratiğin; en eski anlamıyla, insanın kendini ve doğayla kurduğu ilişkiyi “güzelleştirme” çabası olduğunu düşünürsek, yapay zekâ üretimlerinin bu bağlamda neden eksik kaldığını da daha iyi kavrarız. Çünkü sanatın doğuşunda imgelem, yalnızca teknik bir araç değil, bireyin ve toplumun görünmezle kurduğu bağı, yani tanrılarla, ruhlarla ya da kendi iç dünyasıyla ilişkisinin simgesel bir ifadesidir (Godelier, 2017). Oysa yapay zekâ, geniş veri havuzlarından türetilen “ortalama imgeler” üreterek bu bağı yeniden kurmaz; yalnızca mevcut estetik kodların bir yansımasını ortaya koyar. Bu nedenle, bir yandan görsel veya işitsel ürünler yaratırken, öte yandan sanatın asli kaynağı olan “öznel imgelemi” dışarıda bırakır.
Bu noktada Emre Şan’ın “Dijital Teknolojiler ve Aklın Kamusal Kullanımı” başlıklı, bu yazıya fikir vermiş seminerine Steyerl’in kavramsal çerçevesini dahil ederek biraz derine inelim. Şan, dijital teknolojilerin hızının, insanın sembolik alışveriş akışıyla boy ölçüşemeyecek kadar yüksek olduğunu vurguluyor. Gündelik yaşamın hızlanması, kişiler arası toplumsal bağlantıların yerini teknik araçlar aracılığıyla kurulan ilişkilere bırakmasına yol açmış durumda. Bu, bireylerin düşünme süreçlerini ve toplumsal akıl biçimlerini yeniden şekillendirmekte, zihinlerin atıllaştığı üzerine tartışmalar yaratmakta. Bunun bir örneği olarak düşünebilecek ortalama imgeler, artık teknik araçlar ile atıllaşmaya eğilimli toplumsal aklın, veri aracılığıyla kendine dair oluşturduğu bir yansıma niteliği taşır.
Bu hususta Şan’ın işaret ettiği hız ve sembolik alışveriş arasındaki uçurum, Steyerl’in “ortalama imgeler” kavramıyla birleştiğinde daha berrak görünüyor. İnsan zihni anlam üretirken kaçınılmaz olarak belirsizlik, tutarsızlık ve özgünlük taşır; oysa yapay zekânın ürettiği ortalama imgeler, bu süreci hızlandırılmış ve homojenleştirilmiş bir temsil ile ikame eder. Şan’ın “kamusal aklın zayıflaması” olarak tarif ettiği bu durum, aslında Steyerl’in işaret ettiği toplumsal vasatlığın teknik zeminiyle buluşur: bireyler, hızla tüketilen ortalama imgeler karşısında kendi özgün sembolik katkılarını geri plana iter. Böylece toplumsal akıl, düşünsel çoğulluktan uzaklaşıp algoritmik hızın ve veriye dayalı ortalamanın hegemonyasına daha açık hale gelir.
Böyle bir mekanizma haline gelmesi ise yapay zekâ üretimlerinin “veri popülizmi” kavramıyla açıklanabilir. Veriyi ana-akım bir siyasi partiye benzetelim; büyük ölçekli veri setleri, çoğunluğun sesi gibi sunulabilir; ancak hangi verilerin toplanacağına, bunların nasıl etiketleneceğine ve hangi amaçlarla kullanılacağına parti ve onun ekonomik dayanağı olan şirketler vb. karar verir. Bu veri popülizmi, görünüşte demokratik bir süreç gibi işleyebilir, fakat gerçekte eşitsizlikleri ve baskın kültürel kodları yeniden üretir. Yapay zekâ modellerinin ürettiği imgeler, bireysel yaratıcılığı değil baskın kodların ortalamasını yansıtır ve çoğunlukla klişelerle uyumludur.
Şeffaflık iddiası taşıyan farklı algoritmalar üzerinden bir örnekle bunu sağlamlaştırmak gerekirse en doğru örnek, Stable Diffusion gibi modellerin işleyişidir. Bu modeller algoritmik yapıları nedeniyle teknik şeffaflık ile toplumsal etkenlerin şeffaflığı arasındaki farkı göstermek açısından önemlidir. Genellikle “kara kutu algoritması” olarak nitelendirilen modellerde; kullanıcı, verinin nasıl işlendiğini bilmez. Oysa Stable Diffusion açık kaynaklı bir modeldir; yani kodu herkes tarafından incelenebilir. Buna rağmen, algoritmanın teknik şeffaflığı toplumsal sonuçların şeffaf olduğu anlamına gelmez. Bu “beyaz kutu” algoritmalar, toplumsal normların süzgeçten geçirilmiş bir yansımasını üretir ve bireysel gerçekliğin, özgünlüğün veya çeşitliliğin önüne geçer. Örneğin, orta yaşlı bir kadının kendi portresinin Stable Diffusion tarafından işlenmiş hali, eğitim verileriyle yapay bir ilişki kurarak sabit bir yaş aralığına ve ortalama görünüme indirgenir. Bu süreç, topluma ait internet çöplüğü vasıtasıyla üretilmiş ortalama bir perspektifin görsel çıktısıdır.
Peki sadece şeffaf olmayan yapay zeka mıdır, şeffaflık sanat eserinin oluşumunda zorunlu mudur? Tabii ki böyle bir varsayımı sanat eseri için yapmıyoruz ancak yapay zeka geliştiricilerinin yaslandığı bu “ilke”yi tartışıyoruz. Sanatçının eserinde kullandığı imge de asla bütünüyle şeffaf değildir; her zaman ima eden, çağrıştıran ve gizleyen bir yan taşır. Bu da eserin, izleyeni kendi içsel anlam arayışına davet etmesini sağlar. Yapay zekâ üretimleri ise tam da bu noktada bir kırılmaya yol açar: onun ürettiği imgeler, istatistiksel ortalamalara indirgenmiş oldukları için “ima”ya değil, “klişe”ye yaslanır. İzleyiciyi kendi iç dünyasına çağırmak yerine, verinin toplumsal ortalamasını yansıtarak zaten aşina olunan bir estetikle karşılaştırır. Bu nedenle, sanatın simgesel gücü olan “içsel çağrı” yerini, toplumsal normların tekrarına bırakır (Godelier, 2017).
Ortalama imgelerin üretim süreci sadece teknik bir mesele değil, aynı zamanda siyasal ve ekonomik bir mesele. Bu imgeler, biz internet çöplüğü olarak tanımlasak da küresel kapitalizmin veri merkezlerine, enerji altyapıları ve düşük ücretli emek zincirine dayanıyor. Devasa veri merkezleri, enerji tüketimi ve çevre kirliliği yaratırken; modellerin eğitimi ve moderasyonu çoğu zaman görünmez işçiler tarafından yürütülüyor. Bu işçiler, algoritmanın veri setlerini etiketler, hataları düzeltir ve sistemin çalışmasını sağlar; ancak hem ücretleri düşüktür hem de emekleri görünmezdir. Dolayısıyla yapay zekâ üretimi, yalnızca teknik bir süreç değil, kapitalist üretim ilişkilerinin dijital izdüşümü olarak işlev görür.
Özetle, görünmez emek ve estetik körlükle bizimle yarışan, sergiler açan, kitaplar yazan yapay zekanın üretiminde yazarın kendine has kelimelerine, tutukluklarına ya da ressamın kendine has çizgilerine şahit olamazsınız çünkü yapay zeka rötuşlarıyla estetik olanı, politik olanı ve ekonomik olanı kapatır.
Bu ise hem kültür teorisi hem de politik ekonomi açısından kritik bir analiz nesnesi hâline gelir çünkü yapay zekâ, kültürel ve politik bir özne gibi hareket eder; mesele de tam burada, yani insan emeğiyle algoritmik ortalamanın karşılaşmasında düğümlenir.
Chiang, T. (2023, February 9). ChatGPT is a Blurry jpeg of the Web. New Yorker.
Steyerl, H. (2023, April 28). Mean Images. New Left Review.
Godelier, M. (2017). İmgelenen, imgesel ve simgesel (Çev. Mehmet Moralı). İstanbul: Heretik Yayınları.
Şan, E. (2024). Dijital Teknolojiler ve Aklın Kamusal Kullanımı. Akbank Sanat.
Ana Görsel: Refik Anadol, Quantum Memories, 2020.
The post “İçsel Çağrı”dan “Ortalama İmge”ye Yapay Zekanın Toplumsallığı appeared first on Terrabayt.