
GitHub Copilot Davası
Yazılımcıların kaynak kodlarını paylaştığı ve işbirliğinde bulundukları en büyük platform olan GitHub, 2021’de piyasaya sunduğu yapay zeka asistanı Copilot’un fikri mülkiyet haklarını ihlal ettiği iddiasıyla yazılımcılar tarafından dava edildi. Microsoft (GitHub’ın ana şirketi) ve OpenAI işbirliğinde üretilen Copilot, çok sayıda programlama dilinde istenilen kodu oluşturma ve yazılımcılara gerçek zamanlı kod tamamlama önerilerinde bulunma becerisi sayesinde kısa sürede büyük popülerliğe ulaştı. Ancak, GitHub’a yazılımlarını açık kaynak yazılım lisansı ile yükleyen yazılımcılar açtıkları toplu dava ile Copilot’un telif haklarını, yazılım lisanslarını ve GitHub Hizmet Şartlarını ihlal ettiğini iddia ediyor.
Dava temel olarak Copilot’un eğitiminde GitHub’a açık kaynak yazılım lisansı ile yüklenen yazılımların kullanıldığına ve bu yazılımların Copilot tarafından eser sahibine atıfta bulunulmaksızın bire bir kopyalanıldığı iddiasına dayanıyor. Dava, yapay zeka eğitimleri sırasında hangi materyallerin kullanılabileceği ve yapay zeka programlarının hangi çıktıları verebileceği konularında önem taşıyor.
Copilot
Copilot, bir yazılım yükleme platformu ve açık kaynaklı sürüm kontrol sistemi olan GitHub tarafından yapay zeka araştırma laboratuvarı OpenAI ile işbirliği içinde geliştirilen bir yapay zeka asistanıdır. Günlük dil ile ifade edilen fikirleri koda dönüştürmenin yanında, yazılımcılara kod satırlarını tamamlamaları için gerçek zamanlı olarak değişken isimlerinden karmaşık algoritmalara kadar çeşitli uzunluklarda kod parçacığı önerileri sunmaktadır. Github’ı 2018 yılında satın alan Microsoft’un bulut sunucularında tutulan Copilot, çok sayıda yazılım dilini desteklemesinin yanında birden çok yazılımcının aynı kod üzerinde çalışabilmesine olanak tanıyor.
Copilot, milyarlarca satır kodu analiz ederek kalıpları bulmak veya tahminlerde bulunmak için (Chat GPT tarafından kullanılan) GPT modelinin bir varyantı olan Codex makine öğrenimi modeli ile eğitilmiştir. Eğitimde temel olarak GitHub’da bulunan kamuya açık ancak genellikle açık kaynak yazılım lisansına sahip kodlar kullanılmıştır. GitHub her ne kadar Copilot’un kopyala yapıştır yöntemini kullanmadığını belirtse de kendi websitesinde yaklaşık yüzde 1 ihtimalle üretilen yazılımın eğitimde kullanılan yazılım ile bire bir eşleşme ihtimali olduğunu söylemekte.
Açık Kaynak Yazılım Lisansları (Open Source Licenses)
Bilgisayar programları ve yazılımlar fikri mülkiyet hukuku kapsamında korunurlar. Herhangi bir işlem yapmasına gerek kalmaksızın kodun yaratıcısı telif hakkı korumasına ve münhasır dağıtım hakkına sahip olur. Bu koruma ile başka kişilerin kodu izinsiz kullanması, değiştirmesi veya yayması önlenir. Yazılım lisansları ise belirli bir yazılımın ne şekilde kullanılabileceğini düzenleyen sözleşmelerdir. Açık kaynak yazılım lisansları ise genel olarak, belirli şartlara tabi olmak kaydıyla, kullanıcılara ücretsiz olarak yazılımı kullanma değiştirme veya paylaşma izni verir. Yazılımcılar arasında işbirliği sağlamak ve inovasyona katkıda bulunmak gibi sebepler adına birçok yazılımcı kodlarını açık kaynak yazılım lisansları ile GitHub başta olmak üzere benzeri platformlarda paylaşmaktadır.
Birçok açık kaynak yazılım lisansı, yazılımın yaratıcısına atıf yapılması zorunluluğu veya yazılım kullanılarak üretilecek ürünün de açık yazılım lisansı ile paylaşılması zorunluluğu gibi hükümler içerir. GitHub’a yazılım yükleyen yazılımcıların yüklerken aralarından seçim yapabildiği 13 lisanstan 11’i de benzer şekilde ilgili yazılımdan yararlanılması halinde yazılımcıya atıfta bulunulması şartını taşımaktadır.
Dava süreci
3 Kasım 2022’de GitHub’da kayıtlı yazılımları olan 4 anonim yazılımcı, ABD Kaliforniya Kuzey Bölgesi Bölge Mahkemesi’nde GitHub, OpenAI ve Microsoft aleyhine bir toplu dava açtı. Davacılar GitHub’da kayıtlı olan açık kaynak lisanslı yazılımların Copilot’u eğitmek için kullanıldığını ve Copilot’un kod parçacığı önerisinde bulunurken lisanslı yazılımları tamamen kopyaladığını ancak eser sahibine hiçbir atıfta bulunmadığını iddia ettiler. Davacılar bu durumun maddi zarara sebep olduğunu; açık kaynak yazılım lisanslarını, ABD’deki Dijital Binyıl Telif Hakkı Yasası’nı (“DMCA”) ve GitHub’ın Hizmet Şartları’nı (“TOS”) ihlal ettiğini öne sürüyor.
GitHub, OpenAI ve Microsoft savunmalarında, davacıların yazılımlarının kendilerine atıfta bulunulmadan kopyalandığını somut olarak gösteremedikleri sebebiyle maddi zararın oluşmadığını ve GitHub’ın Hizmet Şartları’nın (“TOS”) kendilerine kodu kullanmak, görüntülemek, çalıştırmak ve çoğaltmak için geniş haklar verdiğini öne sürdüler.
4 Mayıs 2023 tarihinde gerçekleştirilen ilk duruşmada hakim,
· Davacıların bizzat kendilerinin yazmış oldukları yazılımların Copilot tarafından öneride bulunurken bire bir kopyalandığını somut olarak gösteremediklerini, bu durumun gelecekte gerçekleşme ihtimalini göstermiş olmalarının ise tazminat veya sebepsiz zenginleşme talepleri için yeterli olmayacağına; ancak gelecekte bu ihlalin önlenmesi için önlem talebinde bulunabileceklerine;
· Davalıların Codex ve Copilot’u bilinçli olarak orijinal metne atıf yapmayacak şekilde tasarladıklarının ve atıf metinlerinin sonuç yazılımlardan silinmesinin DMCA 1202(b)(1) ve 1202(b)(3)’e aykırı olduğuna;
· GitHub’a yazılım yükleyenlere önerilen ve orijinal yazılımcıya atıf yapılmasını gerekli gören 11 açık kaynak yazılım lisansının ihlal edildiğine dair kuvvetli kanıtlar bulunduğuna karar verdi.
Bu kararın üzerine taraflar iddia ve savunmalarını revize ettiler. Mahkeme hala devam ediyor.
Davanın Önemi
Copilot davası, telif hakkıyla korunan içerikler ile eğitilen yapay zeka araçlarının fikri mülkiyet haklarına etkisinin karmaşıklığını ortaya koymakta. Dava, yapay zeka araştırmacılarının eğitimde hangi materyalleri kullanabileceği ve yapay zekanın hangi sonuçları üretmesine izin verebilecekleri konusunda önemli sorular soruyor. Yapay zeka eğiten şirketlerin eğitimde kullandıkları materyallerin yaratıcılarının fikri mülkiyet haklarına müdahale etmemek ve bu materyallerin doğrudan kopyalanmasını önlemek için ne gibi önlemler alması gerektiği henüz net olarak ortaya konulmuş değil. Milyarlarca satır kod veya milyonlarca farklı sanat eseri söz konusu olduğunda bu gibi önlemlerin nasıl alınabileceği başlı başına bir problem oluşturmakta.
Bir taraftan davanın davacılar lehine sonuçlanması birçok devam eden yapay zeka projesinin zarar görmesine veya gelecekteki eğitimlerde kullanılabilecek materyallerin oldukça sınırlanmasına yol açabilir. Öbür taraftan yapay zeka araştırmacılarının açık kaynak yazılım lisanslarına veya sanat eserlerinin telif hakkı korumalarına saygı göstermemesi hem bu eserleri ortaya koyan kişilere zarar verebilir hem de gelecekte insanların eserlerini sergileme veya topluma sunma motivasyonlarının azalmasına sebep olabilir.
Sonuç
Copilot gibi yazılım üreten yapay zeka uygulamalarının ürettikleri sonucun herhangi bir yazılım lisansını ihlal etmeyeceği konusunda bir kesinlik bulunmamakta. Bu sebeple yazılım üreten şirketlerin Copilot ve benzeri Generative AI uygulamaları kullanmaları durumunda dikkatli olmaları gerekmekte ve potansiyel riskleri azaltmak için çeşitli önlemler alması gerekmektedir. Şirketler yapay zeka üreticilerinden kendilerine sunulan ürünün yalnızca lisanssız yazılımları kullanarak cevap oluşturmasını sağlayacak parametrelerin sağlanmasını talep edebilir veya yapay zeka kullanılarak oluşturulan yazılımın herhangi bir lisanslı yazılımla eşleşip eşleşmediğini tarayan üçüncü taraf uygulamalardan faydalanabilirler. Uygulamada yazılımcılar bu tarz önlemlere uyacak onu zaman ve mahkeme kararlarının istikrarı gösterecek.
Author: Said Emir Bodakçı