Test Verisi Yönetimi: Akıllı ve Etik Yaklaşımlar

Test Verisi Yönetimi: Akıllı ve Etik Yaklaşımlar
Photo by Claudio Schwarz / Unsplash

Test mühendisliğinde yıllar geçtikçe fark ettiğim bir gerçek var:

Hatalar çoğu zaman koddan değil, yanlış kullanılan veriden çıkıyor.

Test süreçlerinde genelde “senaryo”, “araç”, “otomatize test”, “CI/CD” gibi terimler öne çıkar. Ama perde arkasında sessizce duran, doğru kullanılmadığında sistemi çökerten bir unsur vardır: test verisi.

Ben de ekibimle birlikte onlarca projede aynı problemi yaşadım:

Verinin eksikliği, dağınıklığı, tutarsızlığı veya güvenlik riskleri…

Bazen doğru veri olmadan yapılan bir test, hiç yapılmamış bir test kadar değersiz olabiliyor.

Bir noktadan sonra şunu fark ettim:

“Test kalitesi, senaryodan değil, veriden başlar.”

Bu yazıda; test verisinin neden bu kadar kritik olduğunu, modern test ekiplerinin veriyi nasıl yönettiğini ve bu süreçte etik yaklaşımın neden hiç olmadığı kadar önemli hale geldiğini kendi bakış açımdan paylaşacağım.


1️⃣ Test Verisi Neden Bu Kadar Kritik?

Bugünün yazılım dünyasında test verisi üç önemli şeye karar verir:

  1. Hata bulma kapasitesi
  2. Gerçek kullanıcı davranışını simüle etme yeteneği
  3. Testin güvenilirliği

Kaliteli veri = anlamlı test çıktısı.

Kötü veri = güvenilmez sonuç.

Bir test mühendisinin en dikkat etmesi gereken şeylerden biri, “gerçek dünyayı ne kadar doğru taklit edebildiğidir”.

Eğer test verisi gerçeği yansıtmıyorsa, hataları ancak müşteriniz bulduğunda fark edersiniz.

Aşağıdaki tablo bunu çok net özetliyor:

Veri Tipi

Açıklama

Risk

Sonuç

Eksik Veri

Örnek çeşitliliği düşük

Hatalar saklanır

Ürün riskli çıkar

Yanlış Veri

Gerçek kullanıcı davranışından uzak

Yanlış senaryolar test edilir

Hatalar üretimde patlar

Aşırı Gerçek Veri

Üretim verisi kullanılır

KVKK/etik risk

Güvenlik açıkları

Temiz ve Çeşitli Veri

Gerçeğe yakın ama anonim

En düşük risk

En yüksek doğruluk

Bu tablo aslında bize şunu söylüyor:

Doğru veri, test ekibine hem teknik hem etik anlamda güç kazandırır.


2️⃣ Yapay Zekâ Çağında Test Verisi Yönetimi Nasıl Değişti?

Eskiden test verisi genellikle Excel dosyaları, CSV’ler veya manuel olarak oluşturulmuş küçük örneklerden oluşurdu.

Bugün ise tablo şöyle:

  • Ürünler daha büyük.
  • Kullanıcı davranışları daha çeşitli.
  • Senaryolar daha karmaşık.
  • Mikroservis mimarilerinde verinin “tutarlılığını” sağlamak daha zor.
  • Anonimlik ve güvenlik zorunlulukları arttı.

Yapay zekâ araçları test verisi üretmeyi kolaylaştırdı; ama bu kolaylıkla birlikte yeni riskler de geldi:

  • Modelin yanlış veri üretmesi
  • Gerçek veriye çok benzer örnekler oluşturması
  • Önyargılı veri setleri
  • Eksik veri çeşitliliği

Bu yüzden test mühendisi artık yalnızca veriyi “kullanan” değil, veriyi “kontrol eden” kişi oldu.


3️⃣ Test Verisi Yönetiminde 5 Temel Adım

Test verisini yönetmek artık başlı başına bir uzmanlık.

Ekip lideri olarak benim de sürekli odaklandığım beş temel adım var:


✔️ 1. Veri Envanteri Oluşturmak

İlk adım verinin nerede olduğunu, ne kadar olduğunu ve ne içerdiğini bilmektir.

  • Hangi sistemde?
  • Hangi servis ile ilişkili?
  • Güncel mi?
  • Anonim mi?
  • Eksik alan var mı?

Bu sorular cevaplanmadan yapılan testler, daha başlamadan hatalıdır.


✔️ 2. Veri Yaşam Döngüsünü Belirlemek

Veri de tıpkı yazılım gibi bir yaşam döngüsüne sahiptir:

  1. Oluşturma
  2. Dönüştürme
  3. Depolama
  4. Kullanma
  5. Silme/Anonimleştirme

Ekip olarak bu döngüyü net şekilde tanımlamazsanız, veriniz bir süre sonra çöplüğe dönüşür.


✔️ 3. Anonimleştirme ve Maskeleme

Bugünün dünyasında gerçek veriyi test ortamına kopyalamak sadece yanlış değil — açıkça risklidir.

KVKK, GDPR ve güvenlik gereklilikleri sebebiyle:

  • Kimlik bilgileri
  • E-posta
  • Telefon
  • Adres
  • Ödeme bilgileri

asla olduğu gibi kullanılmamalıdır.

Bu yüzden anonimleştirme araçlarının kullanımı artık zorunlu hale geldi.


✔️ 4. Çeşitlilik ve Kapsam Sağlamak

Test verisi sadece “çok olmak” değil, doğru dağılmış olmak zorunda.

İyi bir test setinde bulunması gereken kombinasyonlar:

  • Farklı kullanıcı tipleri
  • Farklı cihaz ve tarayıcı davranışları
  • Farklı veri boyutları
  • Uç değerler (extreme values)
  • Geçerli & geçersiz veri örnekleri

Bu çeşitlilik, yapay zekâ destekli sistemlerin hatalarını ortaya çıkarmada çok etkilidir.


✔️ 5. Sürekli Güncel Tutmak

Yeni özellik eklenince veri de güncellenmelidir.

Birçok ekip bu adımı atladığı için testler başarısız olur.

Veri eskirse, testler de eskir.


4️⃣ Test Ekiplerinde Sık Görülen Veri Problemleri

Ekibimle birlikte birçok projede en çok rastladığım problemler şunlar:

🚫 Üretim verisini “kopyala-yapıştır” yapmak

Bu hem riskli hem de genellikle yararsızdır.

🚫 Veriyi tek kişiye bağımlı bırakmak

“Veriyi Ahmet oluşturuyor, o olmazsa testler duruyor” → En büyük hata.

🚫 Güncel olmayan veriyle test yapmak

Yeni sürümde yenilenen alan eski veriyle test edildiğinde sonuçlar tamamen yanlış çıkar.

🚫 Yapay veriyi hatalı üretmek

AI araçları doğru yönlendirilmezse eksik/yanlış veri oluşturabilir.

🚫 Veriyi senaryoya değil, senaryoyu veriye uydurmak

En yaygın hatalardan biridir.

Senaryo doğruysa veri ona göre ayarlanır — tersi değil.


5️⃣ Yapay Zekâ ile Veri Üretme: Avantajlar ve Riskler

AI destekli araçlar sayesinde artık yüzlerce veri örneğini saniyeler içinde üretebiliyoruz.

Örneğin:

  • Sahte kullanıcılar
  • Adres bilgilerinin varyasyonları
  • Hatalı giriş örnekleri
  • Karmaşık JSON yapıları
  • Edge case verileri

Avantajları büyük: hız, çeşitlilik, düşük maliyet.

Ama riskleri de var:

Risk

Açıklama

Gerçek veriye çok benzer üretim

KVKK/GDPR ihlali

Veri önyargısı

Modelin dengesiz veri üretmesi

Mantıksal tutarsızlık

Kullanıcı + adres + şehir tutmaması

Eksik varyasyon

Modelin belli örneklerde takılı kalması

Bu yüzden test mühendisinin görevi sadece “veriyi oluşturmak” değil, doğrulamak olmalıdır.


6️⃣ Ekip Lideri Perspektifi: Test Verisini Yöneten Ekipler Neden Daha Başarılı?

Test verisi olgun olan takımlar şunları başarır:

  • Daha az tekrar eden hata yaşarlar
  • Gereksiz efor kaybı olmaz
  • Test otomasyonu daha stabil çalışır
  • Geri bildirim döngüleri hızlanır
  • Yeni gelen ekip üyeleri daha kolay adapte olur

Benim kendi ekibimde uyguladığım bazı prensipler:

🔹 Veriyi tek kişiye bağlı bırakmamak

Görev dağılımı karışık olmalı; bilgi tek elde toplanmamalı.

🔹 Veri rehberi oluşturmak

Yeni gelen testçiye “veri nasıl yönetilir” sorusunu anlatan bir mini doküman çok iş görüyor.

🔹 Ortak veri havuzu kurmak

Her takım için standart ve güncel bir veri seti olması, test tekrarını ve tutarsızlıkları ortadan kaldırıyor.

🔹 Denetim mekanizması

Veriyi sadece oluşturmak değil, düzenli kontrol etmek gerekir.

🔹 Etik yaklaşımı netleştirmek

Her test mühendisi “hangi veri kullanılabilir, hangisi kullanılamaz” konusunda bilinçli olmalıdır.


7️⃣ Örnek Bir Test Veri Akış Tablosu

Aşağıdaki tablo, iyi bir ekipte veri akışının nasıl yönetilmesi gerektiğini gösteriyor:

Adım

Sorumlu

Açıklama

Veri ihtiyacının belirlenmesi

Test Mühendisi

Senaryoya göre

Veri oluşturma

Test Mühendisi / AI Aracı

Anonim + çeşitli

Veri doğrulama

Kıdemli Testçi

Mantık kontrolü

Veri havuzuna işleme

Takım

Sürüm bazlı ekleme

Sürüm sonrası temizlik

Takım

Eski veriyi sil

Bu tabloyu kullanmak ekiplerde düzen sağlar.


8️⃣ Test Mühendisleri Neleri Öğrenmeli?

2025 ve sonrası için test mühendislerinin şu alanlarda kendini geliştirmesi artık zorunlu:

  • Veri anonimleştirme teknikleri
  • Yapay veri üretme araçları
  • Veri doğrulama yöntemleri
  • Servis bazlı veri kontrolü (API → DB → UI)
  • Test verisi sürüm yönetimi
  • Etik kurallar
  • Güvenli veri aktarımı

Bunlar sadece teknik beceriler değil, mesleğin geleceğini şekillendiren beceriler.


🎯 Sonuç: Kalitenin Temeli, Doğru Veriden Geçer

Bu yazıyı yazarken aklımda hep şu düşünce vardı:

Kod değişir, araçlar değişir, metodolojiler değişir…

Ama veri değişmez.

Testin omurgası, temeli, bütün yapıyı ayakta tutan unsurdur.

Test verisini doğru yöneten bir ekip, yazılım kalitesini yönetir.

Veriyi önemsemeyen bir ekip ise her zaman bir adım geriden gelir.

Bir test mühendisi olarak en büyük sorumluluğumuz, doğru veriyi doğru yerde kullanmaktır.
Çünkü kaliteyi sadece test senaryosu değil, doğru veri belirler.

Geleceğin test ekipleri, sadece hataları bulan ekipler olmayacak;

veriyi anlayan, yöneten ve etik şekilde kullanan ekipler olacak.

Read more

🧠 Alışkanlıkların Gücü

🧠 Alışkanlıkların Gücü

Yıllar geçtikçe, bazı insanların ve şirketlerin neden değişmek için mücadele ettiğini görüyoruz. Bazıları yıllarca denemelerine rağmen bir türlü değişemezken, bazıları kendilerini bir gecede yeniden inşa ediyor gibi görünür. Sinir bilimciler, doğru alışkanlıkların başarılı olmak için çok büyük rol oynadığını söylüyor. 💡 Alışkanlıkların Gücü Nedir? Özünde Alışkanlıkların Gücü, hayatımızı dönüştürmemizi sağlayan bir

By Savaş Avcu
Yapay Zekânın Test Süreçlerinde Kullanımı: Yazılım Testinin Yeni Dönemi

Yapay Zekânın Test Süreçlerinde Kullanımı: Yazılım Testinin Yeni Dönemi

Yazılım testi dünyasında son yıllarda yaşanan değişim beni her zamankinden daha fazla heyecanlandırıyor. Test lideri olarak ekiplerimizin nasıl daha verimli, öngörülü ve yenilikçi hale gelebileceğini her zaman merak ediyorum. Yapay zekâ artık sadece bir teknoloji trendi değil; test süreçlerimizi yeniden şekillendiren, düşünme biçimimizi dönüştüren bir gerçeklik. Bu yazıda, AI’nin

By Savaş Avcu
2025 Yılında Yazılım Test Mühendislerinin Odaklanması Gereken Alanlar ve Teknolojiler

2025 Yılında Yazılım Test Mühendislerinin Odaklanması Gereken Alanlar ve Teknolojiler

Yazılım test mühendisliği, her geçen yıl gelişen yeni teknolojiler, metodolojiler ve araçlarla birlikte dönüşmeye devam ediyor. 2025 yılında, test mühendislerinin daha etkili, hızlı ve güvenilir test süreçleri oluşturabilmesi için belirli alanlara odaklanması kritik hale gelecek. Bu yazıda, yazılım test mühendislerinin 2025 yılında odaklanması gereken alanları, kullanması gereken teknolojileri ve takip

By Savaş Avcu