Test Verisi Yönetimi: Akıllı ve Etik Yaklaşımlar

Savaş Avcu

24 Kas 2025 — 5 min read

Test mühendisliğinde yıllar geçtikçe fark ettiğim bir gerçek var:

Hatalar çoğu zaman koddan değil, yanlış kullanılan veriden çıkıyor.

Test süreçlerinde genelde “senaryo”, “araç”, “otomatize test”, “CI/CD” gibi terimler öne çıkar. Ama perde arkasında sessizce duran, doğru kullanılmadığında sistemi çökerten bir unsur vardır: test verisi.

Ben de ekibimle birlikte onlarca projede aynı problemi yaşadım:

Verinin eksikliği, dağınıklığı, tutarsızlığı veya güvenlik riskleri…

Bazen doğru veri olmadan yapılan bir test, hiç yapılmamış bir test kadar değersiz olabiliyor.

Bir noktadan sonra şunu fark ettim:

“Test kalitesi, senaryodan değil, veriden başlar.”

Bu yazıda; test verisinin neden bu kadar kritik olduğunu, modern test ekiplerinin veriyi nasıl yönettiğini ve bu süreçte etik yaklaşımın neden hiç olmadığı kadar önemli hale geldiğini kendi bakış açımdan paylaşacağım.

1️⃣ Test Verisi Neden Bu Kadar Kritik?

Bugünün yazılım dünyasında test verisi üç önemli şeye karar verir:

Hata bulma kapasitesi
Gerçek kullanıcı davranışını simüle etme yeteneği
Testin güvenilirliği

Kaliteli veri = anlamlı test çıktısı.

Kötü veri = güvenilmez sonuç.

Bir test mühendisinin en dikkat etmesi gereken şeylerden biri, “gerçek dünyayı ne kadar doğru taklit edebildiğidir”.

Eğer test verisi gerçeği yansıtmıyorsa, hataları ancak müşteriniz bulduğunda fark edersiniz.

Aşağıdaki tablo bunu çok net özetliyor:

Veri Tipi	Açıklama	Risk	Sonuç
Eksik Veri	Örnek çeşitliliği düşük	Hatalar saklanır	Ürün riskli çıkar
Yanlış Veri	Gerçek kullanıcı davranışından uzak	Yanlış senaryolar test edilir	Hatalar üretimde patlar
Aşırı Gerçek Veri	Üretim verisi kullanılır	KVKK/etik risk	Güvenlik açıkları
Temiz ve Çeşitli Veri	Gerçeğe yakın ama anonim	En düşük risk	En yüksek doğruluk

Bu tablo aslında bize şunu söylüyor:

Doğru veri, test ekibine hem teknik hem etik anlamda güç kazandırır.

2️⃣ Yapay Zekâ Çağında Test Verisi Yönetimi Nasıl Değişti?

Eskiden test verisi genellikle Excel dosyaları, CSV’ler veya manuel olarak oluşturulmuş küçük örneklerden oluşurdu.

Bugün ise tablo şöyle:

Ürünler daha büyük.
Kullanıcı davranışları daha çeşitli.
Senaryolar daha karmaşık.
Mikroservis mimarilerinde verinin “tutarlılığını” sağlamak daha zor.
Anonimlik ve güvenlik zorunlulukları arttı.

Yapay zekâ araçları test verisi üretmeyi kolaylaştırdı; ama bu kolaylıkla birlikte yeni riskler de geldi:

Modelin yanlış veri üretmesi
Gerçek veriye çok benzer örnekler oluşturması
Önyargılı veri setleri
Eksik veri çeşitliliği

Bu yüzden test mühendisi artık yalnızca veriyi “kullanan” değil, veriyi “kontrol eden” kişi oldu.

3️⃣ Test Verisi Yönetiminde 5 Temel Adım

Test verisini yönetmek artık başlı başına bir uzmanlık.

Ekip lideri olarak benim de sürekli odaklandığım beş temel adım var:

✔️ 1. Veri Envanteri Oluşturmak

İlk adım verinin nerede olduğunu, ne kadar olduğunu ve ne içerdiğini bilmektir.

Hangi sistemde?
Hangi servis ile ilişkili?
Güncel mi?
Anonim mi?
Eksik alan var mı?

Bu sorular cevaplanmadan yapılan testler, daha başlamadan hatalıdır.

✔️ 2. Veri Yaşam Döngüsünü Belirlemek

Veri de tıpkı yazılım gibi bir yaşam döngüsüne sahiptir:

Oluşturma
Dönüştürme
Depolama
Kullanma
Silme/Anonimleştirme

Ekip olarak bu döngüyü net şekilde tanımlamazsanız, veriniz bir süre sonra çöplüğe dönüşür.

✔️ 3. Anonimleştirme ve Maskeleme

Bugünün dünyasında gerçek veriyi test ortamına kopyalamak sadece yanlış değil — açıkça risklidir.

KVKK, GDPR ve güvenlik gereklilikleri sebebiyle:

Kimlik bilgileri
E-posta
Telefon
Adres
Ödeme bilgileri

asla olduğu gibi kullanılmamalıdır.

Bu yüzden anonimleştirme araçlarının kullanımı artık zorunlu hale geldi.

✔️ 4. Çeşitlilik ve Kapsam Sağlamak

Test verisi sadece “çok olmak” değil, doğru dağılmış olmak zorunda.

İyi bir test setinde bulunması gereken kombinasyonlar:

Farklı kullanıcı tipleri
Farklı cihaz ve tarayıcı davranışları
Farklı veri boyutları
Uç değerler (extreme values)
Geçerli & geçersiz veri örnekleri

Bu çeşitlilik, yapay zekâ destekli sistemlerin hatalarını ortaya çıkarmada çok etkilidir.

✔️ 5. Sürekli Güncel Tutmak

Yeni özellik eklenince veri de güncellenmelidir.

Birçok ekip bu adımı atladığı için testler başarısız olur.

Veri eskirse, testler de eskir.

4️⃣ Test Ekiplerinde Sık Görülen Veri Problemleri

Ekibimle birlikte birçok projede en çok rastladığım problemler şunlar:

🚫 Üretim verisini “kopyala-yapıştır” yapmak

Bu hem riskli hem de genellikle yararsızdır.

🚫 Veriyi tek kişiye bağımlı bırakmak

“Veriyi Ahmet oluşturuyor, o olmazsa testler duruyor” → En büyük hata.

🚫 Güncel olmayan veriyle test yapmak

Yeni sürümde yenilenen alan eski veriyle test edildiğinde sonuçlar tamamen yanlış çıkar.

🚫 Yapay veriyi hatalı üretmek

AI araçları doğru yönlendirilmezse eksik/yanlış veri oluşturabilir.

🚫 Veriyi senaryoya değil, senaryoyu veriye uydurmak

En yaygın hatalardan biridir.

Senaryo doğruysa veri ona göre ayarlanır — tersi değil.

5️⃣ Yapay Zekâ ile Veri Üretme: Avantajlar ve Riskler

AI destekli araçlar sayesinde artık yüzlerce veri örneğini saniyeler içinde üretebiliyoruz.

Örneğin:

Sahte kullanıcılar
Adres bilgilerinin varyasyonları
Hatalı giriş örnekleri
Karmaşık JSON yapıları
Edge case verileri

Avantajları büyük: hız, çeşitlilik, düşük maliyet.

Ama riskleri de var:

Risk	Açıklama
Gerçek veriye çok benzer üretim	KVKK/GDPR ihlali
Veri önyargısı	Modelin dengesiz veri üretmesi
Mantıksal tutarsızlık	Kullanıcı + adres + şehir tutmaması
Eksik varyasyon	Modelin belli örneklerde takılı kalması

Bu yüzden test mühendisinin görevi sadece “veriyi oluşturmak” değil, doğrulamak olmalıdır.

6️⃣ Ekip Lideri Perspektifi: Test Verisini Yöneten Ekipler Neden Daha Başarılı?

Test verisi olgun olan takımlar şunları başarır:

Daha az tekrar eden hata yaşarlar
Gereksiz efor kaybı olmaz
Test otomasyonu daha stabil çalışır
Geri bildirim döngüleri hızlanır
Yeni gelen ekip üyeleri daha kolay adapte olur

Benim kendi ekibimde uyguladığım bazı prensipler:

🔹 Veriyi tek kişiye bağlı bırakmamak

Görev dağılımı karışık olmalı; bilgi tek elde toplanmamalı.

🔹 Veri rehberi oluşturmak

Yeni gelen testçiye “veri nasıl yönetilir” sorusunu anlatan bir mini doküman çok iş görüyor.

🔹 Ortak veri havuzu kurmak

Her takım için standart ve güncel bir veri seti olması, test tekrarını ve tutarsızlıkları ortadan kaldırıyor.

🔹 Denetim mekanizması

Veriyi sadece oluşturmak değil, düzenli kontrol etmek gerekir.

🔹 Etik yaklaşımı netleştirmek

Her test mühendisi “hangi veri kullanılabilir, hangisi kullanılamaz” konusunda bilinçli olmalıdır.

7️⃣ Örnek Bir Test Veri Akış Tablosu

Aşağıdaki tablo, iyi bir ekipte veri akışının nasıl yönetilmesi gerektiğini gösteriyor:

Adım	Sorumlu	Açıklama
Veri ihtiyacının belirlenmesi	Test Mühendisi	Senaryoya göre
Veri oluşturma	Test Mühendisi / AI Aracı	Anonim + çeşitli
Veri doğrulama	Kıdemli Testçi	Mantık kontrolü
Veri havuzuna işleme	Takım	Sürüm bazlı ekleme
Sürüm sonrası temizlik	Takım	Eski veriyi sil

Bu tabloyu kullanmak ekiplerde düzen sağlar.

8️⃣ Test Mühendisleri Neleri Öğrenmeli?

2025 ve sonrası için test mühendislerinin şu alanlarda kendini geliştirmesi artık zorunlu:

Veri anonimleştirme teknikleri
Yapay veri üretme araçları
Veri doğrulama yöntemleri
Servis bazlı veri kontrolü (API → DB → UI)
Test verisi sürüm yönetimi
Etik kurallar
Güvenli veri aktarımı

Bunlar sadece teknik beceriler değil, mesleğin geleceğini şekillendiren beceriler.

🎯 Sonuç: Kalitenin Temeli, Doğru Veriden Geçer

Bu yazıyı yazarken aklımda hep şu düşünce vardı:

Kod değişir, araçlar değişir, metodolojiler değişir…

Ama veri değişmez.

Testin omurgası, temeli, bütün yapıyı ayakta tutan unsurdur.

Test verisini doğru yöneten bir ekip, yazılım kalitesini yönetir.

Veriyi önemsemeyen bir ekip ise her zaman bir adım geriden gelir.

Bir test mühendisi olarak en büyük sorumluluğumuz, doğru veriyi doğru yerde kullanmaktır.

Çünkü kaliteyi sadece test senaryosu değil, doğru veri belirler.

Geleceğin test ekipleri, sadece hataları bulan ekipler olmayacak;

veriyi anlayan, yöneten ve etik şekilde kullanan ekipler olacak.