Azure Content Understanding ile Belgeleri Akıllı İş Akışına Çevirmek
Belgeler artık sadece PDF değil
Araya gireyim: Bakın şimdi, kurumsal tarafta en çok vakit yediren işlerden biri hâlâ belgeyle boğuşmak. Fatura, sözleşme, sevk irsaliyesi, denetim kanıtı, e-posta eki… Liste uzuyor da uzuyor. Bir müşteri dosyasını açıyorsunuz, içinde yarım yamalak (belki yanılıyorum ama) taranmış bir PDF var; öbür tarafta Excel’e aktarılması gereken rakamlar dürüyor, başka yerde de insan gözüyle okunması gereken notlar bekliyor. İşin aslı şu: klasik OCR bu yükü tek başına çoğu zaman taşıyamıyor.
Azure Content Understanding tam burada devreye giriyor. Ben bunu artık “belgeyi okuyan servis” diye anlatmıyorum; daha çok “belgenin ne anlattığını kavrayan katman” gibi düşünüyorum. Çünkü mesele yalnızca metni çekmek değil. Hangi alan önemli, hangi satır bağlam taşıyor, hangi bilgi başka bir sayfayla ilişkili — bunları da ayıklamak gerekiyor. 2024’te bir finans kuruluşunda benzer bir projede tam bu noktada tıkandık; klasik çıkarım dışarıdan düzgün görünüyordu ama operasyon ekibi hâlâ manuel kontrol yapıyordu. Kağıt üstünde iyiydi, pratikte biraz hayal kırıklığı yarattı.
Azure Content Understanding’ın hoş tarafı şu: yapılandırılmış ve yapılandırılmamış içerik arasında köprü kuruyor. Sadece form doldurur gibi veri çıkarmıyor; aynı zamanda LLM tabanlı akıl yürütmeyle bağlamı da yakalamaya çalışıyor. Bu da özellikle karmaşık dokümanlarda fark yaratıyor. Mesela bir sözleşmede tarih ayrı yerde, taraf bilgisi başka sayfada olabilir; servis bunları tek bir mantık altında toparlayabiliyor.
Ha bu arada, “her şeyi çözer” demiyorum (bizzat test ettim). Öyle sihirli değnek yok. Eğer kaynak doküman kalitesi kötüyse — bulanık tarama, eksik sayfa, eğri büğrü tablo — sonuç da ona göre dalgalanıyor. Yanı önce giriş verisini düzeltmek lazım. Sonra otomasyon konuşulur.
Ben bunu neden ciddiye alıyorum?
Açık konuşayım: Azure AI tarafında son iki yılda gördüğüm en önemli değişimlerden biri, servislerin tek tek parlayan oyuncular olmaktan çıkıp uçtan uca senaryoya oturması öldü. AZ-305’e hazırlanırken hep mimariyi düşünürsünüz ya hani; burada da aynı refleks gerekiyor. Document Intelligence tek başına yetmezdi, Foundry Tools içindeki Content Understanding işe işi daha geniş çerçevede ele alıyor.
Ve işler burada ilginçleşiyor.
Geçen yıl İstanbul’da bir lojistik firmasına danışmanlık verirken şunu yaşadık: depo fişleri var, e-faturalar var, sevkiyat fotoğrafları var… Her biri farklı formatta geliyor ve ekipler bunları ayrı araçlarla işliyordu (şaşırtıcı ama gerçek). Kısacası sürtünme fazlaydı. Böyle yerlerde CU gibi bir yaklaşım baya iş görüyor çünkü veri tipi fark etmeksizin ortak bir işleme hattı kurabiliyorsunuz.
Bir de ölçek konusu var tabi. Küçük ekipler için hızlı kazanım önemli; büyük kurumsal yapılarda işe izlenebilirlik ve güven ön planda oluyor. Startup tarafında “hemen çıkaralım” baskısı vardır ama enterprise dünyasında onay zinciri bitmez bitmez… Bu yüzden CU’nun sadece teknik yeteneklerine değil, yönetilebilirliğine de bakıyorum ben.
Kısa bir not düşeyim buraya. Microsoft Discovery: R&D İçin Ajanlı Yapay Zekâ Dönemi Başlıyor yazımızda bu konuya da değinmiştik.
Neyi farklı yapıyor?
Klasik belge işleme sistemleri genelde şuna benzer: alan tanımlarsınız, model eğitirsiniz veya hazır modeli çağırırsınız. Beklediğiniz kutucuklara değer düşmesini umarsınız (ben de ilk duyduğumda şaşırmıştım). Güzel sistemdir. Sınırı belli olur! CU işe biraz daha esnek davranmaya çalışıyor; görüntüden sese kadar farklı modaliteleri kapsayan geniş bir yorumlama yüzeyi sunuyor.
Bunu mutfak benzetmesiyle anlatayım: eski yöntemle sız malzemeleri tek tek ayıklıyorsunuz; yeni yaklaşımda servis hem malzemeyi tanıyor hem de tarifin ne olduğunu sezebiliyor gibi düşünün (tam olarak aşçı değil tabiî). En çok da de agentic senaryolarda bu çok kritik çünkü ajanların doğru karar verebilmesi için sadece ham veri değil anlamlı özet gerekir.
Evet, doğru duydunuz.
Benim kanaatim şu: CU’nun gerçek değeri “metin çıkarmak” değil, işletmenin karar alabileceği temiz sinyal üretmekte yatıyor.
Sahada nerede fark yaratır?
Wolters Kluwer örneğini okuyunca şaşırmadım doğrusu; vergi ve finans süreçlerinde belge yoğunluğu hep yüksek oluyor çünkü hata toleransı düşük oluyor zaten işlem hacmi büyükse küçük gecikmeler bile maliyete dönüşüyor böyle durumlarda çıktı kalitesi doğrudan iş sonucuna yansıyor burası önemli. Bu konuyla ilgili Agent Memory Artık Ciddiye Alınmalı: Üretimde Güven, Şeffaflık, Kontrol yazımıza da göz atmanızı tavsiye ederim.
Benzer şekilde DataSnipper’ın Excel içine yerleştirdiği kullanım senaryosu bana çok mantıklı geldi çünkü kullanıcıyı alıştığı yerden koparmıyorsunuz Kurumsalda en zor şey budur insanlar yeni aracı öğrenmek istemez mevcut akışın içine girmesini ister Geçen sene Ankara’da bir denetim ekibinde buna yakın bir yaklaşımı test ettik ilk tepki şuydu “Excel’den çıkmadan halledebilir mıyız?” Evet dedik ve benimsenme ciddi hızlandı.
FinHero tarafında görülen geçiş de bence kıymetli. Geleneksel extraction’dan contextual reasoning’e kaymak kolay değil İlk adımda alan bazlı doğruluk iyi görünür sonra gerçek hayat gelir istisnalar başlar kenar durumları başlar işte orada LLM destekli yorumlama avantaj sağlıyor Ama hemen söyleyeyim her şey pembe değil bazen fazla yorum yapıp gereksiz zenginlik üretebiliyor o yüzden guardrail şart.
| Kullanım Senaryosu | Küçük Ekip | Büyük Kurum |
|---|---|---|
| Fatura işleme | Hazır akış + hızlı POC | Onaylı entegrasyon + denetim izi |
| Sözleşme analizi | Sınırlı alanlar yeterli olabilir | Lojik kontrol + hukuk onayı gerekir |
| Muhasebe/denetim | Düşük hacimde hızlı kazanç | Kural motoru + rol bazlı erişim şart |
| E-posta eki/RAG besleme | Basit indeksleme yeterli olabilir | Muhteviyat sınıflandırma + veri yönetişimi gerekir |
Teknik açıdan hoşuma giden kısım ne?
GPT-5.x tabanlı daha kaliteli çıkarımların gündeme gelmesi boş laf değil; çıktı tutarlılığı artınca downstream sistemler rahatlıyor Ben bunu özellikle azd ile kurulum yapan ekiplerde gördüm ilk hatalı parse zincir boyunca büyüyor sonra kimse sebebi bulamıyor O yüzden kalite artışı küçümsenecek şey değil fena hâlde işe yarıyor. Azure Cosmos DB’de GSI: Okuma Yükünü Hafifletmenin Pratik Yolu yazımızda bu konuya da değinmiştik.
Neyse uzatmayayım — SDK desteğinin Python’dan.NET’e kadar geniş olması enterprise dünyasında işleri kolaylaştırır Biz Logosoft’ta bazı projelerde JavaScript ekibine API tüketimi verirken.NET tarafına orchestration bırakıyoruz Böyle hibrit yapılarda dil bağımsız erişim hayat kurtarıyor Gerçi burada ufak bir not düşeyim: SDK olgunluğu iyi ama dokümantasyonun örnekleri bazen biraz kuru kalabiliyor İnsan eli değmiş kısa senaryolar görmek isterdim açıkçası. Bu konuyla ilgili Foundry Managed Compute: Açık Modelleri Üretimde Taşımak Kolaylaştı yazımıza da göz atmanızı tavsiye ederim.
Nereden başlanmalı?
- Önce üç tip belge seçin: düzenli PDF, bozuk tarama ve yarı yapılandırılmış form. (bu kritik)
- Daha sonra başarımı sadece extraction accuracy ile ölçmeyin; manuel müdahale süresini de ölçün.
- Pilot’u genelde gerçek kullanıcıyla yapın: muhasebe uzmanıysa muhasebeci görsün, hukuksa hukuk görsün. (bence en önemlisi)
- CÜ çıktısını doğrudan üretime vermeden önce basit doğrulama katmanı koyun.
- Maliyet hesabını en başta açın; yoksa pilot ucuz görünür ama ölçek pahalıya patlar!
{
"input": "invoice.pdf",
"workflow": [
"extract_structure",
"reason_over_context",
"validate_key_fields",
"send_to_rag_or_erp"
],
"notes": [
"low_quality_scan => review_required",
"multi_page_docs => cross_page_context_enabled"
]
}
Maliyet ve benimsenme açısından dürüst yorumum
Dürüst olmak gerekirse, Burası önemli çünkü herkes özellikleri konuşuyor ama fatura gelince sessizlik oluyor Azure fiyatlandırmasını TL bazında düşündüğünüzde işlem hacmi büyüdükçe toplam maliyet hissedilir hâle gelir Hele bir de Türkiye’de döviz kuru etkisi yüzünden CFO sorusu hemen gelir “Bu ay kaç lira yazacak?” O yüzden pilot tasarımında mutlaka sayfa başına maliyet yerine süreç başına maliyet hesaplayın Bence doğru bakış bu. VS Code’da Kurumsal Eklenti Dönemi: Kontrol, Hız, Düzen yazımızda bu konuya da değinmiştik.
Kurum müşterilerimde gördüğüm kadarıyla Türkiye’de benimsenmeyi belirleyen ana faktör teknik yetenekten çok organizasyonel cesaret oluyor Yanı araç iyi olsa bile süreç sahibi ikna olmuyorsa proje bekliyor Bankacılıkta bunu defalarca yaşadım güvenlik ekibi tamam der operasyon ekibi bekler satın alma ayrı gider hukuk ayrı bakar Sonunda teknoloji projesi toplantıya dönüşür… İşte orada sabırlı olmak gerekiyor ama dürüst olayım bu bazen can sıkıcıdır.
Eğer bütçe kısıtlıysa önce tüm belge evrenini kapsamaya çalışmayın En sık gelen iki ya da üç dokümandan başlayın mesela fatura ve kimlik doğrulama Daha dar kapsamla başlayıp başarılı olursanız yönetimi ikna etmeniz kolaylaşır Enterprise ortamda işe tam tersi disiplin gerekir rol bazlı erişim loglama veri saklama politikası ve geri dönüş planı olmadan ilerlememek lazım Küçük ekip hız ister büyük kurum kontrol ister konu bu kadar net.
Daha sağlam kullanım için birkaç pratik ipucu
Aşağıdaki listeyi ben sahada gerçekten kullanıyorum kimi maddeler kulağa basit geliyor ama üretimde atlanınca sorun çıkarabiliyor:
- Döküman türlerini en başta sınıflandırın; hepsine aynı modeli dayatmayın. (bu kritik)
- Zor belgeler için insan-onayı adımı koyun; özellikle hukukî veya finansal akışlarda şarttır.
- CÜ çıktısını doğrudan ERP’ye basmayın önce staging katmanı kullanın. — bunu es geçmeyin
- Eğitim verisi yoksa bile iyi örnek seti hazırlayın; kötü örneklerle başlamayın!
- Kullanıcıya düz metin yerine açıklamalı sonuç gösterin ki güven artsın.
Bunun yanında gözden kaçan başka nokta da şu: multimodal destek varsa önü sırf özelliği var diye kullanmayın gerçekten ihtiyacınız olsun Görselden okunan imza mı lazım ses kaydından aksiyon mu çıkacak video içinden olay mı bulunacak? Bunların her biri ayrı masraf ayrı karmaşa getirir Bir ara 2023’te İzmir’de yaptığımız demo ortamında sırf meraktan video desteğini zorladık sonuç teknik olarak etkileyiciydi ama iş ihtiyacı olmadığı için rafa kalktı Demek istediğim şu — teknoloji güzel fakat amaca hizmet etmiyorsa dekor olur.
Kendi deneyimlerimde beni şaşırtan hata neydi?
CÜ tarzı servisleri ilk denerken aldığım en sınır bozucu hata aslında model hatası değildi entegrasyon hatasıydı Yanlış content type gönderince pipeline sessizce saçmaladı Şunu çözerek ilerledik dosya tipini önceden doğruladık MIME eşlemesini netleştirdik sonra retry mekanizması koyduk Bu küçük detay olmasa saatler giderdi Gerçekten giderdi yanı…
Sıkça Sorulan Sorular
Azure Content Understanding ile Document Intelligence arasındaki fark ne?
Şöyle ki, Document Intelligence hani daha çok yapılandırılmış alan çıkarımında güçlü. Content Understanding işe aslında bağlamı okuma ve farklı içerik türlerini bir arada yorumlama tarafını öne çıkarıyor. Yanı ikisi birbirini tamamlar gibi düşünebilirsin.
Hangi dosya türlerinde işe yarıyor?
Sözleşmelerde, faturalarda, e-postalarda, görsellerde ve çok modlu içeriklerde kullanabilirsin. Karmaşık ya da yarı yapılandırılmış dokümanlarda farkı daha net hissediyorsun. Düzgün dijital PDF’lerde de çalışıyor tabiî ama asıl kazanç, bence, karışık veride ortaya çıkıyor.
Küçük ekipler için uygun mu?
Doğrusu, Açıkçası evet, küçük ekipler için de makul bir seçenek. Tecrübeme göre kurulum sürecine biraz zaman ayırman yeterli; sonrasında işleri ciddi ölçüde kolaylaştırıyor.
Bu içerik işinize yaradı mı?
Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.









Yorum gönder