Microsoft Foundry Mart 2026: Sahadan İlk İzlenimler

⏱️ 8 dk okuma📅 10 Nisan 2026👁️ 1 görüntülenme

Geçen hafta bir müşteri toplantısından çıktım, adam bana döndü: “Aşkın bey, her ay bir şey GA oluyor, biz hangisine yetişeceğiz?” dedi. Haklı soruydu. Mart 2026’da Microsoft Foundry tarafında o kadar (belki yanılıyorum ama) fazla şey oldu ki, ben bile bir adım geri çekip “tamam, bunların hangisi gerçekten önemli?” diye düşünmek zorunda kaldım (kendi tecrübem). Ciddi söylüyorum.

Bu yazıda her yeniliği sırayla anlatmak yerine — dur bir saniye, aslında tam öyle de yapmayacağım. Önce sahada fark yaratan şeylere bakalım, sonra gerisini toparlayalım. Çünkü açık konuşayım: her GA etiketi aynı ağırlığı taşımıyor.

Foundry Agent Service Artık Prodüksiyonda

Dürüst olmak gerekirse, Uzun süre preview’da bıraktığımız, dikkatli kullandığımız Agent Service nihayet GA oldu. Responses API tabanlı çalışıyor. Uçtan uca private networking desteği var, MCP auth tarafında OAuth passthrough eklendi ve 6 yeni bölge geldi — kurumsal müşteriler için bu son madde baya kritik, küçümsemeyin.

Geçenlerde Logosoft’ta bir finans kuruluşuyla çalışıyorduk, müşteri “agent’ımız Avrupa’daki kullanıcılara hizmet verecek ama veri Türkiye’de kalacak” diyor. Private networking desteği olmadan bunu yapmak gerçekten çetrefilliydi, yanı mimarı tarafta ciddi jimnastik yapıyordunuz. Şimdi en azından o kısım kolaylaştı (şaşırtıcı ama gerçek). Ama — bunu vurgulamak istiyorum — GA olması her şeyin pürüzsüz işlediği anlamına gelmiyor. Voice Live hâlâ preview’da mesela. Hani ne farkı var diyorsunuz, değil mi? Ses tarafına güvenip prodüksiyona almayın, söylüyorum işte.

Hosted agent’ların 6 yeni bölgeye gelmesi güzel de, Türkiye’ye yakın bölge hâlâ sınırlı (en azından benim deneyimim böyle). West Europe. North Europe var ama zaman zaman latency konusunda sürprizlerle karşılaşıyorsunuz — bunu yaşadım, biliyorum. 2024 sonlarında benzer bir yapıyı kendi test ortamımda denemiştim; o zamanki agent runtime ile şimdiki arasında dağlar kadar fark var, önü da söyleyeyim.

GPT-5.4 Ailesi: Güvenilirlik Ön Planda

Eh, GPT-5.4 ve GPT-5.4 Pro 5 Mart’ta GA oldu. İlk izlenimim şu: bu model “daha zeki” olmaktan çok “daha güvenilir” olmayı hedefliyor. Kulağa sıkıcı gelebilir, anlıyorum. Ama inanın, prodüksiyonda agent çalıştıran herkes bilir — task drift ve tutarsız tool calling ne kadar sınır bozucu bir şey.

Standard vs Pro: Hangisi Kime?

Şöyle söyleyeyim, Fiyatlandırma tablosu şöyle:

Model	Input (1M token)	Output (1M token)	Kullanım Alanı
GPT-5.4	$2.50	$15	Genel üretim, agent orchestration
GPT-5.4 Pro	$30	$180	Derin analitik, bilimsel iş yükleri
GPT-5.4 Mini	Düşük	Düşük	Sınıflandırma, extraction, yüksek hacim

Bakın, Standard ile Pro arasında tam 12 kat fiyat farkı var. Düşünün bir. Küçük bir startup için Pro’ya gerek yok, Standard fazlasıyla yeterli. Ama bir bankacılık müşterimizde uzun reasoning chain’lerle çalışan bir karar destek sistemi var — orada Pro gerçekten fark yaratıyor, bizzat gördüm. Multi-path reasoning evaluation denen şey, yanı modelin birden fazla düşünce yolunu değerlendirip en tutarlısını seçmesi, işte bu enterprise seviyede önemli hâle geliyor.

Ha, bir de GPT-5.4 Mini var. Sınıflandırma, veri çıkarma, hafif tool call’lar için biçilmiş kaftan. Eğer routing stratejisi kuruyorsanız — basit sorular Mini’ye, karmaşık olanlar Standard’a, can alıcı analitik işler Pro’ya — bu üçlü kombinasyon maliyet tarafında gerçekten ciddi tasarruf sağlıyor. Daha önce GPT-5.1 Codex Modelleri Emekli Oldu: Ne Yapmalısınız? yazımda model geçişlerinden bahsetmiştim; şimdi o geçişi yapanlar için 5.4 ailesi güzel bir sonraki durak olacak.

GPT-5.4’ün asıl gücü “daha zeki” olması değil, “daha güvenilir” olması. Prodüksiyonda agent çalıştıran herkes bu farkı anlayacaktır.

Phi-4 Reasoning Vision 15B: Küçük Ama İddialı

Vallahi, Phi ailesi beni her seferinde şaşırtıyor. 15 milyar parametreyle multimodal reasoning yapmak… hmm, bir düşüneyim — evet, bu gerçekten etkileyici. En çok da chart, diyagram ve doküman layout’larını anlamlandırma konusunda chain-of-thought ile çalışıyor.

Geçen ay bir telekom müşterimizde fatura görsellerinden veri çıkarma projesi vardı. O zaman çok daha büyük modeller kullanıyorduk, maliyet uçuyordu adeta. Phi-4 Reasoning Vision tam bu tip iş yükleri için ideal görünüyor — henüz sahada test etmedim ama kağıt üstünde vaatler fena değil. Bir de şu var: 15B model olduğu için edge deployment senaryolarında da kullanılabilir, ki bu ayrıca büyük bir avantaj.

Şimdi gelelim işin can alıcı noktasına.

Ama açık konuşayım: Phi modelleri benim için her zaman “benchmark’ta süper, pratikte göreceğiz” kategorisinde başlıyor. Bekleyip görmek lazım.

Evaluations GA ve Continuous Monitöring

İşte bu benim en çok heyecanlandığım kısım. Neden mi? GitHub Bildirimlerinde Sıralama Geldi: Küçük Detay mı? yazımızda bu konuya da değinmiştik.

Çünkü herkes model seçimi, prompt engineering konuşuyor ama kimse “ya bu agent prodüksiyonda nasıl performans gösteriyor, nereden bileceğiz?” diye sormuyor. Aslında — dur, soranlar var ama cevap hep yetersiz kalıyordu (ciddiyim). Şimdiye kadar.

Evaluations artık GA. Hazır evaluator’lar var, custom evaluator yazabiliyorsunuz ve en güzeli: continuous monitöring Azure Monitör’a akıyor. Yanı kalite artık “deploy öncesi bir checkbox” değil, canlı bir sinyal. Bu büyük değişim baya önemli, hafife almayın.

💡 Bilgi: Continuous Monitöring sayesinde agent’ınızın prodüksiyondaki kalite metriklerini Azure Monitör üzerinden gerçek zamanlı takip edebilirsiniz. Drift algılama, hallucination oranı ve tool call başarı yüzdesi gibi metrikleri dashboard’a bağlamak artık mümkün.

2025 başında bir e-ticaret projesinde agent’ın müşteri sorularına verdiği cevapların kalitesini ölçmek için kendi custom evaluation pipeline’ımızı yazmıştık. Saçımız başımız yolunmuştu, neredeyse. Şimdi bunu out-of-the-box yapabilmek… neyse, uzatmayalım. Çok güzel, bu kadar.

SDK Tarafında Temizlik: azure-ai-projects 2.0

Şahsen, Python 2.0.0, JS/TS 2.0.0, Java 2.0.0 stable çıktı..NET 2.0.0 de 1 Nisan’da geldi. En önemli değişiklik ne biliyor musunuz? azure-ai-agents bağımlılığı gitti. Her şey artık AIProjectClient altında yaşıyor. Bu konuyla ilgili AG-UI ile Çoklu Ajan Arayüzü: Gerçek Zamanlı Demo yazımıza da göz atmanızı tavsiye ederim.

# Eski yöntem (artık deprecated)
from azure.ai.agents import AgentClient
# Yeni yöntem (GA v2)
from azure.ai.projects import AIProjectClient
client = AIProjectClient(
endpoint="https://your-foundry.azure.com",
credential=DefaultAzureCredential()
)
# Agent oluşturma artık tek client üzerinden
agent = client.agents.create(
model="gpt-5.4",
name="my-production-agent",
instructions="You are a helpful assistant..."
)

Bu basitleştirme çok yerinde, valla. Ayrı ayrı paketlerle uğraşmak, versiyon uyumsuzlukları… Bunlar geride kaldı artık. Ama bir uyarı: hâlâ eski azure-ai-agents paketini kullanıyorsanız, migration yapmanız şart. Breaking change’ler var, dikkat edin (şaşırtıcı ama gerçek)

Fireworks AI ve Üçüncü Parti Modeller

Foundry’nın sadece Microsoft modelleri değil, üçüncü parti modelleri de barındırma stratejisi devam ediyor. Fireworks AI preview olarak geldi — DeepSeek V3.2, gpt-oss-120b, Kimi K2.5 ve MiniMax M2.5 modelleri mevcut. Bring-your-own-weights desteği de var.

İşin garibi, Grok 4.2 de GA oldu. xAI’ın chat modeli beta’dan çıktı. NVIDIA Nemotron modelleri de artık Foundry kataloğunda birinci sınıf vatandaş olarak yerini aldı; GTC’de Agent Service GA ile birlikte duyuruldu bunlar. Daha fazla bilgi için GitHub Secret Scanning API ve Webhook İyileştirmeleri yazımıza bakabilirsiniz.

Gel gelelim asıl soru şu: bu kadar model seçeneği güzel de, hangisini ne zaman kullanacağız? Bu konuda Gemini API’de Maliyet. Hız Dengesi: Flex ile Priority yazımda benzer bir karşılaştırma yapmıştım. Model seçimi artık sadece “en iyisi hangisi” sorusu değil — “bu iş yükü için en uygun maliyet/performans dengesi nerede” sorusu. Fark var, önemli bir fark. Daha fazla bilgi için GitHub’un Mart 2026 Dersi: Dayanıklılık Kağıt Üstünde Değil yazımıza bakabilirsiniz.

Güvenlik ve Gözlemlenebilirlik

Palo Alto Prisma AIRS + Zenity

Size bir şey söyleyeyim, Üçüncü parti runtime security entegrasyonları GA oldu. Prompt injection, data leakage ve tool misuse detection… Bunlar prodüksiyon agent’ları için olmazsa olmaz. Bir arkadaşım geçen ay bir POC’de prompt injection açığı buldu — agent’a “önceki tüm kuralları unut” deyince gerçekten unutuyordu. Şaka gibi ama değil. İşte Prisma AIRS tam bu tip şeyleri yakalıyor.

Tracing GA

Agent trace inspection artık GA. Sort, filter ve data model iyileştirmeleri de geldi. Bir agent’ın hangi adımda ne yaptığını uçtan uca görebilmek (şaşırtıcı ama gerçek). Debug açısından hayat kurtarıcı, gerçekten. Visual Studio’da Copilot Mart 2026: Ajan Devrimi yazısında da agent debugging konusuna değinmiştim; şimdi Foundry tarafında da bu olgunlaşıyor, güzel. Daha fazla bilgi için GitHub Universe Sahneye Çağırıyor: Ben Olsam Ne Yaparım? yazımıza bakabilirsiniz.

Evet, doğru duydunuz.

Priority Processing (Preview)

Latency-sensitive iş yükleri için ayrılmış compute lane. Real-time agent’lar ve müşteriye dönük chat uygulamaları için reserved capacity. Henüz preview. Ama konsept çok doğru — tüm trafiği aynı havuzda yüzdürmek yerine can alıcı iş yüklerine öncelik vermek, e tabii, bu FinOps perspektifinden de gayet mantıklı.

PromptFlow Deprecated: Takvimi Not Edin

Bak şimdi, Bunu kaçırmayın. PromptFlow deprecate edildi, Ocak 2027’ye kadar Microsoft Framework Workflows’a geçmeniz gerekiyor. Durun, şunu da ekleyeyim — Ocak 2027 uzak gibi görünüyor, biliyorum (ilk duyduğumda inanamadım). Ama migration projeleri her zaman tahmin edilenden uzun sürüyor; bunu yeterince tecrübe ettim. PromptFlow kullanıyorsanız planlamaya şimdi başlayın, erken başlayın (en azından benim deneyimim böyle)

Biz Logosoft’ta bir sağlık sektörü müşterisinde PromptFlow tabanlı bir pipeline kurmuştuk, Eylül 2025’te. Şimdi o pipeline’ı migrate etmemiz gerekecek. Erken başlamak lazım çünkü test ve validasyon süreci de cabası.

Genel Değerlendirme: Mart 2026 Ne Anlam İfade Ediyor?

Büyük resme bakınca, Mart 2026 Microsoft Foundry için bir olgunlaşma ayı oldu. Yeni parlak özelliklerden çok, mevcut yeteneklerin prodüksiyon kalitesine ulaşması söz konusu. Agent Service GA, Evaluations GA, SDK 2.0 GA, Tracing GA… Hepsi GA. Bu iyi bir şey — preview fatigue yaşayan kurumsal müşteriler için “artık güvenle kullanabilirsiniz” mesajı gerçekten önemli.

Peki her şey yolunda mı? Hayır. Burada, voice Live hâlâ preview’da (ki bu çoğu kişinin gözünden kaçıyor). Priority Processing henüz olgunlaşmadı. Fireworks AI entegrasyonu da preview (bizzat test ettim). Yanı deneysel alanda hâlâ çok şey var, yanılmayın (bizzat test ettim). Beni biraz şaşırtan kısım işe SDK tarafında.NET’in 1 gün gecikmeli gelmesiydi — küçük bir detay, evet, ama.NET ekosisteminin her zaman biraz geride kalması artık bir pattern hâline geldi sanki.

Şimdi gelelim işin can alıcı noktasına.

Maalesef.

Sıkça Sorulan Sorular

Microsoft Foundry Agent Service GA ile ne değişti?

Agent Service artık prodüksiyon ortamlarında güvenle kullanılabilir durumda (yanlış duymadınız). Bir bakıma, responses API tabanlı çalışıyor, uçtan uca private networking desteği var, MCP auth genişledi (OAuth passthrough dahil) ve 6 yeni bölgede hosted agent desteği geldi.

GPT-5.4 ile GPT-5.4 Pro arasındaki fark nedir?

Standard GPT-5.4 genel üretim iş yükleri ve agent orchestration için uygun ($2.50/$15 per million token). Pro işe derin analitik ve bilimsel iş yükleri için tasarlanmış, multi-path reasoning evaluation sunuyor ($30/$180). Latency’den çok doğruluk ve derinlik önemliyse Pro tercih edilmeli.

Durun, bir saniye.

PromptFlow ne zaman tamamen kalkıyor?

PromptFlow deprecate edildi ve Ocak 2027’ye kadar Microsoft Framework Workflows’a migration tamamlanmalı. Erken başlamak önemli çünkü test. Validasyon süreçleri dahil migration projeleri genellikle tahmin edilenden uzun sürüyor.

Foundry’de hangi üçüncü parti modeller kullanılabiliyor?

Ne yalan söyleyeyim, Fireworks AI preview ile DeepSeek V3.2, gpt-oss-120b, Kimi K2.5 ve MiniMax M2.5 geldi. İşte, nVIDIA Nemotron modelleri birinci sınıf katalog öğesi olarak eklendi. xAI’ın Grok 4.2 modeli de GA olarak mevcut. Kısacası, bring-your-own-weights desteği de Fireworks AI ile sunuluyor.

Priority Processing ne işe yarıyor?

Latency-sensitive AI iş yükleri için ayrılmış bir compute lane sağlıyor. Real-time agent’lar. Müşteriye dönük chat uygulamaları gibi kritik iş yüklerine reserved capacity ayırarak, genel trafik yoğunluğundan etkilenmemelerini sağlıyor. Henüz preview aşamasında.

Kaynaklar ve İleri Okuma

What’s new in Microsoft Foundry | March 2026 — Microsoft DevBlogs

Yanı, Azure AI Agent Service Documentation — Microsoft Learn

Evaluation of Generative AI Applications — Microsoft Learn

İçeriği paylaş:

📬 Bu yazıyı faydalı buldunuz mu?

Azure, DevOps ve bulut teknolojileri hakkında güncel içerikler için beni takip edin!

𝕏 Twitter LinkedIn YouTube GitHub

📚 Benzer Yazılar

Claude Sonnet 4.6: Kodlama ve İş Akışında Yapay Zeka

Claude Sonnet 4.6: Güçlü ve Uygun Fiyatlı Yapay Zeka

Python ile Azure MCP Server: PyPI & uvx Yenilikleri

Aşkın KILIÇ

Foundry Agent Service Artık Prodüksiyonda