Cartesia, geliştiricilerin gerçek zamanlı ses ajanları ve ses merkezli uygulamalar tasarlamalarını hızlandırmayı amaçlayan bir platform olarak kendini konumlandırıyor. Bu girişim, düşük gecikmeli metinden sese dönüştürme (text-to-speech, TTS) ve konuşmadan metne dönüştürme (speech-to-text, STT) modellerine ek olarak, bu modeller üzerine inşa edilen Line adında kod odaklı bir ajan geliştirme katmanı sunmaktadır. Cartesia, telefon görüşmelerinden müşteri hizmetlerine, satış otomasyonuna ve yerelleştirmeye kadar geniş bir yelpazede insan benzeri, anlık konuşma deneyimleri sunmayı hedeflemektedir. Platform, Türkçe dahil olmak üzere toplamda 15 dilde doğal konuşma ve aksan yerelleştirme desteği sağlamaktadır.
Cartesia’nın TTS sistemindeki öncü ürünü Sonic, metinden sese geçiş süresini 40 ms’ye kadar azaltarak akış tabanlı üretken ses üretiminde hız rekoru kırmayı hedefliyor. Bu hız, karşılaştırmalarla da desteklenerek gerçek zamanlı diyaloglarda kullanıcı deneyimini daha akıcı hale getiriyor. Doğal ses tonu, doğru telaffuz ve bağlam göz önünde bulundurularak yapılan ses üretimi, dikkat çeken özellikler arasında yer alıyor. Cartesia, numara, adres ve kimlik gibi detayların doğru bir şekilde okunmasına özel bir önem atfettiğini belirtiyor.
STT tarafında ise Ink-Whisper, gerçek dünya koşullarındaki gürültü, aksan ve ses sıkıştırmasının zorluklarına rağmen hızlı ve okunaklı transkripsiyon sağlamak için geliştirilmekte. Cartesia’nın verilerine göre, bu sistemin transkript tamamlama süresi 66 ms’ye kadar düşebilmektedir. Ayrıca platform, LiveKit ve Vapi gibi ses altyapılarıyla sorunsuz entegrasyon imkanı tanımaktadır.
Sonic ve Ink ana modellerinin yanında, Line modern bir ses ajanı geliştirme platformu olarak tanıtılmakta ve sıfırdan ilk ajana kadar olan süreci tamamen kod yazarak yönetmeye odaklanmaktadır. Line, çoklu prompt yapılandırması, bilgilere ve eyleme erişim sağlayan araçlar, paralel çalışan arka plan ajanları, GitHub entegrasyonu, komut satırı arayüzü (CLI), gözlemlenebilirlik ve yerleşik değerlendirme çerçevesi (framework) gibi çeşitli bileşenler sunmaktadır. Tek tıkla konuşma testi, telefonla canlı denemeler, çağrı metrikleri ve LLM tabanlı çağrı analizleri ile iş akışlarının hızlandırılmasını hedefliyor.
Güvenlik ve kurumsal gereksinimler açısından platform, SOC 2 Type II, HIPAA ve PCI uyumluluğu ile dikkat çekmektedir. Dağıtım konusunda esneklik sağlamak için güvenli API, kuruluşun sanal özel bulutunda yönetilen kurulum seçenekleri ve yerinde barındırma imkanı sunulmaktadır. Böylelikle düzenlemeler, veri yerleşimi ve güvenlik ihtiyaçları etkili bir şekilde karşılanmaktadır.
Cartesia’nın fiyatlandırma modelinde, ücretsiz planda 20,000 kredi, Pro paketi aylık 5 dolara 100,000 kredi, Startup seçeneği ile 49 dolara 1,25 milyon kredi, Scale planıyla 299 dolara 8 milyon kredi sunulmaktadır. TTS için karakter başına 1 kredi ve akışta saniye başına 15 kredi, Ink-Whisper STT için ölçek planında saniye başına 1 kredi, yani saatlik yaklaşık 0,13 dolar tahsil edilmektedir. Line çağrıları dakika bazında ücretlendirilmekte olup, eşzamanlılık limitleri üst planda artırılmaktadır. Ses klonlama yetenekleri planlara bağlı olarak kullanımda olup, Enterprise tarafı özel fiyatlarla sunulurken, bu plan kapsamında özel eşzamanlılık ve SLA sağlanmaktadır.
En Son Tv sitesinden daha fazla şey keşfedin
Subscribe to get the latest posts sent to your email.




