Google Translatotron başka bir konuşma dili dönüştürür, metin

dahil

Her gün biz sürünme biraz daha yakın Douglas Adams’ın ünlü ve ileri görüşlü Babel fish. Google’dan yeni bir araştırma projesi bir dil konuşulan cümleler alır ve başka bir kelime konuşulan çıktıları — ama çoğu çeviri tekniklerinin aksine, herhangi bir ara metin kullanır, sadece ses ile çalışıyor. Bu hızlı yapar, ama daha önemlisi daha kolay hoparlör sesine ritim ve sesi yansıtmak sağlar.

Translatotron, projenin adı, doruk noktası birkaç yıl işle ilgili, ama hala çok fazla bir deney. Google araştırmacıları ve diğerleri, yıllardır konuşma çeviri için, ama sadece son zamanlarda bu çabaların meyve değerinde hasat kaynaklı doğrudan konuşma imkanı araştırıyor.

Çeviri genellikle konuşma (konuşma-metin veya STT), bir dilden başka bir (makine çevirisi) metin içine metin çevirmek, metin kaynak konuşma dönüm küçük sıralı olanları içine sorun: kırmak ve daha sonra geri (okuma veya TTS Metin) Konuşma halinde ortaya çıkan metin çevirerek yapılır. Bu çok iyi, gerçekten, ama mükemmel değil çalışır; her adım eğilimli hata türleri ve bunlar başka bir bileşik olabilir.

Birden fazla dil bilen gerçekten kendi düşünce süreçlerine tanıklık anlaşılacağı gibi insanlar kendi kafalarında tercüme, nasıl dahası değil. Tam olarak kesin olarak söylemek mümkün değildir, nasıl çalışır, ama birkaç metin yıkmak ve yeni bir dile değiştirmek için hayal olduğunu söyleyebilirim, yeni metni okuyun. İnsan biliş sık algoritmaları öğrenme makinesi ilerlemek için nasıl bir rehberdir.

Kaynak ve tercüme konuşma Spectrograms. Çeviri, itiraf edelim, iyi değildir. Ama kulağa daha hoş geliyor.

Bu amaçla, araştırmacılar bakarak bir dilde doğrudan başka spectrograms için ses spectrograms, detaylı frekans dökümleri, konuşma dönüştürme başladı. Bu üç adım çok farklı bir süreçtir ve kendi zayıf yönleri vardır, ama aynı zamanda avantajları vardır.

Bu, karmaşık olsa da, aslında oldukça anlamına gelir çoklu-adım, yeterli işlem gücüne sahip olduğunu varsayarsak, Translatotron daha hızlı çalışmak daha tek adımlı bir işlemdir. Ama çok daha önemlisi, bu süreç kolay kaynak ses karakterini korumak için yapar, bu yüzden çeviri robot gelmiyor ama orijinal cümlenin sesi ve ritim ile.

Doğal olarak bu ifade üzerinde büyük bir etkisi vardır, ve çeviri veya ses sentezi kullanır birisi düzenli olarak sadece geliyor diyorlar ama nasıl derler bunu takdir edecektir. Önemli bu sentetik konuşma Normal kullanıcılar için ne kadar abartmak zor.

Çeviri doğruluğu, araştırmacılar kabul, doğruluk bilemek için daha fazla zamana sahip olan geleneksel sistemler kadar iyi değil. Ama sonuçta elde edilen çevirilerin kısmen çok az (çok iyi), ve ifade dahil olmak kaçırmak için bir avantaj çok büyük. Ayrıca önemli bir etki alanında ileriye doğru büyük bir adım olduğunu görmek kolay olsa sonunda, takım mütevazı bir yaklaşım fizibilite gösteren bir başlangıç noktası olarak çalışmalarını açıklar.

Kağıt açıklayan yeni bir teknikti yayınlanan Arxivve seni göz örneklerin konuşma, kaynak için geleneksel çeviri Translatotron, Bu sayfa. Sadece bu tüm çeviri kalitesi için seçilir, ama anlamını özünü elde ederken sistemi ifade korur örnekler olarak daha fazla hizmet unutmayın.

Leave a Reply

Your email address will not be published. Required fields are marked *