Dziennik Gazeta Prawana logo

Sztuczna Ivona mówi jak człowiek

12 października 2007, 13:40
Ten tekst przeczytasz w 2 minuty
Ivona - najlepszy na świecie syntezator mowy, służący m.in. do odczytywania przez osoby niewidome wiadomości z internetu, powstał w Gdyni. Skonstruowali go dwaj inżynierowie, Łukasz Osowski i Michał Kaszczuk. Zwyciężyli właśnie w międzynarodowym konkursie syntezy mowy ludzkiej Blizzard Challenge w USA. Polacy pokonali takie potęgi, jak Microsoft i IBM.

Przed trzema laty świeżo upieczeni absolwenci Politechniki Gdańskiej założyli firmę IVO Software. Zaczynali od pierwszego telefonu komórkowego dla niewidomych, ale chcieli produkować profesjonalne syntezatory mowy, bo uznali, że na rynku brakuje takich produktów, a przy okazji będzie to szansa na realizowanie wspólnej pasji, jaką jest sztuczna inteligencja. Zabrali się do pracy i stworzyli Ivonę - syntezator, który dziś służy niewidomym i wciąż jest udoskonalany. Choć tekst z komputera czyta elektroniczny lektor, to dźwięk jest do złudzenia podobny do mowy żywego człowieka. Korzysta z niego już pół miliona ludzi, syntezator kupiło też wojsko.

"Nasza Ivona mówi głosem, który powstał na bazie prawdziwej mowy ludzkiej" - tłumaczy Łukasz Osowski. "Nagrywamy głoski i całe wyrazy wypowiadane przez lektora, a potem na tej podstawie tworzymy sztuczne dźwięki. Jak się okazało, robimy to na tyle dobrze, że pokonaliśmy potentatów na rynku informatycznym. No cóż, widocznie używamy lepszych algorytmów matematycznych" - dodaje.

A konkurencyjne ekipy na konkursie w Stanach były naprawdę mocne. Nad syntezatorem IBM pracowały dwie grupy, po 30 osób każda, syntezator dla Microsoftu opracowywał zespół 60-osobowy. Żeby go pokonać, Polacy musieli najpierw zaprezentować Ivonę, a potem stworzyć anglojęzyczną wersję syntezatora. Udało się. Michał Kaszczuk i Łukasz Osowski triumfowali kilka dni temu podczas uroczystej gali w Pittsburgu i choć w konkursie nie przyznaje się żadnych nagród rzeczowych czy finansowych, to sława, jaką zdobyli, przełoży się już wkrótce na ogromny sukces komercyjny ich firmy.

Nasi inżynierowie pracują teraz nad syntezatorem wielofunkcyjnym - Expressiva. Będzie obsługiwał teksty w internecie, edytory tekstu, pakiety biurowe, pocztę elektroniczną. "Chcemy, aby internetowe wydania gazet także miały wbudowaną Expressivę. Nasz syntezator będzie też przez telefon odczytywał na przykład stan kont bankowych" - tłumaczą.

Copyright
Materiał chroniony prawem autorskim - wszelkie prawa zastrzeżone. Dalsze rozpowszechnianie artykułu za zgodą wydawcy INFOR PL S.A. Kup licencję
Źródło dziennik.pl
Zapisz się na newsletter
Świadczenia, emerytury, podatki, zmiany przepisów, newsy gospodarcze... To wszystko i wiele więcej znajdziesz w newsletterze Dziennik Radzi. Chcesz się dowiedzieć, kto może przejść na wcześniejszą emeryturę? A może jakie ulgi można odliczyć od podatku? Kto może otrzymać środki w ramach renty wdowiej? Zapisz się do naszego newslettera i bądź na bieżąco!

Zapisując się na newsletter wyrażasz zgodę na otrzymywanie treści reklam również podmiotów trzecich

Administratorem danych osobowych jest INFOR PL S.A. Dane są przetwarzane w celu wysyłki newslettera. Po więcej informacji kliknij tutaj