Zieliński: po utracie krtani można odzyskać nie tylko głos, ale i śpiew

Fot. Adobe Stock
Fot. Adobe Stock

Po raz pierwszy na świecie podczas koncertu zabrzmi śpiew osoby po laryngektomii wykorzystującej bioniczną krtań. - Chcemy pokazać, że technologia może przywracać nie tylko możliwość mówienia, ale także pełnię wyrażania siebie – powiedział PAP Konrad Zieliński, twórca protezy krtani.

Konrad Zieliński to naukowiec, doktorant Uniwersytetu Warszawskiego oraz współzałożyciel i CEO startupu Uhura Bionics. Po własnej walce z nowotworem i utracie krtani zajął się tworzeniem technologii, która przywraca chorym naturalnie brzmiący głos. Obecnie rozwija rewolucyjny projekt „Okulary dla Głosu” oraz sztuczną krtań nowej generacji, walcząc z wykluczeniem pacjentów po laryngektomii.

PAP: 26 czerwca w Parku Bródnowskim odbędzie się koncert, podczas którego zaśpiewa pan trzy utwory. Nie byłoby w tym nic niezwykłego, gdyby nie fakt, że wystąpi pan z wykorzystaniem bionicznej krtani. Dotychczas urządzenie umożliwiało jedynie mówienie. Teraz osoby po laryngektomii będą mogły również śpiewać. To będzie pierwszy taki występ na świecie. Co ma udowodnić to wydarzenie?

Konrad Zieliński: Są już osoby po laryngektomii, które śpiewają, między innymi w chórach. Zazwyczaj są to jednak projekty, w których występują wspólnie osoby z zachowaną krtanią i osoby po jej usunięciu. Często też mają oni inwazyjne wszczepiane protezy głosowe, a nie krtanie elektronicznie które dotychczas były kojarzone z robotycznym głosem. My chcemy pokazać, że technologia może przywracać pełniejsze możliwości wyrażania siebie. Użytkownicy naszych urządzeń mówią, że rozwiązaliśmy już problem mówienia, krzyczenia czy wyrażania emocji. Pozostaje jednak pytanie, co z sytuacjami, w których ktoś chciałby zaśpiewać przy ognisku albo wystąpić na scenie jako wokalista. To jest dla mnie szczególnie ważne, ponieważ przed chorobą sam grałem w zespole muzycznym. Właśnie takie wyzwania chcemy dziś rozwiązywać.

PAP: Co znajdzie się w repertuarze?

K.Z.: Koncert organizuje studio muzyczne i będzie miał charakter musicalowy. W repertuarze znajdą się między innymi utwory z filmów Disneya. Jedną piosenkę wykonam solo, jedną zaśpiewam w duecie jako utwór autorski, a trzecią wspólnie z zaproszonymi wykonawcami.

PAP: Jak wygląda nauka śpiewu z wykorzystaniem bionicznej krtani? Z jakimi ograniczeniami anatomicznymi i technologicznymi musieliście się zmierzyć?

K.Z.: Ta praca przebiega równolegle na dwóch płaszczyznach. Z jednej strony uczę się wykorzystywać urządzenie w sytuacji muzycznej i rozwijać własną ekspresję. Z drugiej strony zespół inżynierów stale udoskonala technologię, aby jak najlepiej sprawdzała się podczas śpiewu. Rozwiązując tak złożony problem, jednocześnie poprawiamy działanie urządzenia także w codziennym użytkowaniu. W naszym zespole pracują specjaliści od wokalistyki, programowania niskopoziomowego oraz konstrukcji urządzeń. Biuro, warsztat i studio muzyczne znajdują się w jednym miejscu, dlatego możemy bardzo szybko testować kolejne rozwiązania.

PAP: Co podczas śpiewania stanowi największe wyzwanie?

K.Z.: Najważniejszą nowością jest możliwość rzeczywistego prowadzenia melodii. Dotychczasowe rozwiązania dawały bardzo mechaniczny, robotyczny głos. Nasze urządzenia zapewniają już płynniejszą intonację, ale dopiero teraz osiągamy możliwość trafiania w dźwięki muzyczne, co jest podstawą śpiewu. Drugim elementem jest ekspresja. Zależy nam na tym, aby użytkownik mógł przekazywać emocje i różne intencje, niezależnie od tego, czy śpiewa utwór romantyczny, czy dynamiczny.

PAP: Jak rozumiem, ten projekt wynika również z pana osobistych doświadczeń?

K.Z.: Tak. Przed chorobą byłem muzykiem i miałem doświadczenia aktorskie, dlatego możliwość wyrażania emocji zawsze była dla mnie bardzo ważna. Wśród naszych użytkowników są także osoby, które zawodowo pracowały głosem, między innymi neuropsychologowie czy osoby często występujące publicznie. Dla nich odzyskanie pełnej ekspresji ma ogromne znaczenie.

PAP: Czy to wasze urządzenie umożliwiające śpiew zostało już przetestowane przez użytkowników?

K.Z.: Obecnie sprzedawane są urządzenia pozwalające mówić i krzyczeć. Funkcji śpiewania nie udostępnialiśmy jeszcze klientom. Po raz pierwszy zaprosiliśmy ich, wraz z rodzinami, logopedami i lekarzami, właśnie na ten dzisiejszy koncert. Testy z udziałem pacjentów planujemy rozpocząć jesienią.

PAP: Jaką rolę w tym projekcie odgrywa sztuczna inteligencja? Czy dzięki niej możliwe będzie odtworzenie głosu pacjenta sprzed operacji?

K.Z.: W przypadku syntezy tekstu na mowę jest to już możliwe. Problem pojawia się wtedy, gdy chcemy przekształcać mowę lub śpiew w czasie rzeczywistym. Testowaliśmy różne rozwiązania, ale napotkaliśmy dwa zasadnicze ograniczenia. Pierwszym jest opóźnienie. Wygenerowany głos pojawiał się dopiero po około dwóch sekundach, co uniemożliwia swobodną rozmowę czy śpiew. Drugim problemem jest ekspresja. Obecne modele sztucznej inteligencji wciąż zbyt mocno wygładzają emocje zawarte w głosie. Myślę jednak, że w ciągu dwóch lub trzech lat będzie można ten problem rozwiązać.

PAP: Rozpoczynacie współpracę grantową z ElevenLabs, firmą założoną przez dwóch Polaków, która dziś jest światowym liderem w dziedzinie sztucznej inteligencji do syntezy i klonowania głosu. Będziecie korzystać z ich technologii?

K.Z.: Na razie nie mówimy jeszcze o pełnej integracji. Otrzymamy wcześniejszy dostęp do najnowszego modelu, aby testować jego możliwości i sprawdzać, jak można wykorzystać go w naszych urządzeniach. Nadal nie będzie to jednak oznaczało, że użytkownik będzie mógł śpiewać swoim głosem w czasie rzeczywistym z pomocą sztucznej inteligencji. Taka technologia wciąż wymaga dopracowania. Sądzę natomiast, że w ciągu kilku miesięcy możliwe będzie generowanie śpiewu na podstawie wpisanego tekstu. Nawet takie rozwiązanie może być bardzo pomocne dla osób po operacji, ponieważ pozwoli im w większym stopniu wyrażać emocje i komunikować się z otoczeniem.

PAP: Do waszego zespołu dołączyła prof. Rupal Patel z Bostonu, jedna z pionierek personalizowanych głosów syntetycznych. Co wnosi do projektu?

K.Z.: Miałem okazję współpracować z profesor Patel podczas końcowej części mojego stażu doktorskiego. Dysponuje ona ogromnym doświadczeniem zarówno naukowym, jak i biznesowym. Budowała własną firmę, stworzyła jeden z największych zbiorów danych głosowych dla osób z zaburzeniami mowy i zajmowała się tym jeszcze przed obecnym rozwojem sztucznej inteligencji. Doradza nam przy rozwijaniu technologii, budowaniu spółki, kontaktach z inwestorami oraz tworzeniu międzynarodowej sieci współpracy.

PAP: Produkujecie obecnie partię 500 sztuk urządzeń z myślą o rynkach światowych. Dlaczego zdecydowaliście się rozpocząć ekspansję od Stanów Zjednoczonych?

K.Z.: Powody są zarówno biznesowe, jak i regulacyjne. W Stanach Zjednoczonych można najpierw sprzedawać urządzenie jako elektronikę użytkową, a następnie przekształcić je w wyrób medyczny i ubiegać się o refundację. W Europie procedury są znacznie bardziej sztywne. Naszym celem jest wprowadzenie urządzenia w Polsce od razu jako wyrobu medycznego, aby mogło zostać objęte refundacją. Chcemy, żeby pierwsze urządzenia dla polskich pacjentów było ono praktycznie bezpłatne.

PAP: Ta „amerykańska ścieżka” może przyspieszyć wasze wejście na rynek europejski?

K.Z.: Tak. To rozwiązanie często rekomendowane startupom medycznym. Nie oznacza to jednak rezygnacji z Europy. Działamy z Polski, mamy tutaj siedzibę i chcemy jak najszybciej sprzedawać nasze urządzenia również na rynku krajowym. Jednocześnie rozwijamy działalność z myślą o wejściu między innymi do Niemiec.

PAP: Jesienią będziecie pozyskiwać kolejną rundę finansowania w Dolinie Krzemowej. Jakie są wasze cele?

K.Z.: Chcemy pozyskać około dwóch-trzech milionów dolarów. Środki pozwolą zwiększyć skalę produkcji oraz rozwijać wersję premium urządzenia przeznaczoną do śpiewania. Naszym celem jest jej certyfikacja i uzyskanie częściowej refundacji zarówno w Stanach Zjednoczonych, jak i w Europie. Co ciekawe, amerykańscy inwestorzy często są bardziej skłonni finansować projekty o dużym potencjale, jeszcze przed osiągnięciem przez nie pełnej dojrzałości rynkowej, niż inwestorzy europejscy.

PAP: Niedawno otrzymaliście dwa miliony złotych z PARP na rozwój produktu. Dlaczego środki zostaną przeznaczone między innymi na pozornie drobne elementy, takie jak złącze USB-C czy większa wytrzymałość urządzenia?

K.Z.: Ponieważ wynikają one bezpośrednio z doświadczeń użytkowników. Pierwsza wersja produktu pozwala wejść na rynek i zebrać informacje zwrotne. Dopiero później można dopracowywać szczegóły, które mają ogromne znaczenie w codziennym użytkowaniu. To właśnie dzięki takim uwagom możemy tworzyć urządzenie bardziej trwałe, wygodniejsze i lepiej odpowiadające potrzebom pacjentów.

PAP: Ostatnie miesiące przyniosły wam wiele nagród. Czy przekładają się one na wiarygodność za granicą?

K.Z.: W Polsce z pewnością pomagają budować rozpoznawalność. Na rynkach zagranicznych większe znaczenie mają jednak nagrody zdobyte bezpośrednio w Stanach Zjednoczonych lub Europie Zachodniej. To one najmocniej wpływają na postrzeganie firmy przez inwestorów i partnerów.

PAP: Do końca roku planuje pan obronę doktoratu. Czego dotyczy rozprawa?

K.Z.: Rozprawa poświęcona jest bionicznej komunikacji osób po laryngektomii. Interesuje mnie przede wszystkim to, jak takie urządzenia sprawdzają się w codziennym życiu. Analizuję nie tylko sam proces mówienia, lecz także konkretne sytuacje, takie jak jednoczesne jedzenie i rozmowa. Chcemy rozwijać technologię w oparciu o rzeczywiste potrzeby użytkowników, a nie wyłącznie wyniki badań laboratoryjnych.

Rozmawiała: Mira Suchodolska (PAP)

mir/ kcz/

Fundacja PAP zezwala na bezpłatny przedruk artykułów z Serwisu Nauka w Polsce pod warunkiem mailowego poinformowania nas raz w miesiącu o fakcie korzystania z serwisu oraz podania źródła artykułu. W portalach i serwisach internetowych prosimy o zamieszczenie podlinkowanego adresu: Źródło: naukawpolsce.pl, a w czasopismach adnotacji: Źródło: Serwis Nauka w Polsce - naukawpolsce.pl. Powyższe zezwolenie nie dotyczy: informacji z kategorii "Świat" oraz wszelkich fotografii i materiałów wideo.

Czytaj także

  • 25.06.2026 PAP/Darek Delmanowicz

    Ekspert: czeka nas weekend niebezpiecznych upałów - najgroźniej będzie w miastach

  • Podczas upałów woda to podstawa, jednak lepiej nawadniają mleko i soki owoce

Przed dodaniem komentarza prosimy o zapoznanie z Regulaminem forum serwisu Nauka w Polsce.

newsletter

Zapraszamy do zapisania się do naszego newslettera