Tworzenie napisów i transkrypcji

Na Państwa życzenie możemy w sposób automatyczny stworzyć transkrypcję lub napisy do nagrań audio albo audio-video – praktycznie w każdym języku. Adaptujemy:

  • nagrania audio – wywiady, podcasty, rozprawy sądowe, audycje radiowe, zapis audio wykładów, nagrania z dyktafonów oraz rejestratorów dźwięku itd.
  • nagrania audio-video – sesje z posiedzeń, konferencji, wydarzeń kulturalnych, materiały edukacyjne, treści kursów i wykładów online, filmy z YouTube itd.

Napisy lub transkrypcję przygotowujemy w dowolnym języku. Dla nas nie ma znaczenia czy materiał audio lub audio-video jest po polsku, angielsku, ukraińsku czy fińsku.

Wystarczy przesłać do nas link do materiału audio lub audio-video, określić jaki materiał wyjściowy Państwa interesuje – napisy czy transkrypcja – i po potwierdzeniu z naszej strony przyjęcia usługi do realizacji, najpóźniej w ciągu 48 godzin otrzymacie Państwo zamówiony produkt.

Napisy tworzymy w jednej z zalecanych przez międzynarodowy standard dostępności cyfrowej WCAG 2.1 formie napisów zamkniętych w formatach VTT i SRT. Napisy są od razu gotowe do dodania do odtwarzacza video osadzonego na stronie internetowej, lub dołączenia do filmu w serwisie YouTube.

Transkrypcję przekazujemy w formie zwykłego tekstu w formacie TXT i uniwersalnym kodowaniu UTF-8. Dzięki temu jest ona od razu gotowa do opublikowania na stronie internetowej, lub importowania do dowolnego edytora tekstu. Można ją później udostępnić w wybranym, przetwarzanym maszynowo dokumencie w takich formatach jak RTF, DOC/DOCX, czy PDF.

Wycena

Wycena naszych usług jest niezwykle prosta i przejrzysta. Opiera się na stawce za 1 minutę lub godzinę nagrania. Stawki zmieniają się progresywnie, w zależności od długości nagrań, do których chcecie Państwo stworzyć napisy lub transkrypcję.

  • koszt automatycznego stworzenia transkrypcji dla nagrania audio lub audio-video zaczyna się od kwoty 1,50 zł netto za 1 min. czyli 90 zł netto za 1 godzinę, i wraz ze wzrostem długości nagrań spada do 0,83 zł netto za 1 min. czyli 50 zł netto za 1 godzinę.
  • koszt automatycznego stworzenia napisów dla nagrania audio lub audio-video zaczyna się od kwoty 2,50 zł netto za 1 min. czyli 150 zł netto za 1 godzinę, i systematycznie spada do 1,00 zł netto za 1 min. czyli 60 zł netto za 1 godzinę.

Najłatwiej samemu sprawdzić szacowany koszt korzystając z poniższego kalkulatora wyceny. Wystarczy w minutach podać długość jednego nagrania lub sumaryczną długość wszystkich nagrań mających otrzymać transkrypcję lub napisy, aby poznać ostateczną wartość zamówienia. Poszczególne przedziały cenowe można sprawdzić w tabelach umieszczonych pod kalkulatorem wyceny. Zlecenia powyżej 50 godzin nagrań wyceniane są indywidualnie.

Kalkulator wyceny



Koszt: Wypełnij pola kalkulatora, by obliczyć koszt realizacji

Szczegółowy cennik

Cennik napisów
Długość materiału audio-videoCena netto / minCena brutto / minCena netto / hCena brutto / h
do 1 h2,50 zł3,08 zł150,00 zł184,50 zł
od 1 do 5 h2,17 zł2,67 zł130,20 zł160,15 zł
od 5 do 10 h1,67 zł2,05 zł100,20 zł123,25 zł
od 10 do 20 h1,50 zł1,85 zł90,00 zł110,70 zł
od 20 do 30 h1,33 zł1,64 zł79,80 zł98,15 zł
od 30 do 40 h1,17 zł1,44 zł70,20 zł86,35 zł
od 40 do 50 h1,00 zł1,23 zł60,00 zł73,80 zł
Cennik wykonania usługi napisów
Cennik transkrypcji
Długość materiału audio lub audio-videoCena netto / minCena brutto / minCena netto / hCena brutto / h
do 1 h1,50 zł1,85 zł90,00 zł110,70 zł
od 1 do 5 h1,42 zł1,75 zł85,20 zł104,80 zł
od 5 do 10 h1,33 zł1,64 zł79,80 zł98,15 zł
od 10 do 20 h1,17 zł1,44 zł70,20 zł86,35 zł
od 20 do 30 h1,00 zł1,23 zł60,00 zł73,80 zł
od 30 do 40 h0,92 zł1,13 zł55,20 zł67,90 zł
od 40 do 50 h0,83 zł1,02 zł49,80 zł61,25 zł
Cennik wykonania usługi transkrypcji

Składanie zlecenia

Aby złożyć zlecenie na stworzenie Napisów lub Transkrypcji, wystarczy w poniższym formularzu podać niezbędne informacje i zaczekać na kontakt z naszej strony, potwierdzający koszt oraz czas wykonania usługi.







    Po otrzymaniu zlecenia skontaktujemy się z Państwem w celu potwierdzenia kosztów i czasu realizacji usługi. Jeśli interesuje Państwa inna forma płatności, współpracy lub wycena dla materiałów trwających powyżej 50 godzin, prosimy o kontakt na adres biuro@utilitia.pl.

    Subskrypcja na napisy i transkrypcję

    Tworzenie automatycznych napisów oraz transkrypcji oferujemy również w dwóch opcjach subskrypcyjnych:

    • Opcja Standard: umożliwia stworzenie automatycznych napisów i transkrypcji dla 10 godzin dowolnego typu nagrań audio, video lub audio-video w miesiącu. Klient otrzymuje napisy w formatach VTT i SRT, a także transkrypcję nagrania w dowolnym formacie. Usługa rozliczana jest co miesiąc z góry. Jej koszt to 600 zł netto (738 zł brutto) za każdy kolejny miesiąc. Z usługi można zrezygnować w dowolnym momencie.
    • Opcja Optimum: umożliwia stworzenie automatycznych napisów i transkrypcji dla 120 godzin dowolnego typu nagrań audio, video lub audio-video, bez limitu godzin w miesiącu. Oznacza to, że z usługi można nie korzystać przez kilka miesięcy, a potem w ciągu jednego miesiąca zamówić napisy i transkrypcję przykładowo dla 70 godzin nagrań. Klient otrzymuje napisy w formatach VTT i SRT, a także transkrypcję nagrania w dowolnym formacie. Usługa jest płatna z góry za rok (12 miesięcy). Jej koszt to 7000 zł netto (8610 zł brutto).

    Jeśli jesteście Państwo zainteresowani jedną z wymienionych opcji, interesuje Państwa inny okres realizacji usługi lub większa liczba godzin w poszczególnych pakietach, prosimy o kontakt na adres biuro@utilitia.pl albo telefonicznie pod numerem 663 883 600.

    Najczęściej zadawane pytania

    Czy napisy dzielone są na rozmówców?

    Nie. Aktualnie nie ma takiej możliwości. Jednak nie wykluczamy, że w przyszłości taka opcja się pojawi.

    Czy można zamówić napisy lub transkrypcję do materiałów w których naprzemiennie pojawiają się wypowiedzi w różnych językach?

    Tak, istnieje taka możliwość, jednak takie rozpoznawanie jest z reguły mniej dokładne. Zależy od jakości materiału wejściowego, oraz zadeklarowanego języka źródłowego. Celem uzyskania zadowalających wyników najlepiej zlecić rozpoznanie nagrania w tylu językach, w ilu pojawiają się wypowiedzi, a następnie połączyć wedle potrzeby.

    Czy w rozpoznanych tekstach pojawi się interpunkcja?

    Tak, lecz jej dokładność zależy od jakości nagrania oraz tego, co używane przez nas narzędzie uzna za pełne zdanie.

    Czy dobrze rozumiem, że gdy zamawiam napisy, to otrzymam od Państwa pliki w obu formatach?

    Tak, od razu przesyłamy napisy w dwóch plikach. W formatach VTT i SRT.

    Czy automatycznie tworzone napisy są przez Was w jakikolwiek sposób poprawiane?

    Nie, napisy nie są poddawane redakcji. Przy tak dużej ilości tworzonych napisów nie jest to możliwe. Proszę przyrównać ten proces do digitalizacji zasobów bibliotecznych. Jeśli nawet część dokumentów elektronicznych poddawanych jest procedurze rozpoznawania tekstu, to nigdy, albo bardzo rzadko na bieżąco weryfikowana jest poprawność tego procesu.

    W oparciu o jaki mechanizm realizujecie tę usługę??

    Wykorzystujemy system Whisper, stworzony przez Open AI. Bazujemy na modelu large.

    Przecież Whisper jest darmowy, za co w takim razie mam wam płacić?

    Whisper jest darmowy, darmowy za to nie jest sprzęt, na którym pracuje. System ten potrzebuje bardzo mocnych podzespołów, głównie karty graficznej. Model Large, w oparciu o który przeprowadzamy proces rozpoznawania, wymaga co najmniej 12 GB pamięci VRAM. Dodatkowo, istotna jest także karta graficzna, na której przeprowadzane jest rozpoznawanie. Dzięki odpowiedniemu doborowi sprzętu, udało nam się przyspieszyć je czterokrotnie, większość urządzeń działa z Whisperem z prędkością 1X, co w przypadku dużej ilości materiału nie jest bez znaczenia.

    Piszecie, że realizacja trwa 48h. Czy można zamówienie zrealizować szybciej?

    Tak, oczywiście. Podany czas, to maksymalny okres oczekiwania, przy maksymalnym obciążeniu naszej usługi. Zazwyczaj napisy lub transkrypcję tworzymy na bieżąco. Oznacza to, że po dostarczeniu nagranie z konferencji trwającej na przykład 4 godziny, po godzinie od rozpoczęcia realizacji materiał będzie gotowy. Dlatego jeśli Klient planuje rejestrację jakiegoś wydarzenia, warto nas o tym uprzedzić, abyśmy mieli wolne okienko i wtedy jeszcze tego samego dnia, wraz z nagraniem danego wydarzenia, możliwe będzie od razu opublikowanie napisów do niego.

    Czy w przypadku zapotrzebowania na stworzenie większej ilości napisów, na przykład do kilkudziesięciu godzin wykładów stanowiących część kursu e-learningowego, możliwe jest uzyskanie niższych stawek?

    Tak, w przypadku większego wolumenu materiałów audio lub audio-video, tworzymy napisy i transkrypcję na bardziej preferencyjnych warunkach. Szczegóły zawiera powyższy cennik. Dodatkowo, Kontrahenci podpisujący z nami umowę na stałą, dłuższą współpracę mogą liczyć na jeszcze bardziej satysfakcjonujące stawki.

    Jak dokładna jest synchronizacja napisów?

    Każdy wiersz napisów zawiera od 3 do 7 sekund wypowiedzi.

    Gdzie mogę sprawdzić jakość rozpoznawanych przez was nagrań?

    Poniżej znajdują się przykładowe fragmenty nagrań wraz z powstałymi na ich podstawie napisami i transkrypcją.

    Przykładowe fragmenty nagrań wraz z powstałymi na ich podstawie napisami i transkrypcją

    Materiały audio-video, do których przygotowano powyższe próbki: