Register
Login
Resources
Docs Blog Datasets Glossary Case Studies Tutorials & Webinars
Product
Data Engine LLMs Platform Enterprise
Pricing Explore
Connect to our Discord channel
Type:  dataset Task:  speech recognition Data Domain:  audio
467ce8bfaf
initial commit
2 years ago
f869b8b30d
fix readme
2 years ago
Storage Buckets

README.md

You have to be logged in to leave a comment. Sign In

Це загальнодоступний український голосовий набір, що складається з 6843 коротких аудіокліпів, прочитані Андрієм Вільколеком з книги Павла Загребельного «Тисячолітній Миколай». Для кожного кліпу надається транскрипція. Кліпи мають різну тривалість від 1 до 10 секунд. Загальна тривалість набору - 5 годин.

Цей набір даних використовувався для навчання рушія перетворення мовлення в текст (https://github.com/mozilla/DeepSpeech).


This is a public domain Ukrainian Voice Dataset consisting of 6843 short audio clips of a single speaker reading passages from the book "Тисячолітній Миколай" by Павло Загребельний, read by Андрій Вільколек. A transcription is provided for each clip. Clips vary in length from 1 to 10 seconds and have a total length of approximately 5 hours.

This dataset was used to train mozilla speech-to-text engine (https://github.com/mozilla/DeepSpeech).

Tip!

Press p or to see the previous file or, n or to see the next file

About

Ukrainian Voice Dataset consisting of 6843 short audio clips

Collaborators 1

Comments

Loading...