Якщо ви працюєте з відео або аудіо, то, напевно, перебуваєте в пошуках зручних програм для розшифровки мови в текст. Наприклад, для субтитрів чи написання статей. У цьому матеріалі ми зібрали сервіси для транскрибації голосу в письмовий формат. Усі вони розпізнають українське мовлення й зазвичай кілька десятків інших мов.
Вміст:
Що таке транскрибація й навіщо потрібне розшифрування
Транскрибація — це розшифрування інформації з аудіо або відео в текстову форму. Це може бути актуальним не лише для тих, хто має вади слуху, а і для тих, хто воліє споживати текстовий контент.
Мета транскрибації — якісно перекласти мову в текстовий формат, який людина добре розумітиме.
Завдання розшифровки:
- Розібрати все сказане спікерами.
- Розбити мовлення на окремі речення.
- Прибрати слова-паразити та паузи.
Розшифровка використовується в субтитрах до відео, у статтях та постах, а також для аналізу та досліджень.
Нижче наводимо таблицю, у якій ми вказали, де використовують розшифровку.
Вид транскрибації | Особливості |
Диктування | Автор читає підготовлений текст — повільно, виразно, дотримуючись пауз за розділовими знаками. Текст може використовуватися під час підготовки статей, дописів до соцмереж тощо. |
Лекція | Студенти записують промову викладача на диктофон, щоби надалі перевести аудіофайли в текст, якщо там трапляються складні терміни та незнайомі імена. Використовується, коли лектор швидко розмовляє й записати матеріал у такій ситуації дуже складно |
Подкаст | Формат радіо, де проблеми з вимовою трапляються рідко. Подкаст може бути монологом чи діалогом. Під час розшифровки обов’язково вкажіть ім’я людини. Розшифровка потрібна для субтитрів |
Інтерв’ю | Формат, у якому бере участь двоє та більше осіб. Розшифровка потрібна для субтитрів у відео, написання статті чи посту. Сувора дослівність не потрібна, у пріоритеті — передати емоції та головну думку інтерв’юйованого |
Синхрон | Схожий на інтерв’ю. У кадрі експерт коментує якусь тему, камера записує не тільки голос, а і звукове тло, що супроводжує запис |
Вебінар | Мова одного чи кількох експертів вебінару. Розшифровка схожа на формат подкасту — потрібно вказати ім’я спікера. Транскрибацію використовують для субтитрів, написання статті чи книги |
Фокус-група | Фокус-група бере участь у маркетингових дослідженнях та соціологічних опитуваннях. Складний формат розшифровки. Спочатку всі люди можуть говорити спокійно, та під кінець багато хто починає перебивати один одного. Щоб уникнути мішанини, запитуйте кожного учасника по черзі. Розшифровка потрібна для звітів, аналізу та досліджень |
Конференція | У конференції є ведучий — він же модератор — і спікери. Тут також важливо вказати ім’я того, хто говорить. Розшифровка використовується для субтитрів, написання статей та постів |
Телефонні розмови | Розшифровка використовується для аналізу клієнтів, збору даних про них — інтереси, потреби, болі та проблеми. Також це допомагає покращити якість роботи менеджерів. Транскрибація дзвінків використовується не тільки для бізнесу, а і для вирішення специфічніших завдань — наприклад, силовики можуть прослуховувати розмови потенційних злочинців. |
Субтитри | Використовуються у відео. Текст має точно повторювати мову того, хто говорить. Щоби розбити її на підтеми — використовуйте тайм-коди |
Монтажний лист | Застосовується в кіно та кліпах. Це таблиця, де вказано кадри з репліками героїв та технічними коментарями. Тут потрібно не тільки розписати промову персонажа, а й зафіксувати все, що зараз перебуває в кадрі |
Далі ми розглянемо сервіси як для автоматичної транскрибації, так і для ручної розшифровки.
Сервіси, які полегшать ручне розшифрування
У цьому розділі ми зібрали добірку популярних сервісів для розшифрування аудіо та відео в текст.
Google Docs
Google Docs— онлайн-сервіс для роботи з текстом та даними. Усередині платформи можна увімкнути мікрофон, який допоможе перевести мову в письмовий формат. Щоб активувати функцію, створіть Google Документ. Далі у верхньому меню знайдіть розділ «Інструменти» та виберіть «Голосовий ввід». Або затисніть кнопки Ctrl+Shift+S для запуску команди.
Особливості:
- Працювати з файлом можуть одночасно кілька людей.
- Годиться для досліджень, розшифрування телефонних дзвінків та аналізу споживачів.
Плюси:
- Безплатний продукт.
- Автоматичне збереження тексту.
- Можливість одразу ж відредагувати матеріал.
Мінуси:
- Повільне розшифрування.
- Сервіс розпізнає не всі слова. Потрібне гарне диктування, щоби дістати якісний текст. Втім, це стосується всіх сервісів.
- Сервіс не може розпізнати запис з іншої вкладки браузера або програвача. Потрібно все записувати в мікрофон, тобто з іншого пристрою: диктофона, телефону, телевізора або комп’ютера.
Dictation.io
Dictation.io — простий сервіс розшифровки мовлення.
Особливості:
- Готовий матеріал можна завантажити, опублікувати у твіттері або надіслати електронним листом.
Плюси:
- Безплатна програма.
- Вбудований редактор тексту.
- Понад 100 мов озвучення.
Мінуси:
- Не підтримує роботу із готовими файлами.
- Не завжди працює коректно.
oTranscribe
oTranscribe — безплатний сервіс, який не перетворює аудіо на текст, але полегшує процес самостійної роботи.
Особливості:
- Є функція відстеження тайм-кодів.
- Можна поновити минулий проєкт з історії.
- Працює з посиланнями з YouTube та файлами: WAV, MP3, MPEG, WEBM тощо.
- Зберігає документи у форматі OTR.
Плюси:
- Мінімалістичний редактор тексту.
- Автоматично зберігає документ у форматі HTML5.
- Для зручності користування можна настроїти гарячі кнопки.
Мінуси:
- Розшифрувати аудіофайли в текст потрібно вручну.
Transcribe by Wreally
Transcribe by Wreally — універсальний сервіс, у якому ви можете доручити розшифрувати файл штучному інтелекту або зробити це самостійно. В останньому випадку сервіс прискорить швидкість вашої роботи щонайменше вдвічі.
Передплата для самостійної роботи коштує 20 доларів на рік. Для автоматичної — стільки ж, кожна година роботи з аудіофайлом обійдеться додатково в ще 6 доларів.
Є тестовий період 7 днів, коли ви можете безлімітно використовувати самостійне розшифрування та 30 хвилин для автоматичної транскрибації.
Особливості:
- Підтримує формати файлів — 3GP, AAC, AIF, AIFF, AMR, CAF, DSS, FLAC, M4A, MOV, MP3, MP4, OGG, WAV, WEBM, WMA, WMV.
- Максимальний розмір файлу — 6 гігабайт або 420 хвилин.
- Готовий документ можна завантажити у форматі DOC.
Плюси:
- Простий в управлінні.
- Є редактор тексту.
- Підтримує посилання з YouTube.
- Є тайм-коди.
- Файли можна завантажити як із ПК, так і з хмарних сервісів.
- Докладна інструкція, як користуватися сервісом.
- Підтримує велику кількість мов і діалектів.
- Є гарячі кнопки для швидкої роботи.
Мінуси:
- Потрібна реєстрація.
- Платний сервіс.
Алгоритм YouTube — вбудовані субтитри
Субтитри YouTube — це можливість не тільки автоматично створити текст, а й самостійно розшифрувати мову з відео.
Нижче наведено приклад, як працюють автоматичні субтитри: текст сприймається нечітко. Якщо пролунало іноземне слово, воно буде перероблено під вибрану мову, а не перекладено. Також якщо людина запнулася, алгоритм підбере свій варіант слова.
Щоби самостійно розшифрувати мову в YouTube, зайдіть у «YouTube студію», перейдіть до налаштувань відео та знайдіть розділ «Субтитри». У вікні виберіть «Синхронізувати автоматично».
Особливості:
- Блогерам зручно працювати на одному майданчику — редагувати ролик та налаштовувати субтитри.
- Можна самостійно налаштувати субтитри.
Плюси:
- Безплатний інструмент.
- Простий сервіс.
Мінуси:
- Розпізнавання мовлення нечітке, як результат — текст із незрозумілими словами та розривами.
- Працює тільки з якісним відео та аудіо. Якщо мовлення складно розібрати, автоматичне налаштування субтитрів не спрацює.
Google Перекладач
Google Перекладач — сервіс перекладу з однієї мови на іншу. Тут ви можете надиктувати матеріал, трансформувати записану мову в текст і перекласти його обраною мовою. Або увімкнути відео або аудіо на ПК або в сусідній вкладці та дати сервісу записати мову.
Особливості:
- Сервіс може записати мову та перекласти її.
- Максимальний обсяг тексту — 5000 символів.
Плюси:
- Безплатний інструмент.
- Простий інтерфейс.
Мінуси:
- Переклад може бути некоректним.
- Розпізнавання слів не завжди відповідає дійсності.
SpeechText.AI
SpeechText.AI — програма перетворення аудіо в текст і транскрібаціі аудіофайлів із заявленою точністю 96 %.
Особливості:
- Безплатно можна розшифрувати до 10 хвилин запису розміром до 60 мб, далі послуга платна. Мінімальний тариф коштує 10 доларів і містить 180 хвилин розпізнавання.
- Програма намагається розставляти розділові знаки й ділити текст на абзаци — хоча й не завжди успішно.
Плюси:
- Висока точність і позитивні відгуки користувачів.
Мінуси:
- Програма платна.
Розширення для браузера
Нижче наведено список розширень для браузера, які допоможуть вам працювати з транскрибацією в будь-який час.
VoiceIn
VoiceIn — розширення створене на основі розпізнавання мови від Google. Можна використовувати розшифрування на будь-якому сайті й водночас працювати в будь-якому редакторі. Є пробна версія із мінімальними можливостями. Передплата коштує 4 долари на місяць.
Після встановлення розширення розробник рекомендує закрити браузер і завантажити його знову, щоби розпізнавання мови спрацювало.
Особливості:
- Можна використовувати для диктування текстів для сайту, заповнення форм та щоби залишити коментар.
Плюси:
- Підтримує понад 120 мов.
Мінуси:
- Повний функціонал доступний у платній версії.
SpeechTexter
SpeechTexter — ще одне розширення на основі розпізнавання мови від Google, яке перетворює мовлення в текст. На відміну від попереднього — безплатне.
Особливості:
- Технологія підтримується браузером Chrome і деякими браузерами в ОС Android.
- Можна використовувати як онлайн-сервіс.
Плюси:
- Висока якість розпізнавання — заявлено 90 %.
- Можна встановити розширення, або користуватись онлайн-сервісом.
Мінуси:
- Не знайшли.
Застосунок для Android
Якщо ви багато переміщаєтесь, у пригоді може стати застосунок для смартфона, адже гаджет завжди під рукою.
Voice to text
Voice to text — це безкоштовний застосунок для розпізнавання мовлення в текст. Надає можливість створювати довгі записи, диктанти, есе, повідомлення, звіти тощо.
Особливості:
- Результатом можна поділитися в соцмережах або відправити поштою, зберегти на Google Диск у форматі.txt тощо.
- Немає обмежень на розмір/довжину створюваної нотатки.
Плюси:
- Працює досить коректно.
- Легко пишете короткі або довгі тексти.
- Автоматичне розміщення інтервалів.
- Автоматичне збереження.
- Можливість редагувати текст під час диктування.
Мінуси:
- Не знайшли.
За таким самим принципом працює й застосунок Speech to text. Це й не дивно, адже в них спільний розробник. Втім Voice to text вдвічі популярніший. У принципі, значної різниці між ними немає, але інтерфейс Voice to text нам сподобався трохи більше.
Порівняння сервісів для транскрибації
Для зручності пропонуємо вам таблицю, де ви наочно можете порівняти сервіси для транскрибації.
Назва | Особливість | Український інтерфейс | Вартість |
Google Docs | онлайн-сервіс, є застосунок | + | безплатно |
Dictation.io | онлайн-сервіс | — | |
oTranscribe | онлайн-сервіс | + | безплатно |
Transcribe by Wreally | онлайн-сервіс | — | від 20 доларів на рік Є тестовий період 7 днів |
Субтитри YouTube | онлайн-сервіс | + | безплатно |
Google Перекладач | онлайн-сервіс, є застосунок | + | безплатно |
SpeechText.AI | онлайн-сервіс | + | безплатно можна розшифрувати до 10 хвилин запису. Далі тарифи від від 10 доларів |
VoiceIn | розширення для браузера | — | платний тариф із розширеним функціоналом коштує 4 долари на місяць |
SpeechTexter | розширення для браузера або онлайн-сервіс | + | безплатно |
Voice to text | застосунок для Android | — | безплатно |
Висновок
У цій статті ми розглянули програми для транскрибації — дізналися їхні особливості, переваги та недоліки. Ви можете використовувати не тільки готові сервіси, у яких люди або штучний інтелект розшифровуватимуть файли, але й самостійно зайнятися транскрибацією аудіо та відео.
Рекомендації щодо роботи з розшифровкою:
- Чим менша швидкість відтворення звуку, тим менше помилок у результаті транскрибації.
- Якщо ви набираєте текст вручну, дійте за такою схемою: прослухали запис — поставили на паузу — записали та відредагували.
- Використовуйте гарячі клавіші для роботи із шаблонами. Якщо у вас часто повторюється те саме слово — використовуйте клавішу замість того, щоби наново його набирати.
- Усі редагування та коригування робіть наприкінці, коли вже розшифрували весь текст.
- Якщо у вас є високоякісне відео або аудіо — використовуйте автоматичні інструменти.
- У разі, коли на записі є шуми, а сам звук поганої якості — спробуйте самостійне розшифрування або довіртеся професіоналам.
А щоби відстежувати потреби клієнтів та підтримувати з ними зв’язок у будь-який час доби, реєструйтесь у сервісі SendPulse та підключайте наші інструменти: використовуйте CRM та конструктор лендингів, відправляйте email, Viber та SMS розсилки, а також підключайте чат-боти у Telegram, Instagram, Facebook та WhatsApp! А також спробуйте нашу платформу для створення онлайн-курсів.