Костадин Колев: Balabolka: Разделяне на книги на по-малки части и конвертирането им в аудио файлове

Програмата за четене на книги посредством TTS (Text-To-Speech) – Balabolka – има доста полезни функции. Една от тях е възможността даден голям текстов файл (в повечето случаи – книга) да бъде разделен на части, и тези части да бъдат директно съхранени в аудио файлове (wav, mp3, wma, ogg, и др.). В това ръководство ще ви опиша начина, по който се извършва тази процедура.

И така, следвайте стъпките:

Отворете Balabolka.
Натиснете CTRL+O, за да извикате прозореца за отваряне на файл. В този прозорец навигирайте до книгата, която искате да разделите на части и съхраните в аудио файл и след като маркирате файла, натиснете Enter върху него, за да го заредите в Balabolka.
Уверете се, че сте задали правилно следните параметри:

Глас, с който искате да ви бъде прочетена книгата. Изборът на гласа може да стане от меню „Глас“ -> подменю „Глас“, или от панела за настройка на гласа (който се скрива и показва от меню Изглед -> подменю „Показвай“ и натискане на Enter върху „Настройка на гласа“, или чрез натискане на клавиша F10).
Параметри на гласа (скорост, височина на тона и сила на звука). Тези настройки са най-лесно достижими от панела за настройка на гласа. Първият от плъзгачите е за скоростта на гласа, вторият – за височината на тона му, а третият – за силата на звука. Плъзгачите в раздела за SAPI4 са само два, като липсва този за сила на звука - явно SAPI4 поддържа контрол на височината на гласа, но не и на силата на звука.
Настройки на изходния аудио файл. Прозорецът за настройване на параметрите на изходния аудио файл се извиква най-лесно с клавишната комбинация SHIFT+F5. Първият разгъващ се списък определя звуковите параметри на изходния аудио файл (звукова честота, битове използвани за кодирането и брой звукови канали) – най-подходящата настройка за SpeechLab (гласа „Гергана“) е 48kHz, 16bit, Mono. За препоръчване е обаче да се избере стойността „По подразбиране за гласа„, освен ако някоя от другите стойности не работи по-добре за избрания глас. После има едно поле за отметка, което ако е отметнато, ще принуди избрания глас да използва избраните по-горе звукови параметри не само за експортиране в аудио файл, но и при четене на глас. Следват няколко раздела, в които ще намерите настройките специфични за поддържаните от Balabolka компресирани аудио формати (mp3, wma, ogg и др.) – wave аудио форматът (.wav) има нужда само от параметрите от разгъващия се списък от по-горе (звукова честота, битово кодиране и брой канали).

След като сте задали описаните по-горе настройки, натиснете CTRL+F8, за да извикате прозореца за разцепване и конвертиране в аудио файлове. Тук има следните опции:

„Изходяща файлова папка“ – в това поле трябва да въведете пълния път към папката, в която ще се съхранят експортираните аудио файлове. Можете да активирате бутона „Преглед“, за да изберете вече съществуваща папка от Windows Explorer.
„Формат на аудио файла“ – от този комбобокс избирате формата на изходния аудио файл. Засега имате възможност за избор между некомпресиран wave (.wav) файл или компресиран mp3, ogg, wma, mp4, m4a, m4b или awb файл.
„Създай подпапка„ – ако в това поле има отметка, изходните аудио файлове ще бъдат съхранени в автоматично създадена за целта подпапка.
Група от няколко контроли, свързани с именуването на изходните файлове:

Два радио бутона, чрез които се определя дали ще се използва стандартен шаблон за именуване (с име на документа и последователен номер) или шаблон по избор, като във втория случай може да се използват и променливи като „Number„ за последователен номер, „FileName„ за име на файла, „FirstLine„ за първи ред от раздела, както и думи и други знаци.
Две текстови полета за задаване на името на изходния файл, като във всеки един момент активно ще е само едно от тях, в зависимост от това кой от двата радио бутона от по-горе е избран.

„Число от което да започне номерирането на изходните файлове“ – тук посочвате от кое число да започне номерирането на изходните файлове. По подразбиране е зададена стойност „1“. Към момента на писане/обновяване на статията обаче, има проблем с обхождането на контролите в този прозорец и въпросното цифрово поле е чак след бутона „Затвори„ в TAB подредбата или преди „Изходяща файлова папка„ ако се обхожда с Shift+TAB.
После попадате на една група от два радиобутона с маркировка „Именуване на изходните файлове“. Единият от тези два радиобутона указва на Balabolka да поставя последователния номер на аудио файла след основното му име, а другият – преди него.
Следва една група от полета за отметка, с маркировка „Критерии при разцепването“. Тези опции определят критериите, с които ще се съобразява Balabolka, при разцепването (разделянето на части) на нашата книга. Надписите на тези опции са достатъчно ясни и не смятам да се спирам на това за какво точно служи всяка една от тях.
Следва едно поле с надпис "Размер на текстовия блок" - в това поле трябва да се зададе размера на изходния текстов блок (в килобайти) на който ще се базира създаването на отделните аудио файлове. Това поле е активно само когато е включен критерия "по размера на текстовия блок" в раздела с критериите за разцепване.
После е полето за въвеждане на текстови низове. То ще бъде активно, само ако сме включили опцията с текст „по зададени низове във входния текст“.
Следва опцията „Раздели текста при ключовата дума и премахни ключовата дума от текста„, която е свързана с разделянето по ключови думи и сама за себе си обяснява какво прави.
После следва един бутон с надпис „Прочитай номера на раздела“. Активирането му извиква друг прозорец, в който можем да зададем опции, които да накарат речевия синтезатор да прочита номера на раздела на поредния аудио файл в началото и/или в края му.
Следва бутонът „Тествай“. При активирането му излиза диалогов прозорец, в който пише приблизителния брой на изходните аудио файлове, след задаването на критериите за разцепване.
После е бутонът „Разцепване и конвертиране“. При активирането му излиза друг прозорец, в който има списък с точките на разцепване и всяка една от тях има поле за отметка. Ако полето е с отметка, то книгата ще бъде разделена в тази точка. Ако в полето няма отметка, то книгата няма да бъде разделяна в тази точка. Отметката в първото поле не може да бъде премахната – доколкото схващам – този елемент показва началото на книгата.

А ако желаем просто да разделим книгата на отделни части, но без да я конвертираме в аудио файлове, задействаме бутона „Разцепи„ в прозореца „Разцепи текста и конвертирай в аудио файлове„ (намиращ се след бутона „Разцепи и конвертирай„). Появява се прозорец, подобен на „Резултати от търсенето„ за разцепване и конвертиране. Разликата е, че при този само за разцепване на файла, има и разгъващ се списък за избор на кодировката на изходния текст. Там се задейства бутона „Раздели„. Програмата разделя файла на части по зададените критерии и ги запазва в посочената в прозореца „Разцепи текста и конвертирай в аудио файлове„ папка.
След като в прозореца със списъка с точките на разцепване сме определили къде ще бъде разделяна книгата и къде не, натискаме бутона „Разделяне“, за да започне самата процедура по разделянето на части и конвертирането им в аудио файлове. И после не ни остава нищо друго, освен да чакаме да завърши процедурата.
А ако желаем просто да разделим книгата на отделни части, но без да я конвертираме в аудио файлове, задействаме бутона „Разцепи„ в прозореца „Разцепи текста и конвертирай в аудио файлове„ (намиращ се след бутона „Разцепи и конвертирай„). Появява се прозорец, подобен на „Резултати от търсенето„ за разцепване и конвертиране. Разликата е, че при този само за разцепване на файла, има и разгъващ се списък за избор на кодировката на изходния текст. Там се задейства бутона „Раздели„. Програмата разделя файла на части по зададените критерии и ги запазва в посочената в прозореца „Разцепи текста и конвертирай в аудио файлове„ папка.

Пояснения:

Моето мнение е, че една книга би трябвало (дори само с цел удобство) да се разделя по критерий за начало на следващата глава. Така според мен е по-смислено и по-удобно. В настройките за разцепване и конвертиране има няколко опции, които могат да ви улеснят при извършване на разцепване по този критерий. Ако името на главата е с главни букви, можете да посочите на Balabolka да цепи файла при наличието на ред само с главни букви. По-точно е разделянето обаче (поне в повечето случаи) ако за критерий използваме намиращи се в текста низове (примерно „ГЛАВА“, с главни букви. А ако искате – можете с функцията за търсене в документа (активираща се с CTRL+F) да си намерите сами къде започва всяка нова глава, и на всяко такова място да си сложите по един именуван показалец (това става с CTRL+F3). И след това в прозореца за разцепване и конвертиране да укажете на Balabolka да разделя файла базирайки се на именуваните показалци – така книгата ви ще бъде разцепена по глави, ако сте поставили именуваните показалци на точните места.
32-битовия вариант на SAPI стандарта има ограничение, което не позволява експортиране в аудио файл, надвишаващ 4GB. Аз от личен опит установих, че дори да е под 4GB (3.8GB примерно) изходния аудио файл, пак възникват проблеми. Затова съветът ми е: ако имате по-голяма книга, която искате да експортирате в аудио файл – разделете я на части преди експортирането (ползвайки описаната от мен в това ръководство функция). По принцип една книга експортирана в компресиран аудио файл (mp3, wma или ogg) трудно би достигнала 4GB големина, но SAPI стандартът е направен така, че текста първо трябва да се експортира в некомпресиран wave (.wav) файл, а после евентуално да се компресира. А един .wav файл би достигнал доста по-лесно 4GB размер, и това трябва да се има предвид.

Костадин Колев

Страници

сряда, 26 декември 2012 г.

Balabolka: Разделяне на книги на по-малки части и конвертирането им в аудио файлове

Страници

сряда, 26 декември 2012 г.

Balabolka: Разделяне на книги на по-малки части и конвертирането им в аудио файлове

сряда, 26 декември 2012 г.