Vocx-Kolektado

Vocx-Kolektado de naturaj Esperanto-paroloj.

Por krei bonan Esperanto-lernilon, ni bezonas bon-kvalitan vocx-legan sistemon.
Ne ekzistas suficxe bon-kvalita Esperanto-vocx-lega sistemo por publika uzo.
Google translation provizas Esperanto-vocxon sed la vocxo estas robotika kaj tre acxa. (http://translate.google.com/)
Vocalware provizas suficxe taugxan Esperanto vocxon en la nomo de Ludoviko, sed gxi havas kelkajn ne-ignoreblajn erarojn. (https://www.vocalware.com/index/demo)
- Oni respondis, ke ili planas forigi la Esperanto-vocxon, cxar ili ne povas korekti tiujn erarojn.
Pola lingvo tre simil-sonas al Esperanto kaj uzante la parolion de pola lingvo, iu programisto (Martin Rue) disvolvigis belan Esperanto parolilon. https://parol.martinrue.com/ Suficxe bonas, sed pli-malpli 10 % da vortoj havas ia-specan akcenton de la pola, ne deziratan por internacia lernilo.

Baza datumo por krei auxtomatan vocx-legadon

Se ni havas suficxe multe da vocxlegan datumon, ni povos trejni komputilon pere de teknologio de Artefarita Inteligento.
Por tiu celo, ni devas kolekti bazan datumon por trejnado de la vocx-lega sistemo.
Baza datumo estas vocx-sona dosiero kun-ordigita de teksto.
Gxi devas esti tre mallonga kun nur unu frazeto. (1~10 sekundoj)
Post iom komplikaj procezoj de la bazaj datumoj, oni povas krei forman datumon por komputiloj, por uzi en la trejnado de la masxinoj.

Kiel krei datumojn?

Por kolektado de vocxoj, ni bezonas helpon de multaj homoj kolektivaj.
Helpanto mem elektu bonkvalitajn Esperanto-parolantojn el Youtubo-kanaloj laux sia propra jugxo.
Jen estas kelkaj bonkvalitaj Youtubo-kanaloj:
- Esperanto Variety Show: https://www.youtube.com/channel/UCXnT_KZNsQw-MX8Q8gJQDgw
- Evildea: https://www.youtube.com/user/Evildela
- Fingtam Esperanto : https://www.youtube.com/channel/UC21NBss-ioqoDpvZsKl5niw
Elsxutu la vocxojn el la videoj kaj konvertu gxin al auxdio-dosiero (.mp3).
Elektu plej-bonsonan parton/frazon (1~10 sekundoj) el la auxido kaj konservu gxin en tauxga formo. (Eltondu frazojn)
Taugxa formo estas jenaj:
- Eltondita datumo estu konservata en .mp3 formato.
- Gxi estu en 1~5 sekundoj longa.
- Gxi enhavu nur klaran Esperanto-parolon, sen bruo.
- La titolo de la konservita dosiero estu la teksto, kiu estas parolata en la sono.

Kiom multe ni bezonas por krei bonkvalitan vocx-legan sistemon?

Temas pri trejnado de komputiloj uzante ekzemploj, kaj do ju pli multe des pli bona.
Por la angla vocx-legado, oni uzis 13,000 vocx-legan dosieron de 1~10 sekundoj, legataj de diversaj homoj. (https://keithito.com/LJ-Speech-Dataset/)
Por Esperanto, ni bezonus almenaux 2,500 vocx-legajn dosierojn, en simila formo.

Procezo de datum-kreado

Unue elsxutu youtube-sonon en .mp3 formato, uzante jenan retejon.
- https://y2mate.com/kr/youtube-to-mp3
- Elektu mallongan enhavon, plejbona estus 1 minutoj longa.
- 10 minuto-longa estas tro longa por kapti sonon, cxar ni bezonas 1~10 sekundaj partoj.
- Se vi elektis pli ol 1 minuto, vi unue trancxu gxin en partoj de 1 minut-longaj.
Plej simpla kaj tauxga ilo, por tondi kaj trancxi la sonon, estas WavePad, instalata sur via komputilo.
Se vi ne volas instali softvaron, vi povas tondi/trancxi la son-dosieron pere de cxi tiuj retejoj.
- Audio Trimmer: https://audiotrimmer.com/
- Jen la procezo:
  - (1) alsxutu (upload) vian .mp3 dosieron,
  - kaj (2) elektu kiun parton vi volas eltondi,
  - kaj (3) kaj elsxutu (download) la tonditan parton.
  - La titolo de la dosiero estu la teksto parolata.
- Grave estas, ke la titolo de la dosiero estu la teksto parolata.

Ekzemploj de la datum-dosieroj

Datum-kolekta dosierujo
- http://bit.ly/2yRWrUE (Malfermita. Cxiuj povas aldoni novan dosierujon, kaj dosieron)
  - Dosieruja strukturo : Parolo / Via-Nomo / Esperanto-Rekordo /
  - ekz. ) Parolo/Nomota/Esperanto-Rekordo/
  - Se vi volas kontribui, unue kreu vian propran dosierujon, kaj aldonu viajn dosierojn al via dosierujo.
Jen estas ekzempla son-dosiero elsxutita el Youtubo/Evildea kanalo.
- Origina enhavo, 6MB, 6.4 minuta: https://drive.google.com/open?id=1wnItgMc2B1JLL9jkdgGGuUSfL9ehn7eO
  - Elprenita de Evildea kanalo. Evildea estas la plej rapida parolanto.
  - Ses minuto estas tro longa por eltrancxi frazetojn
- Unua sesono 1 MB, 1 minuta: https://drive.google.com/open?id=1upHYJMh7ubjbaLNuNtFfxKXFF4E_CmRj
- Dua sesono 1 MB, 1 minuta: https://drive.google.com/open?id=1CSmaBViMDXVNKgW1hR5iJvtw-oarWwiK
- Tria sesono 1 MB, 1 minuta: https://drive.google.com/open?id=137aNAUuV_5yDHi3dVXhI4dtHFgpPGa3C
- Kvara sesono 1 MB, 1 minuta: https://drive.google.com/open?id=19QYxUESoNqfjyWc0nbVVvBKbQlGLsM8L
- Kvina sesono 1 MB, 1 minuta: https://drive.google.com/open?id=122ZGUBQBTlCD0wOX8GjZPL3OKCKhVIvR
- Sesa sesono 1 MB, 1 minuta: https://drive.google.com/open?id=18k_UauVF6A9RbAevTN3FO-9fJC5arMiL
Jen estas kelkaj ekzemploj de la baza datumo bon-orde kreita (eltrancxita).
- Cxiuj cxi subaj frazetoj estis eltrancxita el la "Unua sesono" supra.
- "simple pro tio ke multaj iras al la domo de alia esperantisto.mp3"
  - https://drive.google.com/open?id=1EsgreHSEXlSRih5Px1fNFUqw4egTEUrL
- "sed la programo lernejo eltrovis manieron.mp3"
  - https://drive.google.com/open?id=1r9EcmxzPj-1-LbFPXgczgs9uUOCpKrOF
- "sed ankaux mi devas studi cxi nokte cxar en la sekvanta semajno mi havos teston.mp3"
  - https://drive.google.com/open?id=1sGJbhFI3UBYQTqimaM4UPeAqRp_xIHAd
- "saluton al cxiuj.mp3"
  - https://drive.google.com/open?id=1jH7Sk1FLKAvemkrvfQLkDx9nguSAEoSY
- "por partopreni en festo.mp3"
  - https://drive.google.com/open?id=1RboMcWCzJxbtB-Fx1RCUz6PSSBN4m1J0
- "nun mi volas montri al vi ion kion Dima havas.mp3"
  - https://drive.google.com/open?id=1KU_HkYbPZGThlnSuSFghvKMxnyxiBeuw
- "ne tiom multe da esperantistoj hodiaux cxeestos la eventon.mp3"
  - https://drive.google.com/open?id=1UiWj1cndZSCQ9lDX-oK6e_POQYiKNioH
- "mi ne povas iri pro pluraj kialoj.mp3"
  - https://drive.google.com/open?id=1hFpY0RQ_M_kaJFiFiZlcC7bezyjhtgoe
- "hodiaux sabate kaj mi estas en la esperanto-domo.mp3"
  - https://drive.google.com/open?id=1lj9fFB4PRJ8931Jvap4RueloglSX1-iL
- "ekzamenon de mia kapablo pri programado.mp3"
  - https://drive.google.com/open?id=15vxThTzq6Cx3iYFMK0yCQr1I-29FPa84
- "donu al mi vian pasporton.mp3"
  - https://drive.google.com/open?id=1NLvAXpkXxtxmH7tCJhcfHEek9VCFk7It
- "do kiam mi unue komencis studi programadon mi ecx ne pensis tio eblus.mp3"
  - https://drive.google.com/open?id=1txVpqpIEupNYYKRgh8YKsCkQ8jS9G8Kz

Kion ni faros post la datumo kolektado?

Unua kolekto da datumoj havos multe da eraroj, cxar ili estas kolektitaj de multaj ne teknologiaj homoj. Kaj do ni devos unue korekti la datumojn kaj rafini la bazan kvaliton de la datumoj.
Ni simple konvertos cxiun MP3 dosierojn en alia plej kruda formo.
Ni utiligos jamekzistantan softvaron.
- https://github.com/r9y9/wavenet_vocoder

La projekt plano?

La projekto estos vere long-dauxra.
Vocx-kolektado estos pli ol 6 monatoj
Korektado kaj konvertado de la vocxoj al teknikaj krudaj formoj bezonos alian 6 monatojn
Kaj do gxi estus pli mal-pli 1 jara projekto.
Antauxvidas, ke la rezulto estu publikigita en aug. 2020.

Google Sites

Report abuse