Vocx-Kolektado

Vocx-Kolektado de naturaj Esperanto-paroloj.

  • Por krei bonan Esperanto-lernilon, ni bezonas bon-kvalitan vocx-legan sistemon.
  • Ne ekzistas suficxe bon-kvalita Esperanto-vocx-lega sistemo por publika uzo.
  • Google translation provizas Esperanto-vocxon sed la vocxo estas robotika kaj tre acxa. (http://translate.google.com/)
  • Vocalware provizas suficxe taugxan Esperanto vocxon en la nomo de Ludoviko, sed gxi havas kelkajn ne-ignoreblajn erarojn. (https://www.vocalware.com/index/demo)
    • Oni respondis, ke ili planas forigi la Esperanto-vocxon, cxar ili ne povas korekti tiujn erarojn.
  • Pola lingvo tre simil-sonas al Esperanto kaj uzante la parolion de pola lingvo, iu programisto (Martin Rue) disvolvigis belan Esperanto parolilon. https://parol.martinrue.com/ Suficxe bonas, sed pli-malpli 10 % da vortoj havas ia-specan akcenton de la pola, ne deziratan por internacia lernilo.

Baza datumo por krei auxtomatan vocx-legadon

  • Se ni havas suficxe multe da vocxlegan datumon, ni povos trejni komputilon pere de teknologio de Artefarita Inteligento.
  • Por tiu celo, ni devas kolekti bazan datumon por trejnado de la vocx-lega sistemo.
  • Baza datumo estas vocx-sona dosiero kun-ordigita de teksto.
  • Gxi devas esti tre mallonga kun nur unu frazeto. (1~10 sekundoj)
  • Post iom komplikaj procezoj de la bazaj datumoj, oni povas krei forman datumon por komputiloj, por uzi en la trejnado de la masxinoj.

Kiel krei datumojn?

  • Por kolektado de vocxoj, ni bezonas helpon de multaj homoj kolektivaj.
  • Helpanto mem elektu bonkvalitajn Esperanto-parolantojn el Youtubo-kanaloj laux sia propra jugxo.
  • Jen estas kelkaj bonkvalitaj Youtubo-kanaloj:
  • Elsxutu la vocxojn el la videoj kaj konvertu gxin al auxdio-dosiero (.mp3).
  • Elektu plej-bonsonan parton/frazon (1~10 sekundoj) el la auxido kaj konservu gxin en tauxga formo. (Eltondu frazojn)
  • Taugxa formo estas jenaj:
    • Eltondita datumo estu konservata en .mp3 formato.
    • Gxi estu en 1~5 sekundoj longa.
    • Gxi enhavu nur klaran Esperanto-parolon, sen bruo.
    • La titolo de la konservita dosiero estu la teksto, kiu estas parolata en la sono.

Kiom multe ni bezonas por krei bonkvalitan vocx-legan sistemon?

  • Temas pri trejnado de komputiloj uzante ekzemploj, kaj do ju pli multe des pli bona.
  • Por la angla vocx-legado, oni uzis 13,000 vocx-legan dosieron de 1~10 sekundoj, legataj de diversaj homoj. (https://keithito.com/LJ-Speech-Dataset/)
  • Por Esperanto, ni bezonus almenaux 2,500 vocx-legajn dosierojn, en simila formo.

Procezo de datum-kreado

  • Unue elsxutu youtube-sonon en .mp3 formato, uzante jenan retejon.
    • https://y2mate.com/kr/youtube-to-mp3
    • Elektu mallongan enhavon, plejbona estus 1 minutoj longa.
    • 10 minuto-longa estas tro longa por kapti sonon, cxar ni bezonas 1~10 sekundaj partoj.
    • Se vi elektis pli ol 1 minuto, vi unue trancxu gxin en partoj de 1 minut-longaj.
  • Plej simpla kaj tauxga ilo, por tondi kaj trancxi la sonon, estas WavePad, instalata sur via komputilo.
  • Se vi ne volas instali softvaron, vi povas tondi/trancxi la son-dosieron pere de cxi tiuj retejoj.
    • Audio Trimmer: https://audiotrimmer.com/
    • Jen la procezo:
      • (1) alsxutu (upload) vian .mp3 dosieron,
      • kaj (2) elektu kiun parton vi volas eltondi,
      • kaj (3) kaj elsxutu (download) la tonditan parton.
      • La titolo de la dosiero estu la teksto parolata.
    • Grave estas, ke la titolo de la dosiero estu la teksto parolata.

Ekzemploj de la datum-dosieroj

Kion ni faros post la datumo kolektado?

  • Unua kolekto da datumoj havos multe da eraroj, cxar ili estas kolektitaj de multaj ne teknologiaj homoj. Kaj do ni devos unue korekti la datumojn kaj rafini la bazan kvaliton de la datumoj.
  • Ni simple konvertos cxiun MP3 dosierojn en alia plej kruda formo.
  • Ni utiligos jamekzistantan softvaron.

La projekt plano?

  • La projekto estos vere long-dauxra.
  • Vocx-kolektado estos pli ol 6 monatoj
  • Korektado kaj konvertado de la vocxoj al teknikaj krudaj formoj bezonos alian 6 monatojn
  • Kaj do gxi estus pli mal-pli 1 jara projekto.
  • Antauxvidas, ke la rezulto estu publikigita en aug. 2020.