Piezīmes par WordPress 5.6. un 5.7. tulkošanu

WordPress vēsturē, jau 2014. gadā lokalizējumu lejupielādes pārsniedza netulkotās versijas lejupielādes. 2021. gada 22. martā lejupielāžu skaitītājs ( versijai 5.7.) rādīja, ka uz apmēram 9 miljoniem netulkotās versijas lejupielāžu ir gandrīz 28 miljoni lokalizējumu lejupielādes dažādās “neangļu” valodās.

Dažu nedēļu laikā pēc iepriekšējās, 5.6. versijas pilna lokalizējuma pabeigšanas lejupielāžu skaitītājs uzrādīja attēlā redzamos skaitļus.

Skaits 9. marta rītā

Pirmo reizi apjomīgai WordPress kodola tekstu tulkošanai iznāca pievērsties tālajā 2016. gadā, kad radās vajadzība pēc pilnībā lokalizētas WP 4.6 versijas. Tās reizes problēmas īsumā aprakstīju šeit. Dīvainas sagadīšanās pēc, tieši pēc desmit WP versijām atkal tulkoju kodola failus.

Ja salīdzina 2016. gada tulkošanas iespējas un pieejamos resursus ar 2021. gadu, var sacīt ka aizvadītajos gados situācija ir nedaudz mainījusies:

  • WordPress tulkotāju komandā var redzēt vairākus kā 160 dalībnieku (Par WordPress >> Dalībnieki), 2016. gadā bija varbūt, daži desmiti, diemžēl vairums no jaunpienācējiem nav īpaši aktīvi WP kodola tulkošanā,
  • “dzimtais” tulkošanas rīks GlotPress ir izaudzis līdz līmenim, kurā to jau ir iespējams izmanto lielāka apjoma tulkojumiem, kā arī aplūkot katram CAT rīkam būtisko tulkojumu konsekvenci
  • ir pamanāmi uzlabojies Google mašīntulkojums (izskatās, ka Google tulkošanas mākslīgais intelekts WordPress lokalizācijas pieņem kā visai ticamu avotu), tomēr tas joprojām konsekventi tulko bloku kā bloķēšanu, terminu kā termiņu un tamlīdzīgi,
  • pavisam nedaudz uzlabojusies situācija latviešu valodas interneta resursu jomā, kurus man ātrumā izdevās atrast:
    • https://termini.gov.lv/
    • https://www.valodaskonsultacijas.lv/
  • nedaudz auguši arī citi lokalizēšanai svarīgi resursi
    • https://lv.glosbe.com/en/lv/
    • https://www.eurotermbank.com/search/
    • http://dictionary.sensagent.com/

Bet viena lieta joprojām ir un, diemžēl, paliek nemainīga – tie ir daudzi baltie plankumi terminoloģijas lauciņā.

Strādājot ar tekstiem, vienlaikus rakstīt piezīmes ir ļoti neērti, tomēr nepieciešami. Tas ļauj izsekot dažu lēmumu pieņemšanas procesam un atvieglo sekojošo kļūdu labošanu. Bet kļūdas, diemžēl, ir pastāvīgi šī procesa līdzdalībnieki vairāku iemeslu dēļ. Pirmkārt, tulkojuma apskatīšana programmā, kamēr nav sasniegts noteikts iztulkoto virkņu skaits no kopējā, ir ļoti laikietilpīga un es to nelietoju. Otrkārt, no jauna tulkotās virknes “jāintegrē” jau esošajā tulkojumā, kas arī nav vienkārši apskatāms kamēr nav pabeigts viss tulkojums. Treškārt, programmētāju sniegtie skaidrojumi, par to, kas ir tulkojamā virkne ir reti un skopi un to meklēšana arī prasa laiku.

Nedaudz WP versiju statistikas

Tulkojamo virkņu skaits 5.6 versijā pret 4.6 versiju ir pieaudzis gandrīz par 40%. Būtiski ir audzis arī vārdu skaits virknēs. Ja abos galvenajos failos kodols (Development) un Admin WP 4.6. versijā bija 29 596 vārdu, tad WP 5.7. versijas failos vārdu skaits ir gandrīz dubultojies – 53 935.

Tabulā vienkopus redzamas tulkotās WP versijas, četri tulkojamie masīvi un lokalizējamo virkņu skaits katrā no tiem. (Faili valstis un tīkls praktiski vairs papildināti netiek.)

FailiTeksta virknes
4.6. x5.4.x5.5.x5.6.x5.7.x
Development18983833406041484293
Administration24162994325533123367
Tīkls316315322318319
Valstis, pilsētas519524524524524
Virknes kopā:51497666816183028503
Virkņu skaita salīdzinājums WordPress versijās

WordPress versijas 5.7 lokalizējumā salīdzinot ar 5.6. klāt nāca vēl aptuveni 200 virknes

Labais stils WP lokalizācijā prasa lai iztulkotas būtu gan aktuālā, gan divas iepriekšējās versijas, tāpēc savedu kārtībā arī versijas 5.4. un 5.5. Tur gan ar tulkošanu nebija īpaši jānopūlas, jo jaunākās versijas visumā iekļauj arī senāko versiju tekstus un tad nepieciešams vien importēt jaunākās versijas tulkojumus un veikt nelielu skaitu redakcionālu labojumu.

Marta sākumā iztulkoju Twenty Twenty tēmu no 0 līdz 144 virknēm, kā arī trūkstošās virknes visām pārējām aktuālajām noklusējuma tēmām, tāpēc, ka jaunākās trīs vai četras no tām vienmēr tiek iekļautas pirmajā WordPress lejupielādē.

Sākot tulkot 5.6. versiju izveidoju glosāriju, kuru tulkojot regulāri papildināju ar vārdiem, kuru tulkojumā līdz šim bija trūcis konsekvences un vārdiem, kuriem vispār nebija atrodams tulkojums, vai arī tulkojumi bija izplūduši – ļoti atšķirīgi dažādos avotos.

Pašlaik glosārijā ir 320 vārdu ar atsevišķiem skaidrojumiem, bet, iespējams ka vajadzētu pievienot vēl kādu simtu, lai tulkotāju skaitam pieaugot, lielākā mērā uzturētu tulkojumu konsekvenci.

Tulkošanas grūtības

Viens no neplānotiem sarežģījumiem uzradās tūdaļ pēc tam kad biju iztulkojis 5.6. versiju, apskatījis to “dabā” un sāku labot acīm redzamās nepilnības un kļūdas. Tā kā citā cilnē bija atvērts lejupielāžu skaitītājs, tad tajā, apmēram 10 min. pēc katra kaut cik garāka labojuma sāka ņirbēt lv lokalizācijas lejupielādes skaitītājs. Sapratu, ka katrs labojums tiek uzrādīts kā atjaunojama lokalizācija. Labošanu nācās pārtraukt, lai lieki neapgrūtinātu lokalizācijas lietotājus. Burtiski dažas dienas vēlāk parādījās versijas 5.7-RC3, kurai bija pieejamas atsevišķs nodalījums — 5.7.x, kur tad varēju veikt labojumus un tulkot klāt nākušās aptuveni 200 virknes.

Atsevišķi vārdi WordPress latviskajās lokalizācijās līdz šim ir sagādājuši nopietnas grūtības, sevišķi spraudņu un tēmu tulkojumos. Un tas ir saprotams, jo:

  • šajos tulkojumos ir piedalījušies lielāks skaits tulkotāju
  • daudzi no šiem tulkojumiem ir iesākti un pamesti, nesasniedzot to tulkojuma pakāpi, kad lokalizācija tiek iekļauta konkrētās tēmas vai spraudņa pakotnē un tulkotājam ir iespējams ieraudzīt sava darba rezultātu

Joprojām pastāv viena un tā paša termina divi, trīs un vairāk tulkojumi. Piemēram: vārds display ticis tulkots

  • 55 x kā attēlot
  • 9 x kā attēlojums
  • 3 x kā parādīt

Vārds title — virsraksts vai nosaukums? Nosaukums (Title) varētu būt grāmatas nosaukums. Virsraksts (Heading) varētu būt nodaļas nosaukums. Tātad Title ir nosaukums bet tas tiek tulkots kā:

  • Virsraksts (489 reizes)
  • Nosaukums (9 reizes)

Arī tik sen lietots vārds kā login ir ar vairākiem tulkojumiem, no kuriem neviens nav Pieteikties, kā redzams Latvijas Nacionālajā terminoloģijas portālā. Tas ticis tulkots kā:

  • Logins (67 reizes)
  • Pieslēgties (6 reizes)
  • Ielogoties (2 reizes)

Šis neprecīzo, neatbilstošo un arī pilnīgi aplami tulkoto vārdu un teicienu saraksts ir garš, lai arī šodien katram tulkotājam ir iespēja ielūkoties avota failā, kur dažkārt ir atrodams koda autora komentārs vai arī no konteksta ir iespējams saprast, kāds būtu attiecīgā vārda pareizais tulkojums.

Atsauču saites

Visas Pastāvīgas saites tika pārdēvētas par Paliekošajām saitēm. Vairs neatceros, kāpēc 2016. gada tulkojumā priekšroku devu pastāvīgajām saitēm, bet šoreiz bija vairāki apsvērumi par labu paliekošajām:

  • Permalink, acīm redzot, nāk no Permanent Link un Permanent ir paliekošs
  • Pastāvīgs ir ļoti tuvu patstāvīgam – vārdam ar citu nozīmi
  • Galvenais arguments bija citāts no WordPress kodeksa:
    “Paliekošā saites ir pastāvīgi URL uz atsevišķām lapām un emuāra ziņām, kā arī uz kategorijām un arhīviem. Paliekošā saites ir Web adrese, ko izmanto, lai izveidotu saiti uz jūsu saturu. URL uz katru ziņu ir jābūt paliekošam — nekad nav jāmainās, tāpēc arī nosaukums ir paliekošā saite.”

Kopumā pēc tulkojuma pabeigšanās tika veikti vairāki simti redakcionālu labojumu, diemžēl, Glotpress tulkošanas rīkam nav atrast un aizstāt funkcijas, tāpēc šādi labojumi prasa nesamērīgi daudz laika.

Tā gadās…

Kādam no tulkotājiem bija nejauši gadījies vārdu Cover iztulkot kā darbības vārdu un atverot bloku pārvaldnieku ieraudzīju negaidītu Vāka bloka nosaukumu:

Vāka bloks

Citā vietā uz rindkopas bloka priekšskata greznojās šāds uzraksts:

Rindkopas bloks

Klasisku tekstu (šai gadījumā Servantesa Dons Kihots) tulkošanai Google, vēl arvien, nav izmantojams 🙂
Salīdzinājumam Mirdzas Ķempes tulkojumā (no spāņu valodas), šis teikums skan šādi:
“Kādā Lamančas ciematā, kura vārdu man nav patikas atcerēties, vēl nesen dzīvoja viens no tiem idalgo, kura mantība ir dzimtas šķēps, senlaicīgs vairogs, izdilis kleperis un medību suns.”

Latviskās lokalizācijas lapā Par WordPress redzams sekojoša galvene:

Kamēr pats Mets Mullenvēgs versijas pieteikumā WordPress.org ielicis nedaudz savādāku attēlu un nosaukumu:

Jāpiebilst, ka Esperanzas Spaldingas vārds 5.7. tulkojamajos failos nebija pieminēts…

Un nobeigumā labā ziņa: ar 5.6/5.7 tulkojumu mēs šobrīd baškīru, zulu, havajiešu un vēl 39 citas valodas apsteidzam par 100%!

Atbildēt