Kaip verčiau šalių pavadinimus Wiki formato lentelėje

1 Comment

Yra wiki formato lentelė:

===Šalys===
{| cellspacing="0" style="border:2px solid #cEDFF2; -moz-border-radius: 5px -webkit-border-radius:5px;border-radius:5px; background:#CEDFF2; border-collapse:collapse; text-align:left;"
|-style="background-color: #d8ECFF; border-bottom: 1px solid #000000; height=27px"
! style="width:150px" |       <small>Šalis</small>
! style="width:200px" |       <small>IRC kanalas</small>
! style="width:280px" |       <small>Oficialus forumas</small>
|-style="background-color: #d8ECFF"
! [[Argentina]]
|'''#esim.arg''' @'' irc.Rizon.net''
! http://esimargentina.foroargentina.net//
|-style="background-color: #f5FAFF"
! [[Australia]]
|'''#simAus''' @'' irc.Rizon.net''
! http://www.esimaustralia.smfnew.com/
|-style="background-color: #d8ECFF"
! [[Belgium]]
|'''#e-sim.be''' @'' irc.Rizon.net''
! http://www.e-sim.be//
|-style="background-color: #f5FAFF"
|}

ir reikia išversti šalių pavadinimus, išverstas variantas turi atrodyt „[[Belgium | Belgija]]“, kadangi šalių daug, o aš linux naudotojas tai savaime aišku naudojau man suteiktus įrankius.
Šalių pavadinimus išverst sugeba ir google translate, vistiek visi pavadinimai kilmininko linksniu tai jokių bėdų. Pirmiausia reikia šalies pavadinimą padaryt išverstos eilutės formatu:

sed -i 's/! [[(.*)]]/! [[x1|1]]/g' countries.txt

vienu žodžiu paima „! [[Belgium]]“ ir padaro „! [[xBelgium | Belgium]]“. „x“ reikalingas tam jog google translate išverstų tik antrą žodį, pirmas turi likt angliškai. Kadangi google translate bando tekstą pataisyt, darydama prielaidą jog tai normalus tekstas tai šiuo atveju tekstą sugadina. Todėl į google translate neįklijuojam viso formatavimo, įklijuojam tik šalies dalį

! [[xArgentina | Argentina]]
|'''#esim.arg''' @'' irc.Rizon.net''
! http://esimargentina.foroargentina.net//
|-style="background-color: #f5FAFF"
! [[xAustralia | Australia]]
|'''#simAus''' @'' irc.Rizon.net''
! http://www.esimaustralia.smfnew.com/
|-style="background-color: #d8ECFF"
! [[xBelgium | xBelgium]]
|'''#e-sim.be''' @'' irc.Rizon.net''
! http://www.e-sim.be//
|-style="background-color: #f5FAFF"

google translate vistiek daug prigadina, bet tai nesunku pataisyt. Pakeičia „“’“ į „“ “, kai kur dingsta „[“, kai kur prideda tarpų, taip kaip jie būtų reikalingi sakiny.
Originale kanalo pavadinimas prasideda iš mažosios, po google pataisymo jis prasideda didžiąja, galim ir tai pataisyt:

sed 's/#(.)/L#1/' countries.txt

paima „#E-sim.LT“ ir paverčia „#e-sim.LT“ jei reik visas raides paverst mažosiom, tai po taško pridedam „*“

sed 's/#(.*)/L#1/' countries.txt

Reklama:
Šiaip nieko nereklamuoju, bet šiuo atveju už reklamą man kaip ir moka 🙂
E-Sim tai yra tikro pasaulio simuliacija. Galite tapti vienos iš 46 šalių piliečiu ir dalyvauti jos politiniame, kariniame, socialiniame ir ekonominiame gyvenime.

Jūsų pilietis gali tapti eiliniu kareiviu, kompanijos savininku ar tapti politiku ir bandyti tapti šalies prezidentu! Galite susikoncentruoti ties savo karjera arba padėti savo šaliai mūšiuose ir karuose. Galite sukurti savo privačią samdinių armiją arba plėsti verslą. Jūsų teisė rinktis!
Jei užsiregistruosite per mano ref nuorodą ir pasieksite 7 lygį, aš gausiu 5 aukso, jūs 2. Jei nenorit padėt man, padėkit bent sau, registracijos puslapyje, langelyje kur klausiam kas pakvietė įrašykit „admin“. Pasiekę 7 lygį gausite 2 aukso, o administratorius vistiek praktiškai nežaidžia tai ir jam gero nepadarysite 🙂

Darbas su SQLite duomenų baze(gtranslator vertimų atmintis)

1 Comment

Gtranslator vertimų atminty saugoja sqlite duomenų bazės faile. Senos(klaida ištaisyta kažkur tarp 2.90 ir 2.91.3) gtranslator versijos nesugebėdavo importuoti lietuviškų simbolių, juos pakeisdavo kažkokias panašiais bet tikrai ne lietuviškais(varnelės ir nosinės būdavo šone, o ne ten kur priklauso). Tokiem dalykam taisyt reikdavo paredaguot duomenų bazę, bet nieks nesako jog su dabartine gtranslator versija negali įvykt tokių ar panašių įvykių. Beto gali būt jog prireiks pataisyt kažkokį žodį ar šiaip.

Gtranslator vertimų atmintis saugoma: ~/.config/gtranslator/translation-memory.db

Darbui su sqlite naudoju „sqliteman“(išbandžiau daug, bet tik su šita sugebėjau padaryt tai ko reik)

1. Eksportuojam vertimus į .csv failą:
atidarom sqliteman, atveriam duomenų bazę, ten yra 4 lentelės. Reikalinga tik „trans“, ten saugomi lietuviški žodžiai(vertimas).

Pasirenkam „trans“->Context->Populate Table…->Dešinėj „Export Data“(šalia monalizos)->eksportuojam kaip csv failą(importuot atgal galima tik .csv ir .xml)
2. Pataisom:
atidarom su „libreoffice calc“, pataisom ką reikia. Išsaugant pakeičiam skirtuką į kitą simbolį(į tokį kurio nėra išverstam tekste) mano atveju „|“, jei nebus pakeista tai neišeis importuot.(nesupras formato, mes klaidas)
3. Importuojam atgal:
ištrinam seną lentelę: trans->drop table.
sukuriam tokia pat naują: Database->Create table->taip kaip paveiksliuke:

trans->Import table data…->parenkam skirtuką, mano atveju Custom: „|“
išsaugom Ctrl+S

„Utorrent“ vertimas

No Comments

Vat sugalvojau atnaujint „utorrent“ vertimą. Ten naudojamas „custom“(beto kreivas) vertimo formatas:
original
vertimas

original2
vertimas2

original3
vertimas3

Tokį formatą reik skaityt/verst su tekstiniu redaktorium… tuo viskas ir pasakyta:) Originalus „Translate Toolkit & Pootle“ įrankis „txt2po“ konvertuoja tik iš formato kur yra tik viena kalba arba „wiki“ formatu, todėl mano situacijoj netinka, o kitų įrankių neradau. Teko pasirašyt savo:

utxt2po.sh(txt2po jau yra)

#!/bin/bash
sed 's/"/"/g' $1>$1.po
#pakeičia kabutes į ", nes kitaip konvertuojant atgal į txt kyla bėdų
sed -i '1~3s/(.*)r/msgid "1"/' $1.po
sed -i '2~3s/(.*)r/msgstr "1"/' $1.po
#čia viskas aišku
sed -i '1 imsgid ""nmsgstr ""n"Project-Id-Version: projektas 1.0\n"n"Report-Msgid-Bugs-To: \n"n"POT-Creation-Date: 2012-01-08 06:36+0000\n"n"PO-Revision-Date: 2012-01-08 13:07+0200\n"n"Last-Translator: Vertėjas\n"n"Language-Team: Lietuvių <>\n"n"Language: lt\n"n"MIME-Version: 1.0\n"n"Content-Type: text/plain; charset=UTF-8\n"n"Content-Transfer-Encoding: 8bits\n"n' $1.po
#įterpia antraštę

po2utxt.sh

#!/bin/bash
sed 's/msgid "(.*)"/1/' $1>$1.txt
sed -i 's/msgstr "(.*)"/1/' $1.txt
#čia viskas aišku
sed -i 's/"/"/g' $1.txt
#" atkeičia atgal į kabutes
sed -i '1,12d' $1.txt
#pašalina antaštę, įrašė 12 eilučių ir ištrina 12 eilučių, nors vertimo programa galėjo prirašyt daugiau

Naudojimas:

$ ./utxt2po.sh utorrent.lang.txt

išverčiam

$ ./po2utxt.sh utorrent.lang.txt.po

Stop acta

No Comments

http://stop-acta.lt/apie-acta/

Mozilla vertimo failų naudojimas

No Comments

Visos „mozilla“ programos(firefox, thunderbird ir t.t.) ir plėtiniai(adblock, noscript ir t.t.) vertimui pateikiami Mozilla formatu, panašiai kaip .ini failai(„foo=bar“). Vienu žodžiu versti tokius failus labai nepatogu.

Mozilla failų vertimas į .po failus:
visi vertimai yra http://www.babelzilla.org puslapyje, parsisiunčiam reikalingus failus. Mano atveju tai enigmail.properties, enigmail.dtd ir am-enigprefs.properties. Sudedam failus į ~/plėtinio_vertimas/lt.

1.(jei naujas vertimas ir niekas dar neišversta)
Aplanke kuriam yra failai įvykdom:
moz2po . .
ir gaunam vertimui paruoštus .po failus.
2.(jei dalis jau yra išversta)
turim tokią struktūrą:
~/plėtinio_vertimas/lt – parsiųsti ir dalinai išversti failai
~/plėtinio_vertimas/en – čia parsiunčiam anglišką(tokios kalbos iš kurios versim) vertimą
aplanke ~/plėtinio_vertimas įvykdom:
moz2po -t en -i lt -o lt_po_failai_pagal_anglišką_šabloną
ir aplanke „lt_po_failai_pagal_anglišką_šabloną“ turim vertimui paruoštus failus.

Išverčiam failus.

Tada padarom vėl tokiu formatu kokiu gavom:
po2moz -t en -i lt/ -o lt-išversta
Ir aplanke „lt-išversta“ yra išversti originalaus formato failai, kuriuos galim nusiųsti atgal į babelzilla.

.mo >> .po

No Comments

msgunfmt mo-failas.mo > naujas-po-failas-iš-mo.po

Reikalingos .po failo dalies ištraukimas

No Comments

Po dviejų savaičių nuo mano užklausos, mane patvirtino kaip wordpress „validator“… Visas wordpress vertimas sumestas į vieną didelį .po failą, 13225 vertimo eilutės… Tokiam faile rast kažką ir suprast ką verti sunkoka:) Tokiu atveju geriausia yra išskirstyt į atskirus .po failus. Pavyzdžiui aš noriu išverst tik temą kurią naudoju, šiuo atveju „kubrick“:
su tekstiniu redaktorium atsidarau failą ir susirandu reikalingą vietą(ieškom žodžio „kubrick“ arba eilutės kuri yra tik reikalingam vertime), radau: wp-content/themes/pub/kubrick . Iškrapštom reikalingas eilutes:
pogrep wp-content/themes/pub/kubrick --search locations -i wordpress-vertimas.po -o wordpress-kubrick-vertimas.po
–search locations – kur ieškoti, galimos reikšmės ‘source’, ‘target’, ‘notes’, ‘locations’, ‘msgid’, ‘msgstr’, ‘comment’. Mano atveju(kaip ir daugumoj) .po faile yra parašyta kur ta eilutė bus naudojama, tai aš ieškojau tik toje dalį kur parašyta kur bus naudojama.
Visa kita ir taip aišku. Ir dabar turim
.po failą kuriame yra tik „kubrick“ temos vertimas(wordpress-kubrick-vertimas.po). Išverčiam tą failą ir įkeliam į wordpress. Jei kalba eina ne apie wordpress, tai tą išverstą failą reik sukišt atgal į didelį failą:
msgcat wordpress-kubrick-vertimas.po wordpress-vertimas.po --use-first -o wordpress-vertimas-su-isversta-kubrick-dalim.po
–use-first – kad būtų naudojama pirma sutikta eilutė, šiuo atveju, kad naudotų eilutę iš wordpress-kubrick-vertimas.po, o ne vėliau rastą wordpress-vertimas.po faile
-o wordpress-vertimas-su-isversta-kubrick-dalim.po – galim ir ant to pačio failo užrašyt, bet taip nereik backup daryt, nes į originalo failus nieko nerašoma.

PO failų atnaujinimas/„Translate Toolkit“ įrankiai

No Comments

Atnaujinam PO iš POT
$ msgmerge -vU senas_išverstas.po naujas_pot_kuriame_yra_kelios_naujos_eilutės.po
„Translate Toolkit“ įrankiai 

oo2po – OpenOffice.org SDF converter
moz2po – Mozilla .properties and .dtd converter. Works with Firefox and Thunderbird
csv2po – Comma Seperated Value (CSV) converter. Useful for doing translations using a spreadsheet.
ts2po – Qt .ts converter
txt2po – Plain text to PO converter
html2po – HTML converter
xliff2po – XLIFF (XML Localisation Interchange File Format) converter
po2tmx – TMX (Translation Memory Exchange) convertor
pot2po – initialise PO Template files for translation
csv2tbx – Create TBX (TermBase eXchange) files from Comma Seperated Value (CSV) files
tiki2po – convert TikiWiki translation files to po
pocompile – create an MO (Machine Object) file from a PO file
poconflict – extract messages that have conflicting translation
pocount – Count words and string in PO files
podebug – Add debug strings to messages
pofilter – filter PO files to find common errors using a number of tests
pogrep – find strings in your PO files
pomerge – merge file extracted using pofilter back into the original files
porestructure – restructures po files according to poconflict directives
lookupserver – a server that can be queried with XML-RPC to lookup strings in a storage format
mozcvs2pot – Convert files in Mozilla CVS layout to Mozilla’s l10n layout
phase – Helps manage a project divided into phases of work, including sending, checking, etc
pocompendium – Creates various types of PO compendium
poen – Initialises POT files to English translations
pomigrate2 – Migrate older PO files to new POT files
popuretext – Extracts all the source text from a directory of POT files
posplit – Split a PO file into translate, untranslated and fuzzy files
poreencode – Converts PO files to a new character encoding

 

Šaltiniai: wiki.civicrm.org softpedia