Evo desc.po fajla. Mi na stavljamo dalje sa desc-om. Do konačnog zvršetka.
Pozdrav B.
2008/10/20 Bojan Jovanovic bojov@fon.rs:
Evo desc.po fajla. Mi na stavljamo dalje sa desc-om. Do konačnog zvršetka.
U descu ima dosta nepravilnosti, naročito oko prevoda X-a: većinom je unošeno kao ćirilično "Ha", što ispadne "H" latinicom nakon translitaracije... Zbog ove nedoumice mi unosimo kao reč "Iks" ćirlicom, a nakon translitaricje to prebacujemo u "X" jednostavnom sed skriptom.
Takođe, nazive jezika uvek pišemo sa početnim malim slovom, treba ispraviti svuda, ja sam stigao samo "H" ;)
U prilogu su manje razlike za summary i desc.
M
Miloš Komarčević wrote:
2008/10/20 Bojan Jovanovic bojov@fon.rs:
Evo desc.po fajla. Mi na stavljamo dalje sa desc-om. Do konačnog zvršetka.
U descu ima dosta nepravilnosti, naročito oko prevoda X-a: većinom je unošeno kao ćirilično "Ha", što ispadne "H" latinicom nakon translitaracije... Zbog ove nedoumice mi unosimo kao reč "Iks" ćirlicom, a nakon translitaricje to prebacujemo u "X" jednostavnom sed skriptom.
Takođe, nazive jezika uvek pišemo sa početnim malim slovom, treba ispraviti svuda, ja sam stigao samo "H" ;)
U prilogu su manje razlike za summary i desc.
M
Fedora-trans-sr mailing list Fedora-trans-sr@redhat.com https://www.redhat.com/mailman/listinfo/fedora-trans-sr
Ako sam dobro razumem problem, stvar je što translator nije svestan postojanja utf-8? (X - IKS) translacija?
2008/10/21 Bojan Jovanovic bojov@fon.rs:
Ako sam dobro razumem problem, stvar je što translator nije svestan postojanja utf-8? (X - IKS) translacija?
Ne, transliterator (bilo Vučkov c2l, bilo gettextov recode-sr-latin) sasvim ispravno radi svoj jednostavan posao, prebacuje jedan ćirilični UTF-8 znak u jedan (ili dva za naš jezik po potebi - lj, nj, dž...) latinični, takođe UTF-8. Pri tome treba imati u vidu da _nijedan_ ćirilični UTF-8 znak _nije identičan nijednom_ latiničnom UTF-8 znaku [1], što zna da ponekad promakne u kucanju - imamo česte a,e,,j,o, k, m, t, b(v), c(s), p(r), u(y), h(x,n) greške koje hvatam korišćenjem aspella i gledanjem u fontu koji ne sadrži ćirilčne znake pa onda moraju da se povuku iz nekog drugog fonta, što onda zgodno bode oči.
Problem je što neko ručno unosi ćirilično "H (ha)" na mestu latiničnog "X (iks)", koji u UTF-8 nikako nisu identični znakovi (ne postoji znak "iks" u ćiriličnom UTF-8 rasopredu, i ovo mašina sasvim korektno prebacuje u latinično "ha"), tako da ili treba ostaviti latinično "X" kao što neke ostale naziva programa ostavljamo u izvornoj latinici), ili unositi transkribovano "Iks" ćirilicom (jer tada korinik neće biti u zabuni da li čita "Ha" ćirilicom ili "X" latinicom, osim kada je nedvosmisleno određeno širim kontekstom, npr. "X11", "X.Org", "XFree86"). Potom je to lako obraditi naknadno (već imamo sed skriptu koja sadrži zamenu s/I[Kk][Ss]/X/g).
Pozdrav, M
AAAAAAAAAAAha :) ustvari potrebno je obratiti pažnju prilikom unosa. hmmm, znači ako bih otkucao sa latinčnom tastaturom X u utf-8 onda ne bi bilo problema. UUUU baš smo se zakomplikovali sa pismima, višeznačnostima i ostalim zafrkancijama. U stvari sve spada pod odgovornost onoga koji unosi prevedeni tekst.
E Vuče, Vuče, šta nam uradi :))
Miloš Komarčević wrote:
2008/10/21 Bojan Jovanovic bojov@fon.rs:
Ako sam dobro razumem problem, stvar je što translator nije svestan postojanja utf-8? (X - IKS) translacija?
Ne, transliterator (bilo Vučkov c2l, bilo gettextov recode-sr-latin) sasvim ispravno radi svoj jednostavan posao, prebacuje jedan ćirilični UTF-8 znak u jedan (ili dva za naš jezik po potebi - lj, nj, dž...) latinični, takođe UTF-8. Pri tome treba imati u vidu da _nijedan_ ćirilični UTF-8 znak _nije identičan nijednom_ latiničnom UTF-8 znaku [1], što zna da ponekad promakne u kucanju - imamo česte a,e,,j,o, k, m, t, b(v), c(s), p(r), u(y), h(x,n) greške koje hvatam korišćenjem aspella i gledanjem u fontu koji ne sadrži ćirilčne znake pa onda moraju da se povuku iz nekog drugog fonta, što onda zgodno bode oči.
Problem je što neko ručno unosi ćirilično "H (ha)" na mestu latiničnog "X (iks)", koji u UTF-8 nikako nisu identični znakovi (ne postoji znak "iks" u ćiriličnom UTF-8 rasopredu, i ovo mašina sasvim korektno prebacuje u latinično "ha"), tako da ili treba ostaviti latinično "X" kao što neke ostale naziva programa ostavljamo u izvornoj latinici), ili unositi transkribovano "Iks" ćirilicom (jer tada korinik neće biti u zabuni da li čita "Ha" ćirilicom ili "X" latinicom, osim kada je nedvosmisleno određeno širim kontekstom, npr. "X11", "X.Org", "XFree86"). Potom je to lako obraditi naknadno (već imamo sed skriptu koja sadrži zamenu s/I[Kk][Ss]/X/g).
Pozdrav, M
[1] http://unicode.org/charts/
Fedora-trans-sr mailing list Fedora-trans-sr@redhat.com https://www.redhat.com/mailman/listinfo/fedora-trans-sr
2008/10/21 Bojan Jovanovic bojov@fon.rs:
E Vuče, Vuče, šta nam uradi :))
Ko je taj Vuk što je ukucavao desc prevod? ;)
Nije problem kada se jednom potpuno prihvati UTF-8 i činjenica da ćirilični i latnični rasporedi tamo nemaju ama baš ništa zajedničko (za razliku od ISO-8859-2 i ISO-8859-5 npr., a verovatno i ostalih: Win-1250 i Win-1251, CP852 i CP855/866). Onda stvarno sve ide kao po loju, samo kao svaki majstor, treba dobro poznavati svoj alat ;)
M
Ma jedan Vuk Stefanović Karadžić ;)
Miloš Komarčević wrote:
2008/10/21 Bojan Jovanovic bojov@fon.rs:
E Vuče, Vuče, šta nam uradi :))
Ko je taj Vuk što je ukucavao desc prevod? ;)
Nije problem kada se jednom potpuno prihvati UTF-8 i činjenica da ćirilični i latnični rasporedi tamo nemaju ama baš ništa zajedničko (za razliku od ISO-8859-2 i ISO-8859-5 npr., a verovatno i ostalih: Win-1250 i Win-1251, CP852 i CP855/866). Onda stvarno sve ide kao po loju, samo kao svaki majstor, treba dobro poznavati svoj alat ;)
M
Fedora-trans-sr mailing list Fedora-trans-sr@redhat.com https://www.redhat.com/mailman/listinfo/fedora-trans-sr
[: Bojan Jovanovic :] UUUU baš smo se zakomplikovali sa pismima, višeznačnostima i ostalim zafrkancijama.
Тја, то зависи од тачке посматрања :) Лично се добрано ослањам на то што је већ на нивоу писма јасно раздвојен енглески и српски садржај, што погодује било каквој аутоматској обради.
Нпр. провера правописа може се елегантно спровести претходним одстрањивањем свих нећириличних речи, како се не би саплитала о разна изворна имена и дословне подниске (адресе, наредбе...) у преводу. Упоредити какве све глупости Французи морају да додају у допунски речник Аспела за превод КДЕ-а, да би провера ћутала, према ономе што сам ја морао да додајем:
http://websvn.kde.org/*checkout*/trunk/l10n-support/pology/l10n/fr/spell/dic... http://websvn.kde.org/*checkout*/trunk/l10n-support/pology/l10n/sr/spell/kde...
Е сад, што се тиче типкача малчице ненавиклих на ћирилицу :), да̑ се разапети заштитна мрежа:
$ cd $FEDORA_PO_ROOT $ cp $WHEREVER/typos-fed.rules . $ posieve.py check-rules -slang:sr -saccel:_ -srfile:typos-fed.rules
Датотека правила typos-fed.rules је први прилог, а други је снимак дела излаза у шкољци (укупно 146 обарања...)
Узгред, кад сам слична правила применио на КДЕ (~100.000 речи), добио сам тачно један проблем, ћирилично ‘е’ у „еt“ у „...<em>Divide еt impera</em>...“ — да ми је претпоставити ланац догађаја којим је до тога успело да дође :) Но поента је да након мало навикавања, претходна аутоматска провера практично није ни потребна. Мој савет: у ротацију распореда само два, *један* латинични (енглески или наш) и ћирилични, а промена распореда на нешто брзо и на руку, нпр. алт+алт или алт+размак.
2008/10/21 Часлав Илић caslav.ilic@gmx.net:
Е сад, што се тиче типкача малчице ненавиклих на ћирилицу :), да̑ се разапети заштитна мрежа:
$ cd $FEDORA_PO_ROOT $ cp $WHEREVER/typos-fed.rules . $ posieve.py check-rules -slang:sr -saccel:_ -srfile:typos-fed.rules
Датотека правила typos-fed.rules је први прилог, а други је снимак дела излаза у шкољци (укупно 146 обарања...)
Časlave, ovo je sjajno, još samo kad bih imao vremena da se obučim i pročešljam ceo Fedorin prevod... :(
Pozdrav, M
У уто, 28. 10 2008. у 11:54 +0000, Miloš Komarčević пише:
Časlave, ovo je sjajno, još samo kad bih imao vremena da se obučim i pročešljam ceo Fedorin prevod... :(
Pozdrav, M
Pologija je zlata vredna! Sada dok sređujem OpenOffice.org prevod, ne prođe dan a da ne napišem neku skripticu[1] koristeći je.
pp, Goran
[1] Split/merge/raznoliki diffovi (razdvoji lektorisano i nelektorisano, primeni izmene iz jedne PO datoteke na sve u stablu, odstrani/vrati ctxt i sl.)
[: Miloš Komarčević :] Časlave, ovo je sjajno, još samo kad bih imao vremena da se obučim i pročešljam ceo Fedorin prevod... :(
Оно јесте, треба пребацити нешто времена са непосредног превођења на опремање алатом, али мислим да се исплати. Ја сам можда мало претерао, у последњих годину дана више сам пискарао којешта него преводио :)
А мислим да и није превише закукуљено, посебно ово са правилима. Инсталација Пологије је проста (тј. не постоји, само се допуне PATH и PYTHONPATH), писање правила је документовано (мало згуснуто додуше), а ту су и примери. Бар један „корисник“, тј. неко ко није учествовао у развоју система, очас посла је почео да пише правила.
Кад већ помену, ево и правила за проверу наводника:
# Аски уместо српских наводника. [".*?"|'.*?'] id="ascii-quotes" hint="аски уместо правописних наводника („“ и ‘’)" valid after="=" valid after="([a-z\d_-]+\s+){2,}"
које само треба дописати у претходно приложену typos-fed.rules. Овакво правило било би готово непотребно поред грепа (не рачунајући фину интеграцију у остатак правила), да није гомиле ваљаних аски наводника унутар обележавања (...<a href="http://blah.blah.org%5C%22%3E...) и понешто у командним линијама (...извршите: foo -a -b "blah, blah"...). Зато су ту две изузимајуће директиве, valid ..., да пропусте цитирану ниску захваћену главним обрасцем ако је одмах после знака једнакости или после бар две аски речи (укључујући и бројеве, цртице и подвлаке). Тако у овој верзији превода Федоре што имам, без дефинисаних изузетака пријави ~700 проблема, а са њима ~200.
А кад је нека појединачна порука баш чудна, да је штета допуњавати или олабављивати правило само због ње, оно се може искључити за ту поруку путем идентификатора у преводилачком коментару:
# skip-rule: ascii-quotes #: foo.c:100 msgid "......" msgstr "......"
Ово зато што је циљ да правила буду нормативног пре него саветодавног карактера, тј. да се на свако обарање мора реаговати: исправком поруке, исправком правила, додавањем филтера, или изричитим и што локалнијим укидањем правила.
Čaki Noris Ilić nam zadade domaći zadatak. :-D :-P :-[ Čim završimo ovo oko 10-tke podelićemo se u strelce da pročešljamo Fedorin prevod.
Miloš Komarčević wrote:
2008/10/21 Часлав Илић caslav.ilic@gmx.net:
Е сад, што се тиче типкача малчице ненавиклих на ћирилицу :), да̑ се разапети заштитна мрежа:
$ cd $FEDORA_PO_ROOT $ cp $WHEREVER/typos-fed.rules . $ posieve.py check-rules -slang:sr -saccel:_ -srfile:typos-fed.rules
Датотека правила typos-fed.rules је први прилог, а други је снимак дела излаза у шкољци (укупно 146 обарања...)
Časlave, ovo je sjajno, još samo kad bih imao vremena da se obučim i pročešljam ceo Fedorin prevod... :(
Pozdrav, M
Fedora-trans-sr mailing list Fedora-trans-sr@redhat.com https://www.redhat.com/mailman/listinfo/fedora-trans-sr
trans-sr@lists.fedoraproject.org