Aké HTML zrady vám pripraví Google Translator pri prekladaní textu
Isto mi dáte za pravdu, že niekedy každý z nás využije moderné technológie aj na také banálne veci, ako je preklad textu zo slovenčiny do češtiny.
Áno, musím priznať, stalo sa mi to nedávno. Nie že by som neovládal češtinu, ale potreboval som preklad rýchlo a spoľahlivo, bez zdĺhavého procesu prepisovania, a tak som sa rozhodol použiť (ako inak) všemocný prekladač od Google. Ale nakoniec som mal s prekladom 2x viac práce, ako keby som si články prekladal ručne.
Google prekladač totiž z pôvodne čistého textu bez HTML kódu urobí zmes <span> elementov zaradených do rôznych tried. Tie po skopírovaní do WYSIWYG editora síce nemajú na vzhľad webstránky žiadny vplyv, ale stránka je zahltená nadbytkom zbytočných HTML elemenov a prípadne stratí validitu.
Poznámka: WYSIWYG editor je ľubovoľný editor na úpravu obsahu webstránok, ktorý funguje na princípe What You See Is What You Get, teda umožňuje formátovanie textu (ako vo Worde) a vkladanie už naformátovaného textu.
Ukážka prekladu textu
Pôvodný text:
„Astronómovia z americkej Národnej agentúry pre letectvo a vesmír (NASA) predpovedali scenár gigantickej kolízie našej galaxie so susednou veľkou hmlovinou v súhvezdí Andromedy, ku ktorej má dôjsť o štyri miliardy rokov. Nevyhnutná zrážka vrhne Slnko na iné miesto Mliečnej cesty. Dobrou správou je, že samotnú Zem kolízia nezničí.“.
Po preložení tohto textu dostávame v prekladači krásne preložený text, avšak vo forme nasledujúceho HTML kódu:
„<span id="result_box" lang="cs"><span class="hps">Astronomové</span> <span class="hps">z americké</span> <span class="hps">Národní agentury pro</span> <span class="hps">letectví</span> <span class="hps">a</span> <span class="hps">vesmír</span> <span class="hps atn">(</span><span>NASA</span><span>)</span> <span class="hps">předpovídali</span> <span class="hps">scénář</span> <span class="hps">gigantické</span> <span class="hps">kolize</span> <span class="hps">naší</span> <span class="hps">galaxie</span> <span class="hps">se sousední</span> <span class="hps">velkou</span> <span class="hps">mlhovinou</span> <span class="hps">v</span> <span class="hps">souhvězdí</span> <span class="hps">Andromedy</span><span>,</span> <span class="hps">ke které</span> <span class="hps">má dojít</span> <span class="hps">o čtyři</span> <span class="hps">miliardy</span> <span class="hps">let.</span> <span class="hps">Nezbytná</span> <span class="hps">srážka</span> <span class="hps">vrhne</span> <span class="hps">Slunce</span> <span class="hps">na jiné místo</span> <span class="hps">Mléčné dráhy</span><span>.</span> <span class="hps">Dobrou</span> <span class="hps">zprávou je</span><span>,</span> <span class="hps">že</span> <span class="hps">samotnou</span> <span class="hps">Zemi</span> <span class="hps">kolize</span> <span class="hps">nezničí</span><span>.</span></span> “
Dôvod zahltenia spanmi
Dôvod pridania spanov je jednoduchý. Prekladač od Googlu totiž ponúka používateľom možnosť si preklad upraviť podľa svojich predstáv. Ak sa im v preklade nejaké slovo nepozdáva, len kliknutím na to slovo alebo skupinu slov im Google ponúkne alternatívne možnosti prekladu, prípadne možnosť napísať vlastnú frázu.
Preto musí Google v pôvodne čistom texte narobiť neporiadok. Pomocou spanov a tried používateľovi ukazuje, ktoré preložené slovo sa spája s ktorým originálom, a takisto že používateľ môže kliknúť na slovo a preložiť si ho sám. Bohužiaľ, ak toto používateľ nevie a kopíruje priamo na stránku výsledok prekladu, dôjde k nežiadúcemu skopírovaniu aj celého HTML kódu z prekladača.
Nezabúdajte preto, ak používate pri výrobe webstránky WYSIWYG editor a kopírujete preložené články priamo z prekladača, radšej použite možnosť vložiť váš text ako čistý text (bez formátovania), ak túto možnosť máte. Ušetríte čas, ktorý by ste vynaložili na odstraňovanie prebytočných HTML tagov zo stránky po tom, čo problém objavíte.
Človek sa učí na vlastných chybách. Snáď tento článok niekomu pomôže a neurobí tú istú chybu ako ja. :)