Rubriky
Napište článek do Rubriky
vložit text
vložit text
     Vložte článek bez registrace.

Věstník
Věstník na email:

zasílatukončit

Převod z win-1250 do UTF-8 konvertor

07.06.2007 | Téma: Převod z win-1250 do UTF-8 konvertor | Rubrika: PHP funkce | Odkaz: http://rubriky.cz/prevod_z_win_1250_do_utf_8_konvertor.php

Převod z win-1250 do UTF-8 pomocí PHP funkce. Překódování textu z kódování win-1250 do kódování UTF-8.
Pokud píšeme texty v php kódu s diakritikou v prostředí operačního systému Windows a text následně uložíme do souboru, čeština je uložena v kódování win-1250. Pokud však chceme, aby se text na webu zobrazil v kódování UTF-8, můžeme použít následující funkci pro převod z win-1250 do UTF-8. PHP funkce v základní sadě PHP interpretru totiž převádějí písmena s českou diaktitikou chybně, neboť vycházejí z iso-8859-2 nebo dokonce z iso-8859-1. I za situace, kdy diakritiku nejprve převedeme z kódování win-1250 do iso-8859-2 a poté využijeme interní php funkce pro převod diakritiky do UTF-8, některá písmena jsou překódována chybně. Pravděpodobně to souvisí s pořadím v jakém jsou uvnitř funkce jednotlivá písmena překódovávána. Což ale řeší následující funkce, kde konveze z win-1250 do UTF-8 proběhne u českých diakritických písmen bez problémů, viz dále. Funkce je odladěna pouze pro český jazyk, jedná se pouze o CZ konvertor diakritiky.

Kódování znaků UTF-8 používá většina vyhledavačů. Konvertor z win-1250 do UTF-8 můžeme v praxi s výhodou použít pro webovou stránku s Google Custom search neboli Google Vlastní hledání, které nám jinak nevyhledává česká klíčová slova s diakritikou, není-li stránka s vyhledávacím formulářem kódována v UTF-8.

PHP funkce - Převod z win-1250 do UTF-8

Poznámka: Je třeba ponechat pořadí jednotlivých písmen v uvedeném sledu, jinak vzniknou chyby v převodu!

function win-utf8 ($slovo) {
  $slovo=str_replace("ě",chr(196).chr(155),$slovo);
  $slovo=str_replace("š",chr(197).chr(161),$slovo);
  $slovo=str_replace("ř",chr(197).chr(153),$slovo);
  $slovo=str_replace("ý",chr(195).chr(189),$slovo);
  $slovo=str_replace("á",chr(195).chr(161),$slovo);
  $slovo=str_replace("í",chr(195).chr(173),$slovo);
  $slovo=str_replace("é",chr(195).chr(169),$slovo);
  $slovo=str_replace("ú",chr(195).chr(186),$slovo);
  $slovo=str_replace("ů",chr(197).chr(175),$slovo);
  $slovo=str_replace("ď",chr(196).chr(143),$slovo);
  $slovo=str_replace("ť",chr(197).chr(165),$slovo);
  $slovo=str_replace("ň",chr(197).chr(136),$slovo);
  $slovo=str_replace("ó",chr(195).chr(179),$slovo);
  $slovo=str_replace("Ě",chr(196).chr(154),$slovo);
  $slovo=str_replace("Š",chr(197).chr(160),$slovo);
  $slovo=str_replace("Č",chr(196).chr(140),$slovo);
  $slovo=str_replace("Ř",chr(197).chr(152),$slovo);
  $slovo=str_replace("Á",chr(195).chr(129),$slovo);
  $slovo=str_replace("É",chr(195).chr(137),$slovo);
  $slovo=str_replace("Ť",chr(197).chr(164),$slovo);
  $slovo=str_replace("Ň",chr(197).chr(135),$slovo);
  $slovo=str_replace("Ó",chr(195).chr(147),$slovo);
  $slovo=str_replace("Ý",chr(195).chr(157),$slovo);
  $slovo=str_replace("Ú",chr(195).chr(154),$slovo);
  $slovo=str_replace("Ů",chr(197).chr(174),$slovo);
  $slovo=str_replace("Í",chr(195).chr(141),$slovo);
  $slovo=str_replace("ž",chr(197).chr(190),$slovo);
  $slovo=str_replace("Ž",chr(197).chr(189),$slovo);
  $slovo=str_replace("č",chr(196).chr(141),$slovo);
  $slovo=str_replace("Ď",chr(196).chr(142),$slovo);
  // autor funkce SoftWork znamost.cz
  return $slovo;
}

Příklad použití:

<?php
echo win-utf8("
Myšička žužlá měkký řízek.");
?>


Výsledek: Uvedená věta napsaná v kódování win-1250 je zobrazena v kódování UTF-8.

Rady a názory k tématu : Převod z win-1250 do UTF-8 konvertor



Rubriky - Českou kuličkářskou elitu čeká mistrovství ČR Pátek 13. Kuličková sezóna odstartuje turnajem na Střeleckém ostrově Radary v Praze Počtem mohou zamíchat NULL hodnoty Blu-ray Nové album Jean Michela Jarreho SMS zdarma Společenský doprovod Seznamka

Názory a rady Převod z win-1250 do UTF-8 konvertor

Vaše názory a rady k tématu Převod z win-1250 do UTF-8 konvertor. Vyjádřete svůj názor nebo poznatek.
Můj komentář 
Mé jméno    Věk volitelně

 

Následují komentáře návštěvníků těchto stránek. Kterýkoli příspěvek může být provozovatelem vymazán, zvláště urážlivé, vulgární nebo příspěvky mimo téma, které nejsou povoleny.

ZHYIqzKQqw01.07.2011 22:11
Wonderful explanation of facts avalaible here.

ŽANETA (15)22.01.2011 14:16
těšímse

06.01.2011 16:08
rtštščřtřšz

likvi09.07.2009 10:19
Do nazvu funkce pomlcka?

23.01.2008 09:48
potřeboval bych napsat řecké "micro" (takový to u s ocáskem na začátku) to vzorečku v exelu. Pokud použiji alt+181 tak se napíše "Á". Co s tím? (změna typu písma ve vzorcích není možná a pokud ho slučuji odjinud tak se tam stejně napíše "m")

čtř (12)09.01.2008 21:43
fgerferřčtčttctč

Nothing20.11.2007 14:12
a kde jsou přehlasovaná písmena?

22.09.2007 10:47
rtštščřtřšz

Převod z win-1250 do UTF-8 konvertor




Články jsou vkládány návštěvníky tohoto serveru. V případě, že v textu rozpoznáte své dílo, sdělte tuto skutečnost, článek bude zakázán. Články je možné přebírat a citovat za podmínky uvedení "zdroj: Rubriky.cz". Bez této poznámky není dovoleno texty citovat.

Vložte článek | Kontakt